WEBREALISATIE: MARTINVANPELT VORMGEVING & DTP
Spreidingsmaten
Variantie en Standaarddeviatie
Variantie en standaarddeviatie spelen een rol bij continue variabelen, als lengte, gewicht, temperatuur, etc., die allerlei
tussenwaarden kunnen aannamen.
De variantie meet de gemiddelde mate waarin een waarneming afwijkt van het gemiddelde. Hoe groter de variantie, hoe
groter de spreiding rond het gemiddelde.
De formule voor variantie is: 1/n ∑_(i=1)^n(xi-μ)2
Opmerkingen
•
Er wordt gebruik gemaakt van vierkanten om ervoor te zorgen dat de grootste afwijkingen van het gemiddelde
zwaarder wegen dan de kleinere afwijkingen. Probleem is dat de variantie hiermee niet meer de oorspronkelijke
maateenheid heeft.
•
Belangrijk: Als er sprake is van een steekproef dan wordt er gedeeld door n-1. De reden is dat er in de formule al
gebruik wordt gemaakt van een benadering, die van het gemiddelde. Er is dan al een vrijheidsgraad gebruikt en moet er
door n-1 gedeeld worden.
De standaarddeviatie meet de mate waarin de waarden zijn verspreid rond het gemiddelde van de waarnemingen. Een
kleine standaardafwijking betekent dat meer
waarnemingen in dezelfde groep zullen zitten. De
standaardafwijking wordt weergeven met de Griekse
letter delta, δ. Gaat het om een steekproef, dan wordt
ook vaak ‘s’ of ’SD’ gebruikt.
De formule voor de standaarddeviatie is √(1/n
∑_(i=1)^n(xi-μ)2 )(ofwel de wortel uit de variantie).
Door het nemen van de vierkantswortel van de
variantie wordt de standaardafwijking hersteld naar de
oorspronkelijke maateenheid.
De variantie is hier berekend door 16 te delen door 5 (6
- 1).
Interkwartielafstand
De interkwartielafstand (IQR) is verschil tussen de laagste kwartiel (25e percentiel) en het hoogste kwartiel (75e percentiel)
in een dataset. De grens van het eerste kwartiel is de waarde waarbij 25% van de data kleiner zijn; de grens van het derde
kwartiel is de waarde waarbij 75% van de data kleiner zijn.
De IQR is een maat voor de mate waarin de waarden onderling verschillen en wordt gebruikt om de variantie van een
indicator te meten. (die door de klant wordt ervaren). Het wordt vooral gebruikt bij het maken van boxplots. Een voordeel
van de IQR is dat het ongevoelig is voor uitschieters. De interkwartielafstand wordt berekend als: IQR = IQR(3) - IQR(1)