KNOWLEDGE BASE

Spreidingsmaten

Variantie en Standaarddeviatie

Variantie en standaarddeviatie spelen een rol bij continue variabelen, als lengte, gewicht, temperatuur, etc., die allerlei tussenwaarden kunnen aannamen. De variantie meet de gemiddelde mate waarin een waarneming afwijkt van het gemiddelde. Hoe groter de variantie, hoe groter de spreiding rond het gemiddelde. De formule voor variantie is: 1/n ∑_(i=1)^n(xi-μ)2 Opmerkingen Er wordt gebruik gemaakt van vierkanten om ervoor te zorgen dat de grootste afwijkingen van het gemiddelde zwaarder wegen dan de kleinere afwijkingen. Probleem is dat de variantie hiermee niet meer de oorspronkelijke maateenheid heeft. Belangrijk: Als er sprake is van een steekproef dan wordt er gedeeld door n-1. De reden is dat er in de formule al gebruik wordt gemaakt van een benadering, die van het gemiddelde. Er is dan al een vrijheidsgraad gebruikt en moet er door n-1 gedeeld worden. De standaarddeviatie meet de mate waarin de waarden zijn verspreid rond het gemiddelde van de waarnemingen. Een kleine standaardafwijking betekent dat meer waarnemingen in dezelfde groep zullen zitten. De standaardafwijking wordt weergeven met de Griekse letter delta, δ. Gaat het om een steekproef, dan wordt ook vaak ‘s’ of ’SD’ gebruikt. De formule voor de standaarddeviatie is √(1/n ∑_(i=1)^n(xi-μ)2 )(ofwel de wortel uit de variantie). Door het nemen van de vierkantswortel van de variantie wordt de standaardafwijking hersteld naar de oorspronkelijke maateenheid. De variantie is hier berekend door 16 te delen door 5 (6 - 1).

Interkwartielafstand

De interkwartielafstand (IQR) is verschil tussen de laagste kwartiel (25e percentiel) en het hoogste kwartiel (75e percentiel) in een dataset. De grens van het eerste kwartiel is de waarde waarbij 25% van de data kleiner zijn; de grens van het derde kwartiel is de waarde waarbij 75% van de data kleiner zijn. De IQR is een maat voor de mate waarin de waarden onderling verschillen en wordt gebruikt om de variantie van een indicator te meten. (die door de klant wordt ervaren). Het wordt vooral gebruikt bij het maken van boxplots. Een voordeel van de IQR is dat het ongevoelig is voor uitschieters. De interkwartielafstand wordt berekend als: IQR = IQR(3) - IQR(1)