KNOWLEDGE BASE

Central Limit Theorem

De CLT gaat er vanuit dat zelfs als een dataset geen normale verdeling (non-normal data) vertoont, er toch een normaalverdeling in die set te vinden is. Op die manier kan de normaal verdeling gebruikt worden op niet-normale data. Anders gezegd, bij een voldoende steekproef van voldoende omvang zal het gemiddelde van alle steekproeven hetzelfde zijn als het gemiddelde van de populatie. Die normaal verdeling kan gevonden worden door meerdere steekproeven te nemen uit niet-normale gegevens en vervolgens het gemiddelde van die steekproeven te nemen. De verdeling van het gemiddelde van al die steekproeven zal een normaal verdeling vertonen. Voorwaarde is dat de omvang van de steekproeven (n) voldoende groot moet zijn (n moet minimaal 30 waardes omvatten)