Sample versus populatie
Bevolking en Steekproef zijn twee belangrijke termen in het onderwerp 'Statistieken'. In eenvoudige bewoordingen is populatie de grootste verzameling items die we willen bestuderen, en de steekproef is een subset van een populatie. Met andere woorden, de steekproef moet de populatie vertegenwoordigen met minder maar voldoende aantal items. Eén populatie kan meerdere steekproeven met verschillende groottes hebben.
Voorbeeld
Een steekproef kan bestaan uit twee of meer items die uit de populatie zijn geselecteerd. De laagst mogelijke grootte voor een steekproef is twee en de hoogste zou gelijk zijn aan de grootte van de populatie. Er zijn verschillende manieren om een steekproef uit een populatie te selecteren. Theoretisch is het selecteren van een 'willekeurige steekproef' de beste manier om nauwkeurige conclusies over de populatie te trekken. Dit type steekproeven wordt ook wel kanssteekproeven genoemd, omdat elk item in de populatie evenveel kans heeft om in een steekproef te worden opgenomen.
‘Simple random sampling’ techniek is de meest bekende random sampling techniek. In dit geval worden de items die voor de steekproef moeten worden geselecteerd willekeurig gekozen uit de populatie. Zo’n steekproef wordt een ‘Simple Random Sample’ of SRS genoemd. Een andere populaire techniek is ‘systematic sampling’. In dit geval worden de items voor een steekproef geselecteerd op basis van een bepaalde systematische volgorde.
Voorbeeld: elke 10e persoon in de wachtrij wordt geselecteerd voor een steekproef.
In dit geval is de systematische volgorde elke 10e persoon. De statisticus is vrij om deze volgorde op een zinvolle manier te definiëren. Er zijn andere willekeurige steekproeven, zoals clustersteekproeven of gestratificeerde steekproeven, en de selectiemethode verschilt enigszins van de bovenstaande twee.
Voor praktische doeleinden kunnen niet-willekeurige steekproeven zoals gemaksteekproeven, beoordelingssteekproeven, sneeuwbalsteekproeven en doelsteekproeven worden gebruikt. Bovendien hebben items die zijn geselecteerd op een niet-willekeurige steekproef betrekking op een kans. In feite heeft niet elk item van de populatie een gelijke kans om te worden opgenomen in een niet-willekeurige steekproef. Dit soort steekproeven worden ook niet-kanssteekproeven genoemd.
Bevolking
Elke verzameling entiteiten die interessant is om te onderzoeken, wordt eenvoudig gedefinieerd als 'populatie'. Bevolking is de basis voor steekproeven. Elke verzameling objecten in het universum kan een populatie zijn, gebaseerd op de studieverklaring. Over het algemeen moet een populatie relatief groot zijn en moeilijk om bepaalde kenmerken af te leiden door de items afzonderlijk te bekijken. De metingen die in de populatie moeten worden onderzocht, worden parameters genoemd. In de praktijk worden de parameters geschat met behulp van statistieken die de relevante monstermetingen zijn.
Voorbeeld: bij het schatten van het gemiddelde wiskundecijfer van 30 leerlingen in een klas uit het gemiddelde wiskundecijfer van 5 leerlingen, is de parameter het gemiddelde wiskundecijfer van de klas. De statistiek is het gemiddelde wiskundecijfer van 5 studenten.
Sample versus populatie
De interessante relatie tussen de steekproef en de populatie is dat de populatie kan bestaan zonder een steekproef, maar dat een steekproef mogelijk niet bestaat zonder populatie. Dit argument bewijst verder dat een steekproef afhangt van een populatie, maar interessant genoeg zijn de meeste populatie-inferenties afhankelijk van de steekproef. Het belangrijkste doel van een steekproef is om sommige metingen van een populatie zo nauwkeurig mogelijk te schatten of af te leiden. Een hogere nauwkeurigheid kan worden afgeleid uit het totale resultaat dat is verkregen uit verschillende steekproeven van dezelfde populatie in plaats van uit één steekproef. Een ander belangrijk ding om te weten is dat bij het selecteren van meer dan één steekproef uit een populatie het ene item ook in een andere steekproef kan worden opgenomen. Deze zaak staat bekend als 'monsters met vervangingen'. Bovendien is het investeren van de relevante metingen van de populatie uit een steekproef en het verkrijgen van bijna vergelijkbare output een gouden kans om de kosten en tijdwaarde te besparen.
Het is cruciaal om te weten dat, wanneer de steekproefomvang toeneemt, de nauwkeurigheid van de schatting voor de populatieparameter ook toeneemt. Logischerwijs, om betere schattingen voor de populatie te hebben, mag de steekproefomvang niet te klein zijn. Verder moeten ook willekeurige steekproeven worden overwogen om betere schattingen te hebben. Daarom is het cruciaal om aandacht te besteden aan de grootte en willekeurigheid van de steekproef om representatief te zijn om de beste schattingen voor de populatie te krijgen.