Gestratificeerde bemonstering versus clusterbemonstering
In statistieken, vooral bij het uitvoeren van enquêtes, is het belangrijk om een onbevooroordeelde steekproef te verkrijgen, zodat het resultaat en de voorspellingen met betrekking tot de populatie nauwkeuriger zijn. Maar in de eenvoudige willekeurige steekproef bestaat de mogelijkheid om de leden van de steekproef te selecteren die bevooroordeeld zijn; met andere woorden, het vertegenwoordigt de bevolking niet eerlijk. Daarom worden gestratificeerde steekproeven en clustersteekproeven gebruikt om de bias- en efficiëntieproblemen van de eenvoudige willekeurige steekproeven te overwinnen.
Gestratificeerde bemonstering
Gestratificeerde willekeurige steekproeven is een steekproefmethode waarbij de populatie eerst wordt verdeeld in strata (een stratum is een homogene subset van de populatie). Vervolgens wordt uit elk stratum een eenvoudige willekeurige steekproef genomen. De resultaten van elke strata gecombineerd vormen de steekproef. Hieronder volgen voorbeelden van mogelijke lagen in populaties
• Voor een populatie van een staat, mannelijke en vrouwelijke lagen
• Voor mensen die in een stad werken, ingezeten en niet-ingezeten lagen
• Voor studenten in een hogeschool, blanke, zwarte, Latijns-Amerikaanse en Aziatische lagen
• Voor een publiek van een debat over theologie, protestantse, katholieke, joodse, islamitische lagen
In dit proces wordt de populatie, in plaats van willekeurig rechtstreeks uit de populatie te nemen, in groepen verdeeld met behulp van een inherent kenmerk van de elementen (homogene groepen). Vervolgens worden steekproeven uit de groep genomen. Het aantal willekeurige steekproeven dat uit elke groep wordt genomen, is afhankelijk van het aantal elementen binnen de groep.
Hierdoor kunnen steekproeven worden gemaakt zonder dat de steekproef van één groep groter is dan het aantal vereiste steekproeven van die specifieke groep. Als het aantal elementen uit een bepaalde groep groter is dan het vereiste aantal, kan een scheve verdeling leiden tot foutieve interpretaties.
Gestratificeerde steekproeven maken het gebruik van verschillende statistische methoden voor elk stratum mogelijk, wat helpt bij het verbeteren van de efficiëntie en nauwkeurigheid van de schatting.
Clusterbemonstering
Cluster willekeurige steekproeven is een steekproefmethode waarbij de populatie eerst wordt verdeeld in clusters (een cluster is een heterogene subset van de populatie). Vervolgens wordt een eenvoudige willekeurige steekproef van clusters genomen. Alle leden van de geselecteerde clusters vormen samen de steekproef. Deze methode wordt vaak gebruikt wanneer natuurlijke groeperingen duidelijk en beschikbaar zijn.
Overweeg bijvoorbeeld een enquête om de betrokkenheid van middelbare scholieren bij buitenschoolse activiteiten te evalueren. In plaats van willekeurige studenten uit de studentenpopulatie te selecteren, is het selecteren van een klas als de steekproeven voor de enquête een clustersteekproef. Daarna wordt elk lid van de klas geïnterviewd. In dit geval zijn klassen clusters van de studentenpopulatie.
Bij clustersteekproeven zijn het de clusters die willekeurig worden geselecteerd, niet de individuen. Aangenomen wordt dat elk cluster op zichzelf een onbevooroordeelde weergave is van de populatie, wat impliceert dat elk van de clusters heterogeen is.
Wat is het verschil tussen gestratificeerde bemonstering en clusterbemonstering?
• Bij gestratificeerde steekproeven wordt de populatie verdeeld in homogene groepen die strata worden genoemd, met behulp van een kenmerk van de steekproeven. Vervolgens worden leden uit elke laag geselecteerd en het aantal monsters dat uit die lagen wordt genomen, is evenredig met de aanwezigheid van de lagen in de populatie.
• Bij clustersteekproeven wordt de populatie gegroepeerd in clusters, voornamelijk op basis van locatie, en vervolgens wordt willekeurig een cluster geselecteerd.
• Bij clustersteekproeven wordt een cluster willekeurig geselecteerd, terwijl bij gestratificeerde steekproeven leden willekeurig worden geselecteerd.
• Bij gestratificeerde steekproeven omvat elke gebruikte groep (strata) homogene leden, terwijl bij clustersteekproeven een cluster heterogeen is.
• Gestratificeerde bemonstering is langzamer, terwijl clusterbemonstering relatief sneller is.
• Gestratificeerde steekproeven hebben minder fouten doordat rekening wordt gehouden met de aanwezigheid van elke groep binnen de populatie en de methoden worden aangepast om een betere schatting te krijgen.
• Clustersteekproeven hebben een inherent hoger foutenpercentage.