Willekeurige variabelen versus kansverdeling
Statistische experimenten zijn willekeurige experimenten die voor onbepaalde tijd kunnen worden herhaald met een bekende reeks resultaten. Zowel willekeurige variabelen als kansverdelingen worden geassocieerd met dergelijke experimenten. Voor elke willekeurige variabele is er een bijbehorende kansverdeling gedefinieerd door een functie genaamd cumulatieve verdelingsfunctie.
Wat is een willekeurige variabele?
Een willekeurige variabele is een functie die numerieke waarden toekent aan de uitkomsten van een statistisch experiment. Met andere woorden, het is een functie die is gedefinieerd vanuit de steekproefruimte van een statistisch experiment naar de verzameling reële getallen.
Beschouw bijvoorbeeld een willekeurig experiment waarbij je een munt twee keer opgooit. De mogelijke uitkomsten zijn HH, HT, TH en TT (H – heads, T – tales). Laat de variabele X het aantal hoofden zijn dat in het experiment is waargenomen. Dan kan X de waarden 0, 1 of 2 aannemen en is het een willekeurige variabele. Hier zal de willekeurige variabele X de verzameling S={HH, HT, TH, TT} (de steekproefruimte) toewijzen aan de verzameling {0, 1, 2} op een zodanige manier dat HH wordt toegewezen aan 2, HT en TH worden toegewezen aan 1 en TT wordt toegewezen aan 0. In functienotatie kan dit worden geschreven als, X: S → R waarbij X(HH)=2, X(HT)=1, X(TH)=1 en X(TT)=0.
Er zijn twee soorten willekeurige variabelen: discreet en continu, dienovereenkomstig is het aantal mogelijke waarden dat een willekeurige variabele kan aannemen ten hoogste telbaar of niet. In het vorige voorbeeld is de willekeurige variabele X een discrete willekeurige variabele aangezien {0, 1, 2} een eindige verzameling is. Overweeg nu het statistische experiment om de gewichten van studenten in een klas te vinden. Laat Y de willekeurige variabele zijn, gedefinieerd als het gewicht van een student. Y kan elke reële waarde aannemen binnen een bepaald interval. Y is dus een continue willekeurige variabele.
Wat is een kansverdeling?
Kansverdeling is een functie die de kans beschrijft dat een willekeurige variabele bepaalde waarden aanneemt.
Een functie genaamd cumulatieve verdelingsfunctie (F) kan worden gedefinieerd van de verzameling reële getallen tot de verzameling reële getallen als F(x)=P(X ≤ x) (de kans dat X kleiner is dan of gelijk aan x) voor elke mogelijke uitkomst x. Nu kan de cumulatieve verdelingsfunctie van X in het eerste voorbeeld worden geschreven als F(a)=0, als a<0; F(a)=0,25, indien 0≤a<1; F(a)=0,75, als 1≤a<2 en F(a)=1, als a≥2.
In het geval van discrete toevalsvariabelen kan een functie worden gedefinieerd van de verzameling van mogelijke uitkomsten tot de verzameling van reële getallen op zo'n manier dat ƒ(x)=P(X=x) (de kans op X gelijk is aan x) voor elke mogelijke uitkomst x. Deze specifieke functie ƒ wordt de kansmassafunctie van de willekeurige variabele X genoemd. Nu kan de kansmassafunctie van X in het eerste specifieke voorbeeld worden geschreven als ƒ(0)=0,25, ƒ(1)=0,5, ƒ(2)=0,25, en anders ƒ(x)=0. Dus de waarschijnlijkheidsmassafunctie samen met de cumulatieve verdelingsfunctie zal de kansverdeling van X in het eerste voorbeeld beschrijven.
In het geval van continue willekeurige variabelen kan een functie die de kansdichtheidsfunctie (ƒ) wordt genoemd, worden gedefinieerd als ƒ(x)=dF(x)/dx voor elke x waarbij F de cumulatieve verdelingsfunctie is van de continue willekeurige variabele. Het is gemakkelijk in te zien dat deze functie voldoet aan ∫ƒ(x)dx=1. De kansdichtheidsfunctie samen met de cumulatieve verdelingsfunctie beschrijft de kansverdeling van een continue willekeurige variabele. De normale verdeling (wat een continue kansverdeling is) wordt bijvoorbeeld beschreven met behulp van de kansdichtheidsfunctie ƒ(x)=1/√(2πσ2) e^([(x- µ)]2/(2σ2)).
Wat is het verschil tussen toevalsvariabelen en kansverdeling?
• Willekeurige variabele is een functie die waarden van een steekproefruimte associeert met een reëel getal.
• Kansverdeling is een functie die waarden die een willekeurige variabele kan aannemen, associeert met de respectieve kans van optreden.