Tilfældige variabler vs sandsynlighedsfordeling
Statistiske eksperimenter er tilfældige eksperimenter, der kan gentages på ubestemt tid med et kendt sæt af resultater. Både tilfældige variabler og sandsynlighedsfordelinger er forbundet med sådanne eksperimenter. For hver tilfældig variabel er der en tilknyttet sandsynlighedsfordeling defineret af en funktion kaldet kumulativ fordelingsfunktion.
Hvad er en tilfældig variabel?
En tilfældig variabel er en funktion, der tildeler numeriske værdier til resultaterne af et statistisk eksperiment. Med andre ord er det en funktion defineret fra prøverummet i et statistisk eksperiment til sættet af reelle tal.
Overvej for eksempel et tilfældigt eksperiment med at vende en mønt to gange. De mulige resultater er HH, HT, TH og TT (H - hoveder, T - tales). Lad variablen X være antallet af hoveder, der er observeret i eksperimentet. Derefter kan X tage værdierne 0, 1 eller 2, og det er en tilfældig variabel. Her vil den tilfældige variabel X kortlægge sættet S = HH, HT, TH, TT (prøveområdet) til sætet 0, 1, 2 på en sådan måde, at HH er kortlagt til 2, HT og TH er kortlagt til 1 og TT er kortlagt til 0. I funktionsnotation kan dette skrives som, X: S → R, hvor X (HH) = 2, X (HT) = 1, X (TH) = 1 og X ( TT) = 0.
Der er to typer tilfældige variabler: diskret og kontinuerlig, i overensstemmelse hermed er antallet af mulige værdier, som en tilfældig variabel kan antage, højst tælles eller ej. I det foregående eksempel er den tilfældige variabel X en diskret tilfældig variabel, da 0, 1, 2 er et endeligt sæt. Overvej nu det statistiske eksperiment med at finde de studerendes vægt i en klasse. Lad Y være den tilfældige variabel defineret som en elevs vægt. Y kan tage enhver reel værdi inden for et specifikt interval. Derfor er Y en kontinuerlig tilfældig variabel.
Hvad er en sandsynlighedsfordeling?
Sandsynlighedsfordeling er en funktion, der beskriver sandsynligheden for, at en tilfældig variabel tager visse værdier.
En funktion kaldet kumulativ fordelingsfunktion (F) kan defineres fra sættet af reelle tal til sættet med reelle tal som F (x) = P (X ≤ x) (sandsynligheden for at X er mindre end eller lig med x) for hvert muligt resultat x. Nu kan den kumulative fordelingsfunktion af X i det første eksempel skrives som F (a) = 0, hvis a<0; F(a)=0.25, if 0≤a<1; F(a)=0.75, if 1≤a<2 and F(a)=1, if a≥2.
I tilfælde af diskrete tilfældige variabler kan en funktion defineres fra sættet af mulige resultater til sættet af reelle tal på en sådan måde, at ƒ (x) = P (X = x) (sandsynligheden for at X er lig med x) for hvert muligt resultat x. Denne særlige funktion ƒ kaldes sandsynlighedsmassefunktionen for den tilfældige variabel X. Nu kan sandsynlighedsmassefunktionen af X i det første særlige eksempel skrives som ƒ (0) = 0,25, ƒ (1) = 0,5, ƒ (2) = 0,25, og ƒ (x) = 0 ellers. Således vil sandsynlighedsmassefunktion sammen med den kumulative fordelingsfunktion beskrive sandsynlighedsfordelingen af X i det første eksempel.
I tilfælde af kontinuerlige tilfældige variabler kan en funktion kaldet sandsynlighedsdensitetsfunktionen (ƒ) defineres som ƒ (x) = dF (x) / dx for hver x, hvor F er den kumulative fordelingsfunktion for den kontinuerlige tilfældige variabel. Det er let at se, at denne funktion tilfredsstiller ∫ƒ (x) dx = 1. Sandsynlighedsdensitetsfunktionen sammen med den kumulative fordelingsfunktion beskriver sandsynlighedsfordelingen for en kontinuerlig tilfældig variabel. For eksempel er den normale fordeling (som er en kontinuerlig sandsynlighedsfordeling) beskrevet under anvendelse af sandsynlighedsdensitetsfunktionen ƒ (x) = 1 / √ (2πσ2) e ^ ([(x-µ)]2/ (2σ2)).
Hvad er forskellen mellem tilfældige variabler og sandsynlighedsfordeling? • Tilfældig variabel er en funktion, der knytter værdier af en prøveplads til et reelt tal. • Sandsynlighedsfordeling er en funktion, der knytter værdier, som en tilfældig variabel kan tage til den respektive sandsynlighed for forekomst.
|