Befolkning vs prøve standardafvigelse
I statistikker bruges flere indekser til at beskrive et datasæt svarende til dets centrale tendens, spredning og skævhed. Standardafvigelse er et af de mest almindelige mål for spredning af data fra datasættets centrum.
På grund af praktiske vanskeligheder vil det ikke være muligt at gøre brug af data fra hele populationen, når en hypotese testes. Derfor bruger vi dataværdier fra prøver for at foretage konklusioner om populationen. I en sådan situation kaldes disse estimatorer, da de estimerer populationsparameterværdierne.
Det er ekstremt vigtigt at bruge uvildige estimatorer til slutning. En estimator siges at være objektiv, hvis den forventede værdi af denne estimator er lig med populationsparameteren. For eksempel bruger vi prøveværdien som en objektiv estimator for befolkningsgennemsnittet. (Matematisk kan det vises, at den forventede værdi af eksempeldelen er lig med gennemsnittet for populationen). I tilfælde af estimering af populationsstandardafvigelsen er prøvestandardafvigelsen også en objektiv estimator.
Hvad er befolkningsstandardafvigelse?
Når der kan tages hensyn til data fra hele befolkningen (for eksempel i tilfælde af en folketælling), er det muligt at beregne populationsstandardafvigelsen. For at beregne standardafvigelsen for populationen beregnes først afvigelserne af dataværdier fra befolkningsgennemsnittet. Det gennemsnitlige rodkvadrat (kvadratisk gennemsnit) af afvigelser kaldes populationsstandardafvigelsen.
I en klasse på 10 studerende kan data om studerende let indsamles. Hvis en hypotese testes på denne population af studerende, er der ikke behov for at bruge prøveværdier. F.eks. Måles de 10 studerendes vægt (i kilogram) til 70, 62, 65, 72, 80, 70, 63, 72, 77 og 79. Derefter er gennemsnitsvægten af de ti personer (i kilogram) (70 + 62 + 65 + 72 + 80 + 70 + 63 + 72 + 77 + 79) / 10, hvilket er 71 (i kg). Dette er befolkningens gennemsnit.
For at beregne populationsstandardafvigelsen beregner vi afvigelser fra gennemsnittet. De respektive afvigelser fra gennemsnittet er (70 - 71) = -1, (62 - 71) = -9, (65 - 71) = -6, (72 - 71) = 1, (80 - 71) = 9, (70 - 71) = -1, (63 - 71) = -8, (72 - 71) = 1, (77 - 71) = 6 og (79 - 71) = 8. Summen af kvadratet for afvigelse er ( -1)2 + (-9)2 + (-6)2 + 12 + 92 + (-1)2 + (-8)2 + 12 + 62 + 82 = 366. Befolkningsstandardafvigelsen er √ (366/10) = 6,05 (i kg). 71 er den nøjagtige middelvægt for eleverne i klassen og 6.05 er den nøjagtige standardafvigelse for vægt fra 71.
Hvad er prøvestandardafvigelse?
Når data fra en prøve (af størrelse n) bruges til at estimere parametre for populationen, beregnes prøvestandardafvigelsen. Først beregnes afvigelserne af dataværdier fra eksempelmidlet. Da eksempelmidlet bruges i stedet for befolkningsgennemsnittet (hvilket er ukendt), er det at tage det kvadratiske middelværdi ikke passende. For at kompensere for brugen af eksempelmiddel er summen af kvadrater af afvigelser divideret med (n-1) i stedet for n. Eksempelstandardafvigelsen er kvadratroten af dette. I matematiske symboler er S = √ ∑ (xjeg-x)2 / (n-1), hvor S er prøvestandardafvigelsen, ẍ er prøven gennemsnit og xjeger datapunkterne.
Antag nu, at i det foregående eksempel er befolkningen studerende på hele skolen. Derefter vil klassen kun være en prøve. Hvis denne prøve bruges i estimatet, vil prøvestandardafvigelsen være √ (366/9) = 6,38 (i kg), da 366 blev divideret med 9 i stedet for 10 (prøvestørrelsen). Det faktum at observere er, at dette ikke garanteres at være den nøjagtige populationsstandardafvigelsesværdi. Det er kun et skøn for det.
Hvad er forskellen mellem populationsstandardafvigelse og prøvestandardafvigelse? • Befolkningsstandardafvigelse er den nøjagtige parameterværdi, der bruges til at måle spredningen fra centrum, mens prøvestandardafvigelsen er en objektiv estimator for det. • Befolkningsstandardafvigelse beregnes, når alle data om hver enkelt af befolkningen er kendt. Ellers beregnes prøvestandardafvigelsen. • Befolkningsstandardafvigelse er givet ved σ = √ ∑ (xi-µ)2/ n hvor µ er populationens gennemsnit og n er populationsstørrelsen, men prøvestandardafvigelsen er angivet med S = √ ∑ (xi-ẍ)2 / (n-1) hvor ẍ er prøven gennemsnit og n er prøvestørrelsen.
|