Afvigelse vs standardafvigelse
Afvigelse vs standardafvigelse
I beskrivende og inferentiel statistik bruges flere indekser til at beskrive et datasæt svarende til dets centrale tendens, spredning og skævhed. I statistisk inferens er disse almindeligt kendt som estimatorer, da de estimerer populationsparameterværdierne.
Spredning er målet for spredning af data rundt om midten af datasættet. Standardafvigelse er et af de mest anvendte målinger af spredning. Afvigelserne for hvert datapunkt fra gennemsnittet tages i betragtning ved beregningen af standardafvigelsen. Derfor kan man hævde, at standardafvigelsen sammen med middelværdien vil give et næsten tilstrækkeligt billede af et datasæt.
Overvej følgende datasæt. Vægtene på 10 personer (i kilogram) måles til 70, 62, 65, 72, 80, 70, 63, 72, 77 og 79. Derefter er middelvægten af de ti personer (i kilogram) 71 (i kg) ).
Hvad er afvigelse?
I statistik betyder afvigelse det beløb, hvormed et enkelt datapunkt adskiller sig fra en fast værdi som gennemsnittet. Lad k generelt være en fast værdi og x1,x2,… , xn betegner et datasæt. Derefter afvigelsen af xj fra k er defineret til at være (xj- k).
For eksempel er i de ovennævnte datasæt de respektive afvigelser fra gennemsnittet (70 - 71) = -1, (62 - 71) = -9, (65 - 71) = -6, (72 - 71) = 1, (80 - 71) = 9, (70 - 71) = -1, (63 - 71) = -8, (72 - 71) = 1, (77 - 71) = 6 og (79 - 71) = 8.
Hvad er standardafvigelse?
Når der kan tages hensyn til data fra hele befolkningen (for eksempel i tilfælde af en folketælling), er det muligt at beregne populationsstandardafvigelsen. For at beregne standardafvigelsen for populationen beregnes først afvigelserne af dataværdier fra befolkningsgennemsnittet. Det gennemsnitlige rodkvadrat (kvadratisk gennemsnit) af afvigelser kaldes populationsstandardafvigelsen. I symboler er σ = √ ∑ (xjeg-μ)2 / n hvor µ er populationens gennemsnit og n er populationsstørrelsen.
Når data fra en prøve (af størrelse n) bruges til at estimere parametre for populationen, beregnes prøvestandardafvigelsen. Først beregnes afvigelserne af dataværdier fra eksempelmidlet. Da eksempelmidlet bruges i stedet for befolkningsgennemsnittet (hvilket er ukendt), er det at tage det kvadratiske middelværdi ikke passende. For at kompensere for brugen af prøveværdien divideres summen af kvadrater af afvigelser med (n-1) i stedet for n. Eksempelstandardafvigelsen er kvadratroten af dette. I matematiske symboler er S = √ ∑ (xjeg-x)2 / (n-1), hvor S er prøvestandardafvigelsen, ẍ er eksempelmidlet og xi er datapunkter.
I det forrige datasæt er summen af kvadrater for afvigelse (-1)2 + (-9)2 + (-6)2 + 12 + 92 + (-1)2 + (-8)2 + 12 + 62 + 82 = 366. Populationsstandardafvigelsen er således √ (366/10) = 6,05 (i kg). (Forudsat at den betragtede befolkning består af de 10 personer, som dataene er hentet fra).
Hvad er forskellen mellem afvigelse og standardafvigelse? • Standardafvigelse er et statistisk indeks og en estimator, men afvigelse er det ikke. • Standardafvigelse er et mål for spredning af en klynge af data fra centrum, mens afvigelse refererer til det beløb, med hvilket et enkelt datapunkt adskiller sig fra en fast værdi. |