Standardafvigelse vs gennemsnit
I beskrivende og inferentiel statistik bruges flere indekser til at beskrive et datasæt svarende til dets centrale tendens, spredning og skævhed. I statistisk inferens er disse almindeligt kendt som estimatorer, da de estimerer populationsparameterværdierne.
Central tendens henviser til og lokaliserer centrum for fordelingen af værdier. Gennemsnit, tilstand og median er de mest anvendte indekser til beskrivelse af et datasæts centrale tendens. Spredning er mængden af spredning af data fra midten af distributionen. Område og standardafvigelse er de mest anvendte målinger af spredning. Pearsons skævhedskoefficienter bruges til at beskrive skævheden i en fordeling af data. Her refererer skevhed til, om datasættet er symmetrisk omkring centrum eller ej, og hvis ikke, hvor skævt det er.
Hvad betyder det??
Middelværdi er det mest almindeligt anvendte indeks for central tendens. Givet et datasæt beregnes gennemsnittet ved at tage summen af alle dataværdier og derefter dividere det med antallet af data. For eksempel måles vægten på 10 personer (i kg) til at være 70, 62, 65, 72, 80, 70, 63, 72, 77 og 79. Derefter kan de gennemsnitlige vægt af de ti personer (i kg) være beregnet som følger. Summen af vægtene er 70 + 62 + 65 + 72 + 80 + 70 + 63 + 72 + 77 + 79 = 710. Gennemsnit = (sum) / (antal data) = 710/10 = 71 (i kg).
Som i dette særlige eksempel er middelværdien af et datasæt muligvis ikke et datapunkt for sættet, men vil være unikt for et givet datasæt. Middelværdien har de samme enheder som de originale data. Derfor kan det markeres på samme akse som dataene og kan bruges i sammenligninger. Der er heller ingen tegnbegrænsning for gennemsnittet af et datasæt. Det kan være negativt, nul eller positivt, da summen af datasættet kan være negativt, nul eller positivt.
Hvad er standardafvigelse?
Standardafvigelse er det mest almindeligt anvendte spredningsindeks. For at beregne standardafvigelsen beregnes først afvigelserne af dataværdier fra gennemsnittet. Rodkvadratværdien af afvigelser kaldes standardafvigelsen.
I det foregående eksempel er de respektive afvigelser fra gennemsnittet (70 - 71) = -1, (62-71) = -9, (65-71) = -6, (72-71) = 1, (80- 71) = 9, (70-71) = -1, (63-71) = -8, (72-71) = 1, (77-71) = 6 og (79-71) = 8. Summen af afvigelsesfelt er (-1) 2+ (-9)2+ (-6)2+ 12+92+ (-1)2+ (-8)2+ 12+ 62 + 82 = 366. Standardafvigelsen er √ (366/10) = 6,05 (i kg). Herfra kan det konkluderes, at størstedelen af dataene er i intervallet 71 ± 6,05, forudsat at datasættet ikke er meget skævt, og det er det faktisk i dette særlige eksempel.
Da standardafvigelsen har de samme enheder som de originale data, giver den os et mål for, hvor meget afvigelse dataene er fra centrum; større standardafvigelse større spredning. Standardafvigelsen vil også være en ikke-negativ værdi uanset arten af data i datasættet.
Hvad er forskellen mellem standardafvigelse og middelværdi? • Standardafvigelse er et mål for spredning fra centrum, hvorimod middel måler placeringen af midten af et datasæt. • Standardafvigelse er altid en ikke-negativ værdi, men middelværdien kan tage enhver reel værdi.
|