Spredning vs skevhed
I statistik og sandsynlighedsteori skal variationen i fordelingen ofte udtrykkes kvantitativ med henblik på sammenligning. Spredning og skevehed er to statistiske begreber, hvor formen af fordelingen præsenteres i en kvantitativ skala.
Mere om spredning
I statistikker er spredningen variationen af en tilfældig variabel eller dens sandsynlighedsfordeling. Det er et mål for, hvor langt datapunkter ligger fra den centrale værdi. For at udtrykke dette kvantitativt anvendes målinger af spredning i beskrivende statistik.
Variation, standardafvigelse og interkvartilinterval er de mest anvendte målinger af spredning.
Hvis dataværdierne har en bestemt enhed på grund af skalaen, kan målingerne af spredning også have de samme enheder. Interdecile rækkevidde, rækkevidde, middelforskel, median absolut afvigelse, gennemsnitlig absolut afvigelse og afstandsstandardafvigelse er mål for spredning med enheder.
I modsætning hertil er der målinger af spredning, som ikke har nogen enheder, dvs. dimensionsfri. Variation, variationskoefficient, kvartil spredningskoefficient og Relativ middelforskel er målinger af spredning uden enheder.
Spredning i et system kan stamme fra fejl, såsom instrumentale og observationsfejl. Tilfældige variationer i selve prøven kan også forårsage variationer. Det er vigtigt at have en kvantitativ idé om variationen i data, inden man drager andre konklusioner fra datasættet.
Mere om Skewness
I statistikker er skævhed et mål på asymmetri af sandsynlighedsfordelingen. Skewness kan være positiv eller negativ eller i nogle tilfælde ikke-eksisterende. Det kan også betragtes som et mål for modregning fra den normale distribution.
Hvis skævheden er positiv, er hovedparten af datapunkter centreret til venstre for kurven, og den højre hale er længere. Hvis skævheden er negativ, er hovedparten af datapunkter centreret mod højre for kurven, og den venstre hale er ret lang. Hvis skævheden er nul, er populationen normalt fordelt.
I en normal fordeling, det er når kurven er symmetrisk, har middelværdien, medianen og tilstand den samme værdi. Hvis skævheden ikke er nul, holder denne egenskab ikke, og middelværdien, tilstand og median kan have forskellige værdier.
Pearsons første og anden koefficient for skævhed bruges ofte til at bestemme skævheden for fordelingen.
Pearsons første skævhedskaffe = (middel - tilstand) / (standardafvigelse)
Pearsons andet skevhedskaffe = 3 (middel - tilstand) / (satndard afvigelse)
I mere følsomme tilfælde anvendes justeret Fisher-Pearson standardiseret momentkoefficient.
G = n / (n-1) (n-2) ∑ni = 1 ((Y-ӯ) / r)3
Hvad er forskellen mellem spredning og skevhed?
Spredning bekymrer sig om det område, som datapunkterne er fordelt på, og skævheden angår fordelingenes symmetri.
Både målinger af spredning og skævhed er beskrivende mål, og skævhedskoefficient giver en indikation af fordelingen.
Målinger af spredning bruges til at forstå datapunkternes rækkevidde og forskydes fra middelværdien, mens skævhed bruges til at forstå tendensen til variationen af datapunkter i en bestemt retning.