Forskel mellem gennemsnit, median og tilstand

Gennemsnit vs median vs tilstand
 

Gennemsnit, median og tilstand er de primære målinger af central tendens brugt i beskrivende statistik. De er helt forskellige fra hinanden, og sager, hvor de bruges til at opsummere dataene, er også forskellige.

Betyde

Det aritmetiske middelværdi er summen af ​​dataværdier divideret med antallet af dataværdier, dvs..

 

Hvis dataene kommer fra et prøveområde kaldes det et eksempelmiddel (), som er en beskrivende statistik over prøven. Selvom det er den mest anvendte beskrivende foranstaltning for en prøve, er det ikke en robust statistik. Det er meget følsomt over for outliers og svingninger.

Overvej for eksempel gennemsnitsindkomsten for borgerne i en bestemt by. Da alle dataværdier summeres og derefter opdeles, påvirker indkomsten for en ekstremt velhavende gennemsnittet betydeligt. Derfor er middelværdierne ikke en god repræsentation af dataene altid.

I tilfælde af et vekslende signal varierer strømmen, der passerer gennem et element med jævne mellemrum fra den positive retning til den negative retning, og vice versa. Hvis vi tager den gennemsnitlige strøm, der passerer gennem elementet i en enkelt periode, vil det give en 0, hvilket betyder, at ingen strøm er passeret gennem elementet, hvilket åbenbart ikke er sandt. Derfor er aritmetiske gennemsnit heller ikke et godt mål i dette tilfælde.

Det aritmetiske middelværdi er en god indikator, når dataene er jævnt fordelt. For en normal fordeling er middelværdien lig med tilstanden og medianen. Det har også de laveste rester, når man betragter den gennemsnitlige firkantede rodfejl; derfor den bedste beskrivende foranstaltning, når det kræves at repræsentere et datasæt med et enkelt nummer.

median

Værdierne for det midterste datapunkt efter at have arrangeret alle dataværdier i stigende rækkefølge defineres som median for datasættet. Median er 2. kvartil, 5. decil og 50. percentil.

• Hvis antallet af observationer (datapunkter) er underligt, er median observationen nøjagtigt i midten af ​​den ordnede liste.

• Hvis antallet af observationer (datapunkter) er jævnt, er medianen gennemsnittet af de to midterste observationer i den ordnede liste.

Median opdeler observationen i to grupper; dvs. en gruppe (50%) af værdier, der er højere, og en gruppe (50%) af værdier, der er lavere end medianen. Medianer bruges specifikt i skæve fordelinger og repræsenterer data temmelig bedre end det aritmetiske middelværdi.

Mode

Mode er det mest forekommende tal i et sæt observationer. Mode for et datasæt beregnes ved at finde frekvensen for hvert element i sættet.

• Hvis der ikke forekommer nogen værdi mere end én gang, har datasættet ingen tilstand.

• Ellers er enhver værdi, der opstår med den største frekvens, en tilstand af datasættet.

Der kan findes mere end 1 tilstand i et sæt; Derfor er tilstand ikke en unik statistik over et datasæt. I en ensartet fordeling er der én tilstand. Funktionen for en diskret sandsynlighedsfordeling er det punkt, hvor sandsynlighedsmassefunktionen når sit højeste punkt. Vi kan sige det fra fortolkningerne ovenfor globale maksima er tilstande.

Overvej anvendelsen af ​​alle tre mål på følgende datasæt.

DATA: 1, 1, 2, 3, 5, 5, 5, 5, 6, 6, 8, 8, 9, 9, 9, 9, 9, 10, 10, 10, 14, 14, 15, 15 , 15

Gennemsnit = (1+ 1+ 2+ 3+ 5+ 5+ 5+ 5+ 6+ 6+ 8+ 8+ 9+ 9+ 9+ 9+ 10+ 10+ 10+ 14+ 14+ 15+ 15+ 15 ) / 25 = 8,12

Median = 9 (13. element)

Mode = 9 (frekvens på 9 = 5)

Hvad er forskellen mellem gennemsnit, median og tilstand?

• Aritmetisk middelværdi er summen af ​​værdierne (observationer) divideret med antallet af observationer. Det er ikke en robust statistik og er meget afhængig af den normale fordelingskarakter inden for den betragtede distribution. En enkelt outlier kan forårsage et markant skift i gennemsnittet, hvilket giver relativt vildledende værdier. Konceptet kan udvides til geometrisk middelværdi, harmonisk middelværdi, vægtet gennemsnit og så videre.

• Median er midtværdierne i sætet af observationer, og det er relativt mindre påvirket af outliers. Det kan give et godt skøn som en sammenfattende statistik i meget skæve sager.

• Mode er de mest almindelige observationsværdier i datasættet. Hvis fordelingen er positiv skæv, ligger tilstanden tilbage til medianen, og hvis den er negativt skæv, ligger tilstanden lige til medianen.

• Hvis det er positivt skævt, er middelet rigtigt med medianen; hvis negativt skævt middelværdi er til venstre for medianen.

• I normal fordeling er alle tre, middelværdi, tilstand og median lige.