Sociale forskere konstruerer ofte en hypotese, hvor de antager, at en bestemt generaliseret regel kan anvendes på en befolkning. De tester denne hypotese ved hjælp af tests, der kan være parametriske eller ikke-parametriske. Parametriske test er normalt mere almindelige og undersøges meget tidligere som standardtestene, der anvendes ved udførelse af forskning.
Processen med at udføre en undersøgelse er relativt enkel - du konstruerer en hypotese og antager, at en bestemt "lov" kan anvendes på en befolkning. Derefter foretager du en test og indsamler data, som du derefter analyserer statistisk. De indsamlede data kan normalt repræsenteres som en graf, og den hypotese lov som middelværdien af disse data. Hvis den hypotetiserede lov og middelværdieloven stemmer overens, bekræftes hypotesen.
I nogle tilfælde er det ikke den mest passende måde at søge efter loven på at finde middelværdien på. Et godt eksempel er fordelingen af den samlede indkomst. Hvis du ikke har matchet middelværdien, er det sandsynligvis fordi en eller to milliardærer forstyrrer dine middelværdier. Imidlertid vil en median give et langt mere præcist resultat på den gennemsnitlige indkomst, der mere sandsynligt matcher dine data.
Med andre ord vil en parametrisk test blive brugt, når antagelserne om befolkningen er klare, og der er meget tilgængelig information om det. Spørgsmålene vil være designet til at måle disse specifikke parametre, så dataene derefter kan analyseres som beskrevet ovenfor. En ikke-parametrisk test bruges, når den testede population ikke er helt kendt, og derfor er de undersøgte parametre også ukendte. Selvom den parametriske test bruger gennemsnitsværdier som dens resultater, tager den ikke-parametriske test medianen og bruges derfor normalt, når den originale hypotese ikke passer til dataene.
En parametrisk test er en test designet til at give de data, der derefter vil blive analyseret gennem en gren af videnskab kaldet parametrisk statistik. Parametrisk statistik antager, at en del information om populationen allerede er kendt, nemlig sandsynlighedsfordelingen. Som et eksempel er fordelingen af kropshøjde på hele verden beskrevet af en normal fordelingsmodel. På lignende måde kan enhver kendt distributionsmodel anvendes til et datasæt. At antage, at en bestemt distributionsmodel passer til et datasæt, betyder imidlertid, at du i sagens natur antager, at nogle yderligere oplysninger er kendt om befolkningen, som jeg har nævnt. Sandsynlighedsfordelingen indeholder forskellige parametre, der beskriver den nøjagtige form for fordelingen. Disse parametre er, hvad parametriske test leverer - hvert spørgsmål er skræddersyet til at give en nøjagtig værdi af en bestemt parameter for hvert interviewet individ. Kombineret bruges middelværdien af den parameter til sandsynlighedsfordelingen. Det betyder, at de parametriske test også antager noget om befolkningen. Hvis antagelserne er korrekte, vil parametriske statistikker anvendt på data leveret af en parametrisk test give resultater, der er meget mere nøjagtige og præcise end for en ikke-parametrisk test og statistik.
På en lignende måde som parametrisk test og statistik findes der en ikke-parametrisk test og statistik. De bruges, når de opnåede data ikke forventes at passe til en normal distributionskurve eller ordinære data. Et godt eksempel på ordinære data er den gennemgang, du forlader, når du bedømmer et bestemt produkt eller tjeneste i en skala fra 1 til 5. Almindelige data er generelt opnået fra test, der bruger forskellige placeringer eller ordrer. Derfor er det ikke afhængigt af tal eller nøjagtige værdier for de parametre, som parametriske test er afhængige af. Faktisk bruger den ikke parametre på nogen måde, fordi den ikke antager en bestemt distribution. Normalt foretrækkes en parametrisk analyse frem for en ikke-parametrisk analyse, men hvis den parametriske test ikke kan udføres på grund af ukendt population, er en udvej til ikke-parametriske test nødvendig.
Som jeg har nævnt, antager den parametriske test antagelser om befolkningen. Den har brug for de parametre, der er forbundet med den normale fordeling, der bruges i analysen, og den eneste måde at kende disse parametre er at have en vis viden om populationen. På den anden side er en ikke-parametrisk test, som navnet antyder, ikke afhængig af nogen parametre og antager derfor ikke noget om populationen.
Grundlaget for den statistiske analyse, der vil blive udført på dataene, i tilfælde af parametriske prøver, er sandsynlighedsfordeling. På den anden side findes grundlaget for ikke-parametriske tests ikke - det er helt vilkårligt. Dette resulterer i mere fleksibilitet og gør det lettere at passe hypotesen til de indsamlede data.
Målet for central tendens er en central værdi i en sandsynlighedsfordeling. Og selvom sandsynlighedsfordelingen i tilfælde af ikke-parametriske statistikker er vilkårlig, eksisterer den stadig, og det gør derfor også målet for central tendens. Disse foranstaltninger er imidlertid forskellige. I tilfælde af parametriske prøver anses det for at være middelværdien, mens det i tilfælde af ikke-parametriske prøver anses for at være den gennemsnitlige værdi.
Som jeg har nævnt i den første forskel, varierer oplysninger om populationen mellem parametriske og ikke-parametriske prøver og statistikker. Visse viden om populationen er nemlig absolut nødvendig for en parametrisk analyse, fordi den kræver populationsrelaterede parametre for at give præcise resultater. På den anden side kan en ikke-parametrisk tilgang tages uden forudgående kendskab til befolkningen.