Prøve mod befolkning
Befolkning og prøve er to vigtige udtryk i emnet 'Statistik'. Enkelt set er population den største samling af genstande, som vi er interesseret i at undersøge, og prøven er en undergruppe af en befolkning. Med andre ord skal stikprøven repræsentere befolkningen med færre, men tilstrækkelige antal poster. En population kan have flere prøver med forskellige størrelser.
Prøve
En prøve kan bestå af to eller flere poster, der er valgt ud af befolkningen. Den lavest mulige størrelse for en prøve er to, og den højeste ville svare til befolkningens størrelse. Der er flere måder at vælge en prøve fra en population. Teoretisk set er valg af en 'tilfældig prøve' den bedste måde at opnå nøjagtige konklusioner om befolkningen. Denne type prøver kaldes også sandsynlighedsprøver, da hvert element i befolkningen har en lige mulighed for at blive inkluderet i en stikprøve.
'Simple random sampling'-teknik er den mest berømte tilfældige samplingsteknik. I dette tilfælde vælges de poster, der skal vælges til prøven, tilfældigt fra populationen. En sådan prøve kaldes en 'Simple Random Sample' eller SRS. En anden populær teknik er 'systematisk prøveudtagning'. I dette tilfælde vælges elementerne til en prøve baseret på en bestemt systematisk rækkefølge.
Eksempel: Hver 10. person i køen vælges til en prøve.
I dette tilfælde er den systematiske rækkefølge hver 10. person. Statistikeren kan frit definere denne rækkefølge på en meningsfuld måde. Der er andre tilfældige stikprøveteknikker, såsom klyngemontering eller stratificeret prøveudtagning, og metoden til valg er lidt forskellig fra ovenstående to.
Til praktiske formål kan der anvendes ikke-tilfældige prøver, såsom bekvemmelighedsprøver, vurderingsprøver, sneboldprøver og målrettede prøver. Mere end, elementer valgt til en ikke tilfældig prøve vedrører en chance. Faktisk har hver post i befolkningen ikke en lige mulighed for at blive inkluderet i en ikke tilfældig prøve. Disse typer prøver kaldes også ikke-sandsynlighedsprøver.
Befolkning
Enhver samling af enheder, som er interessante at undersøge, defineres simpelthen som 'befolkning'. Befolkning er basen for prøver. Ethvert sæt objekter i universet kan være en befolkning, baseret på undersøgelseserklæringen. Generelt bør en population være relativt stor i størrelse og svært at udlede nogle karakteristika ved at overveje dens poster individuelt. Målingerne, der skal undersøges i populationen, kaldes parametre. I praksis estimeres parametrene ved hjælp af statistikker, der er de relevante målinger af prøven.
Eksempel: Ved estimering af gennemsnitligt matematikmærke på 30 studerende i en klasse ud fra gennemsnitlige matematikkarakterer for 5 studerende er parameteren gennemsnitlig matematikmærke for klassen. Statistikken er det gennemsnitlige matematikmærke på 5 studerende.
Prøve mod befolkning
Det interessante forhold mellem prøven og populationen er, at befolkningen kan eksistere uden en stikprøve, men prøven findes muligvis ikke uden populationen. Dette argument beviser endvidere, at en stikprøve afhænger af en befolkning, men interessant nok er de fleste af befolkningsindflydelserne afhængige af stikprøven. Hovedformålet med en prøve er at estimere eller udlede nogle målinger af en population så nøjagtige som muligt. En højere nøjagtighed kan udledes af det samlede resultat opnået fra flere prøver af den samme population snarere end fra en prøve. En anden vigtig ting at vide, er, at når du vælger mere end en prøve fra en population, kan en vare også inkluderes i en anden prøve. Denne sag er kendt som 'prøver med udskiftninger'. Yderligere er investering i de relevante målinger af befolkningen fra en stikprøve og opnå næsten lignende output en gylden mulighed for at spare omkostninger og tidsværdi.
Det er vigtigt at vide, at når prøvestørrelsen øges, øges nøjagtigheden af estimatet for populationsparameteren også. For at have bedre estimater for befolkningen bør logisk set ikke størrelsen være for lille. Desuden skal tilfældige prøver også anses for at have bedre estimater. Derfor er det vigtigt at være opmærksom på størrelsen og tilfældigheden af prøven for at være repræsentativ for at få de bedste estimater for befolkningen.