Kategoriske data kontra numeriske data
Data er fakta eller information indsamlet med henblik på reference eller analyse. Ofte indsamles disse data som en attribut for det pågældende emne. Denne attribut kan variere fra en til en anden, derfor kan denne varierende attribut betragtes som en variabel. Variablerne kan antage forskellige former for værdier, og disse er iboende i de indsamlede data.
Variabler kan være enten kvalitative eller kvantitative; dvs. hvis variablen er kvantitativ, er svarene tal, og størrelsen af den målte attribut kan angives med en vis nøjagtighed. Den anden type, de kvalitative variabler måler de kvalitative attributter, og de værdier, der er antaget af variablerne, kan ikke angives med hensyn til størrelse eller størrelse. Variablerne i sig selv kaldes kategoriske variabler, og data indsamlet ved hjælp af en kategorisk variabel er kategoriske data.
Mere om numeriske data
Numeriske data er dybest set de kvantitative data, der er opnået fra en variabel, og værdien har en fornemmelse af størrelse / størrelse. De opnåede numeriske data er yderligere opdelt i yderligere tre kategorier baseret på teorien udviklet af Stanley Smith Stevens. Numeriske data kan være enten ordinale, intervaller eller forhold. Datatypen bestemmes af metoden til måling af værdierne, og typerne er kendt som målingsniveauer.
Vægt for en person, afstanden mellem to punkter, temperatur og prisen på en bestand er eksempler på numeriske data.
I statistikker er størstedelen af metoderne afledt til analyse af numeriske data. Grundlæggende beskrivende statistikker og regression og andre inferentielle metoder anvendes hovedsageligt til analyse af numeriske data.
Mere om kategoriske data
Kategoriske data er værdier for en kvalitativ variabel, ofte et tal, et ord eller et symbol. De fremhæver det faktum, at variablen i det betragtede tilfælde hører til et af de forskellige tilgængelige valg. Derfor hører de til en af kategorierne; deraf navnet kategorisk.
Den politiske tilknytning af en person, en persons nationalitet, en persons yndlingsfarve og en patients blodgruppe er kvalitative egenskaber. Nogle gange kan et tal opnås som en kategorisk værdi, men tallet i sig selv repræsenterer ikke størrelsen af den målte attribut. Postnummer er et eksempel.
Eventuelle kategoriske værdier hører også til den nominelle datatype, som er en anden type baseret på målingsniveauer. Metoder, der bruges til analyse af kategoriske data er forskellige fra numeriske data, men det underliggende princip kan være det samme.
Hvad er forskellen mellem kategoriske og numeriske data?
• Numeriske data er værdier opnået for kvantitativ variabel og bærer en følelse af størrelse relateret til variablenes kontekst (de er derfor altid tal eller symboler, der bærer en numerisk værdi). Kategoriske data er værdier opnået for en kvalitativ variabel; kategoriske datanumre har ikke en følelse af størrelse.
• Numeriske data hører altid til enten ordinal, ratio eller intervaltype, mens kategoriske data hører til nominel type.
• Metoder, der bruges til at analysere kvantitative data, er forskellige fra metoderne, der bruges til kategoriske data, selvom principperne er de samme, i det mindste har applikationen betydelige forskelle.
• Numeriske data analyseres ved hjælp af statistiske metoder i beskrivende statistik, regression, tidsserier og mange flere.
• For kategoriske data anvendes der normalt beskrivende metoder og grafiske metoder. Nogle ikke-parametriske tests bruges også.