Korrelation vs covariance
Korrelation og samvariation er nært beslægtede begreber i teoretisk statistik. De er vigtige for at bestemme forholdet mellem to tilfældige variabler.
Hvad er korrelation?
Korrelation er et mål på styrken i forholdet mellem to variabler. Korrelationskoefficienten kvantificerer ændringsgraden for en variabel baseret på ændringen af den anden variabel. I statistikker er sammenhængen forbundet med begrebet afhængighed, som er det statistiske forhold mellem to variabler
Pearsons korrelationskoefficient eller bare korrelationskoefficienten r er en værdi mellem -1 og 1 (-1≤r≤ + 1). Det er den mest almindeligt anvendte korrelationskoefficient og gælder kun for et lineært forhold mellem variablerne. Hvis r = 0 findes der ingen forhold, og hvis r≥0 er forholdet direkte proportionalt; værdien af den ene variabel stiger med stigningen fra den anden. Hvis r <0 er forholdet omvendt proportionalt; den ene variabel falder, efterhånden som den anden stiger.
På grund af linearitetstilstanden kan korrelationskoefficient r også bruges til at bestemme tilstedeværelsen af et lineært forhold mellem variablerne.
Hvad er covariance?
I statistisk teori er samvariation et mål for, hvor meget to tilfældige variabler ændrer sig sammen. Med andre ord er samvariation et mål på styrken af korrelationen mellem to tilfældige variabler.
I et andet perspektiv kan det ses, at korrelation kun er den normaliserede version af covariance, hvor samvariationen er divideret med produktet af standardafvigelserne for de to tilfældige variabler. Covariansområdet kan være stort; derfor er det ikke let at sammenligne. Denne vanskelighed overvindes ved at bringe covariansværdierne til et interval, hvor det kan sammenlignes ved at normalisere det (ligesom hvad z-score gør). Selvom samvariationen og variansen er knyttet til hinanden på ovenstående måde, er deres sandsynlighedsfordeling ikke knyttet til hinanden på en enkel måde og skal behandles separat.
Hvad er forskellen mellem korrelation og samvariation?
• Både korrelation og samvariation er målinger af forholdet mellem to tilfældige variabler. Korrelation er målet for styrken af lineariteten af de to variabler, og samvariation er et mål på styrken af korrelationen.
• Korrelationskoefficientværdier er en værdi mellem -1 og +1, hvorimod covariansområdet ikke er konstant, men kan enten være positivt eller negativt. Men hvis de tilfældige variabler standardiseres før beregningen af kovariansen, er kovariansen lig med korrelationen og har en værdi mellem -1 og +1.