Forskel mellem korrelation og regression

Korrelation og regression er de to analyser, der er baseret på multivariat distribution. En multivariat distribution er beskrevet som en fordeling af flere variabler. Korrelation beskrives som den analyse, der lader os kende tilknytningen eller fraværet af forholdet mellem to variabler 'x' og 'y'. I den anden ende, Regression analyse, forudsiger værdien af ​​den afhængige variabel baseret på den kendte værdi af den uafhængige variabel under forudsætning af, at det gennemsnitlige matematiske forhold mellem to eller flere variabler.

Forskellen mellem korrelation og regression er et af de ofte stillede spørgsmål i interviews. Derudover er mange mennesker uklarheder i forståelsen af ​​disse to. Så læs denne artikel fuldt ud for at få en klar forståelse af disse to.

Indhold: Korrelation mod regression

  1. Sammenligningstabel
  2. Definition
  3. Vigtige forskelle
  4. Konklusion

Sammenligningstabel

Grundlag for sammenligningKorrelationRegression
BetyderKorrelation er et statistisk mål, der bestemmer ko-forhold eller tilknytning af to variabler.Regression beskriver, hvordan en uafhængig variabel er numerisk relateret til den afhængige variabel.
AnvendelseAt repræsentere lineært forhold mellem to variabler.At passe til den bedste linje og estimere en variabel på grundlag af en anden variabel.
Afhængige og uafhængige variablerIngen forskelBegge variabler er forskellige.
indikererKorrelationskoefficient angiver, i hvilket omfang to variabler bevæger sig sammen.Regression angiver virkningen af ​​en enhedsændring i den kendte variabel (x) på den estimerede variabel (y).
ObjektivAt finde en numerisk værdi, der udtrykker forholdet mellem variabler.At estimere værdier for tilfældig variabel på grundlag af værdierne for den faste variabel.

Definition af korrelation

Udtrykket korrelation er en kombination af to ord 'Co' (sammen) og relation (forbindelse) mellem to mængder. Korrelation er, når man på tidspunktet for studiet af to variabler observeres, at en enhedsændring i en variabel gentages ved en ækvivalent ændring i en anden variabel, dvs. direkte eller indirekte. Ellers siges variablerne at være ukorrelerede, når bevægelsen i en variabel ikke udgør nogen bevægelse i en anden variabel i en bestemt retning. Det er en statistisk teknik, der repræsenterer styrken af ​​forbindelsen mellem par af variabler.

Korrelation kan være positiv eller negativ. Når de to variabler bevæger sig i den samme retning, dvs. en stigning i en variabel vil resultere i den tilsvarende stigning i en anden variabel og vice versa, betragtes variablerne som positivt korrelerede. For eksempel: overskud og investering.

Tværtimod, når de to variabler bevæger sig i forskellige retninger, på en sådan måde, at en stigning i en variabel vil resultere i et fald i en anden variabel og vice versa, er denne situation kendt som negativ korrelation. For eksempel: Pris og efterspørgsel efter et produkt.

Målene for korrelation er angivet som under:

  • Karl Pearsons korrelationskoefficient for produkt-øjeblik
  • Spearmans rangkorrelationskoefficient
  • Spredningsdiagram
  • Koefficient for samtidige afvigelser

Definition af regression

En statistisk teknik til estimering af ændringen i den metriske afhængige variabel på grund af ændringen i en eller flere uafhængige variabler, baseret på det gennemsnitlige matematiske forhold mellem to eller flere variabler, kaldes regression. Det spiller en betydelig rolle i mange menneskelige aktiviteter, da det er et kraftfuldt og fleksibelt værktøj, der bruges til at forudsige tidligere, nutidige eller fremtidige begivenheder på grundlag af tidligere eller nutidige begivenheder.. For eksempel: På baggrund af tidligere poster kan en virksomheds fremtidige fortjeneste estimeres.

I en simpel lineær regression er der to variabler x og y, hvor y afhænger af x eller siger påvirket af x. Her kaldes y som afhængig eller kriterievariabel og x er uafhængig eller forudsigelsesvariabel. Regressionslinjen for y på x udtrykkes som under:

y = a + bx

hvor, a = konstant,
b = regressionskoefficient,
I denne ligning er a og b den to regressionsparameter.

Vigtige forskelle mellem korrelation og regression

Nedenstående punkter forklarer forskellen mellem korrelation og regression detaljeret:

  1. Et statistisk mål, der bestemmer ko-forholdet eller forbindelsen mellem to mængder er kendt som korrelation. Regression beskriver, hvordan en uafhængig variabel er numerisk relateret til den afhængige variabel.
  2. Korrelation bruges til at repræsentere det lineære forhold mellem to variabler. Tværtimod bruges regression til at passe til den bedste linje og estimere en variabel på grundlag af en anden variabel.
  3. I korrelation er der ingen forskel mellem afhængige og uafhængige variabler, dvs. korrelation mellem x og y svarer til y og x. Omvendt er regressionen af ​​y på x forskellig fra x på y.
  4. Korrelation angiver styrken af ​​forbindelsen mellem variabler. I modsætning til afspejler regression virkningen af ​​enhedsændringen i den uafhængige variabel på den afhængige variabel.
  5. Korrelation sigter mod at finde en numerisk værdi, der udtrykker forholdet mellem variabler. I modsætning til regression, hvis mål er at forudsige værdier for den tilfældige variabel på grundlag af værdierne for den faste variabel.

Konklusion

Med ovenstående diskussion er det åbenlyst, at der er en stor forskel mellem disse to matematiske begreber, skønt disse to studeres sammen. Korrelation bruges, når forskeren ønsker at vide, om de variabler, der undersøges, er korrelerede eller ej, hvis ja, hvad er styrken i deres tilknytning. Pearsons korrelationskoefficient betragtes som det bedste mål for korrelation. I regressionsanalyse etableres et funktionelt forhold mellem to variabler for at gøre fremtidige fremskrivninger på begivenheder.