Regression vs ANOVA
Regression og ANOVA (analyse af variation) er to metoder i den statistiske teori til at analysere adfærd af en variabel sammenlignet med en anden. I regression er det ofte variationen i afhængig variabel baseret på uafhængig variabel, mens det i ANOVA er variationen af attributterne for to prøver fra to populationer.
Mere om regression
Regression er en statistisk metode, der bruges til at tegne forholdet mellem to variabler. Ofte når data indsamles kan der være variabler, der er afhængige af andre. Den nøjagtige forbindelse mellem disse variabler kan kun fastlægges ved regressionsmetoder. At bestemme dette forhold hjælper med at forstå og forudsige adfærd fra en variabel til den anden.
Den mest almindelige anvendelse af regressionsanalysen er at estimere værdien af den afhængige variabel for en given værdi eller række af værdier for de afhængige variabler. For eksempel ved hjælp af regression kan vi etablere forholdet mellem råvareprisen og forbruget baseret på de data, der er indsamlet fra en tilfældig stikprøve. Regressionsanalyse vil producere en regressionsfunktion af datasættet, som er en matematisk model, der bedst passer til de tilgængelige data. Dette kan nemt repræsenteres af en scatter-plot. Grafisk regression svarer til at finde den bedste passende kurve for give-datasættet. Kurvens funktion er regressionsfunktionen. Ved hjælp af den matematiske model kan brugen af en vare forudsiges for en given pris.
Derfor er regressionsanalysen vidt brugt til at forudsige og forudsige. Det bruges også til at etablere sammenhænge i eksperimentelle data inden for områderne fysik, kemi og mange naturvidenskabelige og ingeniørdiscipliner. Hvis forholdet eller regressionsfunktionen er en lineær funktion, er processen kendt som en lineær regression. I scatter-plot kan det repræsenteres som en lige linje. Hvis funktionen ikke er en lineær kombination af parametrene, er regressionen ikke-lineær.
Mere om ANOVA (Variansanalyse)
ANOVA involverer ikke eksplicit analyse af en forbindelse mellem to eller flere variabler. Det kontrollerer snarere, om to eller flere prøver fra forskellige populationer har samme gennemsnit. Overvej for eksempel testresultaterne af en eksamen, der afholdes for en karakter i skolen. Selvom testene er forskellige, kan ydelsen være ens fra klasse til klasse. En metode til at verificere dette er ved at sammenligne midlerne til hver klasse. ANOVA eller ANALYS OF Variance tillader, at denne hypotese testes. Grundlæggende kan ANOVA betragtes som en forlængelse af t-testen, hvor middelet til de to prøver trukket fra to populationer sammenlignes.
Grundlæggende idé med ANOVA er at overveje variationen i prøven og variationen mellem prøverne. Variationen inden for prøven kan tilskrives tilfældigheden, mens variationen i prøverne kan tilskrives både tilfældighed og andre eksterne faktorer. Variansanalyse er baseret på tre modeller; fast effekter model, tilfældige effekter model og blandede effekter model.
Hvad er forskellen mellem Regression og ANOVA?
• ANOVA er analysen af variation mellem to eller flere prøver, mens regression er analysen af en forbindelse mellem to eller flere variabler.
• ANOVA-teori anvendes ved hjælp af tre grundlæggende modeller (faste effekter model, tilfældige effekter model og blandede effekter model), mens regression anvendes ved hjælp af to modeller (lineær regressionsmodel og multiple regressionsmodel).
• ANOVA og Regression er begge to versioner af den generelle lineære model (GLM). ANOVA er baseret på kategoriske prediktorvariabler, mens regression er baseret på kvantitative prediktorvariabler.
• Regression er den mere fleksible teknik, og den bruges til at forudsige og forudsige, mens ANOVA bruges til at sammenligne ligheden mellem to eller flere populationer.