Aflați ce simplă regresie liniară este și cum funcționează

O abordare statistică de bază pentru analiza datelor cantitative

Amuzant Colin Broug, Fotograf. © 10 iunie 2010 Stock.xchng

Modelele de regresie liniară sunt utilizate pentru a arăta sau prezice relația dintre două variabile sau factori . Factorul care este prezis (factorul pentru care rezolvă ecuația) este numit variabilă dependentă. Factorii care sunt utilizați pentru a prezice valoarea variabilei dependente sunt numiți variabile independente.

Datele bune nu spun întotdeauna povestea completă. Analiza de regresie este frecvent utilizată în cercetare deoarece stabilește că există o corelație între variabile.

Dar corelația nu este aceeași ca o cauzalitate . Chiar și o linie într-o regresie liniară simplă care se potrivește cu punctele de date bine nu poate spune ceva definitiv cu privire la o relație cauză-efect.

În regresia liniară simplă, fiecare observație constă din două valori. O valoare este pentru variabila dependentă și o valoare este pentru variabila independentă.

Model simplu de regresie liniară

Modelul simplu de regresie liniară este reprezentat astfel: y = ( β 0 + β 1 + Ε

Prin convenția matematică, cei doi factori implicați într-o analiză simplă de regresie liniară sunt desemnați x și y .

Ecuația care descrie modul în care y este legată de x este cunoscută ca modelul de regresie . Modelul de regresie liniară conține, de asemenea, un termen de eroare care este reprezentat de litera E sau de litera greacă epsilon. Termenul de eroare este folosit pentru a ține cont de variabilitatea în y care nu poate fi explicată prin relația liniară dintre x și y .

Există, de asemenea, parametri care reprezintă populația studiată. Acești parametri ai modelului reprezentați de ( β 0+ β 1 x ).

Model simplu de regresie liniară

Ecuația de regresie liniară simplă este reprezentată astfel: E ( y ) = ( β 0 + β 1 x ).

Ecuația de regresie liniară simplă este reprezentată ca o linie dreaptă.

( β 0 este interceptul y al liniei de regresie.

β 1 este panta.

E ( y ) este valoarea medie sau preconizată a y pentru o valoare dată de x .

O linie de regresie poate prezenta o relație liniară pozitivă, o relație liniară negativă sau nici o relație. Dacă linia grafată într-o regresie liniară simplă este netedă (nu înclinată), nu există nici o relație între cele două variabile. Dacă linia de regresie se înclină în sus cu capătul inferior al liniei la interceptul y (axa) graficului, iar capătul superior al liniei care se extinde în sus în câmpul grafic, departe de interceptul x (axa) există o relație liniară pozitivă . Dacă linia de regresie se înclină în jos cu capătul superior al liniei la interceptarea y (axa) graficului și la capătul inferior al liniei care se extinde în jos în câmpul grafic, spre intersecția x (axă) există o relație liniară negativă.

Ecuația de regresie liniară estimată

Dacă s-ar cunoaște parametrii populației , ecuația de regresie liniară simplă (arătată mai jos) ar putea fi utilizată pentru a calcula valoarea medie a y pentru o valoare cunoscută de x .

E ( y ) = ( β 0 + β 1 x ).

Cu toate acestea, în practică, valorile parametrilor nu sunt cunoscute, deci trebuie estimate prin utilizarea datelor dintr-un eșantion din populație. Parametrii populației sunt estimate prin utilizarea statisticilor de eșantioane . Statisticile eșantionului sunt reprezentate de b 0 + b 1. Atunci când statisticile eșantionului sunt înlocuite cu parametrii populației, se formează ecuația de regresie estimată.

Ecuația de regresie estimată este prezentată mai jos.

( ŷ ) = ( β 0 + β 1 x

( ŷ ) se pronunță.

Graficul grafic al ecuației de regresie simplă estimată se numește linia de regresie estimată.

B 0 este interceptul y.

B 1 este panta.

Ŷ ) este valoarea estimată a y pentru o valoare dată de x .

Notă importantă: Analiza de regresie nu este utilizată pentru a interpreta relațiile cauză-efect între variabile. Analiza de regresie poate, totuși, să indice modul în care variabilele sunt legate sau în ce măsură variabilele sunt asociate una cu cealaltă.

În acest sens, analiza de regresie tinde să facă relații importante care să permită unui cercetător cu cunoștințe să se uite mai atent .

De asemenea, cunoscut ca: regresie bivariată, analiză de regresie

Exemple: Metoda "Least Squares" este o procedură statistică pentru utilizarea datelor de eșantion pentru a găsi valoarea ecuației de regresie estimate. Metoda celor mai mici pătrate a fost propusă de Carl Friedrich Gauss, care sa născut în anul 1777 și a murit în 1855. Metoda celor mai mici pătrate este încă utilizată pe scară largă.

surse:

Anderson, DR, Sweeney, DJ și Williams, TA (2003). Essentials of Statistics pentru afaceri și economie (ed. 3) Mason, Ohio: Southwestern, Thompson Learning.

______. (2010). Explicat: Analiza de regresie. MIT News.

Mclntyre, L. (1994). Utilizarea datelor despre țigarete pentru o introducere în regresia multiplă. Jurnalul de statistică Educație, 2 (1).

Mendenhall, W. și Sincich, T. (1992). Statistici pentru inginerie și științe (ed. 3), New York, NY: Dellen Publishing Co.

Panchenko, D. 18.443 Statistici pentru aplicații, toamna 2006, secțiunea 14, Regresie liniară simplă. (Institutul de Tehnologie din Massachusetts: MIT OpenCourseWare)