Sužinokite, kokia yra paprastoji linijinė regresija ir kaip ji veikia

Pagrindinis statistikos metodas kiekybiniams duomenims analizuoti

Courtesy Colin Brough, fotografas. © 2010 m. Birželio 10 d. Stock.xchng

Linear regresijos modeliai yra naudojami parodyti ar prognozuoti santykius tarp dviejų kintamųjų ar veiksnių . Prognozuojamas veiksnys (faktorius, kurį sprendžia lygtis) vadinamas priklausomas kintamasis. Faktoriai, naudojami numatomo kintamojo vertės prognozavimui, vadinami nepriklausomais kintamaisiais.

Geri duomenys ne visada pasakoja visą istoriją. Regresijos analizė dažniausiai naudojama tyrimuose, nes joje nustatoma, kad tarp kintamųjų yra koreliacija.

Bet koreliacija nėra tas pats kaip priežastinis ryšys . Net paprastos linijinės regresijos eilutė, kuri gerai tinka duomenų taškams, gali nepasakoti kažko galutinio apie priežasties ir pasekmės ryšį.

Paprastoje linijinėje regresijoje kiekviena stebjima susideda iš dviejų verčių. Viena reikšmė yra priklausomas kintamasis ir viena reikšmė yra nepriklausomas kintamasis.

Paprastas linijinis regresijos modelis

Paprastas tiesinis regresijos modelis yra toks: y = ( β 0 + β 1 + Ε

Pagal matematinius susitarimus du veiksniai, kurie dalyvauja paprastoje linijinės regresijos analizėje, vadinami x ir y .

Lygtis, apibūdinanti, kaip y susijęs su x, yra žinomas kaip regresijos modelis . Linijinės regresijos modelyje taip pat yra klaidingo termino, kurį vaizduoja E arba graikiškas raidinis epsilonas. Klaidos terminas naudojamas apskaičiuojant y kintamumą, kurio negalima paaiškinti tiesiniu x ir y santykiu .

Taip pat yra parametrų, kurie atspindi tiriamą gyventojų skaičių. Šie modelio parametrai, kurie yra ( β 0+ β 1 x ).

Paprastas linijinis regresijos modelis

Paprastoji linijinė regresijos lygtis yra tokia: E ( y ) = ( β 0 + β 1 x ).

Paprastoji linijinės regresijos lygtis priskiriama tiesia linija.

( β 0 - regresijos linijos y perkėlimas.

β 1 yra nuolydis.

Ε ( y ) yra vidutinė arba tikėtinoji y vertė tam tikros x vertės.

Regresijos eilutė gali parodyti teigiamą linijinį santykį, neigiamą tiesinį ryšį arba santykį. Jei gradiento linija paprastoje tiesinėje regresijoje yra plokščia (nesukleta), tarp šių dviejų kintamųjų nėra ryšio. Jei regresijos linija nukrypsta į viršų su apatiniu linijos viršūnu grafiko y kryžmės (ašies) atžvilgiu, o viršutinis linijos aukštis išplečiamas aukštyn į grafiko lauką, toli nuo x krumpliaračio (ašies) yra teigiamas tiesinis ryšys . Jei regresijos linija nukrypsta į viršutinę linijos viršutinę dalį grafiko y ašies (ašies) link, o apatinis linijos galas praplečiamas žemyn į grafiko lauką, x krypties (ašies) link yra neigiamas tiesinis ryšys.

Apskaičiuota linijinė regresijos lygtis

Jei žinomi gyventojų parametrai, apskaičiuojant vidutinę y reikšmę žinomai x reikšmei, būtų galima naudoti paprastą tiesinę regresijos lygtį (pateiktą toliau).

E ( y ) = ( β 0 + β 1 x ).

Tačiau praktikoje parametrų reikšmės nėra žinomos, todėl jos turi būti įvertintos naudojant gyventojų imties duomenis . Gyventojų parametrai apskaičiuojami naudojant mėginių statistiką . Mėginių statistiniai duomenys yra b 0 + b 1. Kai populiacijos parametrai pakeičiami imties statistiniais duomenimis, apskaičiuojama regresijos lygtis.

Apskaičiuotoji regresijos lygtis parodyta žemiau.

( ŷ ) = ( β 0 + β 1 x

( ŷ ) paskelbiamas " hat" .

Apskaičiuotos paprastos regresijos lygties grafikas vadinamas įvertinta regresine linija.

B 0 yra y perkėlimas.

B 1 yra nuolydis.

Ŷ ) yra numatoma y reikšmė tam tikros x vertės.

Svarbi pastaba. Regresinė analizė nėra naudojama priežasčių ir efektų ryšiui tarp kintamųjų interpretuoti. Tačiau regresijos analizė gali nurodyti, kaip kintamieji yra susiję arba kiek kintamieji yra susiję tarpusavyje.

Tai darydama regresijos analizė linkusi atlikti svarbius santykius, kurie reikalauja, kad žinių tyrinėtojas atidžiau pažvelgtų .

Taip pat žinomas kaip: dviejų pakopų regresija, regresijos analizė

Pavyzdžiai . Mažiausias kvadratų metodas yra statistinė mėginių duomenų naudojimo tvarka, norint rasti numatomos regresijos lygties vertę. Mažiausiai kvadratų metodą pasiūlė Carl Friedrichas Gausas, gimęs 1777 m. Ir miręs 1855 m. Mažiausiai kvadratų metodas vis dar plačiai naudojamas.

Šaltiniai:

Anderson, DR, Sweeney, DJ ir Williams, TA (2003). Verslo ir ekonomikos statistikos pagrindai (3-asis leidimas) Masonas, Ohajas: Pietvakarių, "Thompson Learning".

______. (2010). Paaiškinta: regresijos analizė. MIT naujienos.

McIntyre, L. (1994). Cigarečių duomenų naudojimas keletos regresijos įvedimui. Švietimo statistikos leidinys, 2 (1).

Mendenhall, W. ir Sincich, T. (1992). Inžinerijos ir mokslo statistika (3-asis leidimas), Niujorkas, NY: "Dellen Publishing Co"

Panchenko, D. 18.443. Paraiškų statistika, 2006 m. Ruduo, 14 sekcija, paprastoji linijinė regresija. (Masačiusetso technologijos institutas: MIT OpenCourseWare)