Përcaktimi i Modelit Statistikor të Regresionit

Regresioni Analizon Marrëdhëniet midis Variablave

Regresioni është një teknikë e nxjerrjes së të dhënave që përdoret për të parashikuar një sërë vlerash numerike (të quajtura edhe vlera të vazhdueshme ), duke pasur parasysh një grup të dhënash të veçantë. Për shembull, regresioni mund të përdoret për të parashikuar koston e një produkti ose shërbimi, duke pasur parasysh variablat e tjerë.

Regresioni përdoret nëpër industri të shumëfishta për planifikimin e biznesit dhe marketingut, parashikimi financiar, modelimi i mjedisit dhe analiza e trendeve.

Regresioni Vs. klasifikim

Regresioni dhe klasifikimi janë teknikat e nxjerrjes së të dhënave që përdoren për të zgjidhur probleme të ngjashme, por shpesh konfuzohen. Të dyja janë përdorur në analizën e parashikimit, por regresioni përdoret për të parashikuar një vlerë numerike ose të vazhdueshme ndërsa klasifikimi i cakton të dhënat në kategori të veçanta.

Për shembull, regresioni do të përdoret për të parashikuar vlerën e një shtëpie bazuar në vendndodhjen e saj, këmbët katrore, çmimin kur shitet më parë, çmimin e shtëpive të ngjashme dhe faktorëve të tjerë. Klasifikimi do të ishte në rregull nëse do të donit të organizonit shtëpitë në kategori, siç janë këmbësorët, madhësia e loteve ose normat e krimit.

Llojet e teknikave të regresionit

Forma më e thjeshtë dhe më e vjetër e regresionit është regresioni linear i përdorur për të vlerësuar një marrëdhënie midis dy variablave. Kjo teknikë përdor formulën matematikore të vijës së drejtë (y = mx + b). Në terma të thjeshtë, kjo thjesht do të thotë se, duke pasur parasysh një grafik me një Y dhe një bosht X, marrëdhënia mes X dhe Y është një vijë e drejtë me pak outliers. Për shembull, mund të supozojmë se, duke pasur parasysh një rritje të popullsisë, prodhimi i ushqimit do të rritet në të njëjtën ritëm - kjo kërkon një lidhje të fortë, lineare midis dy shifrave. Për ta përfytyruar këtë, konsideroni një grafik në të cilin aksioni Y rrit gjurmimin e popullsisë dhe boshti X heton prodhimin e ushqimit. Ndërsa vlera e Y rritet, vlera X do të rritet në të njëjtën ritëm, duke e bërë lidhjen mes tyre një vijë të drejtë.

Teknika të avancuara, të tilla si regresioni i shumëfishtë, parashikojnë një marrëdhënie midis variablave të shumëfishta - për shembull, ekziston një korrelacion ndërmjet të ardhurave, arsimit dhe ku vendoset të jetojë? Shtimi i më shumë ndryshoreve rrit ndjeshëm kompleksitetin e parashikimit. Ekzistojnë disa lloje të teknikave të shumta të regresionit duke përfshirë standarde, hierarkike, setwise dhe hap pas hapi, secila me aplikimin e vet.

Në këtë pikë, është e rëndësishme të kuptojmë se çfarë po përpiqemi të parashikojmë (variabla e varur ose e parashikuar ) dhe të dhënat që po përdorim për të bërë parashikimin (variablat e pavarur ose parashikues ). Në shembullin tonë, ne duam të parashikojmë vendndodhjen ku zgjedhim të jetojmë (variablin e parashikuar ) duke marrë të ardhura dhe arsimim (të dy variablat parashikues ).