Linear regression (lineárna regresia)

Čo je linear regression?

Linear regression (v slovenskom preklade lineárna regresia) je jedna zo základných metód strojového učenia, ktorá slúži na modelovanie vzťahu medzi závislou premennou a jednou alebo viacerými nezávislými premennými. Lineárna regresia patrí medzi techniky supervised learning, kde sa model učí na základe označených tréningových dát.

Ako prebieha lineárna regresia?

Proces lineárnej regresie začína zberom tréningových dát, ktoré obsahujú vstupné premenné a zodpovedajúce výstupné hodnoty. Algoritmus následne hľadá optimálne koeficienty, ktoré minimalizujú rozdiel medzi predikovanými a skutočnými hodnotami. Táto optimalizácia sa najčastejšie vykonáva metódou najmenších štvorcov, ktorá minimalizuje súčet druhých mocnín odchýlok.

Výsledkom je matematická rovnica, ktorá umožňuje predpovedanie hodnôt pre nové, doteraz nevidené vstupy. Kvalita modelu sa hodnotí pomocou metrík ako R-squared (koeficient determinácie) alebo stredná kvadratická chyba (MSE).

Typy lineárnej regresie

Rozlišujeme dva základné typy lineárnej regresie podľa počtu vstupných premenných. Jednoduchá lineárna regresia pracuje s jednou nezávislou premennou a výsledný model reprezentuje priamku v dvojrozmernom priestore. Mnohonásobná lineárna regresia využíva dve alebo viac nezávislých premenných a vytára hyperrovinu vo viacrozmernom priestore.

Vieš, že
Vieš, že…

…lineárna regresia bola prvýkrát matematicky formalizovaná už v roku 1805 Adrienom-Marie Legendrom? Napriek svojmu veku zostáva jednou z najpoužívanejších metód v strojovom učení vďaka svojej interpretovateľnosti a výpočtovej efektívnosti.

Príklady použitia lineárnej regresie

V oblasti financií sa lineárna regresia využíva na predikciu cien akcií na základe historických dát alebo na odhad rizika portfólia. Marketingové tímy ju aplikujú pri analýze vplyvu reklamných výdavkov na predaj produktov.

V zdravotníctve pomáha pri predikcii hodnôt biologických ukazovateľov, napríklad krvného tlaku na základe veku a životného štýlu. Výrobné podniky využívajú lineárnu regresiu na odhad spotreby energie v závislosti od produkčných parametrov.

V rámci obmedzení lineárnej regresie evidujeme jav, kedy sa predpokladá lineárny vzťah medzi premennými, čo nemusí vždy zodpovedať realite. Pri komplexnejších závislostiach je vhodné zvážiť nelineárne modely alebo techniky hlbokého učenia.

Zdroje a odkazy

Použité zdroje:

  • IBM Think – What is Linear Regression: https://www.ibm.com/think/topics/linear-regression

Odporúčané zdroje:

  • Google Machine Learning Crash Course – Linear Regression: https://developers.google.com/machine-learning

Uvedené informácie sú orientačné a môžu sa líšiť v závislosti od verzie, implementácie a prostredia.