Regresja liniowa - kurs 4900 rub. z Edukacja Otwarta, szkolenie 5 tygodni, ok. 2 godz. tygodniowo, termin 29.11.2023.
Miscellanea / / November 29, 2023
Jeżeli analiza korelacji umożliwia ilościowe określenie siły i kierunku zależności między dwiema wielkościami, wówczas większe możliwości daje konstrukcja modeli regresji. Za pomocą analizy regresji można ilościowo opisać zachowanie badanych wielkości w zależności od zmiennych predykcyjnych i uzyskać przewidywania na podstawie nowych danych. Dowiesz się jak budować proste i wielokrotne modele liniowe z wykorzystaniem języka R. Każda metoda ma swoje ograniczenia, dlatego pomożemy Ci zrozumieć, w jakich sytuacjach regresję liniową można i nie można zastosować, a my nauczymy Cię metod diagnozowania wybranych modele. Szczególne miejsce w kursie zajmuje dogłębna anatomia analizy regresji: opanujesz operacje na macierzach, które są podstawą regresji liniowej, aby móc zrozumieć bardziej złożone odmiany liniowe modele.
Jeżeli stajesz przed koniecznością poszukiwania i opisu zależności pomiędzy pewnymi zjawiskami dającymi się zmierzyć ilościowo, to ten kurs jest dobrą okazją, aby zrozumieć, jak działa prosta i wielokrotna regresja liniowa, poznać jej możliwości i ograniczenia metody.
Kurs przeznaczony jest dla osób, które znają już podstawowe techniki analizy danych z wykorzystaniem języka R oraz przy tworzeniu prostych dokumentów .html przy użyciu rmarkdown i knitr.
Zainteresowania naukowe: struktura i dynamika zbiorowisk bentosu morskiego, skale przestrzenne, sukcesja międzygatunkowa i wewnątrzgatunkowa interakcje biotyczne, wzrost i rozmnażanie bezkręgowców morskich, struktura demograficzna populacji, mikroewolucja, biostatystyka.
Kurs składa się z 5 modułów:
1. Analiza korelacji. Prosta regresja liniowa
Rozmowę zaczniemy od metod numerycznego opisu zależności między wielkościami ilościowymi za pomocą kowariancji i współczynników korelacji, które pozwalają oszacować siłę i kierunek zależności. Następnie dowiesz się, jakie dodatkowe informacje o zależnościach można uzyskać konstruując liniowy model zależności między wielkościami. Dowiesz się, jak interpretować współczynniki regresji oraz kiedy i w jaki sposób można wykorzystać modele liniowe do przewidywania nowych danych. Pod koniec tego modułu dowiesz się, jak dopasować równanie modelu liniowego i wykreślić je z obszarem ufności.
2. Testowanie istotności i trafności modeli liniowych
Zbudowanie modelu liniowego i zapisanie jego równania to dopiero początek analizy. W tym module dowiesz się, jak opisywać wyniki analizy regresji: jak testować istotność statystyczną całego modelu lub jego współczynników oraz oceniać jakość dopasowania. Modele liniowe (a raczej stosowane w nich testy statystyczne), jak każda metoda, mają swoje ograniczenia. Dowiesz się, czym są te ograniczenia i skąd się biorą. Graficzne metody diagnostyczne, które będziemy stosować, są uniwersalne dla różnych modeli liniowych – więcej praktyki pomoże Ci pewniej podejmować decyzje. Kiedy już to wszystko zrozumiesz, możesz napisać kompletny skrypt w R, aby dopasować, zdiagnozować i przedstawić wyniki prostej regresji liniowej.
3. Krótkie wprowadzenie do świata algebry liniowej
W tym module zagłębimy się w istotę modeli liniowych. Aby to zrobić, będziesz musiał nauczyć się lub zapamiętać podstawy algebry liniowej. Omówimy różne typy macierzy, sposób ich tworzenia w R i podstawowe operacje na nich. Będziemy potrzebować tego wszystkiego, aby zrozumieć, jak regresja liniowa działa od wewnątrz. Dowiesz się czym jest macierz modelu, dowiesz się jak zapisać równanie regresji liniowej w postaci macierzy oraz znajdziesz jej współczynniki. Zobaczysz na własne oczy macierz kapeluszy, która pozwala uzyskać przewidywane wartości, a nawet będziesz mógł ją obliczyć ręcznie. Na koniec nauczysz się obliczać wariancję resztową, macierz wariancji-kowariancji i wykorzystywać to wszystko do budowania strefy ufności regresji. Wtedy wiedza ta pomoże Ci zrozumieć strukturę bardziej złożonych modeli: z dyskretnymi predyktorami, z różnymi rozkładami reszt, z inną strukturą macierzy wariancji-kowariancji.
4. Wielokrotna regresja liniowa
Najczęściej zależności między wielkościami są bardziej złożone, niż można to opisać za pomocą prostej regresji liniowej. Wielokrotna regresja liniowa służy do opisania, w jaki sposób zmienna odpowiedzi zależy od wielu predyktorów. Wraz z pojawieniem się w modelu wielu predyktorów, regresji liniowej postawiono nowy warunek stosowalności – wymóg braku współliniowości. W tym module dowiesz się, jak identyfikować współliniowość i jej unikać. Wreszcie, w wielu modelach często występuje więcej zmiennych, niż można przedstawić na płaszczyźnie, Dlatego nauczymy Cię prostych technik, które pomogą Ci stworzyć grafikę informacyjną nawet w tym sprawa.
5. Porównanie modeli liniowych
Wiele modeli liniowych przypomina zestaw konstrukcyjny: bardziej złożone modele można rozebrać i uprościć. Dowiesz się, w jaki sposób porównania modeli zagnieżdżonych przy użyciu częściowego testu F służą do testowania istotności poszczególnych predyktorów lub grup predyktorów. Bardziej złożone modele lepiej opisują oryginalne dane, ale nadmierne komplikacje są niebezpieczne, ponieważ takie modele zaczynają słabo przewidywać nowe dane. Stosując częściowe testy F, można uprościć modele poprzez stopniową eliminację nieistotnych predyktorów. Uproszczone modele są łatwiejsze w użyciu do interpretacji i prezentacji wyników. Wszystko, czego nauczyłeś się do tej pory na temat regresji liniowej, można zastosować, wykonując projekt analizy danych tam, gdzie jest to potrzebne poprawnie zbudować optymalny model wielokrotnoliniowy i przedstawić jego wyniki w raporcie napisanym za pomocą rmarkdown i knitr.