Uogólnione modele liniowe - kurs 3600 rub. z Edukacja Otwarta, szkolenie 3 tygodnie, około 6 godzin tygodniowo, termin 29.11.2023.
Miscellanea / / December 01, 2023
Jednym z warunków stosowalności konwencjonalnych modeli liniowych jest niezależność od siebie obserwacji, na podstawie których wybierany jest model. Jednak w praktyce często zdarzają się sytuacje, w których projekt gromadzenia materiału jest taki, że naruszenie tego warunku jest nieuniknione. Wyobraź sobie, że zdecydowałeś się zbudować model opisujący związek między wynikami w zakresie wychowania fizycznego a wynikami testów IQ uczniów. Aby rozwiązać ten problem, pobrano liczne próbki w kilku instytucjach. Czy można połączyć takie dane w jedną analizę zbudowaną według tradycyjnego schematu? Oczywiście nie. Studenci każdej uczelni mogą być do siebie pod pewnymi względami podobni. Nawet charakter zależności między badanymi wielkościami może być nieco inny. Tego typu dane, w których występują korelacje wewnątrzgrupowe, należy analizować za pomocą liniowych modeli mieszanych. Pokażemy, że niektóre predyktory powinny zostać uwzględnione w modelu jako tzw. „czynniki losowe”. Dowiesz się, że czynniki losowe mogą być hierarchicznie podporządkowane. Omówimy, w jaki sposób można zbudować takie modele mieszane dla zmiennych zależnych, które mają różne typy rozkładów. Dodatkowo pokażemy, że losowa część modelu może być jeszcze bardziej złożona – może posiadać składnik modelujący zachowanie wariancji w odpowiedzi na wpływ współzmiennej. Na końcu kursu znajdziesz projekt, w którym możesz przećwiczyć budowanie modeli mieszanych, wybierając jeden z kilku zbiorów danych. Na podstawie analizy tych danych można stworzyć raport w tradycji powtarzalnych badań.
Profesor nadzwyczajny, Katedra Zoologii Bezkręgowców, Wydział Biologii, Uniwersytet Państwowy w Petersburgu, dr hab.
Zainteresowania naukowe: struktura i dynamika zbiorowisk bentosu morskiego, skale przestrzenne, sukcesja międzygatunkowa i wewnątrzgatunkowa interakcje biotyczne, wzrost i rozmnażanie bezkręgowców morskich, struktura demograficzna populacji, mikroewolucja, biostatystyka.
Kurs składa się z 4 modułów:
1) Wprowadzenie do uogólnionych modeli liniowych
Uogólnione modele liniowe (GLM) umożliwiają modelowanie zachowania wielkości, które nie mają rozkładu normalnego. Aby ułatwić Ci pierwsze kroki w świecie GLM, przeanalizujemy ich strukturę na przykładzie GLM dla wielkości o rozkładzie normalnym - w ten sposób możesz rysować podobieństwa z prostymi modelami liniowymi. Dowiesz się, czym jest funkcja łączenia, jak działa największe prawdopodobieństwo oraz jak testować hipotezy GLM za pomocą testów Walda i testów współczynnika wiarygodności.
2) Problem z wyborem modelu
W tym module omówimy zagadnienia metodologiczne związane z budowaniem modeli. Model jest uproszczoną reprezentacją rzeczywistości, a wybór pomiędzy różnymi konkurencyjnymi metodami takiego uproszczenia jest częstym zadaniem analityka. W tym module nauczysz się porównywać modele przy użyciu kryteriów informacyjnych. Omówimy główne opcje analizy przy wyborze modeli i porozmawiamy o trudnościach pojawiających się w związku z ukrytą wielością modeli. Na koniec nauczymy Cię rozpoznawać główne rodzaje nadużyć w wyborze modelu (data-fishing, p-hacking).
3) Uogólnione modele liniowe do zliczania danych
W tym module omówimy podstawowe metody modelowania wielkości przeliczalnych. Najpierw omówimy, dlaczego konwencjonalne modele liniowe nie nadają się do liczenia danych. Właściwości rozkładów przeliczalnych pomogą Ci zrozumieć różnice pomiędzy typami GLM dla danych przeliczalnych i cechami ich diagnostyki. Działanie funkcji łączenia zobaczysz, gdy zwizualizujesz przewidywania GLM na skali funkcji łączenia i skali zmiennej odpowiedzi.
4) Uogólnione modele liniowe z odpowiedzią binarną
Czasami istnieje potrzeba symulacji, czy jakieś zdarzenie miało miejsce, czy nie, niezależnie od tego, czy drużynę piłkarską, czy przegrał, czy pacjent wyzdrowiał po leczeniu, czy nie, czy klient się dopuścił kupić, czy nie. Konwencjonalne modele liniowe nie nadają się do modelowania takich danych binarnych (zdarzeń z dwoma wynikami), ale można to łatwo zrobić za pomocą uogólnionych modeli liniowych. W tym module nauczysz się modelować prawdopodobieństwa wystąpienia zdarzeń, przedstawiając je jako szanse. Przyjrzymy się, jak działa funkcja łącza logitowego i jak interpretowane są współczynniki GLM, gdy jest ona używana. Na koniec będziesz mógł przećwiczyć analizę uogólnionych modeli liniowych z różnymi rozkładami, wykonując projekt analizy danych. Wyniki tej analizy należy przedstawić w postaci raportu w formacie HTML zapisanego przy użyciu rmarkdown/knitr.
• Dowiedz się, jakie umiejętności są potrzebne, aby rozpocząć pracę w analityce i nauce danych. • Naucz się korzystać z Excela, SQL, Power BI i Google Data Studio do pracy danych i napisz swój pierwszy kod w Pythonie • Uzyskaj przewodnik krok po kroku i dowiedz się, jak wejść do branży data science i wybrać rolę w Data Science
4,4
1 490 ₽