Uczenie maszynowe w praktyce - kurs 41 500 rub. z Centrum Szkoleniowego IBS, szkolenie 24-godzinne, termin 26.11.2023.
Miscellanea / / December 02, 2023
Kurs opiera się na kilku praktycznych przypadkach zawierających tabele z danymi początkowymi.
W każdym przypadku przechodzimy przez pełny cykl życia projektu uczenia maszynowego:
badanie, czyszczenie i przygotowanie danych,
dobór metody uczenia odpowiedniej do zadania (regresja liniowa dla regresji, las losowy dla klasyfikacji, K-średnie i DBSCAN dla grupowania),
szkolenie wybraną metodą,
ocena wyników,
optymalizacja modelu,
prezentacja wyniku klientowi.
W części dyskusyjnej kursu omawiamy praktyczne problemy stojące przed studentami, które można rozwiązać za pomocą omawianych metod.
Omawiane tematy:
1. Przegląd zadania (teoria – 1 godzina)
Jakie problemy dobrze rozwiązuje uczenie maszynowe i jakie problemy próbuje rozwiązać?
Co się stanie, jeśli zamiast Data Scientist zatrudnisz osobę niebędącą specjalistą w danej dziedzinie (tylko programistę/analityka/menedżera) z oczekiwaniem, że przy okazji się czegoś nauczy?
2. Przygotowanie, sprzątanie, badanie danych (teoria – 1 godz., praktyka – 1 godz.)
Jak rozumieć źródłowe dane biznesowe (i ogólnie wykryć w nich dowolny porządek).
Kolejność przetwarzania.
Co można i należy zlecić analitykom domenowym, a co najlepiej zrobi sam Data Scientist.
Priorytety rozwiązania konkretnego problemu.
3. Klasyfikatory i regresory (teoria – 2 godz., praktyka – 2 godz.)
Część praktyczna - dobrze sformalizowane zadania z przygotowanymi danymi.
Różnica pomiędzy zadaniami (klasyfikacja binarna/niebinarna/probabilistyczna, regresja), redystrybucja zadań pomiędzy klasami.
Przykłady klasyfikacji problemów praktycznych.
4. Klastrowanie (teoria – 1 godzina, praktyka – 2 godziny)
Gdzie i jak przeprowadzić klastrowanie: badanie danych, sprawdzenie sformułowania problemu, sprawdzenie wyników.
Jakie przypadki można sprowadzić do grupowania.
5. Ocena modelu (teoria – 1 godzina, praktyka – 1 godzina)
Metryki biznesowe i metryki techniczne.
Metryki dla problemów klasyfikacji i regresji, macierz błędów.
Wewnętrzne i zewnętrzne wskaźniki jakości klastrów.
Walidacja krzyżowa.
Ocena przekwalifikowania.
6. Optymalizacja (teoria – 5 godzin, praktyka – 3 godziny)
Co sprawia, że jeden model jest lepszy od drugiego: parametry, cechy, zespoły.
Zarządzanie ustawieniami.
Praktyka wyboru cech.
Przegląd narzędzi wyszukiwania najlepszych parametrów, cech i metod.
7. Wykresy, raporty, praca z zadaniami na żywo (teoria – 2 godziny, praktyka – 2 godziny)
Jak jasno wytłumaczyć co się dzieje: sobie, zespołowi, klientowi.
Piękniejsze odpowiedzi na bezsensowne pytania.
Jak zaprezentować trzy terabajty wyników na jednym slajdzie.
Testy półautomatyczne, które punkty kontroli procesu są naprawdę potrzebne.
Od zadań na żywo do pełnego procesu badawczo-rozwojowego („B+R w praktyce”) – analiza i analiza zadań od odbiorców.