Data Science – kurs bezpłatny ze Szkoły Analizy Danych, szkolenie 4 semestry, termin 2 grudnia 2023 r.
Miscellanea / / December 05, 2023
Dla tych, którzy chcą postawić problemy za pomocą analizy danych, zaproponować rozwiązania i ocenić ich skuteczność nie tylko w eksperymencie syntetycznym, ale także w warunkach rzeczywistych.
Statystyka, uczenie maszynowe i praca z różnymi typami danych.
Dane stanowią podstawę większości nowoczesnych usług i produktów, od aplikacji do prognozowania pogody po samochody autonomiczne. Data Scientist przeprowadza eksperymenty, buduje metryki, wie, jak optymalizować działanie usług i rozumie, gdzie są ich punkty wzrostu.
Każdy student musi pomyślnie zaliczyć co najmniej trzy przedmioty w semestrze. Na przykład, jeśli w programie głównym są dwa z nich, musisz wybrać jeden z kursów specjalnych.
Sprawdzanie wiedzy odbywa się przede wszystkim poprzez prace domowe – egzaminy i kolokwia przeprowadzane są tylko z niektórych przedmiotów.
Pierwszy semestr
Obowiązkowy
Algorytmy i struktury danych, część 1
01.Złożoność i modele obliczeniowe. Analiza wartości księgowych (początek)
02.Analiza wartości księgowych (koniec)
03.Algorytmy scalania i szybkiego sortowania
04. Statystyka porządkowa. Sterty (początek)
05. Stosy (koniec)
06.Haszowanie
07. Przeszukaj drzewa (początek)
08.Wyszukiwanie drzew (ciąg dalszy)
09.Przeszukaj drzewa (koniec). Układ zbiorów rozłącznych
10. Zadania RMQ i LCA
11.Struktury danych do poszukiwań geometrycznych
12.Zagadnienie spójności dynamicznej w grafie nieskierowanym
Język Pythona
01.Podstawy języka (część 1)
02.Podstawy języka (część 2)
03.Programowanie obiektowe
04. Obsługa błędów
05. Projektowanie i testowanie kodu
06.Praca ze sznurkami
07.Model pamięci
08Programowanie funkcjonalne
09.Przegląd biblioteki (część 1)
10. Przegląd biblioteki (część 2)
11. Obliczenia równoległe w Pythonie
12.Zaawansowana praca z obiektami
Uczenie maszynowe, część 1
01.Podstawowe pojęcia i przykłady stosowanych problemów
02.Metody klasyfikacji metrycznej
03.Logiczne metody klasyfikacji i drzewa decyzyjne
04.Gradientowe metody klasyfikacji liniowej
05.Wspieraj maszynę wektorową
06.Wieloczynnikowa regresja liniowa
07.Regresja nieliniowa i nieparametryczna, niestandardowe funkcje strat
08. Prognozowanie szeregów czasowych
09.Bayesowskie metody klasyfikacji
10.Regresja logistyczna
11.Wyszukaj zasady stowarzyszenia
Drugi termin
Obowiązkowy
Podstawy statystyki w uczeniu maszynowym
01.Wprowadzenie
02.Główne zadania i metody teorii wnioskowania statystycznego
03. Estymacja rozkładu i funkcjonały statystyczne
04.Symulacja Monte Carlo, bootstrap
05.Estymacja parametryczna
06. Testowanie hipotez
07. Ograniczanie wymiarowości danych wielowymiarowych
08.Ocena wrażliwości modelu
09.Regresja liniowa i logistyczna
10.Metody projektowania eksperymentów
11.Różne rodzaje regularyzacji w regresji liniowej
12. Nieliniowe metody konstruowania zależności regresyjnych
13.Estymacja nieparametryczna
14.Bayesowskie podejście do estymacji
15.Bayesowskie podejście do regresji
16. Bayesowskie podejście do regresji i optymalizacji
17.Wykorzystanie modelu losowego pola Gaussa w zagadnieniach analizy danych
18.Wykorzystanie modeli i metod statystycznych w zagadnieniach modelowania zastępczego i optymalizacji
Uczenie maszynowe, część 2
01.Metody klasyfikacji i regresji sieci neuronowych
02.Kompozycyjne metody klasyfikacji i regresji
03.Kryteria doboru modeli i metody doboru cech
04. Ranking
05. Uczenie się przez wzmacnianie
06. Nauka bez nauczyciela
07.Problemy z treningiem częściowym
08. Filtrowanie wspólne
09. Modelowanie tematyczne
Trzeci semestr
Do wybrania z
Automatyczne przetwarzanie tekstu
01Materiał kursu
Lub
Wizja komputerowa
Kurs poświęcony jest metodom i algorytmom widzenia komputerowego, tj. wyodrębniać informacje ze zdjęć i filmów. Przyjrzyjmy się podstawom przetwarzania obrazu, klasyfikacji obrazów, wyszukiwania obrazów według treści, rozpoznawania twarzy, segmentacji obrazów. Następnie porozmawiamy o algorytmach przetwarzania i analizy wideo. Ostatnia część kursu poświęcona jest rekonstrukcji 3D. W przypadku większości problemów omówimy istniejące modele sieci neuronowych. Na zajęciach staramy się zwracać uwagę wyłącznie na najnowocześniejsze metody, które są obecnie stosowane w rozwiązywaniu problemów praktycznych i badawczych. Kurs ma w dużej mierze charakter praktyczny, a nie teoretyczny. Dlatego wszystkie wykłady wyposażone są w laboratorium i prace domowe, które pozwalają wypróbować większość omawianych metod w praktyce. Praca wykonywana jest w języku Python z wykorzystaniem różnych bibliotek.
01.Cyfrowa korekcja obrazu i tonalności.
02.Podstawy przetwarzania obrazu.
03.Łączenie obrazów.
04. Klasyfikacja obrazów i wyszukiwanie podobnych.
05. Splotowe sieci neuronowe do klasyfikacji i wyszukiwania obrazów podobnych.
06. Wykrywanie obiektów.
07. Segmentacja semantyczna.
08.Transfer stylu i synteza obrazu.
09.Rozpoznawanie wideo.
10.Rzadka rekonstrukcja 3D.
11.Gęsta rekonstrukcja trójwymiarowa.
12.Rekonstrukcja z jednego układu i chmur punktów, modele parametryczne.
Czwarty semestr
Polecane kursy specjalne
Głęboka nauka
01.Materiał kursu
Uczenie się przez wzmacnianie
01.Materiał kursu
Samochody autonomiczne
Kurs obejmuje podstawowe elementy technologii autonomicznej jazdy: lokalizację, percepcję, przewidywanie, poziom zachowania i planowanie ruchu. Dla każdego komponentu zostaną opisane główne podejścia. Dodatkowo studenci zapoznają się z aktualnymi warunkami rynkowymi i wyzwaniami technologicznymi.
01.Przegląd głównych podzespołów i czujników pojazdu bezzałogowego. Poziomy autonomii. Jedź przewodem. Samochody autonomiczne jako produkt biznesowy. Sposoby oceny postępu w tworzeniu dronów. Podstawy lokalizacji: gnss, odometria kół, filtry Bayesa.
02.Metody lokalizacji lidarów: ICP, NDT, LOAM. Wprowadzenie do wizualnego SLAM na przykładzie ORB-SLAM. Omówienie problemu GraphSLAM. Sprowadzenie problemu GraphSLAM do nieliniowej metody najmniejszych kwadratów. Wybór właściwej parametryzacji. Systemy o specjalnej strukturze w GraphSLAM. Podejście architektoniczne: frontend i backend.
03. Zadanie rozpoznawcze w samochodzie autonomicznym. Przeszkody statyczne i dynamiczne. Czujniki systemu rozpoznawania. Reprezentacja przeszkód statycznych. Detekcja przeszkód statycznych za pomocą lidaru (VSCAN, metody sieci neuronowych). Używanie lidaru w połączeniu z obrazami do wykrywania statyki (semantyczna segmentacja obrazu, uzupełnianie głębi). Kamera stereo i uzyskiwanie głębi ze zdjęcia. Świat Stixela.
04.Wyobrażanie sobie dynamicznych przeszkód w samochodzie autonomicznym. Metody sieci neuronowych do wykrywania obiektów w przestrzeni 2D. Wykrywanie oparte na widoku z lotu ptaka przedstawiającym chmurę lidarową. Używanie lidaru ze zdjęciami do wykrywania dynamicznych przeszkód. Detekcja samochodów w 3D na podstawie zdjęć (montaż pudeł 3D, modele CAD). Dynamiczne wykrywanie przeszkód w oparciu o radar. Śledzenie obiektów.
05. Wzorce jazdy samochodem: koło tylne, koło przednie. Planowanie ścieżki. Pojęcie przestrzeni konfiguracyjnej. Grafowe metody konstruowania trajektorii. Trajektorie minimalizujące szarpnięcie. Metody optymalizacyjne konstruowania trajektorii.
06.Planowanie prędkości w dynamicznym środowisku. Planowanie ST. Przewidywanie zachowań innych użytkowników dróg.