„Analiza danych z wykorzystaniem IBM SPSS Statistics” – kurs 42 000 RUB. z MSU, szkolenie (2 miesiące), termin 3 grudnia 2023 r.
Miscellanea / / December 06, 2023
Kurs ten, w bardzo skróconej formie, jest częścią popularnego kursu kształcenia na odległość „Jak prowadzić badania naukowe: metodologia, narzędzia, metody” Fundacji E. Foundation Open University. Gajdar (około 2 tys. słuchaczy rocznie). Wydział Ekonomii Moskiewskiego Uniwersytetu Państwowego zapewnia studentom możliwość korzystania z wyposażonej sali komputerowej z zainstalowanym SPSS szczegółowo przestudiuj metody pracy z danymi twarzą w twarz z nauczycielem, pracuj z programem własnymi „rękami” SPSS. Można pracować nie tylko z bazami danych zaproponowanymi przez nauczyciela, ale także z danymi uczniów, nauczyciel doradzi, jakimi metodami i w jaki sposób zastosować analizę swoich danych.
Kurs ten został przetestowany na Uniwersytecie Otwartym Fundacji E. Gajdar.
Doktor nauk ekonomicznych, profesor Wydziału Ekonomii Moskiewskiego Uniwersytetu Państwowego, specjalista w zakresie badań ilościowych w sfera społeczna, lider ponad 30 projektów badawczych, ma doświadczenie w prowadzeniu kursów analitycznych w National Research University HSE, REU im. V.G. Plechanow.
E-mail: [e-mail chroniony]
1 Istota i główne kierunki badań reprezentacyjnych ludności. Możliwości wykorzystania specjalnych PPP do przetwarzania danych z badań reprezentacyjnych
Metody gromadzenia informacji ilościowych. Przykładowe badania. Przykładowe badania społeczno-demograficzne w Rosji. Podstawowe pakiety oprogramowania statystycznego do badań społecznych. Funkcje programów specjalistycznych (Statistica, SPSS) w przetwarzaniu danych z badań przykładowych. Struktura, moduły SPSS. Obszary przetwarzania danych. Przygotowywanie danych. Wprowadzanie i zapisywanie danych. Skale pomiarowe (ilościowe, porządkowe, nominalne). Właściwości skal i ich dopuszczalne przekształcenia. Rodzaje kategoryzacji danych.
2 Przygotowanie danych. Selekcja i modyfikacja danych
Wybór obserwacji. Sortowanie obserwacji. Dzielenie obserwacji na grupy. Modyfikacja danych. Obliczanie nowych zmiennych. Obliczanie nowych zmiennych według określonych warunków. Formułowanie warunków. Agregacja danych. Transformacje rang. Wagi obudowy. Przyczyny i mechanizmy generowania luk w danych. Możliwość ignorowania pominięć. Metody uzupełniania brakujących wartości. Metody identyfikacji wartości anomalnych. Stosowanie solidnych procedur oceny. Analiza wielu odpowiedzi
3 Statystyki opisowe. Tabele awaryjne
Rola statystyki w przetwarzaniu wyników badań reprezentacyjnych. Mikro i metadane. Obszary zastosowań i granice stosowania metod matematycznych i statystycznych. Podsumowanie obserwacji. Opisowe statystyki. Rozkłady jednowymiarowe. Wskaźniki zmienności. Rozproszenie, zakres zmienności, średnie odchylenie bezwzględne, zakresy kwantylowe. Budowa tabel awaryjnych. Graficzne przedstawienie tabel awaryjnych.
4 Testy parametryczne i nieparametryczne
Analiza zależności pomiędzy cechami. Niezależność zmiennych. Podstawowe cechy komunikacji. Testy nieparametryczne i parametryczne. Test niezależności (test dobroci dopasowania χ2). Porównanie dwóch i kilku próbek (zależnych i niezależnych). test t. Testy statystyczne dla tablic kontyngencji. Współczynniki korelacji (dla skali nominalnej i rankingowej). Miary bliskości zależności pomiędzy zmiennymi. Najprostsze miary bliskości połączeń (dla zmiennych dychotomicznych). Miary relacji dla tabel z danymi porządkowymi. Miary t Kendala i ich własności. Miary d Somersa. Miara Goodmana-Kruskala i jej własności. Analiza wariancji
5 Analiza korelacji i regresji
Istota i cele analizy korelacji. Wykresy rozrzutu. Sparowane współczynniki korelacji. Pomiar stopnia bliskości zależności statystycznej, „oczyszczony” z wpływu obcych cech za pomocą częściowych współczynników korelacji. Sprawdzanie znaczenia relacji między znakami. Przedziały ufności dla współczynników korelacji. Wielokrotny współczynnik korelacji. Współczynnik determinacji. Dwuwymiarowy model analizy regresji: modele regresji liniowej i nieliniowej. Krzywe wzrostu w problematyce prognozowania, zmienne „fikcyjne” i ich zastosowania. Model wielokrotnej regresji liniowej. Regresja nieliniowa (binarna regresja logistyczna, wielomianowa regresja logistyczna, regresja porządkowa, analiza probitowa, dopasowanie krzywej).
6 Metody redukcji wymiarowości
Podejście statystyczne w metodzie głównych składowych. Obliczanie składowych głównych i ich interpretacja graficzna. Treść informacyjna zredukowanej przestrzeni cech. Regresja głównych składników. Rola i miejsce metod nieparametrycznych w modelowaniu konstrukcji. Hierarchiczna analiza skupień. Metryki przestrzeni cech. Zasady pomiaru odległości pomiędzy grupami obiektów. Algorytmy szybkiej analizy skupień, metoda k-średnich. Dwuetapowa analiza skupień. Budowanie drzewa celów