Nowoczesne podejścia do zarządzania danymi - kurs 27 900 RUB. z Centrum Szkoleniowego IBS, szkolenie 16 godz., termin 26.11.2023.
Miscellanea / / December 02, 2023
Podczas projektowania aplikacji jedną z ważnych decyzji jest sposób przechowywania danych. Przez kilka dekad pierwszą i jedyną opcją były relacyjne systemy DBMS, projekty różniły się jedynie stopniem normalizacji, lokalizacją logiki biznesowej itp. Ostatni dziesięciu do piętnastu lat nastąpił szybki rozkwit systemów alternatywnych – od zorientowanych obiektowo i zorientowanych na dokumenty systemów DBMS po rozproszone systemy plików i systemy przetwarzania strumieniowego dane. W ramach kursu analizowane są szereg nowoczesnych rozwiązań, które pozwalają na długotrwałe bezpieczne przechowywanie danych, przyczyny powstawania rozwiązań różnych klas, ich zalety i wady oraz preferowane metody używać.
Omawiane tematy:
1. Ewolucja podejść do przechowywania danych (teoria – 2 godz.).
Bazy danych, hurtownie danych, silniki baz danych, architektury masowo równoległe, hiperkonwergencja.
2. Model relacyjny (teoria – 2 godz.).
Jakie problemy rozwiązuje i jakim kosztem?
Replikacja, sharding, transakcje rozproszone.
3. Minimalny model klucz-wartość (teoria – 1 godzina, praktyka – 1 godzina).
Opcje struktury klucza, opcje struktury wartości, interfejsy oprogramowania.
Efektywność wykorzystania nierelacyjnych baz danych: warunki konieczne i wystarczające [Cassandra, HBase].
4. Model zorientowany na dokument [MongoDB] (teoria – 0,5 godz., praktyka – 0,5 godz.).
5. Rozproszone systemy plików zamiast modeli danych: architektura klastrowa [HDFS] (teoria – 1 godz., praktyka – 1 godz.).
6. SQL w rozproszonych systemach plików (teoria – 1 godzina, praktyka – 2 godziny).
Opcje architektury, formaty plików, ograniczenia, transakcje [Hive, Spark, Spark SQL, Parquet, ORC].
7. Rozproszone systemy przechowywania danych w pamięci RAM [Hazelcast, Ignite, Tarantool] (teoria – 1 godz.).
8. Rozproszone systemy OLAP [Clickhouse, Druid] (teoria – 1 godz.).
9. Przetwarzanie strumieni danych [Spark Streaming] (teoria – 1 godz.).
10. Samokonfigurujące się i autonomiczne bazy danych (teoria – 1 godz.).