3-месячный онлайн-курс по Data-инженерии даст вам самые актуальные знания и навыки по работе с большими данными. Уроки проходят в формате живых вебинаров, которые сопровождаются практическими заданиями и их ревью. В конце обучения вы подготовите итоговый проект на собственных данных.
1.
Python и терминал для задач Data Engineering
2.
Распределенные файловые системы. Hadoop. Map-Reduce
3.
Spark for Data Engineering
4.
Реляционные базы данных
5.
NOSQL базы данных и введение в методологии построения хранилищ
6.
Процессинг и перекладывание (перекладка) данных
7.
Оркестраторы данных. AirFlow
8.
Шины данных. Kafka. Принципы построения систем потоковой аналитики
10.
Архитектура хранилищ данных
11.
Аналитика. Жизненный цикл данных и оценка data quality
12.
Работа с собственным проектом в финальном модуле