Spark Streaming - это расширение, созданное компанией Apache для обработки потоков данных в режиме реального времени. Благодаря своему устройству оно может обеспечить высокую скорость работы и устойчивость к сбоям. Особенностью расширения является работа с микропакетами, на которые разбиваются большие массивы данных, что обеспечивает хорошую производительность. Spark Streaming используют все, кто работает с Big Data: инженеры, аналитики и специалисты по машинному обучению.
Программа курса
Вас ожидает годовой курс лекций и вебинаров, на котором вы освоите всю необходимую теорию, опробуете свои навыки на практических заданиях. На момент окончания обучения в вашем портфолио будет свыше 10 успешных проектов.
Чему вы научитесь
Преподаватели
Data Scientist
Lead DevOps
Старший бизнес-аналитик
Senior BI Analyst в EPAM Systems
Big Data Engineer
Data Engineer
Senior Data Engineer в Dodo Brands
IT Cluster Lead; Кандидат физико-математических наук
Аналитик-разработчик
Senior Data Engineer
Fullstack-разработчик
Business Analyst
Team Lead
Эксперт
Инструменты
Программа курса
На онлайн-курсе вы научитесь редактировать модели данных, освоите ETL-автоматизацию, поработаете с разными типами баз, хранилищ и озёр данных и разберётесь в работе с облачными сервисами.
Чему вы научитесь
Инструменты
Программа курса
Вас ждут онлайн-занятия, на которых вы научитесь работать с потоковыми данными и освоите инженерные навыки, а также выполните итоговый проект для портфолио.