На факультете Data Engineering вы получите знания, необходимые для работы с данными. Вы узнаете, как устроена система контроля версий Git и как наладить в ней командную работу, научитесь работать с ОС Linux, будете разбираться в устройстве баз данных, сможете работать с Big Data, создавать приложения для потоковой работы с данными, разрабатывать хранилища, использовать продукты экосистемы Hadoop, BI-системы и программировать на Python.
Вы сможете получить востребованные профессии инженера данных, ML Engineer или DHW-аналитика. После обучения GeekBrains поможет вам с трудоустройством.
Показываем, как будет расти ваш заработок вместе с опытом. И сколько времени потребуется, чтобы окупить вложения в образование
Большая часть курса — это вебинары, на которых вы сможете задавать вопросы преподавателям и обсуждать пройденный материал. Вы будете постепенно двигаться от легких тем к объемным и сложным.
Вы познакомитесь с системой контроля версий, установите на ПК и настроите её под себя. Рассмотрите базовые команды терминала, научитесь управлять файлами и ветками репозитория и проводить сложные операции.
Узнаете, как устроены базы данных и изучите язык запросов SQL, чтобы общаться с ними. Научитесь сортировать и фильтровать данные, проводить и оптимизировать сложные запросы.
Познакомитесь с функциями, выражениями и словарями этого языка программирования. Изучите принципы ООП и узнаете, как работать с файловой системой.
Вы изучите методы парсинга данных с помощью нескольких программ и приложений. Познакомитесь с системами, которые управляют базами данных. Освоите фреймворк Scrapy.
Вы с нуля разработаете парсер.
Вы изучите архитектуру хранилищ и узнаете, как их спроектировать. Научитесь создавать ETL-процессы и управлять качеством обрабатываемых данных. Выполните курсовую работу.
Познакомитесь с многомерными хранилищами, научитесь создавать меры и работать с разными измерениями. Сможете оптимизировать процессинг и подключить BI-систему
Узнаете, как организовать NoSQL данные несколькими способами. Познакомитесь с MongoDB и изучите Tarantool.
Создание собственного хранилища для BI-системы.
Вы научитесь работать с файловой системой, разберетесь с управлением кластерами с помощью HDFS, движком для SQL-запросов Hive, веб-интерфейсом для анализа данных HUE, форматами хранения данных, ETL, нереляционными базами данных и Data Warehouse.
Вы познакомитесь с архитектурой фреймворка, узнаете, как он обрабатывает запросы, хранит и читает данные. Научитесь оптимизировать SQL-запросы, проводить операции с данными и разберете тему Machine Learning на PySpark
Узнаете, как разрабатывать и настраивать потоки данных и планировать задачи. Рассмотрите примеры использования задач, которые можно решить с помощью Airflow.
Вы создадите ETL-пайплайн, пользуясь инструментами для работы с Big Data.
Вы поймете, как обрабатывать данные в реальном времени, используя Kafka и Spark Streaming. Получите навыки DevOps, которые помогут вам в работе.
Вы познакомитесь с устройством Kafka и Workflow. Научитесь применять их в работе. Узнаете, как создавать динамические запросы.
Узнаете, зачем используется Docker, что такое контейнеры и микросервисы, познакомитесь с программой Kubernetes и поймете принципы ее работы, разберетесь в устройстве кластеров и научитесь использовать CI/CD.
Вы создадите сервис, который будет использовать машинное обучение для оценки способности клиентов банка погашать кредиты.
Эти курсы обязательны для прохождения и входят в основную программу курса. Вы сами можете выбрать время обучения на этих курсах, чтобы подстроить нагрузку под себя. Вы должны закончить курсы в течение 2,5 лет после покупки курса.
Вы узнаете, как работает машинное обучение, что нужно для построения модели и как готовить данные для выполнения разных задач.
Установите операционную систему, рассмотрите её интерфейс и командную строку, поймете, как устроена файловая система и как управлять пользователями. Изучите скрипты Bash и узнаете, как обеспечить безопасность сети. Познакомитесь с Docker.
Просмотр обучающих видеороликов
Делаете все тогда, когда вам это удобно и в подходящем вам темпе
Объяснение возникших вопросов, закрепление пройденного материала и исправление ошибок
Данный проект, показывающий ваши навыки, будет прекрасным дополнением к вашему портфолио
Научитесь выгодно презентовать свои сильные стороны, чтобы получать больше откликов компаний
Познакомитесь с площадками для поиска работы, узнаете, как успешно пройти стажировку, и получите доступ к бирже с вакансиями компаний-партнёров
Обучение организовано так, что вы можете спокойно совмещать его с работой, учебой и личной жизнью. Именно вы решаете, когда работать с материалами курса - вы занимаетесь тогда, когда удобно вам. Все уроки курса будут всегда в вашем доступе, даже после окончания курса, поэтому вы в любой момент сможете повторить пройденный материал.
Именно вы решаете, когда и сколько заниматься. Обычно студенты тратят на обучение от трех до пяти часов в неделю.
Да, вы всегда сможете задать вопрос преподавателю в личном кабинете. Также вы будете получать от него обратную связь после выполнения домашних заданий.
Да, вы можете купить курс в рассрочку, что позволит вам лучше спланировать свой бюджет.