Курс по Data-инженерии будет полезен для многих специалистов: инженеров, желающих прокачать свои навыки и освоить новые инструменты, аналитиков и разработчиков, чтобы лучше понимать процессы, связанные с большими данными, и даже предпринимателей, которым эти знания пригодятся для повышения выручки компании.
Обучение предполагает наличие базовых знаний по Python, Linux, SQL. На этой базе вы сможете эффективно работать с большими данными, а именно собирать, хранить и обрабатывать их; анализировать и выстраивать архитектуру хранилищ данных; проектировать пайплайны и подбирать подходящий инструмент для конкретной задачи. Также вы сможете получить важные soft skills: умение работать с дата-командой, навык объяснения профессиональных терминов простым языком, умение принимать решения, учитывая их последствия.
Показываем, как будет расти ваш заработок вместе с опытом. И сколько времени потребуется, чтобы окупить вложения в образование
Небольшое видео-знакомство расскажет вам о преподавателях и экспертах, которые будут помогать вам с обучением. Вы посмотрите пример из урока, как можно выстроить различные подходы к построению данных, а также получите общее понимание специфики работы дата-инженера.
3-месячный онлайн-курс по Data-инженерии даст вам самые актуальные знания и навыки по работе с большими данными. Уроки проходят в формате живых вебинаров, которые сопровождаются практическими заданиями и их ревью. В конце обучения вы подготовите итоговый проект на собственных данных.
Начнете обучение на курсе по Data-инженерингу с изучения вопроса применимости языка Python под рабочие задачи специалиста по большим данным. Познакомитесь с терминалом задач.
Изучите классические подходы, решающие задачи распределённого вычисления. Также ознакомитесь с функционалом hdfs, Hadoop и Map-Reduce. В качестве практики научитесь решать простые задачи с помощью этого метода.
В центре внимания этого урока будет Spark. Вы сможете настроить инструмент под учебные, а также будущие рабочие задачи. В качестве практического задания получите задачки на знание Spark.
Познакомитесь с важным инструментом в арсенале Data-инженера. Узнаете, каким образом строится работа по организации значений в реляционных базах данных. На практическом занятии изучите принципы работы при помощи SQL.
Узнаете, каким образом отличаются базы данных, на примере NoSQL и других вариантов. Сможете оценивать, какую выбрать для решения подходящих задач. Также разберетесь в способах построения хранилищ.
Поймете, как происходит процессинг и перекладывание данных. Сравните ETL и ELT и найдете отличия. На примерах разберетесь с последствиями для инфраструктуры при выборе определенного подхода. Спикеры поделятся с вами составленным списком критериев, который помогает при принятии решения о перекладке данных.
Узнаете, что такое оркестраторы данных. Научитесь работать с Apache AirFlow и поймете, какие примущества у него есть. В качестве практической задачи попробуете его конфигурировать.
Перейдете к изучению полезного инструмента под названием Kafka. Разберетесь, как его настраивать в зависимости от типа задач (батчинг или стриминг). Узнаете, что такое шины данных.
Поближе рассмотрите ETL-инструменты. Узнаете, как их использовать для преобразования данных, в том числе произвольных. Зададите интересующие вас вопросы спикеру и выполните практическое задание по теме.
Модуль посвящен методам проектирования и архитектуры хранилищ. Вы узнаете, какие проблемы и ошибки возникают чаще всего и как от них эффективнее всего избавиться.
Получите необходимый для инженера Big Data навык аналитики процессов и данных. Научитесь производить оценку data quality и предоставлять заказчику информацию о проделанной работе так, чтобы вас поняли.
В конце обучения вы сможете создать собственный проект на учебных или ваших данных. Вы сможете доказать спикерам, а главное себе, что отлично освоили изученный материал и готовы к реальной работе Data-инженером.
Просмотр обучающих видеороликов
Делаете все тогда, когда вам это удобно и в подходящем вам темпе
Объяснение возникших вопросов, закрепление пройденного материала и исправление ошибок
Данный проект, показывающий ваши навыки, будет прекрасным дополнением к вашему портфолио
Научитесь выгодно презентовать свои сильные стороны, чтобы получать больше откликов компаний
Познакомитесь с площадками для поиска работы, узнаете, как успешно пройти стажировку, и получите доступ к бирже с вакансиями компаний-партнёров
В курсе собраны самые свежие данные по Big Data и профессии Data-инженера. Вы начнете с изучения основ специальности и к концу обучения сможете претендовать на должность Junior-специалиста.
Python лежит в основе программы курса, поэтому вас будет проще погрузиться в мир Big Data и осваивать новый материал.
С каждым годом объем больших данных растет в геометрической прогрессии. Бизнесу и крупным корпорациям необходимы специалисты, которые смогут разбираться с подобным объемом данных и творчески подходить к решению задач по развитию бизнеса.
Вы ни в коем случае не останитесь один на один с новым материалом. Для вас будет доступен чат поддержки, где спикеры курса помогут разобраться с трудными темами. Кстати, доступ к чату останется у вас и после завершения обучения.
Чтобы обучение принесло вам пользу, необходимо разбираться в нескольких областях. Так, требуется знание Linux на продвинутом уровне, умение работать с SQL и скриптами на Python, а также понимать, как проектируются IT-системы и работают клиент-серверные приложения.