Курс «Симулятор Data Warehouse Analytics Engineer на базе dbt для инженеров и аналитиков данных»

Живые вебинары, Видеоуроки, Консультации / В группе с наставником / Обучение в ЛК на сайте автора

  • 3 месяца
  • Сертификат
  • Участие в потоке

Вы изучите один из самых востребованных инструментов аналитики, научитесь DataOps-практикам, построете хранилище данных на базе dbt, подготовитесь и проанализируете данные.

Автор: Онлайн-школа Inzhenerka.Tech Автор курса : Павел Рословец

Обновлено: 20.11.2024

Источник изображения: Unsplash

Старт следующего потока

25 ноября

Через 2 дня

от38 500  от45 000
Скидка 14%
  • Оплата на сайте автора. Цена может отличаться.
  • Доступен в рассрочку

Варианты участия

Мастер задач 38 500

  • Скидка 14%
  • Цена без скидки — 45 000 ₽
  • Дата старта — 25 ноября
  • Бессрочный доступ к тренажеру.
  • Чат курса с поддержкой и преподавателем.
  • AI-бот ДуДу для мгновенного CodeReview.
  • Сертификат.

Основательный подход 55 000

  • Скидка 21%
  • Цена без скидки — 70 000 ₽
  • Дата старта — 25 ноября
  • Бессрочный доступ к тренажеру.
  • Вебинар по Airflow.
  • Вебинар по Dagster.
  • Чат курса с поддержкой и преподавателем.
  • AI-бот ДуДу для мгновенного CodeReview.
  • Бонус: тренажер по работе в GIT или Английский для IT.
  • 2 встречи вопрос-ответ с Team Lead 1 на 1 (по запросу).
  • Сертификат.
Этот курс включает:
  • 3 месяца
  • Срок доступа: бессрочный
  • Обучение: в ЛК на сайте автора
  • Когда будете учиться: строго по расписанию
  • Уровень сложности: для новичков
  • Бонусы: только для дорогих тарифов
  • Демодоступ
  • Сопровождение: куратором
  • Сертификат
  • Техническая поддержка: в рабочее время, чат в мессенджере, телефон
  • Доступ: сразу после оплаты
Симулятор Data Warehouse Analytics Engineer на базе dbt для инженеров и аналитиков данных

Онлайн-школа Inzhenerka.Tech

Перейти на сайт

Что вы получите?

  • Умение строить хранилища данных.
  • Знания по решению бизнес-проблем.
  • Навыки подготовки и тестирования..
  • Опыт в DataOps-практиках.
  • Знания в создании ELT-пайплайнов.

О курсе

Курс-симулятор для инженеров и аналитиков данных, которые хотят овладеть навыками построения хранилищ данных и научиться работать с актуальными инструментами для обработки и анализа информации. На курсе вы научитесь использовать dbt (Data Build Tool) для создания и оптимизации ETL-процессов, DataOps-практикам и автоматизации аналитической работы. Проводится подготовка экспертами образовательного проекта «Онлайн-школа Inzhenerka.Tech».

Вы научитесь проектировать и создавать структуры данных на базе dbt, которые будут обрабатывать большие объемы информации, обеспечивая быстрое и точное получение аналитики. Курс построен на кейсах, имитирующих задачи, с которыми сталкиваются инженеры по аналитике данных в крупных организациях. Вы научитесь работать с настоящими данными и получите реальный опыт, применимый в работе инженера.

Программа курса «Симулятор Data Warehouse Analytics Engineer на базе dbt для инженеров и аналитиков данных»:

  1. Знакомство с профессией инженера аналитики.
  2. Создание базы и проекта Data Build Tool. Где хранить код. Таблица анализа статистики.
  3. Автоматизация проекта.
  4. Практика выполнения финансового анализа организации.
  5. Упаковка и продажа себя как инженера аналитики.

Data Warehouse и Data Build Tool — это то, чем обязан владеть каждый middle-, senior-аналитик и Analytics Engineer. Получив эти знания, вы сможете уверенно чувствовать себя в любом проекте как на отечественном, так и зарубежном рынке.

Миссия 1. Знакомимся с профессией Analytics Engineer
  • Понимание ролей и обязанностей в сфере аналитики и места в ней новой профессии Analytics Engineer.
  • Понимание, какие преимущества дает dbt и какие старые проблемы эффективно решает.
Миссия 2. Ускоряем обучение с AI
  • Тренируемся эффективно использовать большие языковые модели, генерировать SQL-скрипты и дебажить ошибки dbt.
  • Осваиваем AI-помощника ДуДу.
  • Краткое введение в промпт-инжиниринг.
Миссия 3. Создаем базу и проект dbt
  • Понимание, чем отличаются разные виды хранилищ данных, какие у них достоинства, недостатки и границы применимости.
  • Умение настраивать локальную и облачную инфраструктуру для персональных проектов.
Миссия 4. Начинаем освоение dbt на практике
  • Понимание, как устроен проект dbt и описание моделей.
  • Умение создавать таблицы из SQL-моделей dbt.
Миссия 5. Деплоим таблицы и представления из dbt
  • Понимание, как аналитики моделируют и перемоделируют хранилище данных.
  • Умение создавать модели dbt из SQL-запросов.
  • Расчет и визуализация географических данных.
Миссия 6. Инкрементально обновляем большие таблицы
  • Понимание, когда нужно превращать обычные модели в инкрементальные и что для этого требуется.
  • Умение выбирать инкрементальную стратегию в зависимости от задачи и типа хранилища.
  • Базовое владение техникой шаблонизации SQL-моделей dbt с помощью встроенного инструмента Jinja.
  • Умение внедрять инкрементальность в SQL-код модели, проводить их отладку и заполнять исторические данные.
Миссия 7. Создаем таблицы из CSV-файлов
  • Понимание границ применения CSV-файлов в аналитике, их достоинств, недостатков, изучение альтернатив.
  • Умение создавать таблицы из CSV-файлов с помощью dbt seed.
  • Умение строить и обновлять пайплайны данных на основе CSV-файлов.
  • Умение генерировать CSV-файлы под заданные требования с помощью сервисов LLM.
Миссия 8. Автоматизируем проект с помощью макросов
  • Умение создавать макросы Jinja для переиспользования бизнес-логики между моделями.
  • Умение создавать параметризованные модели, управляемые с помощью переменных из командной строки.
  • Умение правильно работать с тайм-зонами в хранилище.
  • Автоматизация проекта dbt для решения вспомогательных задач с помощью хуков.
  • Понимание основ низкоуровневой оптимизации данных в хранилище.
  • Настройка автоматической раздачи доступов к артефактам dbt.
Миссия 9. Тестируем качество моделей
  • Понимание основных проблем качества данных, умение диагностировать и решать их.
  • Использование взвешенного подхода при внедрении тестов данных с фокусом на основных проблемах.
  • Умение использовать стандартные тесты dbt для быстрого внедрения типовых проверок данных.
  • Умение создавать свои тесты данных на основе SQL для моделей и отдельных колонок.
Миссия 10. Создаем каталог данных и внедряем контракты
  • Добавляем в проект метаданные и data contracts.
  • Генерируем интерактивный портал с каталогом всего проекта и учимся работать с ним.
  • Что такое артефакты dbt и как их можно использовать для анализа проекта.
  • Настраиваем CI/CD с GitHub Actions для автоматического обновления каталога данных из исходного кода.
Миссия 11. Используем сторонние пакеты для решения сложных задач
  • Что такое пакеты dbt, какие возможности дают, где их брать и устанавливать.
  • Обзор dbt Package Hub и наиболее интересных пакетов.
  • Переиспользование сложной бизнес-логики для быстрого построения моделей и создания тестов данных.
Миссия 12. Настраиваем семантический слой для автоматической агрегации данных
  • Изучаем особенности семантического слоя, отличие от OLAP-кубов и разные способы его реализации.
  • Создаем семантический слой в проекте dbt с MetricFlow.
Миссия 13. Переносим легаси-код SQL в dbt
  • Переносим старый непонятный и недокументированный SQL-код из представлений и сохраненных процедур в проект dbt. Автоматизируем расчет показателей бизнеса с помощью dbt.
Миссия 14. Используем dbt + DuckDB для быстрой обработки файлов
  • Что такое in-memory-аналитика и почему DuckDB набирает популярность.
  • Заменяем расчеты в Excel на DuckDB и документированные SQL-модели.
  • Выполняем финансовый анализ компании.
Миссия 15. Деплоим проект в продакшн: CI/CD
  • Методы деплоя аналитических пайплайнов.
  • Multi-stage окружение.
  • Запускаем dbt-core в GitHub Actions по расписанию.
  • Обзор оркестраторов для dbt.
  • Введение в Dagster и Airflow.
Эпилог. Продаем себя как инженера аналитики
  • Учимся красиво представлять свой опыт и полученные знания.
  • Как составить эффективное резюме, оформить демо-проект на GitHub и пройти техническое интервью на должность дата-инженера/аналитика.
  • Дальнейшие пути развития в рамках dbt и не только.
Вебинар: dbt и Dagster. От запуска до тестов
  • Научитесь запускать сборку моделей dbt руками.
  • Научитесь настраивать запуск по расписанию.
  • Научитесь работать с селекторами dbt.
  • Научитесь запускать тесты dbt assets.
  • Коротко обсудим остальные аспекты работы с Dagster – software defined assets, ops, jobs.
Вебинар: dbt и Airflow
  • Научитесь запускать сборку моделей dbt руками.
  • Научитесь настраивать запуск по расписанию.
  • Научитесь работать с селекторами dbt.
  • Обсудим отличия от Dagster и работу с дагами эйрфлоу в целом.
  • Формат
    В группе с наставником
    Живые вебинары / Видеоуроки / Консультации Мастер задач — Видеоуроки
    Обучение в ЛК на сайте автора
  • Демодоступ
  • Продолжительность
    3 месяца
  • Уровень сложности
    Для новичков
  • Когда вы будете учиться
    Строго по расписанию
  • Документ об обучении
    Сертификат
  • Сопровождение
    Куратором
  • Общение с группой
    Форум или чат внутри ЛК
  • Техническая поддержка
    В рабочее времяЧат в мессенджереТелефон
  • Срок доступа к материалам
    Бессрочный
  • Бонусы
    Только для дорогих тарифов
  • Год выхода
    2024 Последнее обновление: 20.11.2024
  • Дополнительные материалы курса
    AI-бот для мгновенного CodeReview
  1. Нажмите на кнопку
    Узнать подробности
  2. Вы перейдете на детальную страницу курса онлайн-школы. Внимательно прочитайте представленную на ней информацию.
  3. Следуя указаниям, оформите заказ на курс.
  4. Обязательно укажите актуальный e-mail. На него придет вся информация, в частности, по доступу к курсу.

Если инструкция вам не помогла, пожалуйста напишите нам на почту info@info-hit.ru, мы оперативно поможем вам получить необходимую информацию.

Отзывы о курсе

Пока никто не оставил отзывов. Чтобы оставить отзыв перейдите на полную версию страницы.

Другие курсы автора