Курс «Симулятор Data Warehouse Analytics Engineer на базе dbt для инженеров и аналитиков данных»
Живые вебинары, Видеоуроки, Консультации / В группе с наставником / Обучение в ЛК на сайте автора
Вы изучите один из самых востребованных инструментов аналитики, научитесь DataOps-практикам, построете хранилище данных на базе dbt, подготовитесь и проанализируете данные.
Обновлено: 20.11.2024
Источник изображения: Unsplash
Старт следующего потока
25 ноября
Через 2 дня
- Оплата на сайте автора. Цена может отличаться.
- Доступен в рассрочку
Варианты участия
Мастер задач
38 500 ₽
- Скидка 14%
- Цена без скидки — 45 000 ₽
- Дата старта — 25 ноября
- Бессрочный доступ к тренажеру.
- Чат курса с поддержкой и преподавателем.
- AI-бот ДуДу для мгновенного CodeReview.
- Сертификат.
Основательный подход
55 000 ₽
- Скидка 21%
- Цена без скидки — 70 000 ₽
- Дата старта — 25 ноября
- Бессрочный доступ к тренажеру.
- Вебинар по Airflow.
- Вебинар по Dagster.
- Чат курса с поддержкой и преподавателем.
- AI-бот ДуДу для мгновенного CodeReview.
- Бонус: тренажер по работе в GIT или Английский для IT.
- 2 встречи вопрос-ответ с Team Lead 1 на 1 (по запросу).
- Сертификат.
- 3 месяца
- Срок доступа: бессрочный
- Обучение: в ЛК на сайте автора
- Когда будете учиться: строго по расписанию
- Уровень сложности: для новичков
- Бонусы: только для дорогих тарифов
- Демодоступ
- Сопровождение: куратором
- Сертификат
- Техническая поддержка: в рабочее время, чат в мессенджере, телефон
- Доступ: сразу после оплаты
Что вы получите?
- Умение строить хранилища данных.
- Знания по решению бизнес-проблем.
- Навыки подготовки и тестирования..
- Опыт в DataOps-практиках.
- Знания в создании ELT-пайплайнов.
О курсе
Описание
Программа обучения
Особенности
Курс-симулятор для инженеров и аналитиков данных, которые хотят овладеть навыками построения хранилищ данных и научиться работать с актуальными инструментами для обработки и анализа информации. На курсе вы научитесь использовать dbt (Data Build Tool) для создания и оптимизации ETL-процессов, DataOps-практикам и автоматизации аналитической работы. Проводится подготовка экспертами образовательного проекта «Онлайн-школа Inzhenerka.Tech».
Вы научитесь проектировать и создавать структуры данных на базе dbt, которые будут обрабатывать большие объемы информации, обеспечивая быстрое и точное получение аналитики. Курс построен на кейсах, имитирующих задачи, с которыми сталкиваются инженеры по аналитике данных в крупных организациях. Вы научитесь работать с настоящими данными и получите реальный опыт, применимый в работе инженера.
Программа курса «Симулятор Data Warehouse Analytics Engineer на базе dbt для инженеров и аналитиков данных»:
- Знакомство с профессией инженера аналитики.
- Создание базы и проекта Data Build Tool. Где хранить код. Таблица анализа статистики.
- Автоматизация проекта.
- Практика выполнения финансового анализа организации.
- Упаковка и продажа себя как инженера аналитики.
Data Warehouse и Data Build Tool — это то, чем обязан владеть каждый middle-, senior-аналитик и Analytics Engineer. Получив эти знания, вы сможете уверенно чувствовать себя в любом проекте как на отечественном, так и зарубежном рынке.
- Понимание ролей и обязанностей в сфере аналитики и места в ней новой профессии Analytics Engineer.
- Понимание, какие преимущества дает dbt и какие старые проблемы эффективно решает.
- Тренируемся эффективно использовать большие языковые модели, генерировать SQL-скрипты и дебажить ошибки dbt.
- Осваиваем AI-помощника ДуДу.
- Краткое введение в промпт-инжиниринг.
- Понимание, чем отличаются разные виды хранилищ данных, какие у них достоинства, недостатки и границы применимости.
- Умение настраивать локальную и облачную инфраструктуру для персональных проектов.
- Понимание, как устроен проект dbt и описание моделей.
- Умение создавать таблицы из SQL-моделей dbt.
- Понимание, как аналитики моделируют и перемоделируют хранилище данных.
- Умение создавать модели dbt из SQL-запросов.
- Расчет и визуализация географических данных.
- Понимание, когда нужно превращать обычные модели в инкрементальные и что для этого требуется.
- Умение выбирать инкрементальную стратегию в зависимости от задачи и типа хранилища.
- Базовое владение техникой шаблонизации SQL-моделей dbt с помощью встроенного инструмента Jinja.
- Умение внедрять инкрементальность в SQL-код модели, проводить их отладку и заполнять исторические данные.
- Понимание границ применения CSV-файлов в аналитике, их достоинств, недостатков, изучение альтернатив.
- Умение создавать таблицы из CSV-файлов с помощью dbt seed.
- Умение строить и обновлять пайплайны данных на основе CSV-файлов.
- Умение генерировать CSV-файлы под заданные требования с помощью сервисов LLM.
- Умение создавать макросы Jinja для переиспользования бизнес-логики между моделями.
- Умение создавать параметризованные модели, управляемые с помощью переменных из командной строки.
- Умение правильно работать с тайм-зонами в хранилище.
- Автоматизация проекта dbt для решения вспомогательных задач с помощью хуков.
- Понимание основ низкоуровневой оптимизации данных в хранилище.
- Настройка автоматической раздачи доступов к артефактам dbt.
- Понимание основных проблем качества данных, умение диагностировать и решать их.
- Использование взвешенного подхода при внедрении тестов данных с фокусом на основных проблемах.
- Умение использовать стандартные тесты dbt для быстрого внедрения типовых проверок данных.
- Умение создавать свои тесты данных на основе SQL для моделей и отдельных колонок.
- Добавляем в проект метаданные и data contracts.
- Генерируем интерактивный портал с каталогом всего проекта и учимся работать с ним.
- Что такое артефакты dbt и как их можно использовать для анализа проекта.
- Настраиваем CI/CD с GitHub Actions для автоматического обновления каталога данных из исходного кода.
- Что такое пакеты dbt, какие возможности дают, где их брать и устанавливать.
- Обзор dbt Package Hub и наиболее интересных пакетов.
- Переиспользование сложной бизнес-логики для быстрого построения моделей и создания тестов данных.
- Изучаем особенности семантического слоя, отличие от OLAP-кубов и разные способы его реализации.
- Создаем семантический слой в проекте dbt с MetricFlow.
- Переносим старый непонятный и недокументированный SQL-код из представлений и сохраненных процедур в проект dbt. Автоматизируем расчет показателей бизнеса с помощью dbt.
- Что такое in-memory-аналитика и почему DuckDB набирает популярность.
- Заменяем расчеты в Excel на DuckDB и документированные SQL-модели.
- Выполняем финансовый анализ компании.
- Методы деплоя аналитических пайплайнов.
- Multi-stage окружение.
- Запускаем dbt-core в GitHub Actions по расписанию.
- Обзор оркестраторов для dbt.
- Введение в Dagster и Airflow.
- Учимся красиво представлять свой опыт и полученные знания.
- Как составить эффективное резюме, оформить демо-проект на GitHub и пройти техническое интервью на должность дата-инженера/аналитика.
- Дальнейшие пути развития в рамках dbt и не только.
- Научитесь запускать сборку моделей dbt руками.
- Научитесь настраивать запуск по расписанию.
- Научитесь работать с селекторами dbt.
- Научитесь запускать тесты dbt assets.
- Коротко обсудим остальные аспекты работы с Dagster – software defined assets, ops, jobs.
- Научитесь запускать сборку моделей dbt руками.
- Научитесь настраивать запуск по расписанию.
- Научитесь работать с селекторами dbt.
- Обсудим отличия от Dagster и работу с дагами эйрфлоу в целом.
-
ФорматВ группе с наставником
Живые вебинары / Видеоуроки / Консультации Мастер задач — Видеоуроки
Обучение в ЛК на сайте автора -
Демодоступ
-
Продолжительность3 месяца
-
Уровень сложностиДля новичков
-
Когда вы будете учитьсяСтрого по расписанию
-
Документ об обученииСертификат
-
СопровождениеКуратором
-
Общение с группойФорум или чат внутри ЛК
-
Техническая поддержкаВ рабочее времяЧат в мессенджереТелефон
-
Срок доступа к материаламБессрочный
-
БонусыТолько для дорогих тарифов
-
Год выхода2024 Последнее обновление: 20.11.2024
-
Дополнительные материалы курсаAI-бот для мгновенного CodeReview
- Нажмите на кнопку
Узнать подробности - Вы перейдете на детальную страницу курса онлайн-школы. Внимательно прочитайте представленную на ней информацию.
- Следуя указаниям, оформите заказ на курс.
- Обязательно укажите актуальный e-mail. На него придет вся информация, в частности, по доступу к курсу.
Если инструкция вам не помогла, пожалуйста напишите нам на почту info@info-hit.ru, мы оперативно поможем вам получить необходимую информацию.
Отзывы о курсе
Пока никто не оставил отзывов. Чтобы оставить отзыв перейдите на полную версию страницы.
Другие курсы автора
- Формат — Живые вебинары
- 3 месяца
Курс — Playwright для инженеров по тестированию
- Формат — Живые вебинары
- 4 недели
Курс — Английский для IT-специалистов
- Формат — Живые вебинары
- 2 месяца
Курс — Автоматизация тестирования на Java с нуля
- Формат — Живые вебинары
- 3 месяца
- 29 уроков
Курс — Тренажер по Rust
- Формат — Живые вебинары
- 3 месяца
Практикум — Тренажер Python и SQL для ML и анализа данных
- Формат — Живые вебинары
- 4 месяца