Курс «Основы Trino»

Курс «Основы Trino» − двухдневный практический курс по эксплуатации, установке и настройке кластера Trino в рамках Arenadata Hyperwave, который направлен на изучение ключевых аспектов работы с различными источниками данных. Курс поможет получить практические навыки по развертыванию и настройке ключевых параметров, для успешной эксплуатации кластера Trino.
программа курса

Преимущества курса «Основы Trino»

Курс единственного в мире вендора-разработчика открытого дистрибутива Hadoop.

Arenadata — единственный вендор, который на базе Apache Hadoop разрабатывает собственный дистрибутив, адаптированный для корпоративного использования и предназначенный для хранения и обработки слабоструктурированных и неструктурированных данных.

Теоретические знания и практический опыт

В рамках курса участники:

  • подготовке окружения и установке Trino в рамках Arenadata Hyperwave;
  • архитектуре кластера Trino (Основные узлы кластера. Плагины, Коннекторы);
  • настройке каталогов для взаимодействия с различными источниками данных;
  • написанию и оптимизации запросов в Trino;
  • использованию мониторинга и знание WEB-интерфейса мониторинга;
  • принципам настройки ролей и безопасности.

Знания с нуля

Слушатели курса без предварительных знаний научатся использовать современные инструменты для разработки (IDE, интерактивные), сборки (Maven, sbt) и запуска приложений Apache Spark на языке программирования Scala (Python, Java), включая различные режимы и способы размещения приложений в Arenadata Hadoop.

Сертификация

    Слушателям, успешно прошедшим сертификацию, выдается именной вендорский сертификат со статусом сертифицированного специалиста. Слушателям курса предоставляется 2 попытки для прохождения проверки знаний.

Аудитория курса и начальные требования
Как проходит курс
Сертификация
Аудитория курса и начальные требования

Курс актуален для аналитиков, Data инженеров, которые планируют научиться использовать Trino для задач обмена и анализа данных.

Для получения практических навыков необходимы:

  • базовые знания по работе с командной строкой Linux;
  • базовые знания SQL (опыт написания запросов из нескольких таблиц).
Как проходит курс

Занятия проходят удаленно. Курс проводится в формате вебинара: вас ждет общение с преподавателем, лекционная часть, практические работы на виртуальных машинах и разбор лабораторных работ, сессия вопросов-ответов с практиками из Arenadata.

Время занятий с 10:00 до 18:00 мск.

Группы набираются в двух форматах:

  • Корпоративные (заказчик записывает на курс команду от 10 человек, даты занятий согласуются отдельно)
  • Открытые (смешанные группы, в которые входят представители нескольких компаний, такие занятия проходят по расписанию)
Сертификация

Слушателям, успешно прошедшим сертификацию, выдается именной вендорский сертификат со статусом сертифицированного специалиста. Слушателям курса предоставляется 2 попытки для прохождения проверки знаний.

Аудитория курса и начальные требования

Курс актуален для аналитиков, Data инженеров, которые планируют научиться использовать Trino для задач обмена и анализа данных.

Для получения практических навыков необходимы:

  • базовые знания по работе с командной строкой Linux;
  • базовые знания SQL (опыт написания запросов из нескольких таблиц).
Как проходит курс

Занятия проходят удаленно. Курс проводится в формате вебинара: вас ждет общение с преподавателем, лекционная часть, практические работы на виртуальных машинах и разбор лабораторных работ, сессия вопросов-ответов с практиками из Arenadata.

Время занятий с 10:00 до 18:00 мск.

Группы набираются в двух форматах:

  • Корпоративные (заказчик записывает на курс команду от 10 человек, даты занятий согласуются отдельно)
  • Открытые (смешанные группы, в которые входят представители нескольких компаний, такие занятия проходят по расписанию)
Сертификация

Слушателям, успешно прошедшим сертификацию, выдается именной вендорский сертификат со статусом сертифицированного специалиста. Слушателям курса предоставляется 2 попытки для прохождения проверки знаний.

Программа курса

День 1: Введение в Trino

Введение в Trino:

Trino и большие данные. История Trino.

Окружение Trino:

Обзор платформы Arenadata. Состав компонентов Arenadata Hyperwave (ADH)

Архитектура кластера Trino:

Основные узлы кластера. Плагины, коннекторы.

Источники, коннекторы и каталоги:

Разнообразие источников данных, типы коннекторов, каталог с настройками конфигурации соединения. Основные директории на узлах кластера. Установка Trino.

Подключение к Trino

через CLI и через JDBC. Знакомство с системными таблицами.

Коннектор PostgreSQL:

особенности коннектора и настройка каталога.

Коннектор JMX, Memory, TPC-H, TPC-DS:

основной функционал коннекторов и настройка каталога.

Коннектор Hive:

особенности коннектора и настройка каталога.

Коннектор Iceberg:

Особенности таблиц Iceberg. Настройка каталога.

Коннектор Clickhous:

особенности взаимодействия.

Коннектор ADB:

особенности настройки и взаимодействия.

День 2: Запросы, многопользовательская работа, мониторинг и безопасность
Выполнение запросов:

введение понятий Stage, Task, Split, Driver

План запроса и оптимизатор:

Тип и работа оптимизатора. Оптимизации.Статистика

Мониторинг Trino:

Web UI

Настройка запросов
Особенности SQL запросов
Функции и операторы:

UDF, типы данных

Ролевая модель и безопасность
Итоговое тестирование

Даты
ближайших
курсов

  • 5-6 Августа осталось мало мест!
  • 9-10 Декабря

Спасибо, что написали нам!

Мы обработаем заявку и свяжемся с вами в ближайшее время.

Будем рады помочь!

Отправьте ваш вопрос через форму ниже, и наши специалисты свяжутся с вами в ближайшее время.

Корпоративная группа *
Фамилия *
Имя *
Эл. почта *
Телефон *
Наименование компании *
Опишите ваш вопрос
ошибка! проверьте правильно ли вы заполнили поля

Этот сайт использует cookie-файлы и другие технологии, чтобы помочь вам в навигации, а также предоставить лучший пользовательский опыт, анализировать использование наших продуктов и услуг, повысить качество рекламных и маркетинговых активностей.