Эксплуатация Arenadata Hyperwave. Часть 2: Сервисы платформы

17-18 февраля
28-29 апреля
16-17 июня
28-29 июля
18-19 августа
20-21 октября
25-26 ноября
15-16 декабря

Курс «Эксплуатация Arenadata Hyperwave. Часть 2: Базовые компоненты» предназначен для получения расширенных знаний по сервисам экосистемы Hadoop и работы с компонентами обработки и анализа данных

Преимущества курса

Курс единственного в мире вендора-разработчика открытого дистрибутива Hadoop

Arenadata — единственный вендор, который на базе Apache Hadoop, open-source компонентов и проприетарных решений разрабатывает собственный дистрибутив, адаптированный для корпоративного использования и предназначенный для хранения, обработки и анализа данных любой структуры и объёма.

Только применимые на практике знания

В рамках курса слушатели получат теоретические знания и практический опыт:

  • по планированию и развёртыванию распределённых вычислительных кластеров на базе дистрибутива Arenadata Hyperwave версии 4 и системы управления Arenadata Cluster Manager;
  • работе с сервисами и компонентами платформы Arenadata Hyperwave;
  • мониторингу и оптимизации производительности системы;
  • обслуживанию и аварийному восстановлению узлов кластера и отдельных компонент.

Сертификация

  • Слушателям, успешно прошедшим сертификацию, выдается именной вендорский сертификат.
  • Слушателям курса предоставляется 2 попытки для прохождения проверки знаний.

Что представляет собой курс

«Эксплуатация Arenadata Hyperwave» — двухдневный курс для системных администраторов, инженеров по данным и аналитиков, которые хотят получить расширенные знания по сервисам экосистемы Hadoop и научиться работать с компонентами обработки и анализа данных.

В его рамках участники получат теоретические знания и практический опыт по:

  • принципам работы, архитектуре и настройкам HBase, Hive, Impala, Spark, Phoenix, Kyuubi, Trino и HUE;
  • форматам таблиц Iceberg;
  • работе со снепшотами и механизмами Time Travel;
  • принципам транзакционной согласованности и оптимизации запросов;
  • интеграции сервисов в едином кластере ArenadataHyperwave.

Аудитория курса

Курс актуален:

  • системным администраторам и инженерам, уже знакомым с основами Hadoop (прошедшим курс «Эксплуатация Arenadata Hyperwave ч1 Базовые компоненты»);
  • специалистам по обработке данных, аналитикам и разработчикам, которые хотят освоить экосистему инструментов анализа и хранения больших данных;
  • архитекторам и инженерам, разрабатывающим комплексные решения на платформе Arenadata Hyperwave.

Для успешного освоения курса рекомендуется, чтобы слушатель:

  • прошел курс «Эксплуатация Arenadata Hyperwave ч1 Базовые компоненты» (либо имел знания в сопоставимом объеме);
  • имел базовые знания Linux (работа с консолью, файловой системой, пользователями, сетевыми настройками);
  • понимал основные принципы сетевых взаимодействий (IP-адресация, DNS, SSH, порты);
  • обладал начальными знаниями об архитектуре распределённых систем и принципах хранения данных;
  • умел читать и редактировать конфигурационные файлы (YAML, XML, INI);
  • имел представление о Big Data-концепциях — что такое Data Lake, Data Warehouse, партиционирование данных, отказоустойчивость;
  • имел базовые знания SQL (SELECT, JOIN, фильтрация, агрегирование);
  • имел представление о Python на уровне чтения и написания простых скриптов (работа с файлами, логами, API, обработка данных);
  • Желательно (но не обязательно) имел опыт работы с системами мониторинга (Prometheus, Grafana) или управления кластерами (Ambari, ADCM).

Как проходит курс

Занятия проходят удаленно. Курс проводится в формате вебинара: вас ждет общение с преподавателем, лекционная часть, практические работы на виртуальных машинах и разбор лабораторных работ. Время занятий с 10:00 до 18:00 мск.

Группы набираются в двух форматах:

  • Корпоративные (заказчик записывает на курс команду от 10 человек, даты занятий согласуются отдельно)
  • Открытые (смешанные группы, в которые входят представители нескольких компаний, такие занятия проходят по расписанию)

Сертификация

  • Слушателям, успешно прошедшим сертификацию, выдается именной вендорский сертификат.
  • Слушателям курса предоставляется 2 попытки для прохождения проверки знаний.
сертификат

Программа обучения

Модуль 1

HBase

  • Основные понятия и примеры операций.
  • Установка и конфигурирование (GC, Memstore, Compression, Load balancing, Flush).
  • High Availability.
  • Работа с утилитами HBase (check, repair).
Модуль 2

Phoenix

  • Основные операции с данными.
Модуль 3

Hive

  • Примеры запросов Hive.
  • Основные понятия и примеры операций.
  • Установка и конфигурирование.
  • High Availability HiveServer.
  • Работа с утилитами Hive (schema-tool).
  • Работа с Tez UI.
  • Оптимизация запросов Hive.
  • Лабораторная работа.
Модуль 4

Impala

  • Архитектура и конфигурирование.
Модуль 5

Spark

  • Основные понятия и операции.
  • Установка и конфигурирование.
  • Работа со Spark UI.
  • Примеры кода.
Модуль 6

Работа с Livy сервером (REST API)

Модуль 7

Kyuubi

  • Архитектура, подключение и примеры операций.
  • Установка и конфигурирование.
Модуль 8

HUE

  • Установка, конфигурирование и обзор UI.
Модуль 9

Iceberg

  • Основные возможности.
  • Архитектура таблиц Iceberg.
  • Обслуживание таблиц Iceberg.
  • Лабораторная работа.
Модуль 10

Trino

  • Архитектура.
  • Установка и конфигурирование.
  • Конфигурационные файлы.
  • Коннекторы.
  • Лабораторная работа.
Модуль 11

Интеграция Ozone с сервисами кластера

Модуль 12

Взаимодействие сервисов Arenadata Hyperwave на ETL-стенде, демонстрация нагрузки

Итоговое тестирование

«Эксплуатация Arenadata Hyperwave. Часть 2: Сервисы платформы»

Ближайший старт:

17-18 Февраля

Длительность:

2 дня

Записаться на курс

Спасибо, что написали нам!

Мы обработаем заявку и свяжемся с вами в ближайшее время.

Будем рады помочь!

Отправьте ваш вопрос через форму ниже, и наши специалисты свяжутся с вами в ближайшее время.

Корпоративная группа *
Фамилия *
Имя *
Должность/Роль в компании *
Эл. почта *
Телефон *
Наименование компании *
Опишите ваш вопрос
ошибка! проверьте правильно ли вы заполнили поля

Остались вопросы?

Если вы не нашли ответа на свой вопрос, вы можете воспользоваться формой обратной связи

хочу спросить

Как проходит обучение

Обучение проходит дистанционно в формате вебинаров. Теория перемежается с лабораторными работами, стенд разворачивается для каждого участника, с преподавателями можно общаться на протяжении всего обучения как голосом, так и в чате.

Занятия проводятся с отрывом от производства.

Время проведения занятий с 10:00 до 18:00 мск, если курс рассчитан на целый день.

Корпоративное обучение

Если ваша компания планирует внедрять решения Arenadata или уже работает с ними, вы можете воспользоваться возможностями корпоративного обучения и записать на интересующий курс команду от десяти человек.

Открытые группы

Периодически обучение проходит в смешанных открытых группах. Если вы планируете обучить менее 10 сотрудников, то смело записывайтесь в одну из них. Ориентироваться можно на расписание ниже.

Оставьте заявку на обучение и мы расскажем вам подробнее о том, как набирается группа и сколько свободных мест осталось.

Что получает слушатель по окончанию занятий

После успешной сдачи итогового тестирования, участникам выдается именной вендорский сертификат.

Хотите записаться на курс?

Да, хочу!

Этот сайт использует cookie-файлы и другие технологии, чтобы помочь вам в навигации, а также предоставить лучший пользовательский опыт, анализировать использование наших продуктов и услуг, повысить качество рекламных и маркетинговых активностей.