Топ-100
Сейчас ищут:

Программирование [BigData Тeam] Практический курс по Big Data. Часть 3. RT, NoSQL, Data layout, Kafka (2023)

Admin

Администратор
Команда форума
Регистрация
30 Дек 2017
Сообщения
149,266
Симпатии
4,183




Практический курс по Big Data. Часть 3. RT, NoSQL, Data layout, Kafka [bigdata team]

Вы научитесь работать с потоковой обработкой данных, познакомитесь с Kafka и Spark Structured Streaming, освоите NoSQL поверх больших данных, подружите Spark с Cassandra.

В этом модуле вы изучите:

  • подходы к Realtime-обработке;
  • гарантии обработки, переход от одной гарантии к другой, архитектуры "Лямбда" и "Каппа";
  • Spark Streaming vs. Spark RDD, Spark Structured Streaming vs. Spark DataFrames, DStream;
  • архитектура Kafka, Kafka Streams, репликация в Kafka. Отличие Kafka от классических очередей;
  • семантики доставки сообщений, сжатие данных в Kafka, синхронная и асинхронная репликация.
  • отличия Key-Value хранилищ от реляционных БД;
  • компактификация и её виды, CQLSH;
  • архитектура Cassandra;
  • обеспечение надёжности и высокодоступности в Key-Value хранилищах;
  • интеграция Spark с Cassandra.
  • как бороться с Data Skew с помощью MapReduce подходов в разных фреймворках;
  • trade-off между CPU и IO-bound приложениями, подходы к сжатию в Big Data, горячие и холодные данные;
  • форматы данных в Big Data: ORC vs Parquet, Avro, ...

Пожалуйста Войдите или Зарегистрируйтесь для просмотра скрытого текста.



Скачать:

Для просмотра содержимого вам необходимо авторизоваться или зарегистрироваться.

Если у Вас нет Премиум статуса:

Преимущества VIP-подписки

Оформить VIP-Подписку

 

Вложения

Последнее редактирование модератором:

Похожие курсы:

Сверху