Amerikano
Модератор
- Сообщения
- 19,430
- Реакции
- 365,091
Автор: BigData Тeam
Название: Практический курс по Big Data. Часть 3. RT, NoSQL, Data layout, Kafka (2023)
Практический курс по Big Data. Часть 3. RT, NoSQL, Data layout, Kafka [bigdata team]
Вы научитесь работать с потоковой обработкой данных, познакомитесь с Kafka и Spark Structured Streaming, освоите NoSQL поверх больших данных, подружите Spark с Cassandra.
В этом модуле вы изучите:
Подробнее:
Скачать:
Название: Практический курс по Big Data. Часть 3. RT, NoSQL, Data layout, Kafka (2023)
Практический курс по Big Data. Часть 3. RT, NoSQL, Data layout, Kafka [bigdata team]
Вы научитесь работать с потоковой обработкой данных, познакомитесь с Kafka и Spark Structured Streaming, освоите NoSQL поверх больших данных, подружите Spark с Cassandra.
В этом модуле вы изучите:
- подходы к Realtime-обработке;
- гарантии обработки, переход от одной гарантии к другой, архитектуры "Лямбда" и "Каппа";
- Spark Streaming vs. Spark RDD, Spark Structured Streaming vs. Spark DataFrames, DStream;
- архитектура Kafka, Kafka Streams, репликация в Kafka. Отличие Kafka от классических очередей;
- семантики доставки сообщений, сжатие данных в Kafka, синхронная и асинхронная репликация.
- отличия Key-Value хранилищ от реляционных БД;
- компактификация и её виды, CQLSH;
- архитектура Cassandra;
- обеспечение надёжности и высокодоступности в Key-Value хранилищах;
- интеграция Spark с Cassandra.
- как бороться с Data Skew с помощью MapReduce подходов в разных фреймворках;
- trade-off между CPU и IO-bound приложениями, подходы к сжатию в Big Data, горячие и холодные данные;
- форматы данных в Big Data: ORC vs Parquet, Avro, ...
Подробнее:
Для просмотра ссылок Войдите в аккаунт или Зарегистрируйтесь
Скачать:
Для просмотра ссылок Войдите в аккаунт или Зарегистрируйтесь
Похожие темы из этого раздела:
- [Рик Ховард] Кибербезопасность: главные принципы (2024)
- [Nikolay Petrov] ClickHouse для аналитика [Stepik] (2023)
- [Игнат Егоров] Разработчик мобильных приложений на FlutterFlow (2024)
- [Pikuma] Программирование трехмерной компьютерной графики (2023)
- [Игнат Егоров] Разработчик мобильных приложений на FlutterFlow (2023)
- [Матвеев М.Д.] Весь Linux. Для тех, кто хочет стать профессионалом (2024)
- [Cuantum Technologies] Алгоритмы с нуля [Питер] (2024)
- [Чхави Радж Досадж] Сам себе тестировщик. Пошаговое руководство по тестированию ПО [Питер] (2024)
- [Влад Князев] Готовимся к собеседованию на системного аналитика (2024)
- [Ваутер Грунефелд] Креативный программист [Питер] (2024)