Big Data Technologies. Лекция 4. Hadoop-программы

preview_player
Показать описание
Курс НИЯУ МИФИ "Технологии обработки Больших Данных".

Содержание:
Терминология Hadoop-реализации MapReduce: Job, Task, Task Attempt
Split-логика, Partitioner
Фазы выполнения MapReduce-программ
Оптимизация выполнения - Combiner (Компоновщик)
Примеры MapReduce-программ: поиск, сортировка, обратное индексирование
Рекомендации по теме