Обработка больших данных при помощи Apache Spark ч2 | Технострим

preview_player
Показать описание
Мероприятие: Moscow Data Science Junior Meetup, 10.06.2017
Выступающий: Виталий Худобахшов, Одноклассники

Apache Spark сегодня является одной из самых популярных технологий обработки больших данных в первую очередь за счет очень удобного API, который близок к обычному функциональному стилю программирования на Scala. Спикер расскажет, что такое Spark и как с ним работать. Рассмотрит некоторые паттерны использования Spark. И, конечно, расскажет, что такое большие данные с практической точки зрения. В качестве основных примеров разберет, как определить пол и возраст пользователя в социальной сети, если он указан с ошибкой. На этих примерах станет понятно, что можно узнать просто с помощью правильной обработки данных, даже не используя машинное обучение.

О КАНАЛЕ:

Официальный канал образовательных проектов Mail.Ru Group

Актуальные лекции и мастер-классы о программировании от лучших IT-специалистов. Если вы увлечены мобильной и веб-разработкой, присоединяйтесь!

Наши проекты:

------------------------

МЫ В СЕТИ:

Рекомендации по теме