Дмитрий Бугайченко - Big Data Science на практике с Apache Zeppelin и SparkML - DataStart.ru

preview_player
Показать описание
Билеты на следующую конференцию:

Материалы последней конференции:

На видео – четвертая конференция DataStart 27/04/2019

Дмитрий Бугайченко - Big Data Science на практике с Apache Zeppelin и SparkML

Описание доклада:
Большинство МЛ сегодня происходит с использованием Python, особенно когда речь идет о начинающих специалистах. С другой стороны, для сбора и хранения данных в крупных и не очень компаний используется преимущественно JVM-стек Spark/Hadoop/Kafka и т.д. В результате появлется необходимость "переключения экосистем" при передаче данных в МЛ проработку и внедрению полученных МЛ результатов в бизнес, что, конечно же, приводить к целому букету проблем: разработка идет дольше, результаты часто не удается воспроизвести и они идут "в стол". О том как этого можно избежать и почему Python уже далеко не всегда лучшая альтернатива для начал знакомства с Data Science и пойдет речь

Мы в социальных сетях:

#data_science #machine_learning #spark #big_data
Рекомендации по теме