filmov
tv
Дмитрий Бугайченко - Big Data Science на практике с Apache Zeppelin и SparkML - DataStart.ru
Показать описание
Билеты на следующую конференцию:
Материалы последней конференции:
На видео – четвертая конференция DataStart 27/04/2019
Дмитрий Бугайченко - Big Data Science на практике с Apache Zeppelin и SparkML
Описание доклада:
Большинство МЛ сегодня происходит с использованием Python, особенно когда речь идет о начинающих специалистах. С другой стороны, для сбора и хранения данных в крупных и не очень компаний используется преимущественно JVM-стек Spark/Hadoop/Kafka и т.д. В результате появлется необходимость "переключения экосистем" при передаче данных в МЛ проработку и внедрению полученных МЛ результатов в бизнес, что, конечно же, приводить к целому букету проблем: разработка идет дольше, результаты часто не удается воспроизвести и они идут "в стол". О том как этого можно избежать и почему Python уже далеко не всегда лучшая альтернатива для начал знакомства с Data Science и пойдет речь
Мы в социальных сетях:
#data_science #machine_learning #spark #big_data
Материалы последней конференции:
На видео – четвертая конференция DataStart 27/04/2019
Дмитрий Бугайченко - Big Data Science на практике с Apache Zeppelin и SparkML
Описание доклада:
Большинство МЛ сегодня происходит с использованием Python, особенно когда речь идет о начинающих специалистах. С другой стороны, для сбора и хранения данных в крупных и не очень компаний используется преимущественно JVM-стек Spark/Hadoop/Kafka и т.д. В результате появлется необходимость "переключения экосистем" при передаче данных в МЛ проработку и внедрению полученных МЛ результатов в бизнес, что, конечно же, приводить к целому букету проблем: разработка идет дольше, результаты часто не удается воспроизвести и они идут "в стол". О том как этого можно избежать и почему Python уже далеко не всегда лучшая альтернатива для начал знакомства с Data Science и пойдет речь
Мы в социальных сетях:
#data_science #machine_learning #spark #big_data