filmov
tv
Алексей Зиновьев — Тонкости машобуча вместе со Spark ML
Показать описание
Ближайшая конференция — JPoint 2025, 3–4 апреля (Москва + трансляция).
— —
. . . . Что нужно уметь и понимать джависту на типичном BigData + ML проекте:
— как выбирать фичи;
— как перекодировать фичи;
— как скалировать;
— как очищать и заполнять пропуски;
— как оценивать качество кластеризации;
— что делать, если одного дерева мало;
— уметь делать кросс-валидацию.
И всё это на Scala + Spark!
Всё это на примере одного из самых популярных датасетов с Kaggle — от А до Я.
— —
. . . . Что нужно уметь и понимать джависту на типичном BigData + ML проекте:
— как выбирать фичи;
— как перекодировать фичи;
— как скалировать;
— как очищать и заполнять пропуски;
— как оценивать качество кластеризации;
— что делать, если одного дерева мало;
— уметь делать кросс-валидацию.
И всё это на Scala + Spark!
Всё это на примере одного из самых популярных датасетов с Kaggle — от А до Я.