004. Опенсорс в Яндексе: применение моделей CatBoost внутри ClickHouse

preview_player
Показать описание
ClickHouse - высокопроизводительная аналитическая СУБД, разработанная в Яндексе и выложенная в открытый доступ.
В рамках мероприятия «Опенсорс в Яндексе» Николай Кочетов, разработчик технологии, рассказывает о возможности интеграции ClickHouse с CatBoost.
На примере задачи предсказания вероятности покупки он рассматривает в каких ситуациях удобно применять предобученные модели внутри ClickHouse.
Рекомендации по теме
Комментарии
Автор

Насколько увеличивается объем хранимых данных в такой column-based базе данных. Возможно я что-то не то говорю но с таким подходом индексы надо хранить отдельно для каждой из колонок? И в чем преимущество перед например использованием обычной реляционной бд, в которой данные разбиты на подтаблицы с одной(двумя с учётом связующего индекса) колонной на уровне архитектуры?

adventurer_v