Больше чем Pandas: библиотеки подготовки данных для ML-моделей

preview_player
Показать описание
На вебинаре:
- на что стоит обратить внимание для эффективной работы с данными;
- форматы работы с данными и их особенности;
- фреймворки: pandas, swifter, polars, dask и cudf.

Спикер: Владимир Бугаевский, Team Lead Поиска в Купере

Бонус: демонстрационные jupyter-ноутбуки
Рекомендации по теме
Комментарии
Автор

1. При сохранении в паркет пандасом, поларсом и так далее можно выбирать тип компрессии и степень компресии
2. Поларс поддерживает gpu и тогда прирост скорости ещё на порядок.

Пробовал разные библиотеки но поларс сейчас мета.

cohombroz