Kaggle - поиск работы для Data Scientist / Стратификация, ансамбль моделей

preview_player
Показать описание
Разбор датасета на площадке Kaggle, где необходимо предсказать вероятность того, что кандидат будет искать новую работу, а также интерпретировать факторы, влияющие на решение сотрудника.

Курс Data Science для начинающих PyMagic

Clubhouse miracl6

#ityoutubersru #datascience #kaggle
Рекомендации по теме
Комментарии
Автор

Просмотрел все ваши видео :) Поставленая речь, все четко и по делу, приятно слушать. Доступно подаете информацию, узнал много нового для себя так как работаю в другой области IT, но развиваться надо постоянно. Спасибо!

good-lychik
Автор

Спасибо за видео, я редко пишу комментарии, но этот ролик действительно повлиял на меня, показав на сколько интересен data science . Спасибо за пинок под зад

rxmlxdm
Автор

Просто спасибо за видео! За бесплатный вклад в наше развитие)

subigo
Автор

Класс! Теперь я узнал, какие пробелы мне стоит заполнить. Мега полезно!

OleksiiM
Автор

Красивая, умная девушка даёт огромное количество полезной информации бесплатно - так не бывает! :)

danyazhdanov
Автор

Анастасия, спасибо за видео. Ещё не досмотрел до конца, но очень полезно, что вы показываете все этапы и общий поход к задаче.

DiMAN
Автор

Отлично видео . Как раз то что я искал ... Побольше реальных кейсов ...

flash
Автор

очень круто, лаконично, куча полезных фишечек (особенно понравилось стеккинг и фича импортенс)
сразу друзьям саентистам скинул))
спасибо))

kostiantynzahorulko
Автор

Несколько полезных фишек взял на заметку, спасибо )

salivona
Автор

Было очень увлекательно, спасибо. Продолжай в направлении Kaggle.

maratimus
Автор

Красива и умна, прекрасное сочетание :)

aleksunknow
Автор

спасибо большое! Обязательно буду запускать ноутбук и смотреть видео с вашими комментариями! Ждем видос про теорвер!

ivansavchuk
Автор

Хороший анализ! Мой первый комментарий здесь почему то пропал, хотел поделиться своей работой на этот же датасет, смешно, но выложил свою работу за час до того, как вы выложили видео))) Не знал, что стратификация спасает от дисбаланса, я использовал SMOTE, вы молодец!

JASTOK
Автор

Отличное видео.интересно было посмотреть данный разбор. Очень полезный. Продолжай. Интересно было бы посмотреть реальную какую то работу от начала и до конца, имею ввиду из продакшена

evgenychechel
Автор

Стекинг это немного другое, когда output моделей подаётся в ещё одну модель. Спасибо за видео.

aikspace
Автор

пора разбирать датасет, где нужно найти вероятность того, что комментарий под видео будет на тему "а замужем ли эта принцесса?"🤦

MrVeniamin
Автор

ну что ж, посмотрим и оценим подачу материала...

userwwrwewetw
Автор

Разберите, пожалуйста, более глубокий анализ с подбором гипер-параметров, чтобы лучше понять сам процесс и методику подбора))

roll
Автор

Добрый день, Анастасия. Спасибо большое за видео, было очень познавательно посмотреть на разбор реального соревнования на Kaggle. Очень хочется видеть больше видео такого же формата. По ходу просмотра возникла пара вопросов, буду рад, если вы поможете мне разобраться:

Как график на 15:39 оправдывает гипотезу о том, что к поиску новой работы склонны молодые студенты? Вы выделяете столбец с опытом работы 1 год, говоря, что он явно выделяется, но суммарное значение “proportion” по этому столбцу будет чуть меньше 0, 04 (правильно я понимаю, что это эквивалентно примерно 4% от количества людей в датасете?). Не говоря уже о том, что график не отображает, какой процент от этих людей имеет “target 1”.


Не показывает ли график(15:39), что к поиску работы склонны люди с опытом работы от двух лет и более, работавшие до этого только в 1 компании?


Также, подскажите, пожалуйста, как отсортированы данные на графике(15:39)? Столбцы идут в порядке убывания количества людей из категории “работавшие до этого только в 1 компании”?


Также, если мы хотим найти корреляцию между возрастом потенциального работника и поиском работы, то не наглядней было бы отобразить график таким образом, чтобы значение абсциссы “experience” были упорядочены и шли по возрастанию?


Извините, если вопросы глупые, я ещё студент и только начинаю осваивать DS)

reynardchest
Автор

Расскажи, пожалуйста, что нибудь по бизнес аспектам data science. То есть как находить процессы, которые можно оптимизировать, как предсказывать и оценивать результаты внедрения ml-технологии, в каком виде лучше продавать решение (например, как услугу или как сервис)? Как вообще развивать в себе видение самого прибыльного решения?

Nikita