Middle Data Scientist | Выпуск 1. Секция ML | Собеседование | karpov.courses

preview_player
Показать описание

Это второе mock-интервью на позицию Data Scientist — в этот раз преподаватель курса Hard ML Станислав Гафаров проверил скиллы middle-специалистки Анастасии.

Беседа получилась тёплой и непринуждённой, а само видео мы решили разделить на две части: в первую вошли основы ML и ML Design, а во вторую (которую выложим чуть позже) — Python и работа с данными.

Важно понимать, что это лишь часть вопросов, которые могут задать специалисту данного уровня, и на реальном собеседовании они могут отличаться. В ответах, как и в вопросах, есть неточные формулировки. Просим списать это на то, что интервью проходило поздно вечером :)

0:00 – Интро
02:04 — Формат собеседования
03:18 — Воспоминания
05:09 — Вопрос по ML-дизайну
06:09 — Определение LTV, уточнение условий задачи
09:02 — Начало ответа
12:18 — Переход к ключевым вопросам и самому ответу
22:56 — Обобщение ответа
25:14 — Какие могут возникнуть проблемы при планировании LTV на полгода вперед?
26:59 — Как делать прогноз для новых пользователей?
28:54 — Обоснования выбора и описание модели
30:49 — Представление модели бизнесу
33:32 — Переход к DS
33:58 — Обоснование выбора MSE
35:58 — Примеры несимметричных метрик
40:26 — Переход к регрессорам
43:46 — Gradient-boosted trees
44:50 — Вопрос со звёздочкой
55:36 — Работа с понижением размерности
Рекомендации по теме
Комментарии
Автор

Я думаю, для таких видео желательно, чтобы собеседующий и собеседуемый не знали друг друга. Иначе смазывается процесс. Она видит друга, а не человека, который ее проверяет. Он видит друга, а не человека, которого надо строго оценить.

MrRescued
Автор

Блин, вот я сколько уже таких интервью в ДС посмотрел, где нужно накидать модель. Каждый раз, на самый первый вопрос, где в двух словах говорится что нужно бизнесу - "нужно спрогнозировать ЛТВ", кандидат отвечает:
"а я возьму такую модель, а я МСЕ, МАЕ, ЛОГИТ функцию потерь буду оптимизировать, а я возьму этот алгоритм, а я вот эту метрику буду на валидации использовать".
Ветер в харю, я х..ярю.

Может сначала сформулировать какие данные должны быть на входе, как давно данные собираются, как предсказывают ЛТВ сейчас, для чего потом будет использоваться ЛТВ?
Исходя из данных можно модель выбрать, а с бизнес метрику прикрутить к eval_metric модели.

mwave
Автор

Спасибо за полезный контент! А когда выйдет продолжение? Очень интересно!

sgkccxv
Автор

Вот бы реальные собеседования начинались с такой же ржаки

antontsvetkov
Автор

>Лассо это почти то же самое что и PCA
>ну да
и таких моментов, когда интервьюер принимает или пропускает ошибки и неточности россыпью по всему видео.
Возможно в подобном формате должны участвовать незнакомые дюди

eiybguy
Автор

После двух просмотренных интервью впечатление, то на джуна знаний больше нужно, чем на мидла.

cosmonaut
Автор

Собеседование интересное, спасибо большое как вам, Станислав, так и Анастасии, мне кажется, нужна изрядная смелость для того, чтобы участвовать в таких мероприятиях, и интервьюируемая девушка производит впечатление опытного специалиста.
Собеседование показалось несколько неторопливым.
Обсуждение первого вопроса заняло около получаса и лично мне не хватило конкретики (но с другой стороны, понятно, что с этой стороны экрана рассуждать легко))

По ML design интересно, часто ли на собеседованиях задают вопросы, которые ближе к техническим аспектам размещения и эксплуатации моделей в проде. Например, про узкие места, оптимизацию и поиск проблем, как всё уместить на распределённой вычислительной платформе, как накатывать обновления на модель и так далее?
Понятно, что по классике это ближе к Data Engineering, но ответ всё равно любопытен.

В реальных собеседованиях обычно темп такой же или всё-таки повыше?
Ожидал, что вопросов про DS и ML будет больше, само обсуждение будет с более высокой скоростью.


С нетерпением жду вторую часть, уже интересно, будет ли в python какой-то аналог leetcode-задач, будут ли вопросы по SQL.

ofcroku
Автор

Очень интересно! В частности, потому что я химик. Было забавно узнать, что и химики могут быть успешны в DS....при желании.

madchemistry
Автор

Вопрос про метрику, может кто объяснить. Если мы берём и предиктим на полгода вперёд, то как бэ у-тру у нас нет. И оценить в настоящий момет качество предсказания метрикой регрессии не получится.

fbzvcfs
Автор

Красивая и умная девушка, интересно было посмотреть

rusfinance
Автор

Так в дереве решений для регрессии же вроде используется не энтропия, а дисперсия вокруг среднего?

mqxqhiq
Автор

Когда уже научитесь добавлять таймкоды к видео? :)

Slavlotski
Автор

АБ тестов с питоном не показали;) Интересненько.

petyap
Автор

Мне одному показалось, что на junior ds собеседование было сложнее?

mlwithegor
Автор

32:40 работает хорошо на истории.
А кто ответит - в реальности оно работает?

mlpython
Автор

Что за странный финтех, который не знает ушёл его клиент или нет? Закрыл он счёт и вывел деньги или нет? 🤔

kristinasaraeva
Автор

Ну откуда этот американизированный роствско-краснодарский акцент чё за мода такая😁

AlexxxeyS
Автор

какую чушь спрашивает интервьюер, он даже сформулировать не может толком.. тимлид наверное.. бегите от таких.

pogrom
Автор

Милашка, конечно, но часто очень неуверенные ответы прям

rurchcx
Автор

Жижа какая-то а не собеседование. Большое похоже на то что вьювер барышню в кафешку вывел и вопросы о её работе задаёт. Проводить симуляцию собеседования между знакомыми людьми это буквально переобучение сети.

MrSkinification