075. Карьера в data science: типичные ошибки на собеседовании – Валерий Бабушкин

preview_player
Показать описание
- Как найти работу в Data Science, если у тебя еще нет рабочего опыта?
- Стоит ли тратить время на kaggle?
- Какой путь должен пройти дата саентолог, чтобы стать джуниором, мидлом и сеньором?

* 21 октября 2018 г. в московском офисе Яндекса прошла встреча сообщества Open Data Science. Мы испытали новый формат: программа не была определена заранее, а составлялась по запросам аудитории.
Мы собрали больше 500 заявок от участников и ответили на самые популярные и интересные вопросы.

Валерий Бабушкин
Закончил Университет прикладных наук Карлсруэ, занимался инфракрасной спектрометрией, затем работал в банке «Открытие». Сейчас занимает должность начальника отдела инновационной аналитики и моделирования в Х5 Retail Group, одновременно является консультантом в Яндексе и приглашенным преподавателем в НИУ ВШЭ.

Рекомендации по теме
Комментарии
Автор

Молодец, юмор на нужном месте! )) И узнал, и поржал смотря ролик)

mr_integer
Автор

Парню нужно в StandUp нужно выступать)

Sebastian-gross
Автор

Важно ли для дата саентиста ходить в качалку?

neuzen
Автор

Отличный оратор! Юмор, знания, очень классно!

gjzblvm
Автор

Очень тяжело заниматься data science без компьютера🤣🤣🤣

waydao
Автор

Крутой чел. Очень спокойный, речь грамотная. Понравилось выступление)

rrahll
Автор

Валерий, вас приятно слушать и трудно не согласиться с вашими выводами. Спасибо за вопросы-ответы.

olesyabondar
Автор

Спасибо, смотрю повторно с 2020 года и теперь больше понимаю о чем речь)

lvvovich
Автор

Отличное выступление. Как минимум, нужно хорошо кодить в питоне и SQL. Изучить вопросы статистики. На одном этом понимании можно выстроить план обучения.

christophercave
Автор

какой ты молодец! я про "на собеседовании должно быть то, что человек должен будет знать по работе".
а то порой вопросы в стиле "рассчитайте сферически-магического конька-горбунка в вакууме с применением всей возможной известной человечеству математики", а по факту - REST микросервисы на nodejs и express и простенькие nosql базы данных типа тарантула :-) причём ладно бы одно было подмножеством другого, ну то есть "с запасом" собеседовали...

apristen
Автор

Он в x5 работал. У них был крупный отдел. Он хороший менеджер и умеет вдохновлять людей. Фишка в том что "большие данные" имеют сейчас спрос и хорошо продаются инвесторам и бизнесу. 20 лет назад я думал о единой базе всех хозяйственных операций всех экономических контрагентах и мне казалось это мечтой, а сейчас это пытаются внедрять и продавать потихоньку)

eicofvh
Автор

Джарохов ты ли это? Классный парень респект тебе)

islamtolen
Автор

Ну наверное для науки ещё нужна и огромная база знаний.

vtklczz
Автор

Валерий :) Крутое выступление... мотивирующее ... благодарю.

karlzinher
Автор

Интересно, а на текущий момент всё это актуально? В частности про опыт современных джунов, до сих пор такие бестолковые?
С нейросетями так же?
Грейды зп мне кажется в разы меньше сейчас..

VG-zrsb
Автор

про "что необходимо для начала занятий data science?" ответ "ну... наверно необходим компьютер!" - это 5+, повеселил прям! :-)))

как думаете: индустрия игр, бэкэнды получают "все ходы записаны" от сотен тысяч онлайн игроков, всё это в "самопальную" предобработку ну и затем в ELK stack с целью как измерения KPI (DAU, ARPDAU, Retention, etc.) так и для "инсайтов" - это уже data science или ещё недо-datascience? ;-)

apristen
Автор

2:34 это было странно, что показали. Отвлекли меня

gulparatashenova
Автор

На 14:05 человек говорит про бинарное дерево, и второе я не разобрал, гномикл? Гномиком? Напишите пожалуйста что он сказал.

maksimsergeevich
Автор

Неплохой стендап. Но над шутками надо поработать

AKIBLLIATTKY
Автор

очень хотелось бы видосик найти где было бы побольше практических применимых (не "синтетических" для обучения, а именно практики и куда и где это применили и улучшили результаты) и полезных кейзов применения Data Science, Machine Learning и т.д.
причём без вот этого универсального хайпа с нейросетками, а как в этом видео "дык а тут вообще линейной регрессии хватит", а то реально у многих бзик с нейросетями как с волшебной универсальной решалкой всего.
кстати на Kaggle часто на практике "рулил"... обычный random forest без напрягов, а не нейросетки, ну исторически были случаи когда без гемора получали отличные результаты не нейросетями, а гораздо более простыми вещами.

apristen