Семинар 1. Введение в машинное обучение.

preview_player
Показать описание
Занятие ведёт Григорий Лелейтнер.
---

Deep Learning School при ФПМИ МФТИ
Каждые полгода мы запускаем новую итерацию нашего двухсеместрового практического онлайн-курса по глубокому обучению. Наборы проводятся в августе-сентябре и январе-феврале.

За нашими новостями можно следить здесь:

ФПМИ МФТИ

Рекомендации по теме
Комментарии
Автор

Мне кажется пропущенные значения лучше смотреть не через среднее а через сумму: `data.isna().sum()` - так сразу видно сколько значений кривых.
Чтобы не выводило абракадабру после построения графиков, можно просто добавить в конце `;`

MikhailKatulin
Автор

31:20

Кто работает с новыми версиями pandas, нужно исправить код в ячейке на:



Иначе получите ошибку.

Cavema
Автор

процесс изучения всегда прям приятней когда используются реальные дата сеты ) спасибо

nikpere
Автор

В GridSearchSV перепутали параметр: вместо error_score должен быть scoring. См. документацию GridSearchCV(...)

amipigeon
Автор

Добавлю, что вместо None можно в конце последней строчки поставить точку с запятой

it_ru
Автор

Вопрос к 1:10:08, разве не аргумент scoring отвечает за выбранную нами метрику в GridSearchCV? По такому примеру кода, как мы видим, GridSearchCV будет бежать с дефолтной метрикой для заданной модели (т.е. R^2 для KNeighborsRegressor) и всегда искать модель с максимумом метрики, которую мы передали, т.е. передавать метрику mean_squared_error нельзя, так как GridSearchCV вернет модель с максимумом для этой метрики, что вообщем-то неверно, поскольку mean_squered_error мы хотим минимизировать.

vova_vozniak
Автор

Всё супер, но меня коробит один момент.
Стандартизация (z-оценка) точно не приводит признак к нормальному распределению. Признак распределен либо нормально, либо нет изначально.

cvvs
Автор

на 33 минуте, где лектор объясняет, что отрицательная и большая по модулю корреляция - это хорошо, достаточно сказать, что можно просто поменять знак у фичи и корреляция поменяет знак

vntjzro
Автор

Действительно отличный лектор. Спасибо.

lmao
Автор

У меня gridsearch fit дает ошибку ValueError: error_score must be the string 'raise' or a numeric value. (Hint: if using 'raise', please make sure that it has been spelled correctly.). Как исправить?

bekhzodortikov
Автор

Корреляцию очень удобно отслеживать с помощью seaborn

sns.heatmap(df.corr())

denfnc
Автор

спасибо за урок и за лайфхаки с notebook'ом

fjxuvxm
Автор

у меня вопросы! спасибо за лекцию молодец крут орёл!) 1й не понял после коррел графики как читать чето какая то фигня там или я просто не вникал особо или там так и есть фигня))?
про новые признаки там это типо пца принципал компонент анал) и тому подобное для снижения размерности (такой подход может быть если да то подробнее в каких случаях и какие вобще сниж разм бывают и для чего? опыт применения и тд подробнее если можно)?

Anonymous
Автор

"Джупа́йтер" должно коробить иностранных коллег, и говорит о некой изоляции от международного сообщества. /ˈdʒuːpɪtər/
Больше спасибо за прекрасную лекцию!

MT-xbts
Автор

а загнать в сигмоиду это масштабирование признаков?

Anonymous
Автор

По старинке ссылки больше не работают.
Используйте:

# Загрузим данные и посмотрим на небольшую часть
data = pd.read_csv(path) #загружаем

eugene
Автор

не люблю хэдом пользоваться срезает shape df а потом потерять что то легко просмотрев эту инфу...

Anonymous
Автор

R может быть меньше нуля. R squared НЕ может. оговорочка, кажется

mikatshow