КЛАСТЕРИЗАЦИЯ В МАШИННОМ ОБУЧЕНИИ ДЛЯ НОВИЧКОВ на Python. Метод k-средних или k-means ПРОСТО!

preview_player
Показать описание
Кластеризация в машинном обучение для новичков! Сегодня мы разберем 2 самых главных алгоритма кластеризация в машинном обучении, их преимущества, недостатки и все подводные камни! В первом видео алгоритм кластеризации k-means clustering (Метод k-средних), а во втором - Hierarchical clustering (Иерархическая кластеризация)

00:00 Вступление
00:38 Зачем нам кластеризация? Какие бизнес проблемы мы можем решить?
01:40 Как работает k-means алгоритм (метод k-средних)?

Первый подводный камень:
04:39 Проблема рандомности инициализации центроид - k-means++

Второй подводный камень:
06:06 Как выбрать количество кластеров? Метод локтя!

08:37 Практика

Ноутбуки
Рекомендации по теме
Комментарии
Автор

Спасибо! Пришла смотреть про k-means в итоге еще и поняла почему так любят всё возводить в квадрат😃

kpokit
Автор

Спасибо, ты очень круто объясняешь сложные вещи!

jlvrxyg
Автор

Боженька, очень просто и понятно, спасибо!

clinsen
Автор

Топчик, спасибо, ты самый нормальный в этой теме на ру ютубе

nntngky
Автор

хорошее видео! благодарю. Но есть вопрос: а если много переменных, то как выбрать переменные для лучшей кластеризации?

anrybolt
Автор

Помоги пожалуйста, как отпределять точность кластеризации? Не могу найти никаких примеров в интернете..

TestTest-ytzh
Автор

Спасибо!
с помощью KMeans и 3 кластеров, сколько образцов находится в кластере 1?

bakytti
Автор

Хорошо и понятно всё изложено. Вопрос: а можно ли априори задать количество кластеров?

anatolyzeldin
Автор

-- Объяснение псевдорандомности генерации центроид неким магическим k-means++ не даёт понимания
-- Непонятно как именно сдвигаются центроиды

nargan