#33. Алгоритм кластеризации Ллойда (K-средних, K-means) | Машинное обучение

preview_player
Показать описание

Как работает алгоритм кластеризации Ллойда (K-средних, K-means). Реализация этого алгоритма на Python. Алгоритм Ллойда при частично размеченной выборке. Преимущества и недостатки алгоритма Ллойда.

Рекомендации по теме
Комментарии
Автор

Здравствуйте, наткнулся на ваш канал. Хочу выразить вам огромную благодарность за проделанную вами работу, мне бы такого преподавателя в вуз, как вы)

icarosnya
Автор

@selfedu На 1:22 - нужно ли в метрике нормировать масштаб признаков? Если одна координата в тысячах, а другая в единицах, то расстояния могут сравниваться неадекватно. И как тогда нормировать - приводить к средним по признаку в выборке x=x./[mean(x1), ..., mean(xn)]?
Поздравляю с соточкой! :)

YbisZX
Автор

Благодарю Вас за математическую формулировку решаемых задач!Подскажите, в какой книге(книгах) возможно найти математику алгоритмов машинного обучения?

nicko
Автор

В ролике говорится, что алгоритм минимизирует суммарное внутрикластерное расстояние, в тоже время на формуле в 6:30 минизируется сумма квадратов расстояния от центра кластера до его точек, или иными словами дисперсия.
Как правильно?

antone
Автор

Спасибо за урок! у меня небольшой вопрос касающийся програмирования, когда мы реализуем алгоритм на языке python, то получается что мы инициализируем "" X = [[] for i in range(K)] # инициализация пустого двумерного списка для хранения объектов кластеров "" внутри цикла while. Соответственно при завершении работы while, X должна удалиться, но мы ссылаемся на эту Х и позже, и ошибки не возникает. Как это возможно???

СарматПересветов
Автор

что будет делать программа если есть 2 центра  кластера и 2 точки точки находятся на одном расстояние

АлександраТеплякова-ки
Автор

А если начальные случайные центры лягут совсе близко друг к другу? Будет разделение на два кластера?

NationalVerrater
Автор

подскажите пожалуйста какие перспективы у ml и нейронных сетей на питоне? я понимаю что он много где используется но что будет с этими сферами через 5-10 лет? что будет писаться на мл и нейронке? я начал изучать питон чтобы потом перейти на мл и нейронку вот и хочу понимать будет ли через года два это актуально спасибо

yanavin
Автор

А не могли бы сделать про алгоритм Лувена?

dicloniusN
Автор

А если мне не известно количество кластеров?

Kopasuy
Автор

кажется у вас ошибка в евклидовой метрике, т.к. должна браться сумма, а Вы берете среднее

applymvmcsgo
Автор

Эх, когда же уже количество роликов перерастет в качество...

denisobrezkov