AI4MMR - Лекция 3 - Обучение без учителя и обучение с подкреплением

preview_player
Показать описание
ИСКУССТВЕННЫЙ ИНТЕЛЛЕКТ В МЕДИЦИНСКОЙ МЕХАТРОНИКЕ И РОБОТОТЕХНИКЕ - Лекция 3 - Обучение без учителя и обучение с подкреплением.
Напоминание предыдущей лекции: прямой и обратный расчеты в полносвязных искусственных нейронных сетях. Обучение без учителя: метод к-средних кластеризации данных. Обучение с подкреплением на основе алгоритмов оптимизации награды и оптимизации поведения на примерах симуляторов прогулки по скале и игры в понг.
0:02:43 Напоминание
0:15:58 Обучение без учителя: кластеризация / Unsupervised learning: clustering
0:25:36 Обучение с подкреплением / Reinforcement learning
0:36:11 Оптимизация награды / value optimization (q-learning)
0:53:15 Оптимизация поведения / policy optimization (policy gradient)
1:08:10 Самостоятельная работа / Homework
Рекомендации по теме