filmov
tv
Машинное обучение. Обучение с подкреплением. К.В. Воронцов, Школа анализа данных, Яндекс.
Показать описание
Процесс обучения представляется в виде игры агента со средой, в которой агент совершает действия, среда в ответ даёт премии, и агент должен корректировать свою стратегию принятия решений таким образом, чтобы максимизировать суммарную будущую премию. Задача имеет черты классификации и прогнозирования. В простейшем случае это задача выбора действия по накопленной статистике премий, называемая задачей о многоруком бандите. В более сложном случае на каждом шаге известно, в каком из состояний находится среда. Если состояние среды описывается вектором признаков, то для принятия решений возможно приспособить инкрементные методы классификации, а для оптимизации стратегии агента применять градиентные методы. Во всех случаях основным вопросом обучения с подкреплением остаётся компромисс «exploration-exploitation» между изучающими действиями и действиями, непосредственно нацеленными на получение премий.
Нейросеть учится переходить дорогу | Обучение с подкреплением...
#10. Обучение с подкреплением или как загнать машину на гору | Генетические алгоритмы на Python...
Что такое обучение с подкреплением? Лайтовое интро за 2 минуты...
Машинное обучение. Обучение с подкреплением. К.В. Воронцов, Школа анализа данных, Яндекс....
Прикладное машинное обучение 6. Введение в обучение с подкреплением...
Прикладное машинное обучение 9. Глубокое обучение с подкреплением....
Обучение с подкреплением в MATLAB: 01. Введение
Обучение с подкреплением. Часть 1
Ансамбли моделей // Демо-занятие курса «Machine Learning»
Машинное обучение с подкреплением. Лекция №1
Обучение с подкреплением
Машинное обучение с подкреплением. Лекция №2
Обучение с подкреплением. Тренировка AI в Unity
Машинное обучение. Начало | Основы машинного обучения
Даниил Трубин — Мастер-класс «Использование Python для обучения с подкреплением»...
Машинное обучение в трейдинге / ML trading / Open AI Reinforcement Learning Gymnasium...
Глубинное обучение и обучение с подкреплением — Евгений Бурнаев...
Машинное обучение 21из24 - Обучение с подкреплением
Доленко С.А.-Машинное обучение - Лекция 15. Обучение с подкреплением...
Прикладное машинное обучение 7. Intro to Reinforcement Learning
ОБУЧЕНИЕ С УЧИТЕЛЕМ, ОБУЧЕНИЕ БЕЗ УЧИТЕЛЯ, ОБУЧЕНИЕ С ПОДКРЕПЛЕНИЕМ | ЗАДАЧИ МАШИННОГО ОБУЧЕНИЯ...
Обучение с подкреплением
Crush-курс: машинное обучение с подкреплением
Р.В. Шамин. Лекция № 11 Практика применения машинного обучения с подкреплением...
Комментарии