Лекция 11 - Обучение с подкреплением (Reinforcement Learning)

Показать описание

sim0nsays

Рекомендации по теме

Комментарии

Большое спасибо за лекцию, очень полезно для старта! 👍

dmitrysysoev

Спасибо за данный курс лекций! На русских просторах, без преувеличений, это лучший разбор нейронных сетей.
Наткнулся на Вас случайно, изучая нейронные сети на Хабре. Теперь планирую так же просмотреть Ваш более новый курс "Deep learning на пальцах".

vkznmqi

Привет. А каким образом можно было бы пообщаться онлайн и задать вопросы/обсудить пару идей? Возможно даже найти точки по сотрудничеству? ;)

zjekamur

1:07 Вроде модель R2D2 (авторы Шмитхубер) использует RNN, если не ошибаюсь.

adbastana

Добрый день! Досмотрел до 30 минуты. Мучает вопрос. Как обновлять веса в сети например при policy gradients? Мы начинаем в s0 и проходим последовательно до конца (финиша или пока итерации не закончились), на каждом новом шаге s(t+1) получаем reward (t+1). Я могу высчитать дисконтируемую сумму за всю сессию и отдельно хранить reward по каждому шагу. Не понимаю, как обучить веса сети после сессии? Очень хочется разобраться...

hdrenzt

Лекция 11 - Обучение с подкреплением (Reinforcement Learning)

Лекция 11 - Обучение с подкреплением (Reinforcement Learning)

Михаил Никитин. Лекция 11. Происхождение клеточных мембран и мембранных энергетических систем....

Лекция 11 | Основы C++, первый семестр | Евгений Линский | CSC | Лекториум...

Лекция 11. И.С. Бах ХТК Том 1. № 5-7. | Композитор Иван Соколов о музыке....

11. CS50 на русском: Лекция #11 [Гарвард, Основы программирования, осень 2015 год]...

Лекция 11. Недействительные сделки: общие вопросы

Базовый курс детской психологии. Лекция №11 (10-13 лет), демо-версия...

Глубокое обучение. Лекция 11. Методы оптимизации в обучении глубоких нейронных сетей (2019-2020)...

Лекция 8. Теория потребительского выбора (ТПВ)

Курс «Инструменты промышленной разработки». Лекция 11 (Данила Кутенин)...

Машинное обучение 1. Лекция 11

Архитектура ЭВМ Лекция 11: Организация ввода вывода. Интерфейсы передачи данных....

История России. Лекция 11. Дмитрий Донской | History Lab

История Западной философии. Лекция №11. «Греческая патристика»...

Лекция 11. Духовник и правильные отношения с ним

Лекция 1. Нововведения стандарта C++11

Сергей Переслегин. Лекция №11. Интерпретации квантовой механики...

Треугольник Карпмана. Психолог Наталья Кучеренко. Лекция № 11....

Справедливость: Лекция #11. Как лучше родину любить? [Гарвард]...

Лекция 11. Вера в воскресение мертвых

Лекция 11. Введение в шаблоны II (Программирование на C++, часть 1)...

Лекция 11. ДИНАМИКА С НУЛЯ │Введение, часть 1

[UNИX][GNU/Linux] Лекция 11. udev, DBus, PolicyKit

История России. ХХ век. Лекция 11. НЭП. Большевики за прилавком | History Lab...