Обучение с подкреплением. Часть 1

preview_player
Показать описание
В этом видео были рассмотрены 2 алгоритма обучения с подкреплением (Q-learning(DQN) и Policy Gradient), а также пересчет подкрепления с помощью критика.

Рекомендации по теме
Комментарии
Автор

Шикарно, но это для специалистов, базы не хватает конечно. Помню смотрел видео у парня одного, как на php сделать нейронку за 15 минут, вот это для понимания того как это всё работает с получением хоть каких-то результатов очень зашло

yuresdify