Обучение с подкреплением. Часть 1

preview_player

Показать описание

В этом видео были рассмотрены 2 алгоритма обучения с подкреплением (Q-learning(DQN) и Policy Gradient), а также пересчет подкрепления с помощью критика.

Рекомендации по теме

Комментарии

Шикарно, но это для специалистов, базы не хватает конечно. Помню смотрел видео у парня одного, как на php сделать нейронку за 15 минут, вот это для понимания того как это всё работает с получением хоть каких-то результатов очень зашло

yuresdify