Intelligence Artificielle [13.7] : Apprentissage par renforcement - Q-learning

preview_player
Показать описание

Рекомендации по теме
Комментарии
Автор

Bonjour Hugo, merci pour toutes vos videos qui sont excellentes! :)
Petite question: l'algo de programmation dynamique dans le cadre de renforcement actif semble tout aussi raisonnable que l'algo de Q-learning, pourtant il me semble qu'en pratique, le Q-learning est beaucoup plus utilisé! Y-a-t il une explication intuitive à cela ?

pierrec