IA par renforcement

Objectifs

À la fin du cours, les étudiant(e)s seront capables de :

Plan du cours

Description des TP

1. Introduction au RL

Théorie :

2. Formalisation mathématique du RL

Théorie :

3. Programmation dynamique (Value Iteration)

Théorie :

4. Exploration et exploitation

Théorie :

5. Application du Q-Learning

Théorie :

6. RL avec fonctions d’approximation (DQN)

Théorie :

7. Projet intermédiaire : Jeux vidéo simples

Théorie :

8. Les approches basées politiques (Policy Gradient)

Théorie :

9. PPO : Proximal Policy Optimization

Théorie :

10. SAC : Soft Actor-Critic

Théorie :

11. TP créatif : Développement d’un agent RL pour un jeu vidéo

Théorie :

12. Restitution et soutenances

Théorie :

Connaissances requises

A remplir

RSE (Responsabilité Sociale et Environnementale)

Bibliographie

A remplir