Machine Learning School

Détails de l'AEA

Nom
Lecture content
Description
Content: – Reinforcement learning; – Motivational examples; – MDPs: the elements of an MDP, the Markov condition; – Policies; – Long-term rewards; – The goal of RL; – The types of RL: – Value-based; – Policy-based; – Actor-critic; – Value functions; – Recursiveness, Bellman equations; – Exploration vs. exploitation; – Greedy, ε-greedy, softmax; – Tabular methods: – Dynamic programming; – Monte Carlo learning; – Temporal difference learning; – SARSA and Q-learning: the difference between on-policy and off-policy methods; – Experience replay;
Type d'apprentissage
Acquisition
Description L'apprentissage par acquisition est ce que font les apprenants lorsqu'ils écoutent un cours ou un podcast, lisent des livres ou des sites web, et regardent des démonstrations ou des vidéos.
Example usage Lecture de livres, d'articles, écoute de présentations d'enseignants en présentiel, cours magistraux, visionnage d'animations, de vidéos,…
Charge de travail
120
Prestation de l'activité
En ligne
Sur place
Hybride
Synchrone
Asynchrone
Enseignant présent
Enseignant non présent
Collaboration
Travail en groupes
Rétroaction

Niveau d'utilisation de l'IA
-

Évaluation