Détails de l'AEA

Nom

Lecture content

Description

Content: – Reinforcement learning; – Motivational examples; – MDPs: the elements of an MDP, the Markov condition; – Policies; – Long-term rewards; – The goal of RL; – The types of RL: – Value-based; – Policy-based; – Actor-critic; – Value functions; – Recursiveness, Bellman equations; – Exploration vs. exploitation; – Greedy, ε-greedy, softmax; – Tabular methods: – Dynamic programming; – Monte Carlo learning; – Temporal difference learning; – SARSA and Q-learning: the difference between on-policy and off-policy methods; – Experience replay;

Type d'apprentissage

Acquisition

Description L'apprentissage par acquisition est ce que font les apprenants lorsqu'ils écoutent un cours ou un podcast, lisent des livres ou des sites web, et regardent des démonstrations ou des vidéos.

Example usage Lecture de livres, d'articles, écoute de présentations d'enseignants en présentiel, cours magistraux, visionnage d'animations, de vidéos,…

Charge de travail

120

Prestation de l'activité

En ligne

Sur place

Hybride

Synchrone

Asynchrone

Enseignant présent

Enseignant non présent

Collaboration

Travail en groupes

Rétroaction

Niveau d'utilisation de l'IA

Évaluation

Retour

Machine Learning School

Détails de l'AEA