Machine Learning School

Details der TLA

Name
Lecture content
Beschreibung
Content: – Reinforcement learning; – Motivational examples; – MDPs: the elements of an MDP, the Markov condition; – Policies; – Long-term rewards; – The goal of RL; – The types of RL: – Value-based; – Policy-based; – Actor-critic; – Value functions; – Recursiveness, Bellman equations; – Exploration vs. exploitation; – Greedy, ε-greedy, softmax; – Tabular methods: – Dynamic programming; – Monte Carlo learning; – Temporal difference learning; – SARSA and Q-learning: the difference between on-policy and off-policy methods; – Experience replay;
Lernart
Erwerb
Beschreibung Lernen durch Erwerb ist das, was Lernende tun, wenn sie einem Vortrag oder Podcast zuhören, aus Büchern oder Websites lesen und Demos oder Videos ansehen.
Example usage Lesen von Büchern, Arbeiten, Zuhören von Lehrerpräsentationen vor Ort, Vorträge, Ansehen von Animationen, Videos,…
Arbeitsbelastung
120
Liefermethode der Aktivität
Online
Vor Ort
Hybrid
Synchron
Asynchron
Lehrer anwesend
Lehrer nicht anwesend
Zusammenarbeit
Arbeiten in Gruppen
Rückmeldung

AI usage level
-

Bewertung