Details der TLA

Name

Lecture content

Beschreibung

Content: – Reinforcement learning; – Motivational examples; – MDPs: the elements of an MDP, the Markov condition; – Policies; – Long-term rewards; – The goal of RL; – The types of RL: – Value-based; – Policy-based; – Actor-critic; – Value functions; – Recursiveness, Bellman equations; – Exploration vs. exploitation; – Greedy, ε-greedy, softmax; – Tabular methods: – Dynamic programming; – Monte Carlo learning; – Temporal difference learning; – SARSA and Q-learning: the difference between on-policy and off-policy methods; – Experience replay;

Lernart

Erwerb

Beschreibung Lernen durch Erwerb ist das, was Lernende tun, wenn sie einem Vortrag oder Podcast zuhören, aus Büchern oder Websites lesen und Demos oder Videos ansehen.

Example usage Lesen von Büchern, Arbeiten, Zuhören von Lehrerpräsentationen vor Ort, Vorträge, Ansehen von Animationen, Videos,…

Arbeitsbelastung

120

Liefermethode der Aktivität

Online

Vor Ort

Hybrid

Synchron

Asynchron

Lehrer anwesend

Lehrer nicht anwesend

Zusammenarbeit

Arbeiten in Gruppen

Rückmeldung

AI usage level

Bewertung

Zurück

Machine Learning School

Details der TLA