eine Methode des maschinellen Lernens, bei der ein System durch Belohnungen und Strafen trainiert wird, um bestimmte Entscheidungen zu treffen
eine Methode des maschinellen Lernens, bei der ein System durch Belohnungen und Strafen trainiert wird, um bestimmte Entscheidungen zu treffen