Philosophie Lexikon der Argumente

Home Screenshot Tabelle Begriffe

 
Verstärkendes Lernen: Verstärkendes Lernen (Reinforcement Learning, RL) ist eine Form des maschinellen Lernens, bei der ein Agent durch Versuch und Irrtum lernt, wie er sich in einer Umgebung verhalten soll. Siehe auch Lernen, Maschinenlernen, Künstliche Intelligenz.

_____________
Anmerkung: Die obigen Begriffscharakterisierungen verstehen sich weder als Definitionen noch als erschöpfende Problemdarstellungen. Sie sollen lediglich den Zugang zu den unten angefügten Quellen erleichtern. - Lexikon der Argumente.

 
Autor Begriff Zusammenfassung/Zitate Quellen

Tom Griffiths über Verstärkendes Lernen – Lexikon der Argumente

Brockman I 127
Verstärkendes Lernen/Griffiths: Das Verstärkende Lernen ist eine Standardmethode für das Training intelligenter Maschinen. Durch die Verknüpfung bestimmter Ergebnisse mit Belohnungen kann ein maschinelles Lernsystem
Brockman I 128
dazu trainiert werden, Strategien zu verfolgen, die zu diesen Ergebnissen führen.
Umgekehrtes Verstärkende Lernen: Wendet diesen Ansatz um: Indem wir die Handlungen eines intelligenten Agenten beobachten, der bereits effektive Strategien gelernt hat, können wir die Belohnungen ableiten, die zur Entwicklung dieser Strategien geführt haben.
Brockman I 130
Rationalität ist die Standardannahme in Modellen des inversen Verstärkenden Lernens, die versuchen, Rückschlüsse auf das menschliche Verhalten zu ziehen - vielleicht mit dem Zugeständnis, dass Menschen keine vollkommen rationalen Agenten sind und sich manchmal zufällig dafür entscheiden, in einer Weise zu handeln, die nicht mit ihren Interessen übereinstimmt oder sogar diesen entgegensteht.
Brockman I 131
(...) Heuristik ist eine sinnvolle Strategie zur Vermeidung komplexer probabilistischer Berechnungen, führt aber auch zu Fehlern. Wenn wir uns zum Beispiel als Ausgangspunkt für seine Wahrscheinlichkeit auf die Leichtigkeit verlassen, mit der ein Ereignis aus dem Gedächtnis heraus generierbar ist, überschätzen wir die Chancen extremer (und damit äußerst einprägsamer) Ereignisse wie Terroranschläge. Heuristiken liefern ein genaueres Modell der menschlichen Kognition, aber eines, das nicht leicht verallgemeinerbar ist. Woher wissen wir, welche Heuristik Menschen in einer bestimmten Situation einsetzen werden? Gibt es noch andere Heuristiken, die sie verwenden und die wir nur noch nicht entdeckt haben? >Entscheidungstheorie/Griffiths.


Griffiths, Tom, “The Artificial Use of Human Beings” in: Brockman, John (ed.) 2019. Twenty-Five Ways of Looking at AI. New York: Penguin Press.


_____________
Zeichenerklärung: Römische Ziffern geben die Quelle an, arabische Ziffern die Seitenzahl. Die entsprechenden Titel sind rechts unter Metadaten angegeben. ((s)…): Kommentar des Einsenders. Übersetzungen: Lexikon der Argumente
Der Hinweis [Begriff/Autor], [Autor1]Vs[Autor2] bzw. [Autor]Vs[Begriff] bzw. "Problem:"/"Lösung", "alt:"/"neu:" und "These:" ist eine Hinzufügung des Lexikons der Argumente.
Griffiths, Tom

Brockman I
John Brockman
Possible Minds: Twenty-Five Ways of Looking at AI New York 2019

Send Link
> Gegenargumente gegen Griffiths
> Gegenargumente zu Verstärkendes Lernen ...

Autoren A   B   C   D   E   F   G   H   I   J   K   L   M   N   O   P   Q   R   S   T   U   V   W   Y   Z  


Begriffe A   B   C   D   E   F   G   H   I   J   K   L   M   N   O   P   Q   R   S   T   U   V   W   Z