Dein letzter Login ist schon eine Weile her.

Bitte überprüfe, ob alle Angaben in Deinem Profil noch aktuell sind.


27.05.2020
von Jesko
in IT-Talents

Was ist Reinforcement Learning im Machine Learning?

x
Für Unternehmen:
IT-Nachwuchs kennenlernen!
Jetzt starten

So arbeitet AlphaGo von Google

AlphaGo von Google ist ein enorm Leistungsfähiges Programm - zumindest in seinem eingeschränkten Nutzungsbereich. AlphaGo basiert dabei auf dem sogenannten Reinforcement Learning, einer Lernmethode des Machine Learnings. In diesen Beitrag wollen wir Dir Reinforcement Learning näher bringen.

Lesezeit: ca. 3 Min.

Bewerten

Themen auf dieser Seite:

Mit Reinforcement Learning ist das Überwachte und Unüberwachte Lernen gemeint. Außerdem wird eine der drei Lernmethoden des Machine Learnings damit bezeichnet. Das Reinforcement Learning benötigt kein vorheriges Datenmaterial, denn es werden Strategien und Lösungen auf Basis von erhaltenen Belohnungen im sogenannten Trial-and-Error-Verfahren generiert.

IT-Talents.de ist Deine Plattform für Förderung und Weiterbildung während des IT-Studiums!
Fördermöglichkeiten ansehen


Was ist Reinforcement Learning?

Das Reinforcement Learning wird zu deutsch als "Bestärkendes Lernen" bezeichnet.

Mit dem Reinforcement Learning werden, basierend auf dem Trial-and-Error-Verfahren, Lösungen und Strategien für komplexe Fragestellungen gesucht. Dabei werden für bestimmte durchgeführte Aktionen Belohnungen vergeben. Im Vergleich zu anderen Lernmethoden wird kein Datenmaterial benötigt, um den Agent (das lernende System) zu trainieren. Die Intelligenz und das Wissen entsteht daher einhergehend während verschiedenen Simulationsdurchläufen . Die angewendeten Algorithmen während dieses Prozesses verfolgen das Ziel, die dadurch erhaltenen Belohnungen zu maximieren. Einzelne Aktionen sind deshalb nicht vorgegeben und werden durch den Nutzen der erhaltenen Belohnungen bestimmt.

Das spezielle beim Reinforcement Learning ist, dass es dem menschlichen Lernen sehr ähnelt, es werden zum Beispiel künstliche neuronale Netzwerke dazu genutzt. Als sehr bekanntes Beispiel kann AlphaGo von Google herangezogen werden, bei welchem das Reinforcement Learning ebenfalls Verwendung findet. Das Programm AlphaGo Zero misst sich mit den weltbesten Spielern des beliebten Brettspiels Go und bringt sich das Spiel ohne menschliche Hilfe selbst bei.

Wie funktioniert Reinforcement Learning?

Beim Reinforcement Learning können verschiedene Algorithmen eingesetzt werden. Durch die Aktionen des Agenten wird die Systemumgebung verändert. Bei der Anwendung des Reinforcement Learning hat der Agent in der Ausgangsituation keine Informationen darüber, wie sich eine bestimmte Aktion im Endeffekt auf die Systemumgebung auswirkt. Im Zusammenhang mit einer positiven oder negativen Veränderungen hinsichtlich der Problemlösung erhält der Agent eine Rückmeldungen über den Erfolg seiner Aktion. Diese werden in Form von Belohnungen ausgeschüttet und können auch ausbleiben.

In Verbindung mit dem erhaltenen Feedback, wird der Agent die nächste Aktion ausführen. Die Algorithmen verfolgen dabei immer das Ziel, die vergüteten Belohnungen innerhalb des simulierten Systems zu maximieren. Durch diesen Prozess entstehen oder entwickeln sich automatisch Strategien und Aktionen, durch die für die Problemstellung eine Lösung gefunden wird.

Die Lernergebnisse bilden künstliche neuronale Netzwerke in deren Neuronen ab. Dabei wird die Problemlösung in den Neuronen, zwischen einem sogenannten Input- und Output-Layer gespeichert. Die anderen beiden Lernmethoden werden mit überwachten- und nicht überwachten Lernen bezeichnet.

Auf IT-Talents.de kannst Du Dich mit dem Who-is-Who der IT-Branche vernetzen!
Jetzt Top-Unternehmen anschauen


Was sind die Vorteile beim Reinforcement Learning?

Diese Lernmethode bietet einige Vorteile gegenüber anderen maschinellen Methoden. Durch diesen Prozess ist es möglich, ohne Ausgangsdaten und menschliches (Vor)Wissen, Lösungen zu komplexen Problemen zu finden. Dabei ähnelt Reinforcement Learning dem natürlichen Lernprozess sehr und generiert Lösungen, zu denen ein Mensch nicht fähig ist. Diese Lernmethode kann für beliebige intellektuelle Aufgaben eingesetzt werden. Zudem ist die aufwendige Erhebung und Bearbeitung von Trainingsmethoden durch das Reinforcement Learning nicht notwendig.

Beispiele

  • Ein typisches Anwendungsbeispiel des überwachten Lernens kann die Personenerkennung auf Bildern sein.
  • Des Weiteren auch das automatische Erkennen von Spam-Mails oder die Handschrifterkennung.

Jedoch ist das Erstellen und Generieren von Trainingsdaten beim überwachten Lernen sehr aufwendig. Doch auch das nicht überwachte Lernen braucht Daten zum arbeiten, der Unterschied ist jedoch, dass diese gelabelt sind.

Zu den einzelnen Datensätzen, existieren deshalb keine vorgegebenen Lösungen. Aus diesem Grund versucht das System verschiedene Strukturen, Muster und Unterschiede der Daten zu erkennen, um in der Lage zu sein die Datensätze passend zu gruppieren.

Eine praktische Anwendung kann das Reinforcement Learning zum Beispiel bei der Optimierung von Logistikprozessen, bei der Ampelsteuerung zur Minimierung von Staus, bei der Steuerung der Klimatisierung in Rechenzentren von Google und bei noch vielen anderen Anwendungen finden.

Videoerklärung

Hier noch ein (englischsprachiges) Video zur Verdeutlichung:

Wenn Du willst: IT-Talents.de ist Dein Headhunter! Unser Team macht sich für Dich auf die Suche nach dem passenden Arbeitgeber. Bequem und persönlich.
Jetzt JobScout anschauen


Fazit

Das Reinforcement Learning kann und wird in Zukunft in sehr vielen Bereich zum Einsatz kommen. Bei der praktischen Anwendung wird diese maschinelle Lernmethode, für den Menschen viele Situationen erleichtern und perfekte Problemlösungen finden!

Bildnachweis: mopic @ Adobe Stock

Aktuelle Aktionen:

IT Recruiting-Day Light

Master@BWI!

Starte durch und komm zum IT Recruiting-Day Light ins Phantasialand!
Bewirb Dich bis 06. September bequem online und nutze Deine Chance!


Jetzt bewerben!

IT-Talents ist ein Netzwerk nur für IT'ler. Auf unserer Plattform kannst Du Dich als registriertes Mitglied mit wenigen Klicks auf die Jobs unserer Partnerunternehmen oder auf IT-Projekte für Studierende bewerben. Darüberhinaus führen wir Wettbewerbe durch und vergeben IT-Stipendien.

Jetzt Mitglied werden.

Verwandte Artikel

Was ist GAIA-X?

26. Jun 2020 in IT-Talents

Europäische Konzerne wünschen sich eine europäische Cloud. Am 4. Juni wurden ersten Einzelheiten zur technischen St…

weiter

Was ist ein binäres System?

08. Jun 2020 in IT-Talents

Im Speicher eines Computers sind Daten und Programmcode als eine Folge von Zahlen 0 und 1 dargestellt. Das ist möglich, …

weiter

Machine Learning: Was bedeutet Accuracy und Precision?

19. May 2020 in IT-Talents

Machine Learning ist ein Teilgebiet der künstlichen Intelligenz und befasst sich mit der Verbesserung von …

weiter

Was macht ein Softwareentwickler?

06. May 2020 in IT-Talents

Wir klären in diesem Ratgeber die Fragen, welche Aufgaben ein Softwareentwickler zu erfüllen hat, welche V…

weiter

Was ist Supervised und Unsupervised Learning?

04. May 2020 in IT-Talents

Vielleicht hast du auch schon mal von den Begriffen Supervised Learning und Unsupervised Learning gehört, welche …

weiter

Was ist Ruby?

02. May 2020 in IT-Talents

Ruby ist ein objektorientierter Programmierspracheninterpreter, der vom Programmierer Japaner Yukihiro "Matz" Matsumoto…

weiter

Was ist eine Turingmaschine?

27. Apr 2020 in IT-Talents

Die Turingmaschine ist ein klassisches Konzept, das noch vor der Computer-Ära entstanden ist. Dabei handelte es sich um …

weiter

Was ist MySQL?

23. Apr 2020 in IT-Talents

Mit MySQL ist ein global eingesetztes relationales Datenbanksystem gemeint. Es ist die technische Grundlage bei vielen…

weiter

Schnell-Login für unsere Mitglieder

Tipp: Halte Dein Profil aktuell.

Lass' uns wissen, falls sich etwas Neues bei Dir ergibt.

Tipp: Vervollständige Dein Profil für noch bessere Karrierechancen.

Bist Du Schüler, Student oder bereits berufstätig? Teile uns Deinen aktuellen Status mit, damit wir Dir sinnvolle Aufgaben anbieten können.

Jetzt Status angeben

Wann stehst Du der IT-Branche zur Verfügung?

Bitte Monat und Jahr angeben.

{{ perspectiveForm.availableFrom.$error.dynamic }}

Neuer Versuch

Wo möchtest Du durchstarten?

{{ location.geolocation.name }}×
Bitte mindestens ein Ort angeben.

Als {{currentUser.status.title}} bist Du bereit für:


Lade Beschäftigungsarten

Bitte wähle den Zeitpunkt, Ort und min. eine Beschäftigungsart aus.

You have voted!
Schliessen
Vote for:
stars
Vote
You have not rated!