AI-United » Allgemein » SuperVize Me: Unterschied zwischen überwachtem, unüberwachtem, halbüberwachtem und verstärkendem Lernen?

SuperVize Me: Unterschied zwischen überwachtem, unüberwachtem, halbüberwachtem und verstärkendem Lernen?

SuperVize Me

Es gibt verschiedene Möglichkeiten, IKEA-Möbel zu bauen, die aber mit einem gemeinsamen Ziel verbunden sind – Erstellen einer Fertigware. Abhängig von den Einzelheiten ist die eine Methode sinnvoller als die andere.

Ist die Bedienungsanleitung dabei? Sind alle Teile vorhanden? Dann müssen Sie nun einfach den Anweisungen folgen! Ist alles verständlich? Dann beginnen Sie mit der Montage. Jetzt liegt es an Ihnen, ob es aus diesem ganzen Stapel von Holzdübeln und Planken das gewünschte Möbelstück wird oder nicht.

Genauso ist es mit tiefem Lernen. Auf der Grundlage der verfügbaren Daten und der Forschungsfrage wählt ein Wissenschaftler einen Algorithmus zum Training aus und verwendet ein spezifisches Lernmodell.

In einem Modell des überwachten Lernens verwendet der Algorithmus beim Training einen markierten Datensatz. Als Ergebnis wird ein Antwortschlüssel bereitgestellt, mit dem der Algorithmus die Genauigkeit der Trainingsdaten bewerten kann. Ein unüberwachtes Modell stellt hingegen unmarkierte Daten zur Verfügung, die der Algorithmus durch das Extrahieren von Merkmalen und Mustern selbst zu verstehen versucht.

Halbüberwachtes Lernen nimmt die Mitte ein. Es verwendet eine kleine Menge markierter Daten, die dann einen größeren Satz unmarkierter Daten unterstützen. Ein verstärkendes Lernen trainiert einen Algorithmus mit einem Belohnungssystem, das informiert, wenn ein Agent der künstlichen Intelligenz in einer bestimmten Situation die beste Aktion ausführt.

Betrachten wir nun alle Arten von Datensätzen und Problemen, die sie haben können.

Überwachtes Lernen

Wenn Sie eine Aufgabe unter Aufsicht eines Lehrers machen, beurteilt er, ob Sie die richtige Antwort gefunden haben oder nicht. Ähnlich sieht es beim überwachten Lernen aus: Es gibt einen vollständigen Satz markierter Daten, während ein Algorithmus trainiert wird.

Unter vollständig markierten Daten ist gemeint, dass jedes Beispiel im Trainingsdatensatz mit der Antwort gekennzeichnet ist, die der Algorithmus selbständig finden sollte. Ein markierter Datensatz mit Blumenbildern würde dem Modell also mitteilen, welche Fotos von Rosen, Gänseblümchen und Narzissen waren. Wenn ein neues Bild vorkommt, vergleicht das Modell es mit den Trainingsbeispielen. Und so wird das korrekte Label vorhergesagt.

Beim überwachten maschinellen Lernen wird der Algorithmus aus markierten Daten trainiert.

Überwachtes Lernen wird in zwei Hauptgebieten verwendet: Klassifizierungsprobleme und Regressionsprobleme.

Katze, Koala oder Schildkröte? Dank des Klassifizierungsalgorithmus ist der Unterschied deutlich zu erkennen.

Bei Klassifizierungsproblemen wird der Algorithmus gefordert, einen diskreten Wert vorherzusagen und die Eingabedaten als Mitglied einer bestimmten Klasse oder Gruppe zu identifizieren. In einem Trainingsdatensatz von Tierbildern würde dies bedeuten, dass jedes Foto die Vormarkierung als Katze, Koala oder Schildkröte bekommt. Der Algorithmus wird danach bewertet, wie genau die Klassifizierung neuer Bilder von anderen Koalas und Schildkröten erfolgt.

Die Regressionsprobleme haben hingegen mit kontinuierlichen Daten zu tun. Die lineare Regression, die uns aus der Algebra-Klasse bekannt ist, ist das beste Beispiel: Wenn x-Wert angegeben wird, wie hoch ist dann der erwartete Wert der y-Variable?

Als realistischeres Beispiel im Bereich des maschinellen Lernens betrachten den Algorithmus mit vielen Variablen nennen, der den Preis einer Wohnung in New York nach solchen Parametern wie Quadratmeterzahl, Lage und Nähe zu öffentlichen Verkehrsmitteln vorhersagt.

In Fällen, wenn der Algorithmus mit einem Satz verfügbarer Referenzpunkte oder einer Grundwahrheit trainiert wird, ist überwachtes Lernen am besten zu verwenden. Diese stehen aber nicht immer zur Verfügung.

Unüberwachtes Lernen

Man findet saubere, perfekt markierte Datensätze mit großen Schwierigkeiten. Unüberwachtes Lernen wird verwendet, wenn Forscher den Algorithmen die Fragen stellen, auf die sie keine Antwort wissen.

Unüberwachtes Lernen sieht voraus, dass ein Modell des tiefen Lernens einen Datensatz ohne explizite Anweisung bekommt, wie man damit umgeht. Der Trainingsdatensatz ist eine Sammlung von Beispielen, die kein bestimmtes erwünschtes Ergebnis oder eine korrekte Antwort enthält. Wenn nützliche Funktionen extrahiert und ihre Strukturen analysiert werden, versucht das neuronale Netzwerk dann automatisch, die Struktur in den Daten zu finden.

Modelle des unüberwachten Lernens extrahieren automatisch Merkmale und finden Muster in den Daten.

Die Daten in Modellen des unüberwachten Lernens werden auf folgende Weise organisiert:

  • Clustering:  Ohne Fachkenntnisse in Ornithologie kann man eine Sammlung von Vogelfotos betrachten und sie grob nach Arten trennen, indem solche Merkmale wie Federfarbe, Größe oder Schnabelform in Betracht genommen werden.  Wie funktioniert Clustering als eine am häufigsten verwendete Anwendung für unüberwachtes Lernen? Zuerst sucht das Modell des tiefen Lernens nach Trainingsdaten, die einander ähnlich sind, und dann gruppiert sie.
  • Anomaly detection (Erkennung von Anomalien): Wenn Banken im Kaufverhalten von Kunden ungewöhnlichen Muster finden, so erkennen sie betrügerische Transaktionen. Benutzt man beispielsweise dieselbe Kreditkarte in Washington und London am selben Tag, so gibt dies einen begründeten Verdacht. Ähnlicherweise kann unüberwachtes Lernen verwendet werden, um Ausreißer in einem Datensatz zu markieren.
  • Association (Assoziation): Stellen Sie sich vor: Sie wollen in einem Online-Shop Windeln, Apfelmus und Sippy-Tassen kaufen. Aufgrund ihrer Einkäufe empfiehlt Ihnen die Website, noch ein Lätzchen und ein Babyphon zu besorgen. Dies ist ein Assoziationsbeispiel: Bestimmte Merkmale eines Datenmusters korrelieren mit anderen Merkmalen. Indem ein Modell des unüberwachten Lernens einige Schlüsselattribute eines Datenpunkts betrachtet, werden die anderen Attribute vorhergesagt, mit denen sie gewöhnlich verbunden sind.
  • Autoencoders (Auto-Codeumsetzer): Auto-Encoder übernehmen und komprimieren Eingabedaten in einen Code, um sie anschließend aus diesem summierten Code neu zu erstellen. Man kann folgendes Beispiel einführen: Man beginnt mit Moby Dick, erstellt eine SparkNotes-Version und versucht dann, die Originalgeschichte mit nur SparkNotes als Referenz umzuschreiben. In diesem Fall geht es um einen ordentlichen Trick des tiefen Lernens. In der realen Welt gibt es weniger Fälle, in denen ein einfacher Auto-Encoder nützlich ist. Wenn man aber eine Schicht der Komplexität hinzufügt, so vervielfachen sich die Möglichkeiten: Verwendet man laute und saubere Versionen eines Bildes während des Trainings, so können Auto-Encoder Geräusche aus visuellen Daten wie Bilder, Videos oder medizinische Scans entfernen, um die Bildqualität zu verbessern.

Da die Daten kein Grundwahrheitselement enthalten, ist es schwierig, die Genauigkeit eines mit unüberwachtem Lernen trainierten Algorithmus zu messen. In vielen Forschungsbereichen sind markierte Daten nur flüchtig oder zu teuer zu erhalten. In diesen Fällen kann das tiefe Lernen des Modells die Suche nach eigenen Mustern verursachen, die zu hohen Ergebnissen führen.

Halbüberwachtes Lernen als ein glückliches Medium

Der Begriff Halbüberwachtes Lernen spricht für sich selbst: Es handelt sich um  einen Trainingsdatensatz mit sowohl markierten als auch unmarkierten Daten. Diese Methode wird in Fällen verwendet, wenn das Extrahieren von relevanten Merkmalen aus den Daten schwierig ist und die Markierungsbeispiele eine zeitintensive Aufgabe für Experten sind.

Besonders wichtig ist halbüberwachtes Lernen für medizinische Bilder, wenn ihre Genauigkeit von sogar einer kleinen Menge markierter Daten wesentlich erhöht werden kann.

Warum ist diese Art des Lernens für medizinische Bilder wie CT-Scans oder MRI sehr nützlich? Die Aufgabe jedes Radiologen ist das Untersuchen und Kennzeichnen einer kleinen Untergruppe von Scans auf Tumore oder Krankheiten. Aber es ist zu zeitaufwändig und kostenintensiv, alle Scans manuell zu kennzeichnen. Das Deep-Learning-Netzwerk kommt mit dieser Aufgabe gut zurecht: Es profitiert von dem geringen Anteil von markierten Daten und verbessert die Genauigkeit im Vergleich zu einem völlig unüberwachten Modell.

Bei einer beliebten Trainingsmethode, die mit einem ziemlich kleinen Satz markierter Daten beginnt, wird GANs (Generative Adversarial Networks) verwendet.

Wie kann man sich GAN vorstellen? Dabei handelts es sich um zwei Netzwerke des tiefen Lernens, die miteinander wetteifern und versuchen, einander zu überlisten. Sie werden Generator und Diskriminator genannt. Der Generator versucht, neue Datenpunkte zu erstellen, die die Trainingsdaten nachahmen. Der Diskriminator zieht diese neu generierten Daten ein und bewertet, ob sie Teil der Trainingsdaten oder Fälschungen sind. Die Netzwerke werden in einer positiven Rückkopplungsschleife verbessert: Der Diskriminator trennt die Fälschungen besser von den Originalen, dementsprechend wird die Fähigkeit des Generators verbessert, überzeugende Fälschungen zu kreieren.

Die Vorgehensweise von GAN sieht so aus: Der Diskriminator, der mit „D“ gekennzeichnet wird, zeigt Bilder sowohl vom Generator „G“ als auch vom Trainingsdatensatz. Die Aufgabe des Diskriminators ist dann das Bestimmen, welche Bilder echt sind und welche von dem Generator gefälscht sind.

Verstärkendes Lernen

Videospiele enthalten eine große Anzahl von Verstärkungshinweisen. Hier sind einige von ihnen: Vervollständige ein Level und verdiene ein Badge. Besiege den Bösen in einer bestimmten Anzahl von Schritten und erhalte einen Bonus. Trete in eine Falle – das Spiel ist beendet.

Dank dieser Hinweise lernen die Spieler, wie man die Leistung für das nächste Spiel verbessert. Ohne diese Rückmeldung würden sie in der Hoffnung auf den Übergang auf die nächste Stufe nur zufällige Aktionen in einer Spielumgebung durchführen.

Videospiele sind eine typische Testumgebung für verstärktes Lernen, die nach demselben Prinzip funktioniert.

Diese Art des maschinellen Lernens sieht voraus, dass Agenten der künstlichen Intelligenz versuchen, den optimalen Weg zu finden, um ein bestimmtes Ziel zu erreichen oder die Leistung bei einer genauen Aufgabe zu verbessern. Wenn der Agent die Aktionen durchführt, die zum Ziel führen, erhält er eine Belohnung. Das Gesamtziel lautet dabei so: Wenn der beste nächste Schritt vorhergesagt wird, bekommt man die höchste endgültige Belohnung.

Um eine Wahl zu treffen, verlässt sich der Agent auf das Lernen aus vergangenen Rückmeldungen und auch auf die Erforschung neuer Taktiken, die ein höheres Ergebnis zeigen können. Dies bedeutet eine langfristige Strategie: Wenn Sie den besten unverzüglichen Zug in einem Schachspiel machen, hilft es Ihnen nicht auf lange Sicht zu gewinnen. Der Agent versucht aber dabei, die Gesamtbelohnung zu maximieren.

Dies ist der Sinn eines iterativen Prozesses: Je mehr Runden von Rückmeldungen es gibt, desto besser wird die Strategie des Agenten. In erster Reihe ist diese Technik für das Training von Robotern von hohem Nutzen. Vor ihnen steht die Aufgabe, eine Reihe von wichtigen Entscheidungen zu treffen, z. B. bei der Steuerung eines autonomen Fahrzeugs oder bei der Verwaltung des Lagerbestandes.

Fazit

Man kann einen Algorithmus mit einem Schüler in der Schule vergleichen: Jeder lernt anders. Bei der Vielfalt der verfügbaren Methoden soll der beste Weg gefunden werden, wie sich ein neuronales Netzwerk zurechtfindet.

Sollten Sie Fragen zu SuperVize Me und verschiedenen Überwachungsmodellen haben, so können Sie sich an das Team von AI-United.de per Mail oder Q&A wenden.

Quelle

AI-United-Redaktion

Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.