AI-United » Allgemein » Ein genauerer Überblick über die Hauptarten von Modellen des maschinellen Lernens

Ein genauerer Überblick über die Hauptarten von Modellen des maschinellen Lernens

Das Ziel dieses Artikels ist, einen genaueren Überblick über die wichtigsten Arten von Modellen des maschinellen Lernens zu geben. Er ist sehr hilfreich für diejenige, die mit maschinellem Lernen nicht vertraut sind und einen Überblick über das maschinelle Lernen erhalten möchten.

Hauptarten von Modellen des maschinellen Lernens

Einfach ausgedrückt, wird maschinelles Lernen eingesetzt, um anhand der vergangenen und aktuellen Daten Vorhersagen über zukünftige Daten zu machen. Dies wird in vielen realen Fällen angewendet, von der Empfehlung von Filmen zum Anschauen bis hin zur Identifizierung von Arten von Krebszellen. Der Prozess der Erstellung eines ML-Modells kann ziemlich komplex sein und muss so durchgeführt werden, dass er für das jeweilige Problem funktioniert, das er behandelt sollte. 

Wo Daten vorhanden sind, kann maschinelles Lernen für die Lösung eines Problems, Vermittlung von Erkenntnissen und für viele andere Zwecke eingesetzt werden. Beachten Sie jedoch, dass bei Modellen des maschinellen Lernens nicht eine einzige Art von Algorithmus für alle Fälle verwendet werden kann. Es stehen verschiedene Kategorien von Algorithmen zur Verfügung, die für den Umgang mit unterschiedlichen Daten und die Lösung verschiedener Probleme anhand unterschiedlicher Ansätze entwickelt wurden. Die bereitgestellten Eingaben, die ausgeführte Aufgabe sowie die für jede Klasse gelieferten Ausgaben unterscheiden sich sehr.

Man unterscheidet die folgenden Hauptarten des maschinellen Lernens, die in diesem Artikel im Detail behandelt werden:

  • Überwachtes Lernen
  • Unüberwachtes Lernen
  • Bestärkendes Lernen.

Überwachtes Lernen

Um Algorithmen des überwachten Lernens zu verstehen, betrachten wir zunächst ein bildliches Beispiel:

Es gibt zwei Schiffe, Schiff A und Schiff B, und beide befördern eine Vielzahl von Autos. Während alle Autos auf Schiff A in einer Datenbank beschriftet sind, enthalten die Autos auf Schiff B keine Beschriftungen. Stellen Sie sich nun vor, dass jemand die Aufgabe bekommt, jedes Auto auf Schiff B zu identifizieren und in der Datenbank zu beschriften. Er kann dies tun, indem er ein Modell auf der Grundlage der Daten des Schiffs A entwickelt und es dann auf die Daten des Schiffs B anwendet. Erfährt er beispielsweise von Schiff A, dass Autos mit vier Rädern und mehr als vier Sitzen SUVs genannt werden, weist er das Modell an, aufgrund dieser Informationen solche Autos auf Schiff B auch als SUVs zu identifizieren.

Dies ist eine kurze, bildliche Darstellung des Modells des überwachten Lernens. Es handelt es sich um eine Art von maschinellem Lernen, bei der eine Lösung für das aktuelle Problem auf Basis der bereits vorhandenen Daten gefunden wird.

Stellen wir dies jetzt technisch dar. Überwachtes Lernen ist eine Art von ML-Algorithmus, bei dem ein Modell oder eine Funktion auf Basis der gepaarten Eingabe-Ausgabe-Daten in den Trainingsdaten erstellt wird und die Eingabe der Testdaten auf ihre jeweilige Ausgabe abbildet. Dabei versteht man unter Trainingsdaten oder einem Trainingsdatensatz einen Datensatz mit beschrifteten Daten und unter Testdaten oder dem Testdatensatz einen Satz von Eingaben ohne Beschriftungen. Kurz zusammengefasst, kann überwachtes Lernen als eine Art maschinelles Lernen betrachtet werden, bei dem ein Lehrer notwendig ist, technisch gesehen Trainingsdaten.

Überwachtes Lernen lässt sich grob in zwei Unterarten einteilen: Regression und Klassifikation. Während bei der Regression das Modell des überwachten Lernens numerische (oder kontinuierliche) Werte verwendet, werden bei der Klassifikation kategoriale Werte verwendet, die in der Regel binäre Werte (0 oder 1) sind.

Beim überwachten Lernen gibt es zwei zentrale Probleme:

  • Da diese Modelle mit Verzerrungen und Varianzparametern erstellt werden, gibt es hier einige Probleme. Erstens können durch Verzerrungen Fehler in den Ergebnissen entstehen. Dies lässt sich dadurch erklären, dass sie nicht auf den Daten selbst, sondern auf Annahmen über die Daten basieren. Zweitens kann eine Varianz, besondere eine hohe Varianz, dazu führen, dass Modelle bei Trainingsdaten gut und bei Testdaten schlecht funktionieren. 
  • Rauschen in den Daten: Durch Fehler in den Daten können Dateninkonsistenzen entstehen.

Überwachtes Lernen ist weit verbreitet und umfasst folgende Algorithmen:

  • Support Vector Machines
  • Lineare Regression
  • Logistische Regression
  • Naive Bayes
  • Diskriminanzfunktion
  • Entscheidungsbäume
  • k-Nearest-Neighbor-Algorithmus
  • Neuronale Netzwerke (Mehrschichtiges Perzeptron)
  • Similarity Learning.

Unüberwachtes Lernen

Um unüberwachte Lernalgorithmen zu verstehen, betrachten wir ein weiteres Beispiel:

Angenommen es gibt anstelle von zwei Schiffen, dem Schiff A und dem Schiff B, nur ein einziges Schiff. Und anstelle von Autos befördert es mehrere Obstsorten und Ihnen ist unbekannt, um welche Obstsorten es sich handelt. Um dieses Problem zu lösen, sollten Sie alle Früchte auf dem Schiff nach ihren physikalischen Eigenschaften in Gruppen unterteilen. Zunächst können Sie beispielsweise nach Größe, dann nach Farbe, danach nach Form und so weiter und so fort unterteilen. Dies ist die bildliche Darstellung der Funktionsweise der Modelle des unüberwachten Lernens.

Versuchen wir jetzt dies technisch darzustellen. Unüberwachtes Lernen ist eine Art von maschinellem Lernen, bei dem Schlussfolgerungen aus einem Datensatz ohne Beschriftungen gezogen werden. Eine der beliebtesten Kategorien des unüberwachten Lernens ist das Clustering. Man kann es als ein Verfahren betrachten, bei dem der Prozess der explorativen Datenanalyse durchgeführt wird, um verborgene Muster oder Gruppierungen in Daten zu finden. Anders gesagt, unüberwachte Lernalgorithmen sind Modelle, die aus den Testdaten selbst lernen, im Gegensatz zu Modellen des überwachten Lernens, die von einem Lehrer, d.h. Trainingsdaten, lernen. 

Die am häufigsten von unüberwachten Lernmodellen verwendeten Algorithmen sind:

Clustering-Modelle

  • Hierarchisches Clustering
  • K-means
  • Mischungsmodelle
  • DBSCAN (Density-Based Spatial Clustering of Applications with Noise, etwa: Dichtebasierte räumliche Clusteranalyse mit Rauschen)
  • OPTICS-Algorithmus (Ordering Points To Identify the Clustering Structure, etwa: Punkte ordnen, um die Clusterstruktur zu identifizieren) 

Modelle zur Anomalieerkennung

  • LOF: Local Outlier Factor (etwa: Lokaler Ausreißerfaktor)

Neuronale Netzwerkmodelle

  • Autoencoders
  • Deep-Belief-Netzwerke
  • Hebbsches Lernen
  • GAN: Generative Adversarial Networks (etwa: erzeugende gegnerische Netzwerke).

Bestärkendes Lernen

Modelle des bestärkenden Lernens können mit dem Dressieren eines Hundes verglichen werden. Das heißt, mit der Art und Weise, wie ein Hund trainiert wird und bei der Ausführung einer Zielaufgabe von Ihnen mit einer Leckerei immer belohnt wird. In diesen Algorithmen erfüllt der Hund die Rolle eines Agenten und die Hundeleckerei die Rolle der Belohnung. Beachten Sie, dass es hier eine Aktion oder eine zu ausführende Zielaufgabe gibt. Darüber hinaus zählen zu den zwei wichtigen Elementen dieser Modelle die Umgebung und der Interpreter. Dementsprechend können sie am Ort verstanden werden, an dem die Zielaufgaben vom Hund ausgeführt werden, und die Person, die dem Hund befiehlt und ihn mit Leckereien belohnt.  

Wie können Algorithmen des bestärkenden Lernens technisch erklärt werden? Sie sind die Art des ML-Modells, bei dem die Ausführung der Aufgaben von einem Agenten in einer bestimmten Umgebung erfolgt. In diesem Modell wird dem Agenten entweder eine Belohnung oder eine Strafe für jede ausgeführte Aufgabe gegeben. Wie der Name verrät, handelt es sich um die Durchführung kontinuierlicher Verbesserungen basierend auf bestimmten Regeln. Der Algorithmus des bestärkenden Lernens unterscheidet sich von anderen Ansätzen des maschinellen Lernens dadurch, dass ihm nicht mitgeteilt wird, wie eine Aufgabe ausgeführt werden sollte, sondern er muss von selbst lernen. 

Da die Modelle des bestärkenden Lernens eine Vielzahl von Daten erfordern, funktionieren sie dort, wo leicht verfügbare Daten vorhanden sind. Die typischen Anwendungsfälle sind Gameplay- und Roboterszenarien. Beispielsweise wurde bestärkendes Lernen bei Brettspielen wie Backgammon, Dame und Schach angewendet. Um die Ergebnisse der Modelle des bestärkenden Lernens zu testen, wird die Lehrkraft eines Agenten gegen einen Menschen getestet. 

Zu den wichtigsten Algorithmen des bestärkenden Lernens gehören:

  • Monte Carlo
  • Q-Learning
  • State Action Reward State Action (SARSA)
  • Deep Q Network (DQN)
  • Asynchronous Actor-Critic Agent (A3C)
  • Deep Deterministic Policy Gradient (DDPG)
  • Normalized Advantage Functions (NAF).

Schlussfolgerungen

Maschinelles Lernen lässt sich in drei Hauptarten unterteilen: überwachtes Lernen, unüberwachtes Lernen und bestärkendes Lernen. Für Modelle des überwachten Lernens können die Beschriftungen von Testdaten durch das Training eines Modells basierend auf den Beschriftungen von Trainingsdaten vorhergesagt werden. Abhängig von der Art der verwendeten Daten können Modelle des überwachten Lernens in Regressions- und Klassifizierungsmodelle unterteilt werden. In Modellen des unüberwachten Lernens werden versteckte Muster und Gruppierungen in den Daten ohne Hilfe von Trainingsdaten gefunden. Schließlich können Modelle des bestärkenden Lernens als die Modelle betrachtet werden, bei denen ein einbezogener Agent die Aufgaben in einer Umgebung auf Basis der Belohnungen ausführt. 

Möchten Sie mehr über die wichtigsten Arten von maschinellem Lernen erfahren, so können Sie sich an das Team von AI-United.de per Mail oder Q&A wenden.

Quelle
AI-United-Redaktion

Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.