Ein Anfängerleitfaden für automatisiertes maschinelles Lernen

5 min read

Ein Anfängerleitfaden für automatisiertes maschinelles Lernen

KI-Anbieter versuchen Unternehmen zum Kauf ihrer Plattformen und Tools für das maschinelle Lernen zu bewegen, in dem sie behaupten, dass es automatisiert ist.  Das ist ein entscheidendes Verkaufsargument, denn die meisten Unternehmen wissen sehr genau, dass sie nicht genügend Datenwissenschaftler eingestellt haben (selbst wenn es überhaupt gelungen ist, Datenwissenschaftler einzustellen).

Datenwissenschaftler sind Personen, die Daten untersuchen, bereinigen, Algorithmen testen, von denen sie glauben, dass sie genaue Vorhersagen über diese Daten treffen, und dann diese Algorithmen abstimmen, bis sie gut funktionieren, so wie auch ein Automechaniker ein Auto einstellen würde. Hier finden Sie eine vollständigere Liste von Aufgaben im Machine Learning-Workflow.

Wenn die Datenwissenschaftler Glück haben, erhalten sie Werkzeuge, um diese Aufgaben effizient auszuführen, und sie können sogar in der Lage sein, diese geschulten Machine-Learning-Modelle in einer Produktionsumgebung bereitzustellen, um Vorhersagen über Daten außerhalb des Labors zu treffen.

Viele Anbieter für maschinelles Lernen, von Google bis zu Start-ups wie Datarobot und H2O.ai, behaupten, dass sie maschinelles Lernen automatisieren können.  Das klingt gut! Dann müssen Sie, der Personalchef, nicht auf der Suche nach Data-Science-Talenten sein, deren Fähigkeiten Sie in einem Bieterkrieg, den Sie nicht gewinnen können, nicht beurteilen können.  Sie automatisieren all diese Fähigkeiten einfach weg.

Das Problem ist, dass die Fähigkeiten von Datenwissenschaftlern schwer zu automatisieren sind, und die Leute, die eine automatisierte KI kaufen möchten, sollten wissen, was genau mit der derzeitigen Technologie automatisiert werden kann und was nicht. Datenwissenschaftler erledigen viele Aufgaben. Während die Automatisierung einiger dieser Aufgaben die Arbeitsbelastung verringert, kann dies die Arbeitserleichterung fördern, es sei denn, Sie können alle ihre Aufgaben automatisieren. Sie sind jedoch immer noch erforderlich, und dieses knappe Talent bleibt ein Knotenpunkt, der die Implementierung von maschinellem Lernen in vielen Organisationen behindert.

Was können wir beim maschinellen Lernen automatisieren?

Ich erwähnte, dass Datenwissenschaftler Algorithmen abstimmen. Wenn Sie eine komplexe Maschine einstellen (und diese Algorithmen sind nur mathematische und symbolische Maschinen), müssen Sie normalerweise mehrere Knöpfe drehen. Es ist so, als würde man etwas mit verschiedenen Zutaten kochen. Um den richtigen Geschmack zu erzeugen, um Ihr Gericht sozusagen abzuschmecken, sollten diese Zutaten in einem angemessenen Verhältnis zueinander hinzugefügt werden, genau wie Sie vielleicht doppelt so viel Buttermilch wie Butter zu einem Biskuitrezept hinzufügen. Das Wichtigste ist, dass die Proportionen richtig sind.

Ein Datenwissenschaftler arbeitet häufig ohne ein “Rezept” und muss die Knöpfe in Kombination miteinander einstellen, um herauszufinden, welche Kombination funktioniert. In diesem Fall bedeutet “arbeiten” das Einstellen eines Algorithmus, bis er in der Lage ist, effizient aus den Daten zu lernen, auf die er trainiert wird.

Hyperparameter-Optimierung

In der Datenwissenschaft werden die Knöpfe eines Algorithmus als Hyperparameter bezeichnet. Die Datenwissenschaftler führen daher eine “Hyperparametersuche” durch, während sie unterschiedliche Kombinationen dieser Hyperparameter testen, wobei sich die Verhältnisse zwischen ihren Bestandteilen unterscheiden.

Die Suche nach Hyperparametern kann automatisiert werden. Eclipse Arbiter ist eine Hyperparameter-Optimierungsbibliothek, die zur Optimierung der Hyperparameteranpassung für tiefes neuronales Netztraining entwickelt wurde. Es ist das Äquivalent zu Vizier von Google Tensorflow oder der Open Source-Python-Bibliothek Spearmint. Arbiter ist Teil des Deeplearning4j-Frameworks. Einige Startups wie SigOpt konzentrieren sich ausschließlich auf die Optimierung der Hyperparameter.

Sie können nach der besten Kombination von Hyperparametern mit verschiedenen Arten von Suchalgorithmen suchen, z. B. Rastersuche, Zufallssuche und Bayes’sche Methoden.

Algorithmusauswahl

KI-Anbieter führen die gleichen Daten durch mehrere Algorithmen, deren Hyperparameter standardmäßig eingestellt sind, um zu ermitteln, welcher Algorithmus Ihre Daten am besten lernen kann.  Am Ende des Wettbewerbs wählen sie den Gewinner aus. Die Visualisierung dieser algorithmischen Schönheitswettbewerbe ist ein eingängiger Weg, um die geleistete Arbeit zu zeigen. Es hat jedoch seine Grenzen, vor allem im Bereich der Algorithmen, die ausgewählt werden, um in einem bestimmten Rennen zu laufen, und kommt darauf an, wie gut sie abgestimmt sind.

Begrenzte Anwendungsfälle auf dem glücklichen Weg

KI-Anbieter können sich in den Algorithmen, die sie auswählen, nur dann gut auskennen, wenn sie etwas über das zu lösende Problem und die zum Trainieren des Algorithmus verwendeten Daten wissen. In vielen realen Situationen sind langwierige Erkundungen von Daten und ein paar domänenspezifisches Wissen erforderlich, um die richtigen Algorithmen auszuwählen.

In der Welt des automatisierten maschinellen Lernens geben wir vor, dass Datenexploration und Domänenwissen keine Rolle spielen. Wir können das nur für einige begrenzte Anwendungsfälle tun. In Software nennt man das den glücklichen Weg oder den Anwendungsfall, bei dem alles so läuft, wie wir es erwarten. Automatisiertes maschinelles Lernen hat einen engen, glücklichen Weg; das heißt, es ist leicht, den Pfad zu verlassen und in Schwierigkeiten zu geraten.

Zum Beispiel ist es einfach, maschinelles Lernen für einen einfachen Anwendungsfall wie das Scoring Ihrer Leads für Salesforce zu automatisieren, um die Wahrscheinlichkeit vorherzusagen, dass Sie einen Verkauf abschließen. Das liegt daran, dass das Schema der Daten – die Sie über Ihre Kunden haben – durch die Salesforce-Software eingeschränkt wird und in den Vertriebsteams weitgehend standardisiert ist. Eine automatisierte Machine-Learning-Lösung, die sich auf das Lead-Scoring konzentriert, kann starke Annahmen über die Art der Daten treffen, die Sie eingeben.

Aber Unternehmen brauchen maschinelles Lernen nicht nur für das Lead Scoring. Ihre Anwendungsbereiche unterscheiden sich ebenso wie ihre Daten. In diesen Fällen kann es schwierig sein, eine vorgebackene Lösung anzubieten. Datenpipelines, auch ETL genannt, sind oft die Stufe des KI-Workflows, die die meiste menschliche Aufmerksamkeit erfordert. Die reale Welt ist unordentlich und Daten, die diese Welt darstellen, sind normalerweise auch unordentlich. Die meisten Datensätze müssen erforscht, gereinigt und anderweitig vorverarbeitet werden, bevor diese Daten zum Trainieren eines Maschinenlernalgorithmus genutzt werden können. Diese Reinigung und Erkundung erfordert häufig einen erfahrenen Menschen.

Professionelle Dienstleistungen

Diese Unternehmen haben zwei Möglichkeiten: Sie können ihre eigenen Datenwissenschaftler einstellen oder sich auf Prozessierungsleistungen von Beratungsunternehmen verlassen. Jeder große Public-Cloud-Anbieter hat Teams für maschinelle Lernlösungen eingeführt, um die Talentlücke zu schließen und maschinelles Lernen potenziellen Nutzern seiner Cloud besser zugänglich zu machen. Die großen Beratungsunternehmen von Accenture bis Bain haben Teams von Datenwissenschaftlern beauftragt, Lösungen für ihre Kunden zu entwickeln. Selbst automatisierte Start-ups für maschinelles Lernen wie Data Robot bieten “Data Scientists”, die sich an den Kunden wenden.

Also, seit langem “automatisieren” die KI-Anbieter, die automatisiertes maschinelles Lernen verkaufen, diese Aufgaben tatsächlich mit Menschen. Das heißt, sie erlauben ihren Kunden, die Talente auszulagern, auf die ihre Kunden sonst keinen Zugriff haben. Dies liegt daran, dass die Aufgaben und Entscheidungen, die mit dem Aufbau von KI-Lösungen verbunden sind, vielfältig und komplex sind und die Technologie zur Automatisierung aller noch nicht vorhanden ist. Das ist eine Automatisierung, es sind Dienstleistungen. Wir sollten es so nennen, wie es ist, und anerkennen, dass das maschinelle Lernen von Maschinen oft ein verfeinertes Urteilsvermögen von Experten erfordert, kombiniert mit Automatisierung für einige kleine Aufgaben in einem größeren KI-Workflow.

Übertragen Sie lernende und vorgefertigte Modelle

Modelle für das maschinelle Lernen beginnen dumm und werden intelligent, wenn sie den Daten ausgesetzt werden, die sie “trainieren”. Das Training beinhaltet das Schätzen von Daten, das Messen des Fehlers und das Korrigieren von Fehlern, bis sie genauere Vermutungen treffen. Algorithmen für maschinelles Lernen trainieren Daten, um ein genaues “Modell” der Daten zu erstellen. Ein trainiertes, genaues Modell der Daten ist in der Lage, gute Vorhersagen zu erzeugen, wenn neue Daten eingespeist werden, die denen entsprechen, an denen sie trainiert wurden. Stellen Sie sich für die Zwecke dieser Diskussion ein Modell als Black-Box vor, das eine mathematische Operation mit Daten durchführt, um eine Vorhersage darüber zu treffen. Die Daten gehen in das Modell ein, die Vorhersage kommt heraus; z.B. Fügen Sie ein Bild eines Freundes in das Modell ein, und der Name des Freundes wird im Bild vorhergesagt.

Manchmal können Sie ein Machine-Learning-Modell mit einem Datensatz trainieren und später für einen anderen, etwas anderen Datensatz verwenden. Dies funktioniert nur, wenn die beiden Datensätze einander ähneln. Beispielsweise haben die meisten Fotografien bestimmte gemeinsame Eigenschaften. Wenn Sie ein Machine-Learning-Modell an prominenten Gesichtern trainieren, lernen sie (das Machine-Learning-Modell), wie Menschen aussehen, und wenn sie nur ein wenig mehr lernen, können Sie es lehren, das, was es bereits weiß, auf Fotos Ihrer Familie und Freunde zu übertragen, und diese zu erkennen ohne sie vorher gesehen zu haben. Wenn Sie ein vorgebildetes Modell verwenden, können Sie die Kosten für das Training Ihrer eigenen Tausende von Stunden auf verteilten GPUs einsparen, ein teures Angebot.

Vorgelernte (Zuvor eingelernte) maschinelle Lernmodelle, die ein gewisses Wissen über die Welt erwerben, sind für die Computer Vision nützlich und weit verbreitet. Zu den bekannten vorgebildeten (zuvor eingelernten) Bildverarbeitungsmodellen gehören AlexNet, LeNet, VGG16, YOLO und Inception. Diese vorab trainierten Computer Vision-Modelle sind hier verfügbar. Die Cloud AutoML von Google setzt unter anderem auf Transfer-Learning, um die Behauptung zu unterstützen, dass es “automatisiertes maschinelles Lernen” gibt.

Quelle

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.