Anleitung für Anfänger zur Künstlichen Intelligenz (KI)

5 min read

Anleitung für Anfänger zur KI

KI ist eine Reihe von Algorithmen, die Entscheidungen über Daten treffen. Diese Algorithmen sind nur Mathematik und Code. Die Mathematik umfasst in der Regel lineare Algebra, Kalkül und Wahrscheinlichkeit – Dinge, die viele Leute am Institut studiert und dann vergessen haben. Die Hauptsache ist jedoch, dass es sich um Mathematik für das Bachelorstudium handelt, nicht um Raketenwissenschaft.

Um die KI und ihre Funktion auf hohem Niveau zu verstehen, müssen wir nicht einmal wissen, welche Algorithmen beteiligt sind. Sie machen nur Vorhersagen über etwas, was für Sie wichtig ist. Im Folgenden werden wir uns ein Beispiel für Machine Learning ansehen. (Hier finden Sie die Unterschiede zwischen den Begriffen KI, Machine Learning und Deep Learning.)

Ein Beispiel für Machine Learning

Stellen Sie sich vor, Sie möchten zum Beispiel wissen, wer Ihr Haus betritt. Das ist ein Ziel, das Ihnen sehr am Herzen liegt. Sobald wir das wissen, werden wir strategische Klarheit darüber haben, wofür Sie KI einsetzen wollen. Das ist der erste Schritt.

Der zweite Schritt besteht darin, herauszufinden, ob Sie Daten haben, die mit den Vorhersagen korrelieren. In diesem Fall möchten Sie möglicherweise Bilder von Menschen haben, die Ihr Haus betreten.

Um diese Daten zu erfassen, installieren Sie eine Kamera an der Tür, um ein Foto von Personen auf der Treppe zu machen.

Sie möchten die Identität der Person an der Tür vorhersagen. Die Daten, die mit diesen Vorhersagen korrelieren, sind die von der Kamera aufgenommenen Bilder. Aber es gibt noch einen weiteren Schritt.

Algorithmen, insbesondere Machine-Learning-Algorithmen lernen Korrelationen. Das heißt, wenn Sie ihnen die Ausgänge (Namen) und die Eingänge (Pixel im Bild) geben, werden sie die Regeln finden, die die Pixel, die ein bestimmtes Gesicht repräsentieren, mit einem bestimmten Namen korrelieren.

Training eines Algorithmus

Aber zuerst müssen Sie dem Algorithmus beibringen, diese Vorhersagen zu treffen. Sie müssen dem Algorithmus einen beschrifteten Datensatz geben. Der Datensatz sind die Bilder aller Personen, die zu Ihnen nach Hause kommen. Die Bezeichnungen sind ihre Namen. So würden alle Bilder mit einem Namen verbunden sein – Bob, Rachel, Alice, Alfred. Der Algorithmus wird die Daten sehen und lernen, den Namen vorherzusagen, der zu jedem Gesicht gehört.

Dies ist die Trainingsphase eines Algorithmus für Machine Learning, und Machine Learning ist eine leistungsfähige Art von KI. Wenn er mit dem Training beginnt, weiß der Algorithmus nichts. Sie futtern die Daten, erraten zufällig die Antwort, die normalerweise falsch ist, und da Sie den tatsächlichen Namen kennen, der an jedes Bild angehängt werden soll, messen Sie, wie falsch der Algorithmus war. Dann verwenden Sie diese Fehlermessung, um den Algorithmus immer wieder über Millionen von Versuchen anzupassen, bis er schließlich richtig zu erraten beginnt.

Wir müssen zwischen dem Algorithmus und dem, was wir das “Modell” nennen, unterscheiden. Lassen Sie uns sagen, dass wir mit der linearen Regression arbeiten, die im Grunde y = a * x + b ist. y steht für den Ausgang, den Sie vorhersagen wollen, x steht für die Eingangsdaten, die Sie dem Algorithmus zuführen, während a und b die Parameter sind, die in einem Algorithmus eingestellt sind. Die Parameter a und b können eingestellt werden. Wenn a und b ausgeschaltet sind, erhalten Sie falsche Vorhersagen, und wenn a und b richtig sind, erhalten Sie genaue Vorhersagen. Zusammen bilden a und b das “Modell”. Bei einem trainierten Modell wurden a und b angepasst, um genaue Vorhersagen zu geben.

Die richtigen Daten erhalten

Sie brauchen die richtigen Daten, um einen Algorithmus zu trainieren. Das heißt, wenn Sie Menschen an ihren Gesichtern erkennen möchten, müssen Sie Fotos von Gesichtern der Personen machen. Und dann brauchen Sie jemanden, der diese Fotos beschriftet. Es findet also ein Transfer von menschlichem Wissen in den Datensatz und vom Datensatz in den Algorithmus statt. Wenn Sie nicht die richtigen Daten sammeln und sie korrekt beschriften, wird Ihr Algorithmus nicht lernen, wie man genaue Vorhersagen trifft.

KI beginnt mit den Daten. Leute und Firmen, die KI und Machine Learning einsetzen möchten, müssen eine solide Grundlage schaffen, indem sie die richtigen Daten sammeln und richtig kennzeichnen. Wenn Sie dies nicht tun, wird die Genauigkeit, die die Algorithmen erzeugen können, eingeschränkt. Wenn Sie die Daten richtig erfassen, sind Sie auf halbem Weg.

Die Bedeutung von Datenwissenschaftlern

Der nächste Schritt besteht in der Auswahl und Abstimmung der Algorithmen. Es gibt viele Algorithmen zur Auswahl, von denen viele an anderer Stelle dieser Website beschrieben sind. Und diese Algorithmen können eingestellt werden, genau wie ein Auto oder eine Maschine. Das heißt, es gibt Knöpfe zum Drehen. Sie können bestimmen, wie viel sie trainieren und wie schnell sie sich während des Trainings anpassen. Und genau wie beim Drehen der Knöpfe an einer Maschine gibt es viele Möglichkeiten, dies zu vermasseln.

Die Leute, die wissen, wie man Algorithmen einstellt, werden typischerweise als Datenwissenschaftler bezeichnet. Manchmal werden sie auch als Spezialisten für Machine Learning oder Deep Learning bezeichnet. Das sind die Leute, die wissen, wie man Daten erkundet, um festzustellen, ob sie gut sind, und wie man mit verschiedenen Algorithmen experimentiert, bis sie einen finden, der gut von einem Datensatz lernt.

Es gibt nicht genug Menschen auf der Welt, die über diese Fähigkeiten verfügen. Datenwissenschaftler sind allzu selten, und das gilt doppelt für maschinenlernende Doktoranden. Neben guten Daten ist der Mangel an qualifizierten Datenwissenschaftlern ein weiteres Hindernis für die Einführung und Umsetzung von KI.

Integration und Infrastruktur

Keine Software ist eine Insel. Es muss sich immer in etwas einmischen, weil Daten aus einer Quelle stammen müssen, vorhersagen müssen. Machine Learning Software muss mit Datenquellen im Vorfeld und mit Geschäftslogik- und Datenvisualisierungs-GUIs im Anschluss integriert werden. Ohne diese Integrationen wird es nicht nützlich sein.

Viele Machine-Learning-Tools, Plattformen, auf denen Datenwissenschaftler KI-Algorithmen auswählen, abstimmen und trainieren können, wurden zur Unterstützung der Forschung entwickelt. Das heißt, sie sind für die wissenschaftliche Seite der Datenwissenschaft geeignet. Es sind andere Schritte erforderlich, bevor die KI nützlich sein kann. Nachdem ein Machine-Learning-Modell trainiert wurde, muss es so eingesetzt werden, dass das Unternehmen, das für seine Entwicklung bezahlt hat, die Vorhersagen des Modells nutzen kann.

Es gibt viele Anstrengungen, um Werkzeuge für Machine Learning zu entwickeln, die es einfacher machen, trainierte Modelle einzusetzen, ihre Leistung zu verfolgen und sie bei Bedarf zu aktualisieren. Dazu gehören kostenpflichtige Machine-Learning-Dienste von Public Cloud-Anbietern sowie Open-Source-Projekte. Einige dieser Tools versenden lediglich Blobs aus Python und C-Code in einem Docker-Container, während andere eher umfassende Versuche unternehmen, die Infrastrukturprobleme zu lösen, die bei der AI-Produktion inhärent sind.

Public Clouds, IT-Abteilungen und KI-Beschaffung

Die schlechte funktionale Beziehung zwischen den Datenwissenschaftlern und ihren internen IT-Abteilungen, die für die Beschaffung und Genehmigung von Hard- und Software zuständig sind, treibt diese Datenwissenschaftler in die Cloud, um ihre Arbeit zu erledigen.

Das ist negativ für die Hard- und Softwareanbieter, die versuchen, vor Ort für die proprietären Datenzentren von Unternehmen zu verkaufen. Diese Bewegung gibt den großen Anbietern von Public Clouds mehr Macht.

Der Fachbegriff ist Oligopsie, oder ein Markt mit wenigen Käufern (auch bekannt als “schlechter Markt”), der umgekehrte Fall von Oligopoly.

Die “Total Cost of Ownership” (TCO), die Cloud mit On-Prem vergleichen, zeigt, dass Cloud Services sehr schnell und sehr teuer werden, wenn man sich auf sie mit einer hohen und konstanten Rate verlässt, da sie Teams mit 100.000 Leuten für die Schulung von Machine Learning Modellen benötigen.

Da die Datenwissenschaftler ihre Arbeitsbelastungen als Reaktion auf die Inkongruenz der IT-Abteilung in die Cloud verlagern, werden neue Stapel aufgebaut. Die Datendichte steigt und die Arbeit des Unternehmens ist bald so wegabhängig, dass “Entkopplung” sehr teuer wird. Eine Sache, die es teuer macht, sind die Data Pulls.

IT-Abteilungen kaufen im Allgemeinen keine Hardware und Software für Machine Learning. Sie sehen neue Chips als Modeerscheinung an und betrachten die meisten Data-Science-Software als instabil, nicht unterstützt und nicht behebbar. Sie liegen nicht falsch. Datenwissenschaftler sind jedoch diejenigen, die entscheiden, welche Lernwerkzeuge ihr Unternehmen einsetzen wird. Sie sind immer noch selten genug, um diese Schlagkraft zu haben. Sie neigen dazu, sich für eine Technologie zu entscheiden, die ihre persönliche Produktivität maximiert (z. B. Wie kann man ein trainiertes Modell schnell herstellen?) Und nicht für eine Technologie, die gut für Teams geeignet ist oder in einer Produktionsbereitstellung stabil ist.

Während Unternehmen wie Apple einen Großteil ihrer Data-Science-Arbeit bei Scala standardisiert haben, ist es anderen Unternehmen sehr wichtig, ihren Data Scientists Tools aufzuerlegen.

Welches KI System kommt nun bei Ihnen in Frage?

Wie setzt man KI in Ihrem Umfeld ein?

Diese und weitere Fragen beantwortet das AI_United Team gerne per Email oder im Q&A Bereich.

Quelle

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.