Empfehlungsdienste

5 min read

Empfehlungsdienste

Empfehlungsdienste werden immer beliebter: Kugelmarktforscher führen jährliche Kugelflächenforschungen durch, deren Ziel es ist, mit großen Kugelprozentsätzen die Steigerung der Einkäufe in Ihrem Online-Shop (AKA-Konversion) anzudeuten, wenn unter jedem Artikel Blöcke wie “Ähnliche Artikel” oder “Vielleicht möchten Sie kaufen” oder “Oft zusammen gekauft” oder “Empfohlene Kategorien” sind.

Wir machen keine Witze: Es ist wirklich so.

Wahrscheinlich sind aus diesem Grund im gesamten IT-Bereich Empfehlungsdienste am beliebtesten: Ihren Nutzen können Sie Ihrer Geschäftsleitung am besten anhand schöner Grafiken zeigen, im Gegensatz zu allen anderen Diensten und Systemen. Auf Basis von Empfehlungsalgorithmen werden ganze Projekte erstellt wie beispielsweise LastFM oder Prismatic.

Empfehlungsdienste sind eine Reihe von Algorithmen, die das Ziel haben, eine Vorhersage zu machen, wie stark das Interesse eines Benutzers an einem Objekt (Artikel) ist, nachdem bestimmte Daten zu seinem Profil (Interessen, Ansichten, Bewertungen) analysiert worden sind. Die traditionellen Formen von Empfehlungssystemen sind:

Kollaborative Empfehlungsdienste (auch kollaboratives Filtern)

Sie empfehlen die Objekte, an denen Benutzer mit ähnlichen Bewertungen das größte Interesse haben. Beispiele für Bedingungen: 1) Benutzer A, mit ähnlichen Bewertungen, hat ein Film gefallen. Wahrscheinlich wird er Ihnen auch gefallen. 2) Film B ähnelt Filmen, die Sie bereits hoch bewertet haben. Vielleicht wird er Ihnen auch gefallen. Beispiele für Dienste: last.fm. Vorteile: Theoretisch ist die Genauigkeit hoch. Nachteile: Eingangsschwelle ist auch hoch: Wenn nichts über die Interessen des Benutzers bekannt ist, sind die Empfehlungen praktisch nutzlos. Viele Benutzer sind gezwungen, die Website zu verlassen.

Inhaltsbasierte Empfehlungsdienste

Sie empfehlen Objekte, die ähnlich den Objekten sind, die der Benutzer bereits hoch bewertet hat. Beispiele für Bedingungen: Angefangen mit einfachen: “Bücher desselben Autors”, “Musikwerke desselben Genres”, “Artikel desselben Herstellers” bis “Sie mögen Komödien mit Eddy Murphy, die besten Komödien mit ihm finden Sie hier”. Beispiele für Dienste: Prismatic, Surfingbird. Vorteile: Man kann die Empfehlungen auch an unbekannte Benutzer vermitteln. Dies führt dazu, dass sie in den Dienst einbezogen werden. Darüber hinaus besteht die Möglichkeit, die noch nicht bewerteten Objekte zu empfehlen. Nachteile: Die Genauigkeit sinkt stark, die Entwicklungszeit steigt etwas.

Wissensbasierte Empfehlungsdienste

Empfehlungen werden auf Basis von Kenntnissen des Fachbereichs und nicht über jedes Objekt ermittelt. Oft wird die vorige Form (inhaltsbasierte Empfehlungsdienste) als ein Einzelfall des wissensbasierten Empfehlungssystems definiert, bei dem Kenntnisse aus Informationen über ein Objekt genommen werden. Es lohnt sich, das inhaltsbasierte Empfehlungssystem als eine Sonderform zu betrachten, da es sehr verbreitet ist. Dies wird in den meisten Quellen gemacht. Diese zusätzlichen Kenntnisse ermöglichen, Empfehlungen nicht auf Basis der “Ähnlichkeit” von etwas zu ermitteln, sondern mit komplexeren Bedingungen. Beispiele für Bedingungen: Zu diesem Player könnten Sie noch Kopfhörer kaufen. Sie haben einen ausgezeichneten Laptop gekauft, Sie erhalten 10% Nachlass auf die Tasche. Beispiele für Dienste: Große Online-Shops. Vorteile: Man kann eine Situation aus allen Empfehlungsdiensten ausschließen: “Haben Sie gerade ein Haus in Hamburg gekauft? Vielleicht werden diese 5 Häuser in Hamburg für Sie auch nützlich sein!”. Darüber hinaus kann man folgende Situationen regulieren: “MacBook 2007 wurde mit 5,0 und MacBook 2014 mit 4,9 bewertet, MacBook 2007 ist also besser”. Nachteile: Hoher Schwierigkeitsgrad bei der Entwicklung und Datensammlung.

Hybride Empfehlungsdienste

Die Idee “Das Beste von jeder Form zu nehmen” hat sehr schnell reiche Früchte getragen. Wenn man sehr hartnäckig daran arbeitet, dann erzielt man Erfolg. Beispielsweise gilt Netflix (BellKor), das aus 27 (!) Empfehlungsalgorithmen kombiniert wurde, heute als das coolste Empfehlungssystem. 2009 hat es sogar eine Million Dollar im Netflix Prize gewonnen. Beispiele für Bedingungen: Sie sind nur durch die Phantasie der Entwickler begrenzt. Beispiele für Dienste: Netflix ist das einzige hybride Empfehlungssystem, das GOOGLE finden kann. Vorteile: Die höchste Genauigkeit: Der Fehler in Netflix beträgt etwa 0,86 Punkte für eine 5-Punkte-Bewertungsskala. Selbstverständlich ist alles von der Implementierung abgängig. Nachteile: Der höchste Schwierigkeitsgrad bei der Entwicklung.

Kollaborative Empfehlungsdienste (auch kollaboratives Filtern)

Betrachten wir nun jede der genannten Systemformen etwas ausführlicher. Kollaboratives Filtern erfordert, dass uns Daten zu Benutzern und Objekten, die sie bewertet haben (einschließlich des aktuellen Benutzers), zur Verfügung stehen. Dann wird Filtern in zwei Unterformen unterteilt: benutzerbasiertes und artikelbasiertes.

Benutzerbasiertes Empfehlungssystem: Die Empfehlungen werden nach folgendem Prinzip ermittelt: “Zuerst müssen ähnliche Benutzer gefunden und dann festgestellt werden, ob ihnen das vorgegebene Objekt gefällt”. Zum Beispiel: “Benutzer Michael und Jürgen mögen Schnitzel, Cappuccino und Startups, und Benutzer Markus mag Schnitzel und Cappuccino, was höchstwahrscheinlich bedeutet, dass er einen Startup gründen sollte.”

Artikelbasiertes Empfehlungssystem: In diesem Falle ist die Empfehlungslogik umgekehrt: “Zuerst müssen die Objekte gefunden werden, die dem vorgegebenen ähnlich sind, und dann verglichen werden, wie sie früher schon bewertet wurden.” Zum Beispiel: “Wird Markus gerne Startups gründen? Markus mag Cappuccino und Schnitzel, was bedeutet, dass er Startups wohl auch mögen wird.”

Rein theoretisch ist kollaboratives Filtern sehr einfach: Man findet die Benutzer, die ein bestimmtes Objekt bewertet haben, und berechnet dann den Korrelationskoeffizienten der Bewertungsvektoren für alle Objekte in der Datenbank. Betrachten wir als Beispiel k-Benutzer mit den höchsten Korrelationskoeffizienten und analysieren, wie sie dieses Objekt meistens bewertet haben (ein typischer “k-nächste-Nachbarn-Algorithmus”). Um die Genauigkeit zu erhöhen, soll jede Bewertung durch die durchschnittliche Benutzerbewertung geteilt werden (so wird der Einfluss von “Hassern” und “Ich mag alles”-Benutzer gemindert).

Es sollte noch darauf hingewiesen werden, dass die Singulärwertzerlegung  (oder SVD für Singular Value Decomposition) im Bereich des kollaborativen Filterns heutzutage fortgeschritten ist.

Inhaltsbasierte Empfehlungsdienste

Diese Empfehlungsdienste basieren auf Informationen über Objekte, indem vollständig ignoriert wird, wie diese Objekte von anderen Benutzern bewertet wurden. Als Informationen über das Objekt dienen alle seine Eigenschaften, die wir herausfinden können: Genre, Hersteller, Autor, Land und im Großen und Ganzen alle Angaben, die man erhalten kann. Man sollte aber nicht übertreiben, der Prozessorhersteller ist beispielsweise bei der Auswahl eines Smartphones nicht immer eine relevante Eigenschaft.

In letzter Zeit werden die inhaltsbasierten Empfehlungen am beliebtesten. Es gibt bestimmte Gründe dafür: Keiner der Benutzer will Zeit vergeuden, indem er das System mit seinen Vorlieben lernt und keiner der Ersteller des Systems will viele Benutzer unmittelbar nach der Registrierung verlieren. Hieraus folgen viele Klagen und Witze wie “Ich habe bei eBay einmal ein T-Shirt gekauft und jetzt bietet es mir ständig T-Shirts an” oder “Ich habe einmal eine Website mit Ohrringen besucht, jetzt bekomme ich viele Angebote, wo ich sie kaufen kann.”

Inhaltsbasierte Empfehlungsdienste sind derzeit so beliebt, dass all ihre dummen und unpassenden Empfehlungen schon abstoßend sind. Denken Sie gründlich darüber nach, bevor Sie Ihr nächstes inhaltsbasiertes Empfehlungssystem anwenden, ob es Ihre Benutzer ärgern wird wie dies 90% der vorhandenen machen. Oder vielleicht nehmen Sie sich Zeit und geben sich Mühe, um zu versuchen, es mit zusätzlichen Bedingungen zu ergänzen und sich in die Richtung eines wissensbasierten Systems zu bewegen.Diese Empfehlungsdienste basieren jedoch auf Kenntnissen über TF-IDF (term frequency – inverse document frequency) und die Ähnlichkeit der Dokumente. Wenn Ihnen diese Methoden bekannt sind, dann müssen Sie praktisch nichts Neues beim Erstellen dieser Dienste erlernen. Es handelt sich um dieselbe Sprachverarbeitung und dieselbe Klassifizierung. All dies ist für Sie schon verständlich, bekannt und ziemlich einfach: Sie finden ähnliche Dokumente und platzieren sie auf eine Website.

Prismatic als ein typisches inhaltsbasiertes Empfehlungssystem

Wissensbasierte Empfehlungsdienste

Diese Empfehlungsdienste basieren auch nicht auf den Bewertungen anderer Benutzer, sondern betrachten nur ein Benutzerprofil und einen Artikel. Weitere Wege sind immer unterschiedlich. Aber sie haben eine gemeinsame Eigenschaft: Jeder Weg erfordert das Vorhandensein von Informationen über ein bestimmtes Themengebiet. Dies können Informationen entweder über Benutzer oder über Waren oder etwas Anderes sein. Sie alle sollten beim Ranking behilflich sein.

Der fallbasierte Ansatz erfordert das Vorhandensein zusätzlicher Informationen: Benutzeranforderungen (user requirements). Als Beispiel kann man folgende Anforderungen anführen: “Eine moderne digitale SLR-Kamera mit mindestens 32 Autofokuspunkten und einem Preis von bis zu 2.000 Euro.” Sie können durch Auswahl der notwendigen Checkboxen eingestellt werden. Das Ziel des fallbasierten Ansatzes besteht einfach darin, die empfohlenen Artikel nach Anforderungen zu finden.

Empfehlungssystem auf demografischer Basis zieht unmittelbar die Eigenschaften des Benutzers in Betracht: Ist er wohlhabend? Wo wohnt er? Wie hoch ist sein Einkommen? Und so weiter.

Nutzungsbasierte Empfehlungsdienste berechnen den relativen Nutzen jedes Artikels für den Benutzer. Angenommen der Benutzer ist ein Geek, so wird er sich höchstwahrscheinlich für die Kamera mit den meisten Funktionen entscheiden. Hat ein Benutzer eine Kamera gekauft, so wird er vermutlich bald ein Objektiv brauchen.

Kritikbasierte Empfehlungsdienste haben ein zusätzliches Interface für “Kritik”. Beispielsweise gibt es zwei Achsen, nach denen der Benutzer die Anforderung “Ich möchte eine teure Kamera kaufen, aber mit einer großen Anzahl von Megapixel” stellt. Das System versucht, sich an Ihre Anforderung entsprechend anzupassen.

Die Empfehlungsdienste auf Basis “Was auch immer Sie wollen”: Fast alle Unterarten wissensbasierter Systeme sind ausschließlich von der Phantasie ihrer Autoren abhängig. In jedem konkreten Fall können Sie sich Ihr eigenes Wissensgebiet ausdenken und danach rangieren, um maximale Ergebnisse zu erzielen. Alles hängt nur von Ihnen ab.

Hybride Empfehlungsdienste

Es sollte darauf hingewiesen werden, dass alle „echten“ Empfehlungsdienste, wie auch Suchsysteme, fast immer Hybride sind. Ihre Entwickler verwenden maschinelles Lernen, um die für den Benutzer relevantesten Algorithmen herauszufinden, oder Optimierungsmethoden, um die besten Koeffizienten auszuarbeiten und haben bei all dem viel Spaß. Es gibt keinen einheitlichen Algorithmus für den Aufbau der Hybridsysteme. Jeder, der oben genannte Empfehlungssysteme ausprobiert hat, kommt irgendwann zu hybriden.

Empfehlungssystem Netflix

Dieser Artikel gab einen kurzen Überblick über Empfehlungsdienste und seine Formen. Wir versuchten, alle Formen ausführlich zu beschreiben, indem wir Beispiele anführten und ihre Vorteile und Nachteile betrachteten.

Möchten Sie mehr über Empfehlungsdienste erfahren? Möchten Sie sich unter allen Formen und Unterformen  in Ihrem Element fühlen?

Dann wenden Sie sich an das Team von AI-United.de per Email oder in dem Q&A-Bereich.

Quelle

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.