Antje Marx | Tuesday, der 14. August 2018
Empfehlungssysteme sind effektive Hilfsmittel um dem Nutzer beim Finden von relevanten Filmen auf Video-Portalen und Streaming-Plattformen zu unterstützen. Die Systeme analysieren dazu das Verhalten des Benutzers, ermitteln implizite Präferenzen und berechnen Empfehlungen, die zu den Vorlieben des Nutzers passen. Populäre Plattformen, wie Netflix, Pandora und Amazon, bieten erfolgreich Empfehlungssysteme an, die vorrangig die Bewertungen und das Verhalten der Nutzer analysieren. Collaborative filtering (item-based, user-based) ist ein oft verwendeter Ansatz, um hochqualitative Empfehlungen zu berechnen.
In Nischenmärkten haben diese Standard-Ansätze einige Schwächen: Insbesondere das Fehlen von Bewertungen und Reviews sowie die besonderen Merkmale von Filmen spezifischer Genres erfordert maßgeschneiderte Empfehlungsstrategien. Weitere Herausforderungen sind die begrenzte Größe des Film-Katalogs, die speziellen Merkmale von Dokumentar- und Arthouse-Filmen und die spezifischen Relevanz-Kriterien. Dennoch sind leistungsstarke Recommender-Algorithmen auch in Nischenmärkten unerlässlich, um die Benutzerfreundlichkeit und den Nutzbarkeit von Systemen zu verbessern.
Das Fehlen solch einer Empfehlungslösung war auch die Motivation hinter der Zusammenarbeit zwischen EYZ Media und dem DAI-Labor der TU Berlin. Im Rahmen der Kooperation werden vielfältige Empfehlungsalgorithmen entwicklet und evaluiert. Das umfasst sowohl traditionelle Empfehlungsstrategien (content-based und collaborative filtering) als auch moderne event-based Ansätze (Analyse domain-relevanter Trends in Social-Media Quellen).
Entsprechend der API- und Data Flow Definition von EYZ Media unterstützt das DAI-Labor die Entwicklung eines optimierten Empfehlungssystems durch den Aufbau eines Elastic Search Dienstes, einer Collaborative Filtering Komponente und einer Event-basierten Recommender-Pipeline. Die entwickelten Komponenten werden anhand der Meinung von Experten sowie der Analyse des Nutzerverhaltens zu den entwickelten Ansätzen evaluiert.
In den folgenden Tech-Blog Beiträgen werden detaillierte Erklärungen und der Nutzen der einzelnen Empfehlungskomponenten vorgestellt.
Das DAI-Labor (Distributed Artificial Intelligence Laboratory) an der TU Berlin führt Forschungs- und Entwicklungsprojekte durch, um Lösungen für eine neue Generation von Systemen und Diensten unter Nutzung von Methoden der Künstlichen Intelligenz anzubieten. Das Kompetenzzentrum Information Retrieval and Machine Learning (IRML) konzentriert sich auf die Entwicklung innovativer Empfehlungssysteme und Information Retrieval Systeme, die Machine Learning, graph-basierte Ansätze und Social Media Analysen kombinieren.
EYZ Media betreibt die VOD-Plattform realeyz, die im Web unter realeyz.de als Prime Video Channel verfügbar sowie als App in den Stores für mobile Geräte. Dank der Ausrichtung auf den Independent Filme hat sich realeyz.de eine wachsende Nutzerschaft aufgebaut und gehört zu den Top 3 der VOD-Spezialanbieter in Deutschland. realeyz steht für intelligenten, spannenden, klassischen und neuartigen Content in allen Formaten und Längen, sorgsam und mit Leidenschaft kuratiert. Jeden Tag ein neuer Film, alle in der Originalfassung mit einer Auswahl von 1.000+ Titeln – und der Fokus auf Indie Movies spricht vor allem eine junge, metropole Nutzerschaft an. Durch den Einsatz vieler Komponenten aus eigener Entwicklung wie dem Recommender-System, den Algorithmen, die eine individuelle und persönliche UX ermöglichen sowie der Präsenz auf verschiedenen Kanälen und technischen Umgebungen wird das Profil von realeyz geschärft, die Kundenbindung gestärkt und die Marke als der wesentliche Hub für unabhängige Produktionen etabliert. realeyz wird vom EU-CREATIVE-Programm gefördert und ist Teil des EuroVoD-Netzwerks.
Gefördert von der Investitonsbank Berlin
Über die Autoren:
Andreas Lommatzsch arbeitet als Senior Researcher am Distributed Artificial Intelligence Lab (DAI-Labor) der TU Berlin. Seine Forschungsschwerpunkte sind verteiltes Wissensmanagement und maschinelle Lernalgorithmen. Seine Hauptinteressen liegen in den Bereichen Empfehlungen auf Basis von Datenströmen und kontextabhängigen Meta-Empfehlungsalgorithmen.
Jing Yuan ist Doktorandin am Distributed Artificial Intelligence Lab (DAI-Labor) der TU Berlin. Ihr Forschungsinteresse umfasst Empfehlungssysteme, Information Retrieval Systeme sowie Algorithmen des maschinellen Lernens.
Phani Saripalli arbeitet als Dateningenieur bei der EYZ Media GmbH (Betreiber von realeyz.de) und koordiniert das Projekt vor Ort. Er ist spezialisiert auf den Aufbau von Data Pipelines und Data Wrangling. Er arbeitet mit Redis, AWS, Airflow, Flask, Python und Postgres, um sicherzustellen, dass Daten von der Rohform in aufschlussreiche Inhalte umgewandelt werden.
Khalit Hartmann (Bachelor of Computer Science) arbeitet am Distributed Artificial Intelligence Lab (DAI-Labor) der TU Berlin. Zu seinen aktuellen Forschungsgebieten gehören Empfehlungssysteme, die die Analyse natürlich-sprachlicher Texte und Algorithmen des maschinellen Lernens kombinieren.