Warum man nicht „Data Scientist“ sagen sollte, wenn es um Data Craftsmanship geht.

    |    Wednesday, der 28. February 2018

Die unerwartete Wahl von Trump am 8. November 2016 hat die perversen Ergebnisse des Echokammer-Phänomens verdeutlicht: Nachrichten aus Social Media stimmen mit dem überein, woran Sie bereits glauben, und schmeicheln Ihrer Meinung, indem sie Gruppen von Bürgern dazu bringen, auf die gleiche Weise zu denken und ihnen keinen Widerspruch zu geben. Auf diese Weise wird unter anderem Facebook für seine Algorithmen verantwortlich gemacht, die es den Nutzern nicht erlauben, auf neue Ideen oder Themen zu stoßen, die sie nicht gezielt ausgewählt haben. Mit anderen Worten, ein personalisiertes Empfehlungssystem, das viele Daten erfordert und keinen Raum für Zufälle lässt. In diesem Zusammenhang kommt den Data Craftsmen eine wichtige Rolle zu. Wer sind sie, und warum sollten wir diesen Begriff dem übertriebenen Begriff „Daten Scientist“ vorziehen? Inwiefern ist die Datenverarbeitung der Schlüssel, um den gefährlichen Echokammern zu entkommen?

Wenn der Data Scientist die Komplexität dieser Inhalte oder die Komplexität des Geschmacks eines Nutzers nicht berücksichtigt, werden den Nutzern am Ende nur die Inhalte empfohlen, die sie bereits kennen. Die Nutzer verlieren fortan die Chance, verunsichert, überrascht oder erschüttert zu werden: Wenn Sie den Nutzern nur etwas Ähnliches empfehlen, was ihnen bereits gefällt, lassen Sie die Möglichkeit aus, das mit jeder Aktivität verbundene Risiko, ihr Horizont erweitert wird. Und schließlich, da die Geschmäcker der Nutzer oft sehr vielfältig sind, reicht es aus, ihnen zu empfehlen, was ihnen am besten gefällt, wenn man ihr gesamtes Interessenspektrum abdecken kann?

Im Zeitalter großer Datenmengen müssen die sogenannten „Data Scientists“ in riesige Datenmengen eintauchen, um die besten personalisierten Empfehlungen zu erhalten. Aber wenn es um kreative Inhalte geht, wie z.B. Filme, ist es die beste Lösung, nicht nach immer mehr persönlichen Daten zu suchen, da die meisten davon offensichtlich nicht in der Lage sind, den Wert einer personalisierten Empfehlung zu erhöhen. Warum sollten Sie über das Alter, den Ort oder die Beziehungen eines Nutzers, der Zombie-Filme liebt, Bescheid wissen, wenn die einzige Frage, die wir ihm stellen sollten, lautet: Was möchten Sie sehen?

Meine Kollegen bei Spideo, die jahrelang innovative, personalisierte Empfehlungstools entwickelt haben, sind der Meinung, dass die Lösung in intelligenten Daten liegt. Erster Schritt: ein vorgelagertes Metadaten-Design, um maßgeschneiderte semantisch verbesserte Daten zu entwerfen, die der Komplexität der Inhalte und dem Geschmack der Nutzer gerecht werden. Zweiter Schritt: Präzises und transparentes Fishing der wenigen nützlichen und relevanten Daten, die Sie benötigen, um eine gute Empfehlung zu erstellen. Dieser Ansatz trägt dazu bei, das Vertrauen der Nutzer zu stärken, da sie oft davor zurückschrecken, private Informationen mit skrupellosen Algorithmen und ihren skizzenhaften Datenschutzrichtlinien zu teilen.

Basierend auf dieser internen Expertenanalyse von Metadaten und Inhalten hat Spideo Tools entwickelt, um personalisierte Empfehlungen zu erstellen, die sich menschlich anfühlen und gleichzeitig die Möglichkeit bieten, sich auf die Suche nach dem Zufall zu begeben. Dank semantisch verbesserter und gewichteter Keywords, die in mehrere Kategorien (Stimmungen, Themen, Charaktere, Settings,…) unterteilt sind, können wir uns von Genres befreien und den Nutzern stets vielfältige Interessen vorschlagen.

So ist es zum Beispiel der Zweck unseres Discovery Moodboards nicht, unentschlossene User mit Gefühlen zu infiltrieren. Wir fragen nicht, ob sie traurig oder glücklich sind, kurz gesagt, wir frieren sie nicht unter einem Label ein. Was wir tun, ist, die Stimmung des Films dank unserer Datenverarbeitung einzufangen und zu vermitteln, so dass die Nutzer emotionale Kapseln nach ihren aktuellen Wünschen identifizieren können. Mit der Frage: „Wofür bist du in Stimmung?“ statt „Wie fühlst du dich“ können wir den Usern filmische Erlebnisse anbieten, die ihrem Geschmack entsprechen, auch wenn sie noch keine Geschichte haben.

Ein Film ist ein komplexes und facettenreiches Objekt. Es ist nicht möglich zu erraten, welcher Teil davon den Nutzern gefallen hat, da jede Betrachtung ein einzigartiges Erlebnis ist. Wir können jedoch Inhalte anbieten, die den von den Nutzern ausgewählten Originalinhalten ähnlich sind, und Listen von Themen, die sich auf einen oder mehrere Aspekte jedes Inhalts beziehen. Auf diese Weise schaffen wir neue Assoziationen, befreien die Nutzer von der Idee der Genres und erklären die „Ähnlichkeit“.

Und last but not least, per Definition wird eine personalisierte Empfehlung, so gut sie auch sein mag, die Benutzer immer in ihren Gewohnheiten einschränken. In dem Bewusstsein dieser Einschränkung haben sich meine Kollegen bei Spideo Tools vorgestellt, die Anwendern helfen sollen, sich aus ihrer Komfortzone zu befreien.
Das Modul „I feel lucky“ von Spideo heißt „surprise“. Wenn Sie die Serendipity- (Glücks-) Ratio erhöhen (z.B. 50% basierend auf dem Profil des Benutzers 50% basierend auf Serendipity) und automatisch generierte thematische Listen bereitstellen, helfen Sie den Benutzern neue Film Kategorien zu erkunden, aber dennoch Inhalte vorzuschlagen, die ihnen vertraut sind.

Nun zurück zu den Datenhandwerkern und ihrer Rolle, Serendipity am Leben zu erhalten. Wir halten es für unzulänglich, sie als „Data Scientists“ zu bezeichnen und favorisieren den Begriff „Data Craftsmen“.
Es geht nicht darum, an enorm großen Daten zu arbeiten, sondern darum, sie auf intelligente Daten zu beschränken. Darüber hinaus sind Denken und Kreativität die vorherrschenden Qualitäten in diesem Beruf, bei dem es darum geht, eigene Werkzeuge zu entwickeln, zu handhaben, zu testen und zu verbessern: das sind handwerkliche Qualitäten. So wie der Bäcker das Brot knetet, verarbeiten und transformieren die Data Craftsmen Daten, um sie sinnvoll und wertvoll zu machen.
Spideo arbeitet mit dieser handwerklichen Denkweise, menschlicher, näher an den Daten und den damit verbundenen Elementen und lässt die Idee einer hohlen Wissenschaft hinter sich. Unsere Art zu denken, die personalisierte Empfehlung bringt uns der Natur des Inhalts am nächsten.
Wir sind überzeugt, dass Echokammern kein Todesfall sind, dem sich jedes Empfehlungssystem stellen muss. Indem wir Daten skizzieren, können wir Merkmale erstellen, die es uns ermöglichen, die Gewohnheiten der Benutzer genau zu erkennen und ihnen die Möglichkeit zu geben, sich selbst davon zu befreien. Auf diese Weise rückt die personalisierte Empfehlung näher an die Erkundung heran und weckt den Entdeckungsdrang der Nutzer.


Author: Arthur Vauthier, Marketing Manager bei Spideo

Spideo ist eine Content-Empfehlungs- und Analyse-Plattform, die semantisch basierte Entdeckungen verwendet, um personalisierte Content-Vorschläge basierend auf Profil, Thema, Stimmung und verwandten Inhalten zu liefern.