Data Science. Michael Zimmer. Читать онлайн. Newlib. NEWLIB.NET

Автор: Michael Zimmer
Издательство: Bookwire
Серия: Edition TDWI
Жанр произведения: Математика
Год издания: 0
isbn: 9783960885856
Скачать книгу
können und ob diese zu höheren Verkäufen führt [Linden et al. 2003].

       4.4.6Kontinuierliche Verbesserung mit der Datenwertschöpfungskette

      Wenn man herausgefunden hat, auf welche Art man ein Datenprodukt dem Nutzer anbieten kann, geht es im nächsten Schritt darum, die Vorhersagegüte kontinuierlich zu verbessern. Dies kann gelingen, indem andere Algorithmen zum Einsatz kommen und/oder mehr Datenquellen benutzt werden. Teilweise wird man auch Situationen/Fälle identifizieren, die auch durch eine Verbesserung des Algorithmus nicht zum richtigen Ergebnis führen. Diese Fälle gilt es zu bewerten und im Zweifelsfall manuell zu behandeln. Weiterhin kann davon ausgegangen werden, dass die Nutzung der ersten Version des Datenprodukts weitere klassifizierte Daten generiert, die für Trainingszwecke zur Algorithmenoptimierung genutzt werden können.

      Damit man alle Daten, die innerhalb der Customer Journey anfallen bzw. anfallen könnten, betrachtet, können die Datenflüsse mithilfe der Datenwertschöpfungskette4 analysiert werden (vgl. Abb. 4–4). Diese beschreibt den Fluss der Daten von deren Entstehung bis zur Nutzung. Die Datenwertschöpfungskette sollte für alle Datenobjekte betrachtet werden. Nicht immer werden zum Beispiel alle Schritte für Stamm- und Transaktionsdaten gleichermaßen gut unterstützt. Insbesondere der Rückfluss wird oft vergessen, d.h., es wird nicht protokolliert, wie der Nutzer mit den Daten interagiert. Eine typische Datenwertschöpfungskette enthält die Schritte, die der folgenden Abbildung zu entnehmen sind:

       Abb. 4–4 Abdeckung der Datenwertschöpfung bewerten

       4.4.7Skalierung und Alleinstellungsmerkmal

      In dieser Phase der Entwicklung eines Datenprodukts ist geklärt, welches Wertversprechen das Datenprodukt erfüllt, wie dies gemessen werden kann und welche Datenquellen zur Verfügung stehen, um den Algorithmus zu verbessern. Oft sind zu diesem Zeitpunkt die Methoden des A/B-Tests bereits implementiert und können genutzt werden. Nun gilt es, das Produkt so zu gestalten, dass die Nutzung des Produkts selbst zur kontinuierlichen Verbesserung des Produkts führt. Das Design der Feedbackschleife wird damit zum kritischen Erfolgsfaktor.

       4.5Kritischer Erfolgsfaktor Feedbackschleife

      Ein zentrales Element der Kybernetik ist die Rückkopplung oder Feedbackschleife. Gerade wenn Daten im Zentrum des Wertversprechens liegen, kommt der Feedbackschleife aus zwei Gründen eine besondere Bedeutung zu. Einerseits kann die Feedbackschleife dazu genutzt werden, das Produkt zu verbessern. Andererseits ermöglicht die Feedbackschleife, Daten zu generieren, die die Basis des Produkt-Alleinstellungsmerkmals werden.

      Die Google-Suchergebnisse sollen als Beispiel verdeutlichen, wie die Feedbackschleife zur Verbesserung des Produkts beiträgt. Google hat einen Algorithmus, der auch ohne Nutzer tolle Ergebnisse auf die vorderen Ränge bringt. Einzigartig wird er aber durch die Integration der Nutzer-Interaktionen. Jeder Klick auf ein Suchergebnis ist wieder ein Feedback für das Ranking des Suchergebnisses. Dadurch kann dem nächsten Nutzer ein minimal besseres Suchergebnis angezeigt werden.

      Diese Verbesserung führt gleichzeitig zu einem Alleinstellungsmerkmal. Denn während die Stammdaten (im Falle von Google die Websites und Links) für alle theoretisch zugreifbar sind, sind es die Transaktionsdaten nicht (im Falle von Google die Klicks auf die Links). Die Interaktion des Nutzers mit dem Produkt liefert die notwendige Information, um das Produkterlebnis langfristig besser zu gestalten, als es der Konkurrenz möglich ist.

      Bei der Gestaltung der Feedbackschleife sollten die folgenden Aspekte betrachtet werden:

       Zieldefinition

      Zunächst sollte definiert werden, mit welchem Ziel Feedback eingesammelt werden soll. Die Zielerreichungsgrößen aus der Wertschöpfungskettenanalyse bilden hier einen wertvollen Input. An welchen Stellen werden Informationen über das Nutzerverhalten benötigt, um das Produkt zu verbessern? Man kann den Nutzer eines Dienstes hier durchaus als Leistungsanbieter verstehen, der durch seine Tätigkeit die Dienstleistung verbessert. Die Produktnutzung wird also selbst zum eigentlichen Produkt, nur dass der Anbieter dieses Produkt konsumiert.

      Am Beispiel des Fahrzeugmarktplatzes wird das deutlich. Der Anbieter des Marktplatzes weiß zunächst nicht, welches Auto der Nutzer präferiert. Durch sein Such-, Klick- und Weiterleitungsverhalten kann der Anbieter implizit auf die Präferenzen des Nutzers schließen. Das Ziel ist also, ein möglichst gutes Bild über die Präferenzen des Nutzers herauszuarbeiten.

       Wert für den Nutzer

      Damit der Nutzer das gewünschte Feedback auch gibt, muss dieses auch einen Mehrwert für den Nutzer haben – es ist also fast schon ein eigenes Datenprodukt. Zum Beispiel bietet die Weiterleitung einer Anzeige an einen Bekannten den Mehrwert, die soziale Interaktion zu fördern.

      Häufig genutzte Muster, um den Nutzer zu Feedback zu motivieren, sind die Weiterleitung, die Darstellung der persönlichen Auswahl innerhalb einer Grundgesamtheit, die Dokumentation im Sinne eines zeitlichen Verlaufs und Ähnliches.

       Flow

      Im besten Fall nutzt man das Feedback des Nutzers, um den Nutzer im Flow-Zustand zu halten [Fogg 2002]. Hierbei sind insbesondere die User Experience und Interface Designer gefragt. Die Interaktion erzeugt zum Beispiel Daten, für deren Aggregation über alle Nutzer sich der Einzelne interessiert.

      Ein typisches Beispiel findet sich bei YouTube.5 Sobald ein Video beendet ist, wird das nächste geöffnet und abgespielt. Die Beendigung des Streams kann dann als Feedback für die Präferenzen des Nutzers gewertet werden.

       Community pflegen

      In dem Moment, in dem die soziale Interaktion mit dem Produkt zum Mehrwert für den Nutzer wird, spielen auch andere Kunden eine Rolle. Neugier, Entertainment und Interaktion mit anderen Menschen stehen selten alleine, sondern werden besonders spannend im Vergleich zu anderen Nutzern. Daher sollte man die Gruppe der eigenen Nutzer und Kunden als Community begreifen und diese auch als solche behandeln. Dabei geht es vor allem darum, den Austausch zwischen den Mitgliedern der Community einfach zu gestalten und die Community, gegebenenfalls durch Gamification-Ansätze, zum Austausch zu motivieren.

      Als Beispiel seien hier die Rezept-Communitys von Geräten zur Unterstützung des Kochens genannt. Die Community sorgt dafür, interessante Rezepte zu definieren und zu bewerten. Dadurch wird das Kocherlebnis mit dem Gerät kontinuierlich verbessert.

       Serendipität

      Einen wichtigen Aspekt darf man bei Feedbackschleifen nicht vergessen: die Gefahr des Overfittings. Wenn ein Modell trainiert wird, kann es passieren, dass dieses Modell sehr gut zu den Trainingsdaten passt, aber keine oder wenig Aussagekraft für neue Inputdaten hat. Dies kann zum Beispiel passieren, wenn ein Empfehlungssystem nur mit dem Feedback einer bestimmten Kundengruppe trainiert wird. In dem Fall kann es sein, dass das Modell nicht oder schlecht zu den Bedürfnissen einer anderen Kundengruppe passt. Daher ist es sinnvoll, in Empfehlungen immer wieder etwas Zufall einfließen zu lassen. Ein gängiger Wert für Zufall gegenüber Vorhersagen aus dem Modell liegt zwischen 10 und 20 Prozent. Durch die Zufallsbeimischung wird Serendipität ermöglicht, also die ungeplante Entdeckung von neuen Zusammenhängen.