Product Analytics Teil II: Predictive Analytics

Product Analytics Teil II: Predictive Analytics

Die vier Arten der Datenanalyse

Um wirklich wertvolle Erkenntnisse aus deinen Daten zu gewinnen, solltest du die vier Arten der Datenanalyse kennen. Sie helfen dir zu verstehen, wo ein Unternehmen aktuell steht und wo Wachstumspotenzial liegt.

Kurz gesagt sind das:

  • Descriptive Analytics (deskriptive Analyse)
    Sie hilft dabei, Trends aus Rohdaten herauszufiltern und vergangene oder aktuelle Ereignisse knapp zu beschreiben. Sie beantwortet die Frage: „Was ist passiert?“ Datenvisualisierung ist hier besonders geeignet, um die Ergebnisse zu kommunizieren.
  • Diagnostic Analytics (diagnostische Analyse)
    Hier geht es um die nächste logische Frage: „Warum ist das passiert?“ Analysten untersuchen Zusammenhänge, vergleichen parallele Trends, suchen Korrelationen zwischen Variablen und versuchen, wenn möglich, Ursache-Wirkung-Beziehungen zu erkennen.
  • Predictive Analytics (vorhersagende Analyse)
    Wie der Name sagt, geht es darum, zukünftige Trends oder Ereignisse vorherzusagen. Sie beantwortet die Frage: „Was könnte passieren?“
  • Prescriptive Analytics (präskriptive Analyse)
    Diese Form beantwortet die Frage: „Was sollten wir als Nächstes tun?“ Dabei werden verschiedene Szenarien und Faktoren berücksichtigt, um Handlungsempfehlungen abzuleiten.

Die Stärke von Predictive Analytics liegt darin, Ergebnisse und Trends vorherzusagen, bevor sie eintreten. Mithilfe historischer Daten und Informationen über die aktuelle Situation können zukünftige Entwicklungen prognostiziert werden. Die Wahl des richtigen Predictive-Analytics-Modells ist ein zentraler Bestandteil jeder Business-Strategie. Heute sind diese Modelle so verbreitet und nützlich, dass viele Analyse-Tools sie bereits integriert haben und sie oft mit nur einem Klick genutzt werden können.

Im folgenden Beitrag geht es um die Grundlagen von Predictive Analytics und ihr Potenzial. Dieser Beitrag schließt unsere Serie Analytics jenseits von Dashboards ab. Falls du die vorherigen Artikel noch nicht gelesen hast:

Wie funktionieren Predictive-Analytics-Modelle?

Alle Predictive-Modelle werden mit einem oder mehreren Algorithmen trainiert. Es handelt sich um einen zyklischen Prozess, der mit dem Verständnis des Geschäftsziels und der Daten beginnt, gefolgt von der Datenaufbereitung. Dieser Schritt ist entscheidend, denn ein Modell kann nur auf Basis der Daten Vorhersagen treffen, die ihm zur Verfügung stehen.

Mit einer soliden Datenbasis wird das Modell trainiert und die Ergebnisse werden analysiert. Dabei geht es nicht nur um die finale Vorhersage oder die Genauigkeit des Modells. Analysten betrachten auch die Details: Welche Variablen beeinflussen das Ergebnis? Diese können zum Beispiel für Wartung oder Optimierung entscheidend sein.

Der letzte Schritt ist die Implementierung des Modells, sodass es in die Anwendung integriert wird und tatsächlich Wirkung entfalten kann.

Ein Predictive-Modell ist kein einmaliges Projekt. Es muss regelmäßig überprüft und bei Bedarf neu trainiert werden, zum Beispiel wenn neue Daten hinzukommen oder Anpassungen am Algorithmus nötig sind.

Die Top 5 Predictive-Analytics-Modelle

1. Klassifikationsmodelle

Diese Modelle ordnen Daten anhand historischer Muster in Kategorien ein. Sie können auch binäre Entscheidungen ermöglichen.

Beispiele: Logistische Regression, Entscheidungsbäume, Random Forest, neuronale Netze, Naive Bayes.

2. Clustering-Modelle

Diese Modelle gruppieren Daten anhand gemeinsamer Eigenschaften. Sie werden häufig im Marketing genutzt, um Zielgruppen zu segmentieren. Man unterscheidet zwischen „hartem“ und „weichem“ Clustering. Beim harten Clustering gehört ein Datenpunkt entweder zu einer Gruppe oder nicht, beim weichen Clustering wird eine Wahrscheinlichkeit zugewiesen.

Beispiele: K-Means, Mean Shift, DBSCAN.

3. Forecasting-Modelle (Prognosemodelle)

Diese Modelle schätzen numerische Werte auf Basis historischer Daten. Sie sind besonders beliebt, da sie mehrere Einflussfaktoren gleichzeitig berücksichtigen können.

4. Outlier-Modelle (Ausreißer-Modelle)

Diese Modelle identifizieren ungewöhnliche Datenpunkte. Das ist besonders in Bereichen wie Finanzen oder Retail wichtig, z. B. zur Betrugserkennung.

Beispiele: Isolation Forest, Minimum Covariance Determinant (MCD), Local Outlier Factor (LOF).

5. Zeitreihenmodelle

Diese Modelle arbeiten mit zeitlich geordneten Daten und werden genutzt, um Entwicklungen über Zeit zu prognostizieren.

Beispiele: ARIMA, Prophet.

Tools für Predictive Analytics

Die Bandbreite an Möglichkeiten ist groß und reicht von No-Code-Tools bis hin zu Machine-Learning-Algorithmen. Jedes Unternehmen muss selbst entscheiden, was am besten zu den eigenen Bedürfnissen, der vorhandenen Expertise und dem zeitlichen Rahmen für die Umsetzung passt. Manche Tools sind komplette Arbeitsumgebungen, andere lassen sich in bestehende Systeme integrieren. Es gibt sowohl Cloud-Lösungen als auch On-Premise-Varianten.

Der größte Wandel bei modernen Predictive-Analytics-Tools besteht darin, dass sie deutlich einfacher geworden sind als frühere Modelle oder selbst entwickelte Lösungen von Grund auf. Durch die Möglichkeiten von Automated Machine Learning (AutoML) ist es weniger notwendig, tief im Detail zu verstehen, wie einzelne Variablen miteinander zusammenhängen. Stattdessen wählen diese Systeme automatisch die beste Kombination von Algorithmen für eine bestimmte Aufgabe aus und reduzieren damit den Zeitaufwand, den Analysten für das Schreiben von Code benötigen.

Best Practices zur Auswahl der richtigen Tools für Predictive Analytics je nach Use Case

  • Zuerst sollte man die Anforderungen der jeweiligen Anwendung im Unternehmen analysieren und erst danach das Tool auswählen. Dabei ist es wichtig zu beachten, dass entweder ein einzelnes Tool oder eine Kombination verschiedener Services sinnvoll sein kann. Nicht jedes Unternehmen benötigt das komplette Paket. Oft reichen bereits vorhandene Business-Intelligence-, Analytics- oder CRM-Systeme aus, um die Anforderungen zu erfüllen.
  • Auch der Einsatz von AutoML-Services oder vorgefertigten Modellen, Templates und Toolkits kann sinnvoll sein in Kombination mit klassischen Programmiersprachen wie R oder Python sowie Visualisierungstools wie Tableau oder Qlik Sense. So lassen sich Lösungen individuell erweitern und anpassen.
  • Ein weiterer wichtiger Punkt ist, wer mit den Tools arbeitet. Einige Nutzer benötigen Unterstützung bei der Datenerkundung, Datenaufbereitung und Modellentwicklung, während andere eher Lösungen brauchen, die typische Geschäftsanforderungen absichern und eine kollaborative Zusammenarbeit im Team ermöglichen.
  • Zudem sollten Anwendungen regelmäßig weiterentwickelt werden, um auf Änderungen in den Daten zu reagieren, die Genauigkeit und Performance zu verbessern, die Nutzerfreundlichkeit zu erhöhen, Sicherheitsrisiken zu reduzieren und insgesamt effizienter zu werden.

Die Rolle von Data Analysts

Predictive Analytics wird auch als Predictive Modelling bezeichnet, wobei der erste Begriff eher im kommerziellen Kontext verwendet wird und der zweite eher im akademischen Umfeld. Der erfolgreiche Einsatz von Predictive Analytics hängt stark vom Zugriff auf ausreichende Mengen an sauberen, relevanten und konsistenten Daten ab.

Predictive-Modelle für alltägliche Geschäftsprobleme können heute in Echtzeit ausgeführt werden und sehr präzise Ergebnisse liefern. In diesem Kontext sind Data Analysts besonders geeignet, schnell und zuverlässig das passende Modell auszuwählen und die Ergebnisse zu bewerten. Der Grund dafür ist, dass sie durch Data Profiling und Datenaufbereitung bereits tief mit den Daten vertraut sind und gleichzeitig das Geschäftsproblem verstehen, das als Grundlage für die Modellentwicklung dient.

Die Bewertung der Performance von Predictive-Modellen ist eine zentrale Aufgabe, die Data Analysts mithilfe verschiedener Metriken gut durchführen können. Darüber hinaus ermöglichen ihre Fähigkeiten in der Datenvisualisierung eine verständliche und nutzerfreundliche Darstellung der Ergebnisse.

Fazit

Predictive Analytics ist ein vielseitiger und wichtiger Bereich der Datenanalyse. Die Auseinandersetzung mit seinen Möglichkeiten kann Unternehmen dabei helfen, bessere Entscheidungen zu treffen und zukünftige Entwicklungen besser zu verstehen.


Author info

Back to top