Data Mining

Data Mining ist eine empirische Methode, um mit Hilfe von Algorithmen, künstlicher Intelligenz, Statistik und Programmen große Datenbestände wie Big Data nicht nur zusammenzuführen, sondern diese zielführend auszuwerten. Dabei kommen ebenfalls verschiedene mathematische und statistische Modelle zum Einsatz.

Ein typisches Ziel von Data Mining für den E-Commerce ist es, typische Warenkörbe zu ermitteln, um später das Angebot dahingehend auszurichten. Data Mining ist demnach eine Möglichkeit, um den Online-Handel auf wissenschaftlicher Basis zu optimieren. Die Datenbestände können nach der Generierung und Aufbereitung mittels Informationsvisualisierung ansprechend dargestellt werden.

Hintergrund

Daten spielen eine immer größere Rolle im digitalen Handel und bei der Optimierung von Verkaufsprozessen. Jeder Online-Shop kann theoretisch viele Daten zu Kunden, zum Kundenverhalten, zu den Produkten und zum Einkaufsverhalten sammeln. Doch allein die große Datenmenge sorgt noch nicht dafür, dass Verkäufe gesteigert oder Verkaufsmethoden optimiert werden können. Data Mining soll hierauf die Antwort geben.

Der Begriff bedeutet wortwörtlich übersetzt „Datenschürfung“. Ähnlich wie eine Minengesellschaft den Boden nach wertvollen Mineralien absucht, durchsuchen Programme beim Data Mining vorhandene Datenbestände nach wichtigen und relevanten Daten. Ziel ist es, nötige Schlüsse aus den Daten zu ziehen, die den Verkauf oder das Besucherverhalten effizienter machen.

Im Gegensatz zum herkömmlichen Controlling bietet Data Mining nicht nur die Möglichkeit, den Status quo eines Unternehmens zu bestimmen, sondern auch Prognosen für zukünftige Situationen abzugeben. Dies kann beispielsweise mit Hilfe der Software NeuroBayes bestimmt werden. Durch die immens große Datenbasis beruhen diese Prognosen nicht auf Erfahrung, sondern allein auf Empirie, künstlicher Intelligenz und Statistik. Das Herausfiltern von detaillierten Informationen zur Daten-Analyse erfolgt meist anhand der Drilldown-Funktion.

Umsetzung

Beim Data Mining kommen verschiedene Verfahren zum Einsatz, die im Folgenden kurz vorgestellt werden:

  • Analyse nach Modellen:

Hierbei werden zunächst Hypothesen aufgestellt und ein spezieller Lösungsraum für diese Vermutungen. Aus diesen Voraussetzungen lassen sich schließlich Regeln für die Datenauswertung ableiten. Dabei kann es sich um einfache Bedingungen wie „wenn…dann“ handeln oder um komplexe Sequenzen verschiedener Voraussetzungen, die bis zu neuronalen Netzen reichen können.

  • Zugriff auf Datenbestände:

Bevor der Data-Mining-Prozess gestartet wird, müssen zunächst die Zugriffe auf die vorhandene Datenbasis gesichert werden. Praktischerweise geschieht dies über Schnittstellen. Zugleich werden die vorhandenen Daten segmentiert und in eigene Datenbanken integriert. Data Mining mit diesem Ansatz lässt sich z.B. auch mit Google Analytics durchführen.

  • Ein Suchverfahren:

Wenn Data Mining Lösungen hervorbringt, ist es Aufgabe dieser Programme, die Lösungen mit Hilfe geeigneter Verfahren nach den bestmöglichen Lösungen zu durchsuchen.

  • Ermitteln des Interesses:

Jedes gefundene Muster muss beim Data Mining hinsichtlich seiner Relevanz für die jeweiligen Unternehmensprozesse analysiert bzw. eingestuft werden. Ein Verfahren, um den Grad des Interesses zu messen, besteht z.B. darin, besonders von der Norm abweichende Ergebnisse zu untersuchen.

Anwendungsgebiete

Data Mining kann verschiedene Aufgaben übernehmen. Zum einen lassen sich mit Hilfe dieser Methode Prognosen modellhaft aufstellen und zum anderen dient sie auch zur Beschreibung bzw. Erklärung bestimmter Sachverhalte.

Erklärungsmodelle werden häufig für die Analyse von Warenkörbe zur Conversion Optimierung genutzt. Ebenso bieten diese Modelle die Möglichkeit, Faktoren für den Erfolg eines Online-Shops oder einer Webseite zu identifizieren.

Weitere Anwendungsziele sind:

  • Erstellen von Käuferprofilen, z.B. für das Affiliate Marketing
  • Marktsegmentierung
  • Prognose von Laufzeiten von Verträgen
  • Prognose von Produktpreisen
  • Voraussagen zur Nachfrage eines Produktes
  • Fehlerdiagnose in Verkaufsprozessen

Grenzen

Die beim Data Mining durchsuchten Datensätze liefern zwar viele verschiedene Ansatzpunkte, doch genau hier liegt oftmals die Schwierigkeit. Denn es ist zunächst wichtig, relevante und realistische Zielvorgaben zu stellen, um auch wirklich die Datenergebnisse zu erhalten, die z.B. für mehr Effizienz sorgen.

Ein Beispiel: Wenn ein Online-Shop zwar auswerten kann, welche Produkte am häufigsten zusammen eingekauft werden, sagt das noch nicht aus, ob der Shop langfristig eine neue Cross-Selling-Strategie benötigt, weil evtl. die Periode, in welcher die Daten gesammelt und ausgewertet werden, zu kurz ist und es sich um saisonal bedingte Affinitäten bei der Produktwahl handelt.

Prinzipiell ist Data Mining eine sehr objektive Methode, um Vorteile aus der Datenanalyse zu ziehen. Jedoch wird gerade hier häufig ein Schwachpunkt gesehen, da Algorithmen und Statistikmodell zunächst von Menschen definiert werden müssen. Und an dieser Stelle können z.B. eigene Vorstellungen und Wünsche das empirisch-objektive Ergebnis verfälschen. Aus diesem Grund wäre es beispielsweise ratsam beim Data Mining auf externe Agenturen oder Mitarbeiter zurückzugreifen, die keinen direkten Bezug zum Unternehmen haben.

Nutzen für die Suchmaschinenoptimierung

Data Mining kann auch für die tägliche SEO-Arbeit verwendet werden. So lassen sich z.B. durch die Zuhilfenahme von Tools wie dem Keyword Planer relevante Daten zu Keywords verwenden, um die eigene Ausrichtung des Contents daran anzupassen. In diesem Fall würde der Datenbestand von Google genutzt werden, um anhand einer günstigen Prognose (Zugriffszahlen, Wettbewerb) die richtigen Keywords auszuwählen. Somit könnten möglichst viele Conversions erzielt werden, wenn die betreffende Website dafür rankt.[1] Natürlich arbeiten auch Webanalyse-Tools mit Techniken des Data Mining. Somit gehört die Methode eng zur fundierten Website-Analyse.

Einzelnachweise

  1. Google didn’t want us to use the keyword planner this way advancewebranking.com Abgerufen am 06.03.2014

Weblinks

Kategorie