Data Mining bezeichnet den Prozess des Sichtens großer Datenmengen, um Daten zu finden, die für den jeweiligen Zweck relevant sind. Sowohl in der IT-Wissenschaft als auch im Bereich der Business Intelligence wird es vor allem genutzt, um Muster zu ermitteln.
Zunächst werden Daten gesammelt und gespeichert. Im nächsten Schritt geht es dann darum, in den auf den ersten Blick bedeutungslosen Daten eine Systematik zu erkennen. Bei der Datenanalyse kommen unterschiedliche Methoden zum Einsatz, darunter die Einbeziehung von Konzepten wie maschinelles Lernen, bei dem Daten mithilfe komplexer adaptiver Algorithmen künstlich analysiert werden.
Bei traditionelleren Data Mining-Methoden sind Data Scientists beteiligt. Diese Experten sind speziell dafür ausgebildet, Systematiken hinter komplexen Informationen zu erkennen, und erstellen Berichte, die Managementteams als Orientierung dienen.
Beim Data Mining werden große Datenmengen untersucht und analysiert, um aussagekräftige Muster und Trends zu erkennen. Der Prozess besteht zunächst aus der Erfassung der Daten, dem Erstellen einer Zieldefinition und der Anwendung von Data Mining-Techniken. Die gewählte Taktik variiert je nach Zielsetzung, während der empirische Prozess immer derselbe ist. Hier ein Beispiel für einen typischen Verlauf des Data Mining:
Zielfestlegung: Möchten Sie zum Beispiel mehr über das Kundenverhalten erfahren? Wollen Sie Kosten senken oder den Gewinn steigern? Wollen Sie Fälle von Betrug aufdecken? Am Anfang des Data Mining-Prozesses kommt es vor allem auf eine klare Zielsetzung an.
Datenerfassung: Welche Daten gesammelt werden, hängt von der Zielvorgabe ab. Unternehmen verfügen in der Regel über einen Datenpool, der über mehrere Datenbanken verteilt ist, z. B. Daten, die Kunden im Rahmen von Transaktionen übermittelt haben, usw.
Datenbereinigung: Nach der Erfassung müssen die Daten in der Regel bereinigt, neu formatiert und validiert werden.
Datenanalyse: An diesem Punkt machen sich die Analysten mit den Daten vertraut, indem sie statistische Analysen durchführen und sie in Diagrammen und Tabellen visuell aufbereiten. Ziel ist es, Variablen zu finden, die für das Data Mining-Ziel relevant sind, sowie erste Hypothesen zu entwickeln, aus denen sich letztendlich ein Modell erstellen lässt.
Modellierung: Es gibt eine ganze Reihe von Data Mining-Techniken – siehe unten – und in dieser Phase geht es darum, einen passenden Ansatz zu finden, der zu einem verwertbaren Ergebnis führt. Je nach Zielsetzung stehen den Analysten verschiedene Ansätze zur Verfügung, die im nächsten Abschnitt vorgestellt werden. Die Modellierung ist ein iterativer Prozess und es kann vorkommen, dass die Daten noch einmal neu formatiert werden müssen, da einige Modelle nur mit einem ganz bestimmten Format funktionieren.
Ergebnisauswertung: In dieser Phase prüfen die Analysten, ob die Ergebnisse valide sind. Sind sie das nicht, muss ein neues Modell her und der Prozess beginnt von vorn.
Implementierung des Modells: Die gewonnenen Erkenntnisse können genutzt werden, um das zu Beginn des Prozesses definierte Ziel zu erreichen.
Es gibt eine Vielzahl von Data Mining-Techniken, und welche Sie verwenden, hängt von Ihrem Gesamtziel ab. Jede dieser Data Mining-Techniken führt im Ergebnis zu einem anderen Datenmodell. Man unterscheidet beschreibende, erklärende und vorhersagende Datenmodelle, um nur die wichtigsten zu nennen:
Bei dieser Methode werden historische Daten auf Ähnlichkeiten oder Gruppierungen untersucht, um die Ursachen für Erfolg oder Misserfolg zu ergründen. Ein Beispiel wäre die Kategorisierung von Kunden nach Vorlieben oder emotionaler Bindung an ein Produkt. Dazu werden u. a. folgende Techniken eingesetzt:
Bei dieser tiefer gehenden Methode geht es darum, künftige Ereignisse zu klassifizieren oder Ereignisse mit unbekanntem Ausgang abzuschätzen, wenn z. B. mit einer Überprüfung der Kreditwürdigkeit die Wahrscheinlichkeit errechnet wird, mit der ein Kredit zurückgezahlt wird. Dazu werden u. a. folgende Techniken eingesetzt:
Mit der Zunahme unstrukturierter Daten aus dem Internet, aus E-Mails, Kommentarfeldern, Büchern, PDFs und anderen Textquellen hat auch das Text Mining als eine mit dem Data Mining verwandte Disziplin stark zugenommen. Diese unstrukturierten Daten sind für die Genauigkeit von Prognosen enorm wichtig. Bevor sie jedoch in Vorhersagemodelle einfließen können, müssen Datenanalysten sie analysieren, filtern und konvertieren können.
Zu den durch Data Mining auswertbaren Daten gehören:
Kaum ein Unternehmen kann sich heutzutage der Digitalisierung entziehen. Diese hat unter anderem zur Folge, dass viele Unternehmen auf riesigen Datenmengen sitzen, die, richtig analysiert, genauso wertvoll sein könnten wie ihre Kernprodukte und -services.
Data Mining verschafft Unternehmen einen Wettbewerbsvorteil, wenn es ihnen gelingt, Erkenntnisse aus den Daten dieser vielfältigen digitalen Transaktionen zu ziehen. Durch ein besseres Verständnis des Kundenverhaltens können Unternehmen gezielt neue Produkte, Services oder Marketingtechniken entwickeln. Folgende Vorteile bietet Data Mining für Unternehmen:
Optimierte Preisgestaltung:
Durch den Einsatz von Data Mining zur Analyse verschiedener Preisvariablen wie Nachfrage, Elastizität, Vertrieb und Markenwahrnehmung können Unternehmen die Preise so festlegen, dass sich der Gewinn maximieren lässt.
Optimiertes Marketing:
Data Mining ermöglicht es Unternehmen, ihre Kundschaft nach Verhalten und Bedürfnissen zu segmentieren. Auf Grundlage dieser Daten können sie Werbeanzeigen so personalisieren, dass sich die Kunden direkt angesprochen fühlen.
Höhere Produktivität:
Die Analyse von Verhaltensmustern kann in HR-Initiativen zur Verbesserung der Einbindung und Produktivität der Mitarbeiter einfließen.
Höhere Effizienz:
Vom Kaufverhalten der Kunden bis zur Preisgestaltung von Lieferanten können Unternehmen Data Mining und Datenanalysen nutzen, um ihre Effizienz zu steigern und Kosten zu senken.
Bessere Kundenbindung:
Dating Mining verhilft zu einem besseren Verständnis der Kundschaft. Im Gegenzug werden Ihre Interaktionen mit den Kunden besser und die Kunden stärker an Ihr Unternehmen gebunden.
Verbesserte Produkte und Services:
Der Einsatz von Data Mining zum Aufspüren und Beheben von Qualitätsmängeln kann dazu führen, dass weniger Produkte zurückgegeben werden.
Data Mining wird abhängig vom jeweiligen Unternehmen und seinen Anforderungen zu verschiedenen Zwecken eingesetzt. Hier ein paar Beispiele:
Vertrieb
Data Mining kann die Verkaufszahlen steigern. Nehmen wir zum Beispiel eine Kasse in einem großen Einkaufszentrum. Bei jedem Kauf wird protokolliert, wann etwas gekauft wurde, welche Produkte zusammen gekauft wurden und welche am beliebtesten sind. Im Nachgang kann der Einzelhändler diese Informationen nutzen, um sein Sortiment zu optimieren.
Marketing
Unternehmen können Data Mining nutzen, um Marketingkampagnen zu optimieren. Erkenntnisse aus der Datenauswertung können beispielsweise genutzt werden, um sich ein Bild davon zu machen, wo potentielle Kunden auf die Werbeanzeigen gestoßen sind, welche Altersgruppe angesprochen werden soll, wo digitale Anzeigen zu platzieren sind und welche Marketingstrategie bei den Kunden am besten ankommt.
Produktion
Im produzierenden Gewerbe kann Data Mining eingesetzt werden, um die Kosten für Rohstoffe oder die effiziente Nutzung des Materials zu analysieren, wie lange die Herstellung eines Produkts dauert und an welchen Punkten der Prozess hakt. Data Mining kann für Just-in-Time-Lieferungen eingesetzt werden, indem mittels Prognosen errechnet wird, wann Nachschub bestellt oder Gerätschaften ersetzt werden müssen.
Betrugserkennung
Mithilfe von Data Mining lassen sich Muster, Trends und Korrelationen zwischen unterschiedlichen Datenpunkten ermitteln. Ein Unternehmen kann damit Ausreißer oder Korrelationen aufspüren, die es so nicht geben dürfte. Anhand der Analyse des Cashflows ließe sich beispielsweise feststellen, ob wiederkehrende Zahlungen an ein unbekanntes Konto geleistet werden. Wenn sich daraus Hinweise auf einen Betrugsfall ergeben, können entsprechende Ermittlungen eingeleitet werden.
Personalwesen
Personalabteilungen verfügen oft über eine Vielzahl von Daten, die sie verarbeiten können, darunter Daten über die Mitarbeiterbindung, Beförderungen, Gehaltsspannen, betriebliche Leistungen und deren Nutzung sowie Umfragen zur Mitarbeiterzufriedenheit. Mittels Data Mining lassen sich diese Daten zueinander in Bezug setzen, um zum Beispiel nachzuvollziehen, warum die einen dem Unternehmen den Rücken kehren und sich andere neu einstellen lassen.
Kundenservice
Kundenzufriedenheit ist von einer Vielzahl von Faktoren abhängig. Nehmen wir zum Beispiel einen Online-Händler, der Waren an seine Kundschaft versendet. Ein Kunde kann mit der Lieferzeit, der Lieferqualität oder der Kommunikation über den Status seiner Lieferung unzufrieden sein. Derselbe Kunde ist eventuell wegen der langen Wartezeiten auf E-Mail-Antworten oder am Telefon genervt. Mithilfe des Data Mining werden Informationen aus dem Tagesgeschäft gesammelt und die Ergebnisse zusammengeführt, um Schwachstellen, aber auch Stärken eines Unternehmens aufzuzeigen.
Kundenbindung
Unternehmen können Data Mining einsetzen, um die Merkmale von Kunden zu ermitteln, die zur Konkurrenz abwandern, und dann passende Sonderangebote anbieten, um andere Kunden mit denselben Merkmalen an sich zu binden.
Sicherheit
Bei der Erkennung von Eindringlingen setzen einige Technologien auf Data Mining, um Anomalien aufzuspüren, bei denen es sich um erfolgreiche Hackerangriffe auf das Netzwerk handeln könnte.
Unterhaltung
Streaming-Dienste nutzen Data Mining, um zu analysieren, was die Nutzer sehen oder hören, und um auf dieser Grundlage personalisierte Empfehlungen abzugeben.
Gesundheitswesen
Data Mining hilft Ärzten neben der Diagnose von Krankheiten und der Behandlung von Patienten auch bei der Analyse von Röntgenaufnahmen und anderen Ergebnissen von medizinischen Bildgebungsverfahren. Auch die medizinische Forschung setzt in hohem Maße auf Data Mining, maschinelles Lernen und andere Formen der Analytik.
Cloud-Computing-Technologien haben erheblich zur Verbreitung von Data Mining beigetragen. Ungeachtet der Sicherheitsprobleme und -herausforderungen der Cloud sind Cloud-Technologien in besonderem Maße für die hohen Geschwindigkeiten und riesigen Mengen an teil- und unstrukturierten Daten geeignet, die viele Unternehmen heute erfassen. Die elastischen Ressourcen der Cloud können ausgeweitet werden, um den Anforderungen dieser großen Datenmengen gerecht zu werden. Da in der Cloud mehr Daten in verschiedenen Formaten gespeichert werden können, sind mehr Data Mining-Tools erforderlich, um aus diesen Daten Erkenntnisse zu ziehen. Darüber hinaus werden Weiterentwicklungen des Data Mining wie KI und lernfähige Systeme als Dienste in der Cloud angeboten.
Künftige Entwicklungen im Bereich des Cloud Computing werden wahrscheinlich den Bedarf an noch effizienteren Data Mining-Tools weiter erhöhen. KI und maschinelles Lernen sind auf dem Vormarsch, und die Datenmengen werden weiter wachsen. Immer mehr Daten werden in der Cloud gespeichert und verarbeitet, um sie zu Geschäftszwecken einzusetzen. Aller Wahrscheinlichkeit nach werden Data Mining-Methoden immer stärker auf die Cloud setzen müssen.
Zu den häufig gestellten Fragen zum Data Mining, seiner Funktionsweise und Bedeutung gehören:
Data Mining dient der Sichtung großer Datenmengen mit dem Ziel, Muster aufzuspüren und Einblicke zu gewinnen, die für bestimmte Zwecke genutzt werden. Dabei kann es um die Optimierung von Produktion, Vertrieb und Marketing, das Aufdecken von Betrugsfällen oder die Erhöhung der Sicherheit gehen. Data Mining wird in einer Vielzahl von Branchen eingesetzt, wie z. B. im Banken- und Versicherungswesen, im Gesundheitswesen, im Einzelhandel, bei Online-Spielen, im Kundendienst, in der Wissenschaft, im Ingenieurwesen usw.
Datenanalysten folgen im Allgemeinen einem bestimmten Ablauf von Aufgaben im Data Mining-Prozess. Zunächst wird das Ziels der Datenanalyse bestimmt. Anschließend wird geklärt, wo die Daten gespeichert sind, wie sie gesammelt werden und welche Analysemethode am besten geeignet ist. Anschließend werden die Daten für die Analyse aufbereitet, ein Datenmodell erstellt und die Ergebnisse des Modells ausgewertet, die letztendlich in Änderungen einfließen. Im Nachgang wird dann beobachtet, ob diese Änderungen langfristig den gewünschten Effekt haben.
Data Mining wird eingesetzt, um Herausforderungen und Chancen herauszuarbeiten. Anhand der Ergebnisse können sich Unternehmen daran machen, die Preise ihrer Produkte zu optimieren, Produktivität und Effizienz zu steigern, Kundendienst und Kundenbindung zu verbessern sowie die künftige Produktentwicklung voranzutreiben. Data Mining verschafft Unternehmen einen Wettbewerbsvorteil, wenn es ihnen gelingt, Erkenntnisse aus den Daten dieser vielfältigen digitalen Transaktionen zu ziehen.
Verwandte Artikel:
Verwandte Produkte: