Data Mining Prozesse

 

Data Mining ist oft langwierig in der Datenauswertung; dabei wiederholen sich folgende Phasen:

 

Eine klare Definition der Problemstellung

Das Data Mining Projekt beginnt mit dem Verstehen des Business Auftrages. Data Mining Experten, Firmen, Manager und Domain Fachleute arbeiten Hand in Hand, um gemeinsam Ziele für das Projekt zu definieren und die Anforderungen aus der Business- Perspektive zu ermitteln. Das Projektziel wird dann in eine Data Mining Anforderung übersetzt. Zu Beginn der Themen- und Zielklärungs- Phase sind Data Mining Werkzeuge noch nicht erforderlich.

 

Daten Auswertung und Weiterverwendung

Domain Kenner verstehen die Bedeutung von Metadaten. Sie sammeln, beschreiben und erforschen diese Daten. Sie erkennen ggfs. auch Qualitätsprobleme der Daten. Ein stetiger Austausch der firmeninternen Projektmitarbeiter mit den Data Mining Experten sorgt für eine gute Grundlage für die Datenbearbeitung nach der Definitionsphase.

In der Datenauswertungsphase kommen dann traditionelle Datenanalyse-Werkzeuge wie z. B. statistische Auswertungen zum Einsatz, um die Daten näher zu definieren und zu kategorisieren.

 

Daten Vorbereitung

Domain Experten bauen dann das Datenmodell für den Modelling Prozeß. Sie sammeln, bereinigen und formatieren die Daten, da einige Data Mining Prozesse nur bestimmte Datenformate bearbeiten. Sie schaffen auch neue Attribute, die von den Daten abgeleitet werden und erzeugen Mittelwerte.

In der Datenaufbereitungsphase werden die Daten mehrfach umstrukturiert und neu durchsortiert in vorgeschriebener Reihenfolge. Typische Aufgaben sind dabei Auswertungen wie die Auswahl von Tafeln, Aufzeichnungen und Eigenschaften. Die Bedeutung der Daten an sich wird dabei nicht verändert. Nur der Kontext ändert sich je nach Perspektive der Betrachtung. 

 

Modeling

Data Mining Experten selektieren und wenden verschiedene Data Mining Prozesse auf die gleiche Art Daten an. Manche Data Mining Prozesse setzen bestimmte Arten von Daten oder Datenstrukturen voraus. Der Data Mining Fachmann muss jedes Datenmodell konkret bewerten und einschätzen. In der Modellierungsphase besteht ein konstanter Austausch zwischen den Domain Kennern und dem Data Mining Experten, damit die Vorbereitung der Daten korrekt abläuft.

Die Modeling Phase ist mit der Evaluationsphase gekoppelt. Beide können mehrfach wiederholt werden unter Austausch von Parametern bis optimale Werte erreicht sind. In der Endphase des Modelings entsteht ein hochwertiges Datenmodell.

 

Evaluation Die Auswertung

Data Mining Experten bewerten das Modell. Wenn das Modell die Erwartungen nicht erfüllt, wird die Modeling Phase erneut aufgesetzt und das Modell von neuem mit veränderten Parametern gebildet, dies erfolgt solange, bis ein optimales Wertegeflecht erreicht ist.

Erst wenn der Data Mining Experte mit dem Modell vollkommen zufrieden ist, können Geschäftsdaten daraus extrahiert werden, mit denen folgende Fragen beantwortet werden:

  •    Erreicht das Modell die geplanten und erwünschten Businessziele?
  •    Sind dabei alle Anliegen und Themen des Geschäftsmodells      berücksichtigt?
  •    Gegen Ende der Einschätzungsphase entscheiden Data Mining Experten, wie die Data Mining Ergebnisse zu verwerten sind.

 

Entfaltung oder Umsetzung

Data Mining Experten nutzen die Ergebnisse aus den Datenuntersuchungen, indem sie die Daten in Tabellen oder Übersichten exportieren oder in andere Anwendungen einfügen.