Data Mining im Bankkonto

Wissen | Hintergrund

Die Sammlung, Verdichtung und Auswertung von Betriebsdaten als Informationsgrundlage für Unternehmensentscheidungen ist ein alter Hut. Stülpt man ihn allerdings über Online-Shops und Unternehmensnetze, wird er zum messerscharfen Wettbewerbsinstrument.

Die Sammlung, Verdichtung und Auswertung von Betriebsdaten als Informationsgrundlage für Unternehmensentscheidungen ist ein alter Hut. Stülpt man ihn allerdings über Online-Shops und Unternehmensnetze, wird er zum messerscharfen Wettbewerbsinstrument. Wissensgewinnung aus Firmendatenbanken hat sich vom Technologiethema zum strategisch bedeutenden Wirtschaftsthema gewandelt -- und sollte Datenschützer aufhorchen lassen.

Es klingt ein wenig nach Geheimdienst, wenn Dr. Jörg-Uwe Kietz von der kdlabs AG über die Auswertung von Kunden- und Betriebsdaten mittels Business Intelligence (BI) spricht. Geldinstitute, so berichtet er aus seiner Berufspraxis, setzen schon heute BI-Methoden zur Aufdeckung internationaler Geldwäsche ein. Das heißt im Klartext: Data Mining in Bankkonten und Transaktionsnetzen. Und der Technik-Einsatz, mit dem bei Online-Verkäufen das Kreditrisiko abgeschätzt wird, gerät zur alltäglichen Geschäftspraxis. Laut Kiez lassen sich potenzielle Nicht-Zahler im Internet-Geschäft mit einer Wahrscheinlichkeit von knapp 80 Prozent vorhersagen.

Kietz war einer von vier Referenten des 13. AIK-Symposiums "Business Intelligence - Wissen entdecken für den Unternehmenserfolg" Ende April in Karlsruhe. Rund 70 Teilnehmerinnen und Teilnehmer informierten sich dort über Methoden, Forschungsansätze und Lösungen, um aus betrieblichen Daten entscheidungsrelevantes Geschäftswissen für die Betriebsentwicklung abzuleiten. "Im besten Fall", so Professor Dr. Rudi Studer vom Institut für Angewandte Informatik und Formale Beschreibungsverfahren (AIFB) der Universität Karlsruhe (TH), "können sogar Vorhersagen für eine empfohlene, künftige Geschäftssteuerung generiert werden".

Der Einsatz von Business Intelligence beginnt nicht mit der Technik, sondern mit der Frage, die man beantwortet haben will. Zur Beantwortung gilt es, die verfügbaren Daten methodisch aufzubereiten. BI beschreibt die Informationen, an denen man interessiert ist (oder interessiert sein könnte), klassifiziert die Daten, gießt sie in mathematische Regeln und stellt Vergleichsmuster her. Diese Muster zieht man sodann zur Bewertung der Daten für einen Bericht heran. Beim Aufstellen anwendbarer Regeln stützt man sich am besten auf vorhandene Erfahrungswerte. Das können Produktions- und Betriebsstörungsmeldungen aus der Vergangenheit ebensogut sein wie das vergleichsweise banale Wissen, dass ein Versicherungskunde,der mit 18 sein Auto anmeldet, mit 35 im besten Alter für eine Lebensversicherung ist. Per BI auf alle 18jährigen Autoversicherungsnehmer angewendet, liefert diese Information exakt zum richtigen Zeitpunkt die Aufforderung zur gezielten Kundenansprache.

Zur Fütterung der Systeme setzt man sogenannte ETL-Verfahren (Extraction, Transaction, Loading) ein, die auf automatisierte Auswertungen (Data Mining), die automatische Aufdeckung von Strukturen und Mustern in Datensammlungen (Knowledge Discovery) und herkömmliches Retrieval bauen. Zur Speicherung der Informationen werden eigenständige Datenbanken, die parallel zu den Systemen im Produktivbetrieb arbeiten, empfohlen. (Data Warehousing). Für die Berichtserstellung und die Präsentation kommen neben klassischen Reports auch spezielle Techniken des Data Mining wie etwa das Online Analytical Processing (OLAP) zum Einsatz.

Wichtig ist, dass sie es erlauben, die verfügbaren Daten nach unterschiedlichen Auswertungskriterien zu analysieren und in verschiedenen Abhängigkeiten voneinander zu präsentieren. Benutzer können dann zum Beispiel nicht nur abfragen, in welchem Bundesland die meisten Autoversicherungen im letzten Jahr abgeschlossen wurden, sondern auch gleichzeitig, wie alt der Vertragsnehmer ist und ob es sich um einen Mann oder ein Frau handelt. Oder auch nur, wieviele Frauen aus Berlin ihr Auto versichert haben. Diese mehrdimensionalen Datensichten sollten auch aus heterogenen Datenbeständen zusammengeführt werden können.

Während herkömmliche Analysesysteme mit angewandter Statistik vor allem kennzahlengebundene Informationen auswerten, bezieht BI auch textgebundene Informationen ein. Professor Dr. Lars Schmidt-Thieme vom Institut für Computer Science der Universität Freiburg erläuterte: "Neben den klassischen Techniken der Rückgewinnung von Information, etwa dem Indizieren für eine Volltextsuche, kommen bei Business Intelligence zunehmend auch semantische Technologien des Wissensmanagements zum Einsatz". Diese erlauben eine bessere Erschließung von Textdokumenten wie etwa Kundenbriefen, Patentinformationen, Forschungsberichten und eMail-Korrespondenz. Die Informatik-Forschung arbeitet in vielen Projekten an solchen Textanalysesystemen, auch auf europäischer Ebene. In einigen großen Firmen sind bereits Unternehmensanwendungen zur Mailanalyse im Einsatz.

Business Intelligence, das wurde spätestens an dieser Stelle deutlich, hilft nicht nur, den Unternehmenserfolg zu steigern. Sie eröffnet auch ein neues Spannungsfeld zwischen betrieblicher Effizienz, Verbrechensprävention und dem "gläsernen Kunden" sowie dem "gläsernen Mitarbeiter". Das Potenzial der Technik sollte nicht nur Unternehmensstrategen, sondern auch Datenschützer aufhorchen lassen.

Kommentare

Anzeige