Menü

Data Scientists: Die gefragten Schatzsucher in Big Data

In Daten sind Schätze verborgen. Die finden Data Scientists. Weil es viel zu wenige ausgebildete Spezialisten gibt, haben Quereinsteiger gute Chancen.

Von
vorlesen Drucken Kommentare lesen 55 Beiträge
Data Scientist: Die gefragten Schatzsucher in Big Data

(Bild: Itzchaz/Shutterstock.com)

Jede Sekunde werden weltweit so gigantische Datenmengen gespeichert, dass Generationen von Menschen damit beschäftigt wären, sie auszuwerten. In diesen Daten steckt aber Wissen, das Unternehmen dabei hilft, ihr Geschäft zu optimieren. In den vergangenen Jahren hat sich mit Data Scientists ein seriöser Berufsstand entwickelt, der sich professionell mit Big Data beschäftigt.

Nicolas March

Nicolas March, 40, hatte in seinem Studium der Betriebswirtschaftslehre Data Mining als Schwerpunkt gewählt und darin promoviert. Anschließend hat er in unterschiedlichen Branchen mit Business Intelligence und Advanced Analytics gearbeitet. Seit dreieinhalb Jahren ist er Head of Analytics bei Rewe Digital in Köln. Die Tochter des Handelskonzerns leitet die digitale Transformation der Mutter. Ob nun Data Mining, Business Intelligence oder Advanced Analytics: das alles sind Begriffe dafür, um Wissen aus Datenbeständen zu generieren um daraus ein Handeln abzuleiten.

heise jobs – der IT-Stellenmarkt

Zu Arbeitsplätzen und Stellenangeboten in der IT-Branche siehe auch den Stellenmarkt auf heise online:

mehr anzeigen

"Ich habe zwei Aufgaben", sagt March: "Mithilfe von Daten Fragestellungen zu beantworten und unbekannte Muster in Daten erkennen, um Probleme zu lösen." Zwei Beispiele für die beiden Aufgaben: Eventuell lassen sich Muster in Daten erkennen, wenn ein Lieferant zu spät die bestellten Waren bringt. Hat das mit der Zeit zu tun, in der er fährt oder mit der Route?

Eine Fragestellung, die anhand von Daten beantwortet werden kann, ist die Vorhersage einer Bestellmenge, etwa für Bananen. Wie viele werden montags davon verkauft? Wenn die Zahl gut prognostiziert ist, wird die Menge bestellt, die verkauft wird. Nicht viel mehr, auf keinen Fall zu wenig. Zeitreihen aus der Vergangenheit dienen als Basis für die Vorhersage, die werden ergänzt um Einflussfaktoren wie Ferienzeit, saisonale Aspekte und Aktionen mit Obst. "Aus Daten der Vergangenheit und aktuellen Einflussfaktoren berechnen wir die notwendige Bestellmenge", sagt March. Bislang für den Lieferservice von Rewe, künftig für die etwa 2.500 Märkte deutschlandweit. March hat 15 Mitarbeiter, darunter Informatiker, Mathematiker, Statistiker, Wirtschaftswissenschaftler. Sie sammeln Daten nicht auf Vorrat, sondern gezielt für bestimmte Aufgaben.

Christian Koot

In Data Science wird mithilfe quantitativer Modelle aus Daten Wissen extrahiert. Diese Modelle können statistische Verfahren, Operations Research oder künstliche Intelligenz sein. Big Data ist der Klammerbegriff für Datenquellen. "Seit etwa zehn Jahren lehren und forschen wir an den Hochschulen zu Data Science, seit drei, vier Jahren gibt es spezielle Studiengänge. Inzwischen stellen wir fest, dass das Thema massiv in der Wirtschaft und in den Berufen angekommen ist", sagt Christian Koot, Professor und Studienkoordinator des Studiengangs Data Science und Business Analytics an der Hochschule Aalen.

Unternehmen hätten es nun verstanden, dass sie datenbasiert sichere Entscheidungen treffen können. Die Marktforscher von IDC rechnen zwischen 2017 und 2022 mit jährlichen Wachstumsraten bei Big Data und Analytics mit 11,9 Prozent. 2022 soll der globale Markt rund 260 Milliarden US-Dollar erreichen. Das ist so viel, wie Deutschland in den kommenden zehn Jahren in Straßenwege investieren will.

Informatiker gehören mit zu den gefragtesten Leuten am Arbeitsmarkt. "Data Scientists sogar noch mehr", weiß Koot. Sie arbeiten an Schnittstellen, haben mit unterschiedlichen Abteilungen zu tun. Sie tragen Informationen zusammen, werten sie aus und müssen Ergebnisse verständlich präsentieren. "Zahlen sprechen nicht für sich selbst", so Koot. Unerlässliche Skills sind Informatikkenntnisse in den Programmiersprachen Python und R sowie Datenbankwissen.

Data Scientists müssen sich mit Mathematik und Statistik auskennen und Domainwissen je nach der Branche haben, in der sie arbeiten. Sei es im Onlinehandel, in dem aufgrund persönlichen Kundenverhaltens Kaufvorschläge generiert werden. Oder in der industriellen Fertigung, um den optimalen Servicezeitpunkt von Maschinen zu ermitteln. Oder bei einer Versicherung anhand des Schriftverkehrs automatisch erkennen, ob der Kunde zufrieden ist oder nicht.

Mihael Ankerst

Das ist eine Anwendung von Data Science bei der Allianz in München. Mihael Ankerst, 46, promovierter Informatiker, leitet das Referat Kundendaten und Analyse bei der Versicherung. "Uns dient Data Science dazu, Unternehmenswerte zu schaffen, indem wir durch Datenanalysen Erkenntnisse gewinnen, etwa über Kundengruppen, und durch Datenanalysen Geschäftsprozesse verbessern." Bei der Analyse der Kundenzufriedenheit beispielsweise: Ist der Kunde tatsächlich unzufrieden, werden daraus eventuell organisatorische Maßnahmen abgeleitet.

Ankerst hat acht Mitarbeiter, die sich darum kümmern. Auch das sind meist Informatiker, Mathematiker, Statistiker. Sie finden die Teilmenge heraus, die mit hoher Wahrscheinlichkeit potenzielle Kunden für einen neuen Tarif in der Autoversicherung ist. Davon hat die Allianz 20 Millionen, die alle anzusprechen, ist wenig zielführend. So wird untersucht, ob Kunden, die vor langer Zeit einen Vertrag abgeschlossen haben, sich anders verhalten, als diejenigen, die erst vor kurzer Zeit unterschrieben haben. "Wir schließen aus dem Verhalten in der Vergangenheit auf das Verhalten in der Zukunft, indem wir bestimmte Kriterien berücksichtigen", so Ankerst.

In Zeiten der Digitalisierung werden überall viel mehr Daten erhoben. "Eine größere Datenbasis hat aber nicht zwangsläufig die Folge, dass Data Science bessere Ergebnisse liefert", sagt Ankers. Denn es komme auf die Qualität der Daten an und ob sie zur Fragestellung passen. Eine schlechte Datenbasis ist die, wenn sie aufgrund unterschiedlicher Definitionen erhoben wurde. Gute Daten sind vollständig, konsistent und spiegeln die Realität wieder. Nur daraus kann ein Data Scientist objektive Schlüsse ziehen. Und das kosteneffizient, ohne eine Vielzahl an Modellen dafür zu brauchen, was zeit- und kostenintensiv ist. Das unterscheidet den guten, vom schlechten Data Scientist. (mho)