Data Science – Grundlagen, Architekturen und Anwendungen

Das Buch will eine für Praktiker relevante Einführung in ein sehr breites Themengebiet bieten und Impulse für den konkreten Einsatz von Data Science in Unternehmen setzen. Diese Herausforderung lösen die Autoren durch die Kombination aus Grundlagen, Praxisbeispielen und konkreten Handlungsempfehlungen.

Literatur  –  0 Kommentare

(Bild: Shutterstock)

Uwe Haneke, Stephan Trahasch, Michael Zimmer, Carsten Felden (Hrsg.)
Data Science – Grundlagen, Architekturen und Anwendungen

dpunkt.verlag 2019
336 Seiten, 59,90 Euro (gebunden)
ISBN: 978-3-86490-610-7

Was Data Science genau ist, fragen sich Praktiker nicht zuletzt im Zusammenhang mit den Hypethemen Digitalisierung, künstliche Intelligenz und Indus­trie 4.0. Ausgewiesene Experten geben im vorliegenden Sammelband Antworten auf diese Fragen.

Das Buch spricht nicht nur IT-Profis, Data-Warehouse-Fachleute und Entscheidungsträger an, sondern auch diejenigen, die eine Grundlage für Tätigkeiten im Kontext Data Science, Analytics und KI aufbauen möchten. Der Band gliedert sich in zwei Teile: Die ersten zehn Kapitel behandeln technische, methodische und organisatorische Grundlagen. Die verbleibenden sechs Kapitel stellen Fallstudien aus der Praxis renommierter Unternehmen vor, etwa aus dem Einzel- sowie dem Onlinehandel und zu Predictive Maintenance.

Entwicklung, Einbettung und Relevanz von Data Science

Der relativ neue Beruf des Data Scientist vereint Fähigkeiten aus einer Vielzahl von Disziplinen wie Statistik, Machine Learning, Datenbanken und Visualisierung. Es gelingt den Autoren, die wechsel­sei­tigen Abhängigkeiten der Fachgebiete herauszustellen. Im unternehmerischen Kontext diskutieren sie kritisch die Chancen von Data Science und KI und widmen sich der zen­tralen Aufgabe, der Schaffung sogenannter Datenprodukte. Daten bekommen Produktcharakter, wenn sie zum Beispiel ein Kundenbedürfnis befrie­digen. Hinweise auf Erfolgsfaktoren und Integration runden das Ganze ab. Dass Data-Science-Projekte mehr beinhal­ten als das Entwickeln von Machine-Learning-Modellen und oftmals einfache Analytics-Methoden Effizienzsteigerungen bewirken können, wird hier klar.

Data Science – Grundlagen, Architekturen und Anwendungen (Bild: dpunkt.verlag)

Von Deep Learning bis zur digitalen Ehtik

Dem Thema Deep Learning widmet das Kompendium ein eigenes Kapitel, das methodische Grundlagen angereichert mit verständlichen Beispielen präsentiert. Prominente Entwicklungs-Frameworks finden ebenfalls Erwähnung. Den Aufbau und das Einbetten einer Data-Science-Architektur beschreiben die Autoren technisch und organisatorisch, um sowohl die Interdependenzen zur Business-Intelligence-Architektur als auch die Anforderungen an eine industrialisierte Data Science nachvollziehbar herauszustellen. Hier wäre eine kurze Einführung in Big-Data- und Cloud-Techniken wünschenswert. Ein eigenes Kapitel kümmert sich um den aus der BI vertrauten Self-Service. Es beschreibt systematisch die Lösungsansätze für Data Science und benennt Abhängigkeiten zu anderen Unternehmensbereichen.

Während die Autoren die digitale Ethik in Form eines kurzweiligen Werkstattgesprächs ansprechend vermitteln, sind die Vorschläge zur Schaffung von Data Privacy in das Thema Analytics Lifecycle eingebettet. Eine detailliertere Betrachtung von Data Governance hätte an dieser Stelle weitere Handlungsempfehlungen für die organisatorische Eingliederung liefern können.

Fazit: Eine breitgefächerte Einführung mit Tiefgang

Den Autoren gelingt eine gute Balance zwischen einerseits technologischer sowie methodischer Tiefe und andererseits thematischer Breite. Die Herausforderung, eine für Praktiker relevante Einführung in ein sehr breites Themengebiet zu bieten, erfüllt der Sammelband auf ansprechende und nachvollziehbare Weise. Gerade für Einsteier in das Thema Data Science, die sich zuvor bereits mit Business Intelligence beschäftigt haben, eignet sich das Buch als umfassende und praxisnahe Grundlage.

Prof. Dr. Peer Küppers
ist seit 2017 Professor für Wirtschaftsinformatik (Data Science und Big Data), an der Hochschule für Wirtschaft und Gesellschaft Ludwigshafen. Er befasst sich mit den Themen Machine Learning im Supply Chain Management sowie Big Data- und Cloud-Architekturen. Zuvor war er als Data Scientist und Consultant im Bereich „Predictive Applications im Handel“ sowie als IT-Projektleiter und BI-Experte in der Luftfahrtindustrie tätig.

Save the date: Mehr zum Thema auf der data2day 2020

Von 19. bis 21. Oktober 2020 veranstalten heise Developer, iX und der dpunkt.verlag die mittlerweile siebte Auflage der data2day. In Vorträgen und Workshops widmet sich die Konferenz erneut den wichtigsten Themen rund um Big Data, Data Science sowie maschinelles Lernen.