Zum Hauptinhalt springen
FachbereichFachartikel

Irgendwas mit Daten… Warum wir Data Scientists brauchen

Warum ist die eierlegende Wollmilchsau so wichtig?

Wenn wir Angst haben, dass wir alte Jobs verlieren, weil sie in der digitalen Welt überflüssig werden könnten, müssen neue geschaffen werden. Wenn wir Angst haben, dass uns die Datenflut übermannt und wir niemanden haben, der die Instrumente beherrscht, dann brauchen wir Berufsbilder, die das können. Wenn wir Angst haben, dass nur die bekannten Big Player der Digitalisierung, wie Google, Amazon, Facebook und Apple, Potenzial aus Big Data schöpfen, dann müssen wir Sorge tragen, dass unsere Unternehmen die notwendigen Kompetenzen über entsprechend ausgebildetes Personal aufbauen und nutzen können. Wenn wir Angst haben, dass die Technik zunehmend Macht über uns gewinnt (Stichwort KI/Algorithmen) und wir feststellen, dass sich immer mehr ethische Fragen aufdrängen, sollten wir Rahmenbedingungen wie einen digitalen Datencodex entwickeln und Data Scientists in Ethik schulen.

Wir stellen also fest, dass eine interdisziplinäre und ethische Perspektive notwendig ist, die bei den oft technischen Ausbildungen der heutigen Data Scientists nicht unbedingt gegeben ist. Zum anderen fehlen den Anwendern in den einzelnen Domänen oft Kompetenzen, wenn es darum geht, die Datengrundlage einzuschätzen und Ergebnisse richtig zu interpretieren. Diese Kompetenzen gilt es in der Breite aufzubauen. Es ist deshalb zu begrüßen, dass im Koalitionsvertrag Data Science Beachtung findet.

Handlungsempfehlungen

Um kurzfristig den Bedarf zu decken, sollten die betreffenden Mitarbeiter in den Unternehmen unterstützt und geschult werden (bspw. über Fortbildungen 5). Dafür müssen mehr flexible Angebotsformen (Fernstudienoptionen und berufsbegleitende Optionen) bereitgestellt werden. Ein mittelfristiger Ansatz bringt die Unternehmen mit den anwendungsorientierten Wissenschaftseinrichtungen zusammen, um so die Bedarfsfelder mit den Kompetenzträgern zu vernetzen und ein Bewusstsein in der Öffentlichkeit zu erzeugen (z.B. in einem Kompetenzzentrum, das die Felder identifiziert, die den dringendsten Know-how-Aufbau benötigen und die Inhalte an verschiedene Bildungsniveaus und Disziplinen (nicht jeder braucht das komplette Spektrum) anpasst). Als langfristige Lösung ist ein im breiten Dialog entstandenes Curriculum in Deutschland zu entwickeln, das unter dem Schirm bestimmter Essentials den Universitäten genügend Freiraum überlässt, den Studiengang für sich auszugestalten.

Von Gerald Swarat, Fraunhofer-Institut für Experimentelles Software Engineering IESE

Ein Data Scientist soll „Big Data“ beherrschbar und nutzbar machen, indem er oder sie von der Datensammlung über die Datenanalyse und Präsentation bis hin zur Ableitung von Handlungsempfehlungen den kompletten Big-Data-Lifecycle aus dem Effeff beherrscht. Die Nachfrage nach den Expertinnen und Experten ist enorm und steigt konsequent an, denn Unternehmen haben natürlich erkannt, dass sie Fachexperten brauchen. Der Bedarf muss mit unterschiedlichen Maßnahmen kurz-, mittel- und langfristig adressiert werden.

Data never sleeps: Für die riesigen, großteils unstrukturierten Datenbestände in Wirtschaft und öffentlicher Hand hat sich in den letzten Jahren mit großem Nachdruck ein Fachbegriff etabliert: Big Data. Allerdings sind diese Daten weder Informationen noch Wissen: „Sie sind erst wertvoll, wenn sie verfeinert und analysiert werden, sodass aus Rohdaten ‚Smart Data‘“ 1 werden. Nur dann können die wissenschaftlichen, ökonomischen und sozialen Wirkungskräfte freigesetzt werden.

Im gleichen Maße, wie Schlagworte wie Big Data, Smart Data, Data Mining, Data Engineering, Predictive Analytics in die Diskussion geraten, steigt die Hoffnung auf eine neue Spezies – der Wunsch nach Data Scientists. Denn beinahe unmittelbar mit dem Aufkommen des Begriffs „Big Data“ folgte das Bekenntnis, mit dem Phänomen schier unübersichtlicher Datenmengen überfordert zu sein und diesen nicht mit herkömmlichen Strategien beizukommen oder gar Mehrwerte daraus ziehen zu können.

Data Scientist – The Sexiest Job of the 21st Century? 2

Was ist also ein Data Scientist? Ganz verkürzt dargestellt soll ein Data Scientist „Big Data“ beherrschbar und nutzbar machen, indem er oder sie von der Datensammlung über die Datenanalyse und Präsentation bis hin zur Ableitung von Handlungsempfehlungen den kompletten Big-Data-Lifecycle aus dem Effeff beherrscht.

Einsatzfelder zeigen sich zur Genüge, so hat sich z.B. zunehmend der Bereich von algorithmischen Entscheidungssystemen als Paradebeispiel für Data Scientists angeboten, seitdem über deren Fehler in der Öffentlichkeit diskutiert wird. Bspw. bei der Bewertung von Angeklagten bezüglich ihres aktuellen oder künftig zu erwartenden kriminellen Verhaltens oder bei der Vergabe von Krediten. 3 In diesen Bereichen werden die Entscheidungen und Interpretationen von Data Scientists Auswirkungen sowohl auf die Gesellschaft im Allgemeinen als auch auf das Wohl und Wehe eines einzelnen Individuums besitzen, was zusätzlich zur technischen Souveränität eine klare Berufsethik erfordert. Es geht also darum, „die möglichen gesellschaftlichen Folgen von Softwaresystemen zu modellieren und zu antizipieren.“ 4

 

Der Bedarf ist groß

Die Nachfrage ist trotz (oder gerade wegen) der sehr breiten und unscharfen Definition vorhanden und steigt konsequent an, denn Unternehmen haben natürlich erkannt, dass sie Fachexperten brauchen, die aus diversen Datenquellen Antworten auf die brennenden Fragen finden, um Prozessabläufe zu optimieren, den Kunden besser zu verstehen oder gar völlig neue Geschäftsmodelle zu eröffnen. Banken und Beratungsfirmen suchen die auf große Datenmengen spezialisierten Analysten genauso wie Autohersteller, Versicherungen und Verwaltungsbehörden – und in Zeiten der allgegenwärtigen Digitalisierung und Konzepten wie Industrie 4.0 und autonomer Systeme findet man fast in jeder Branche ein Einsatzfeld. Natürlich steigt mit diesem Markt auch die Nachfrage bei Studierenden. 

Nur werden diese Bedürfnisse durch das heutige Ausbildungssystem noch nicht ausreichend gestillt; hinzu kommt, dass die Anforderungen an einen Data Scientist außerordentlich komplex sind. Es ist also höchste Zeit, Aufgaben und Kompetenzen des Berufsbildes zu diskutieren und ein Curriculum abzuleiten, das übergreifende Kompetenzen und Inhalte in der digitalen Welt, wie z.B. Wissenschaft, Arbeitswelt und Gesellschaft, zusammenbringt. Dabei geht es einerseits tatsächlich um die Ausbildung von Fachexperten – den Data Scientists, die sich in der Tiefe mit den Verfahren und Technologien auskennen – und andererseits darum, in den einzelnen Disziplinen eine Art übergreifende Grundkompetenz in Data Literacy zu vermitteln.

In Deutschland wird Data Science bisher vor allem als Aufbaustudium nach einem Bachelor zum Beispiel in Mathematik oder Informatik angeboten. München war 2015 eine der ersten Universitäten, die einen Master in Data Science anboten, Mannheim und Darmstadt zogen nach. Außerdem gibt es kostenpflichtige Fortbildungsangebote für Berufstätige.

Volker Markl weist zu Recht darauf hin, dass in der Vergangenheit die Disziplinen der Datenanalyse und der skalierbaren Datenverarbeitung nicht eng verzahnt waren, was jedoch für einen souveränen Umgang mit großen Datenmengen mit geringer Latenz erforderlich ist. Zudem sind das Wissen der Anwendungsdomäne und die juristischen und gesellschaftlichen Implikationen zu beachten. Markl vergleicht deshalb die Wünsche, die auf den Data Scientist projiziert werden, mit der Suche nach der eierlegenden Wollmilchsau:

Quellen

Vgl. Markl, Volker: Gesprengte Ketten. In: Informatik Spektrum 01/2015.

2 Lt. Harvard Business Review (2012): hbr.org/2012/10/data-scientist-the-sexiest-job-of-the-21st-century.

3 Vgl. Zweig, Katharina (2018): Wo Maschinen irren können. Verantwortlichkeiten und Fehlerquellen in Prozessen algorithmischer Entscheidungsfindung. Eine Publikation der Bertelsmann Stiftung, Gütersloh.

4 Zweig, Katharina: S. 30.

5 https://www.academy.fraunhofer.de/de/weiterbildung/information-kommunikation/data-scientist-schulungen.html.

Über den Autor

Dieser Text steht unter der Lizenz Creative Commons Namensnennung - Weitergabe unter gleichen Bedingungen 4.0 International - CC BY-SA 4.0. Bitte nennen Sie bei einer möglichen Nachnutzung den angegebenen Autorennamen sowie als Quelle das Hochschulforum Digitalisierung.