Blogbeitrag

Data Science: Lern- und Ausbildungsinhalte

Ein Arbeitspapier der GI-Task Force "Data Science" in Zusammenarbeit mit der Plattform „Lernende Systeme“ soll mit der Ausgestaltung von Studiengängen sowie von Aus- und Weiterbildungsangeboten helfen, die richtigen Themen im Bereich Data Science zu adressieren. Warum das wichtig ist, erläutern die Sprecher der Task Force Peter Liggesmeyer und Michael Goedicke.

Die Begriffe „Künstliche Intelligenz“, „Big Data” und „Data Science“ gehören zu den am meisten “gebrauchten” der letzten Jahre. Die sogenannte „Künstliche Intelligenz“ (Artificial Intelligence) beschreibt dabei – jenseits des Marketingsprechs – die Erforschung „intelligenten“ Problemlösungsverhaltens sowie die Entwicklung „intelligenter“ Computersysteme. Dabei sind Methoden der Künstlichen Intelligenz, insbesondere des maschinellen Lernens und des Deep Learning mit künstlichen neuronalen Netzen, auf große Datenmengen in hinreichender Qualität angewiesen.

“Big Data” bezeichnet Datenmengen, die zu groß, zu komplex, zu schnelllebig oder zu schwach strukturiert sind, um sie mit manuellen und herkömmlichen Methoden der Datenverarbeitung auszuwerten. Der große Datenumfang (Volume), die Geschwindigkeit, mit der die Datenmengen generiert und transferiert werden (Velocity), die Bandbreite der Datentypen und -quellen (Variety) sowie die Echtheit von Daten (Veracity) zeichnen dabei diese Daten aus. Erweitert wird diese Definition häufig um die den unternehmerischen Mehrwert (Value) und die Sicherstellung der Datenqualität (Validity).

Aufgrund der wissenschaftlichen und technologischen Entwicklungen in den Bereichen Big Data und der Künstlichen Intelligenz, die auch Methoden jenseits des maschinellen Lernens beinhalten – etwa die Mensch-Technik-Interaktion, wissensbasierte Systeme oder mathematische Logik – rückt insbesondere die Wissenschaft im Umgang mit Daten zunehmend in den Fokus.

Der Schwerpunkt dieser sogenannten „Data Science“ liegt dabei nicht bei den Daten selbst, sondern auf der Art und Weise, wie diese verarbeitet, aufbereitet, analysiert und in Entscheidungen umgesetzt werden. Data Science beschäftigt sich mit einer zweckorientierten Datenanalyse und der systematischen Generierung von Entscheidungshilfen und -grundlagen, um Wettbewerbsvorteile erzielen zu können.

Dieses neue Wissenschaftsfeld an der Schnittstelle zu verschiedenen Anwendungsbereichen – sowohl für Forschung als auch für die Lehre – erfährt einen enormen Bedeutungszuwachs. Deshalb hat die Gesellschaft für Informatik e.V. vor zwei Jahren die Task-Force „Data Science“ ins Leben gerufen. Diese interdisziplinäre Arbeitsgruppe geht der Frage nach, was einen Data Scientist in Abgrenzung zu bestehenden Wissenschaftsdisziplinen wie der Informatik ausmacht und welche Kompetenzen ein Datenwissenschaftler und eine Datenwissenschaftlerin mitbringen müssen.

Im November 2019 hat das Kabinett Eckpunkte einer Datenstrategie der Bundesregierung mit vier Handlungsfeldern beschlossen: So sollen die Datenbereitstellung und der Datenzugang verbessert, eine verantwortungsvolle Datennutzung befördert, die Datenkompetenz in der Gesellschaft erhöht und der Staat zum Vorreiter einer Datenkultur gemacht werden. Die Gesellschaft für Informatik e.V., die mit 20.000 Mitgliedern die größte Fachgesellschaft für Informatik im deutschsprachigen Raum ist, will diese Entwicklungen maßgeblich mitgestalten.

Ein Arbeitspapier einer interdisziplinären Autorenschaft ist in Zusammenarbeit mit der Plattform „Lernende Systeme“ entstanden und soll mit der Ausgestaltung von Studiengängen sowie von Aus- und Weiterbildungsangeboten helfen, die richtigen Themen im Bereich Data Science zu adressieren.

Hier geht es zum Arbeitspapier "Data Science: Lern- und Ausbildungsinhalte". Wir wünschen viel Spaß bei der Lektüre.

 © Kathrin Richter, Trendsetter - GI e.V.