Anfang der Seite Springe zum Hauptinhalt der Seite
Illustration Interview

Was macht eigentlich ein Data Scientist?

Technologischer Wandel braucht neue Berufe: So helfen Data Scientists Unternehmen, von Big Data zu profitieren. Lesen Sie im Porträt mehr zum Beruf.

Clouds und digitale Plattformen machen mehr und mehr Daten verfügbar, die durch technologischen Wandel immer besser und schneller verfügbar sind. Betriebe nutzen diese Datenmengen immer häufiger, um Produkte und Abläufe zu optimieren. Neben neuen Geschäftsmodellen entstehen so auch neue Berufe – ein Trend, der durch die aktuelle Forschung belegt ist (BMAS, 2021; Arntz et al., 2019; Dengler/Matthes, 2021). Einer dieser Berufe ist der Data Scientist. Welche Aufgaben, Kompetenzen und Einsatzbereiche in der Arbeitswelt zum Berufsbild gehören, beschreibt der Statistiker Christopher Thiele (31), Data Scientist im Finanzbereich des Energiekonzerns Uniper.

Christopher Thiele
© Privat - Christopher Thiele

Arbeitsalltag

Arbeitsalltag

Christopher Thiele: Mein Tag besteht zu einem großen Teil aus Austausch: intern oder mit anderen Fachbereichen. Wir definieren zusammen Probleme und suchen nach Lösungen. Das ist auch meine Kernarbeit: Daten analysieren, das Problem so definieren, dass ich es mit Daten lösen kann, programmieren – Problemlösung mit Daten also. Ein Beispiel sind Prognosen: Kann ich den Einfluss bestimmter Daten nutzen, um etwas vorherzusagen – etwa die Verkaufszahlen eines Produkts oder den Energiebedarf? Ein anderes Beispiel sind Prozesskontrollen zur Optimierung interner Abläufe. Wir generieren Daten, analysieren sie und packen das Ergebnis in einen Prozess, damit Unternehmen davon profitieren können. Auch bei der öffentlichen Hand ist der Bedarf groß, denn hier geht es häufig um Probleme, die sowohl die Weiterverarbeitung von Daten als auch deren Analyse lösen könnten. Für die Fluthilfe zum Beispiel: Durch die Kombination von Luftbildern, Bebauungsplänen, Höhenprofilen, Einwohnerzahlen und anderen bekannten Datenquellen könnte ich als Data Scientist einen Algorithmus programmieren, der aufzeigt, wo Behörden und Anwohner bei Hochwasser besonders schnell reagieren müssen.

Kompetenzen

Kompetenzen

Thiele: Wir brauchen IT- und Programmierkenntnisse, analytisches Denken und müssen mathematische Methoden beherrschen. Aber wir müssen auch eine gute Kommunikationsfähigkeit mitbringen: zur Problemfindung mit anderen Fachbereichen oder auch zur Übersetzung sehr technischer Zusammenhänge in etwas, mit dem jeder arbeiten kann. Im Gegensatz zum Data Engineer, der die Daten optimal bereitstellt, und zum Data Analyst, der mit ihnen bekannte Fragestellungen durch bewährte Methoden beantwortet, ist für den Data Scientist anfangs gar nicht klar, welche Daten und Methoden hilfreich sind. Hier geht es um kreative Problemlösung, sehr viel Recherche, Aufbereitung und Analyse der Daten. Big Data oder KI  sind dabei Schlagworte: Big Data bezeichnet die Schnelllebigkeit und das Volumen an Daten, die heute deren Bewirtschaftung erfordern. Maschinelles Lernen ist Teil der Kernarbeit der Data Scientists: etwas programmieren, das nicht auf zuvor klar definierten Regeln basiert, sondern diese findet. Und wenn man dies alles in einer Software und in einen Prozess mit sichtbarem Effekt kombiniert, spricht man häufig von künstlicher Intelligenz.

Christopher Thiele zu Big Data, Künstlicher Intelligenz und maschinellem Lernen am Beispiel satellitengesteuerter Landwirtschaft

Zukunft

Zukunft

Thiele: Es werden weiterhin mehr und mehr Daten generiert, die durch Cloud- und Plattformanbieter einfacher zu nutzen sind. Produktverbesserungen durch Data Science werden wir deshalb noch viel häufiger sehen. Der Bedarf ist also hoch. Allerdings glaube ich, dass die Kompetenzen von Data Scientists in anderen Berufen aufgehen und spezifischer werden. Viele Unternehmen betreiben aber auch schon lange Data Science – sie nennen es nur nicht so. Unternehmen mit digitalen Geschäftsmodellen sind dabei viel näher an der Nutzung ihrer Daten als zum Beispiel die Landwirtschaft und andere Bereiche, in denen noch nicht viel digitalisiert ist. Und es hat natürlich mit der Größe eines Betriebs zu tun, ob er in reine Datenanalyse oder Datenwissenschaften investiert.