Künstliche Intelligenz ist allgegenwärtig und verändert unsere Welt – auch die Arbeitswelt. Einer der Berufe, die viel Potential in der Zukunft haben, ist der vom Data Scientist. Aber welche Aufgaben ein Data Scientist überhaupt?
Am Anfang stehen die Daten
Diese gilt es zu sammeln, zu analysieren und in den richtigen Kontext zu bringen, um sie dann mittels intelligenter Algorithmen in Wissen und ausführbare Handlungen zu überführen. In vielen Bereichen der Industrie tun sich Unternehmen allerdings noch schwer, die Daten zu nutzen. Selbst wenn die Daten vorhanden sind, dann ist es alles andere als ein Selbstläufer, dass aus den Daten im Handumdrehen Wissen entsteht. Genau an dieser Stelle kommt der Data Scientist ins Spiel.
Leidenschaftlicher Datenversteher
Eine wichtige Eigenschaft des Data Scientist ist das Verhältnis zu Daten, zu denen er eine gewisse Leidenschaft und auch Neugier besitzen muss. Dabei muss er über die Zahlen hinaussehen, sie verstehen, interpretieren und ein Gefühl für sie entwickeln. Nur so kann er sie interpretieren, wichtige von weniger wichtigen unterscheiden und neue Erkenntnisse entwickeln. In der Mitte dieses Jahrzehnts prägte die Bundeskanzlerin Angela Merkel die Aussage „Daten sind der Rohstoff der Zukunft“. Und in der Tat werden Daten immer mehr zu einem Asset in den Unternehmen und das Wachstum geht exponentiell weiter.
Betrug die globale Datenmenge 2018 noch 33 Zettabyte, werden laut IDC für 2025 bereits 175 Zettabyte vorausgesagt. Hierzu benötigt er auf jeden Fall ein grundlegendes Verständnis zum Geschäft bzw. dem Szenario, in dem die Daten erhoben werden. So weiß er, welche Daten welche Werte annehmen können. Im Produktionsprozess erheben smarte Sensoren an Werkzeugmaschinen fortlaufend Daten, beispielsweise für Druck, Durchfluss oder auch Temperatur. Der Data Scientist muss die Werte kennen und sie verstehen, um sie auf Plausibilität zu prüfen und Fehler sowie Ausreißer zu erkennen. An dieser Stelle reden wir noch nicht von Algorithmen.
Liebe zum Detail
Ein nicht unwichtiger Anteil an Data Science Projekten gehört der Datenaufbereitung. Studien besagen, dass der zeitliche Anteil in Bezug auf das Gesamtprojekt bis zu 70% betragen kann. Das zeigt, wie wichtig es ist, die Daten aufzubereiten. Datenqualität und die durch Algorithmen berechneten Ergebnisse stehen damit in einem direkten Zusammenhang. Jeder, der schon einmal beispielsweise eine umfangreiche CSV- oder Textdatei in Excel importiert hat weiß, wie aufwendig es sein kann,
- Formate zu ändern,
- Daten zu verbinden oder zu trennen,
- Fehler zu finden und
- zu bereinigen.
Aber gerade an dieser Stelle bietet Excel mit Werkzeugen wie
- Power Query,
- Power Pivot und
- Power BI
hervorragende Werkzeuge, um Daten teilweise automatisiert zu bereinigen.
Magischer Mathematiker
KI wird oftmals als Zauber & Magie angepriesen. Ich schubse einfach irgendwelche Daten in die KI Blackbox und dann kommen ganz automatisch und wie von Zauberhand intelligente Zukunftsprognosen heraus. Nein – das ist nicht KI. Vielmehr ist KI 100% Mathematik – und 0% Magie. Der Data Scientist sollte neben der Leidenschaft für Daten auch ein Grundverständnis für Mathematik und Statistik haben. Gerade wenn es in einer späteren Phase um das Modellieren von Algorithmen geht, dann müssen Grundkenntnisse über mathematische und statistische Funktionen bekannt sein.
Überzeugter Problemlöser
Der Data Scientist ist ein Problemlöser. Ganz essentiell ist es, dass der Data Scientist mit allen Beteiligten das gleiche Verständnis für das Problem hat. Erst dann ist er in der Lage, mit den geeigneten Algorithmen eine Lösung zu finden. Zu Beginn eines Projektes müssen Beteiligte aus unterschiedlichen Bereichen, beispielsweise IT, Konstruktion und Produktion das Ziel des Projektes definieren und das gleiche Verständnis haben. Soll beispielsweise die „Overall Equipment Effectiveness (OEE)“ einer Produktionslinie erhöht werden, dann muss erarbeitet werden, welche Parameter Einfluß auf die OEE haben.
Modellierer und Programmierer
Stehen nun die Parameter fest, geht es an die Daten. In einem Konzept muss nun definiert werden, welche Daten benötigt werden, wo sich diese in welchem Format mit welchen Zugriffsrechten befinden und wie auf diese entsprechend zugegriffen werden kann. In der Regel geschieht das über eine entsprechende Modellierung der Daten. Hierfür ist ein grundlegendes Verständnis in der Datenbank- und Modellierungstechniken notwendig, um Datenmodelle und die entsprechenden Datenbankabfragen zu erstellen. Mit der IT-Architektur sollte er vertraut sein und für Abfragen sind Programmierkenntnisse wie beispielsweise in R oder Python von großem Vorteil.
Kommunikativer Geschichtenerzähler
Ein Data Scientist arbeitet in der Regel nicht zurückgezogen im Büro. Vielmehr ist es für die Aufgabe notwendig, sich mit unterschiedlichen Bereichen im Unternehmen auszutauschen und abzugleichen. So haben in der Regel Fachbereiche wie beispielsweise Produktion, Konstruktion, IT und Geschäftsführung jeweils recht unterschiedliche Sichtweisen auf ein Data Science Projekt. Diese gilt es entsprechend abzuholen und zu integrieren.
Daher geht es sehr viel auch um Storytelling und Visualisierung. Hier bereitet der Data Scientist die gewonnen Erkenntnisse idealerweise so auf, dass sie leicht verständlich zu interpretieren sind. Es geht darum, eine Geschichte zu erzählen – und sie auch zu verkaufen.
Job mit Perspektive
Der Job des Data Scientist ist gerade dabei, sich in vielen Unternehmen zu etablieren. Erste Stimmen stellen den Job allerdings schon wieder die Frage, ob diesen nicht bald Algorithmen übernehmen werden. Es ist unbestritten, dass Rechengeschwindigkeit und Leistungsfähigkeit der Algorithmen weiter exponentiell steigen werden. Vielleicht ist an dieser Stelle ein Blick auf die Entwicklung der Programmiersprachen der letzten zwei Dekaden sinnvoll.
Die Leistungsfähigkeit hat sich in raketenartiger Geschwindigkeit entwickelt – und es gibt immer noch Programmierer. Gerade die Vielschichtigkeit vom Data Scientist ist es, die sich eben nicht wegrationalisieren lässt. Das Geschäftsverständnis, die Individualität, Kreativität und auch Kommunikationsfähigkeit können bis auf weiteres nicht von einem Algorithmus übernommen werden.
Weitere Informationen:
Meine Daten sollen nicht in Google Analytics erfasst werden.
