Was macht eigentlich ein Data Engineer im DB CargoLab?

Stage

Eine Frau in dunkler Kleidung lehnt auf einer Glasvitrine mit einer Miniatureisenbahn.
Ende des Sliders
17. September 2024, 11:16 Uhr

Artikel: Was macht eigentlich ein Data Engineer im DB CargoLab?

Data Engineer Sanja Klein verwandelt Rohdaten in wertvolle Informationen und treibt so die Digitalisierung des Schienengüterverkehrs voran.

Wenn Sanja Klein in die endlosen Reihen von Datenzeilen blickt, sieht sie nicht nur Zahlen – sie sieht Möglichkeiten. Als Data Engineer ist sie die unsichtbare Kraft hinter den Kulissen, die dafür sorgt, dass aus einer geballten Fülle von Rohdaten präzise und verwertbare Informationen werden. Im Asset Intelligence Center des DB CargoLabs fließen die großen Datenströme zusammen: Sanja Klein und ihre Kolleg:innen sind dafür verantwortlich, dass diese gesammelt, bereinigt, verarbeitet und verwaltet werden. 

Wegbereiterin für datengetriebene Entscheidungen

Mit ihrer Arbeit trägt Sanja Klein dazu bei, dass Entscheidungen bei DB Cargo auf der Grundlage von Daten getroffen werden können, denn sie sorgt zusammen mit Data Scientists und Fachexpert:innen dafür, dass die Daten für Analysen und Machine Learning-Modelle vorbereitet sind. Auf diese Weise wird nicht nur die Digitalisierung und Automatisierung von Prozessen vorangetrieben, sondern auch die Servicequalität gesteigert und der ökologische Fußabdruck verkleinert. Der Aufgabe des Data Engineers kommt somit auch eine Schlüsselrolle in der Umsetzung des Zielbildes der DB Cargo zur Automatisierung & Digitalisierung in der Produktion „Intelligentes System Schienengüterverkehr 2030+“ zu. Im Zielbild wird die Entwicklung des Schienengüterverkehrs entlang der Wertschöpfungskette bis zum Jahr 2030 und darüber hinaus abgebildet und in Form von Innovationsprojekten im DB CargoLab umgesetzt.

Steckbrief: Sanja Klein 
Schwarz-weißes Porträt einer blonden Frau vor grünem Hintergrund.
Schwarz-weißes Porträt einer blonden Frau vor grünem Hintergrund.
Quelle: DB Cargo
Sanja Klein

So bin ich zu DB Cargo gekommen: 
Ich habe mein Psychologiestudium mit dem Master abgeschlossen und danach im Bereich der bildgebenden Neurowissenschaften promoviert. In der wissenschaftlichen Arbeit war ich auch schon mit der Verarbeitung großer Datenmengen, komplexen Analysen und besonderen Herausforderungen an den Datenschutz konfrontiert. Ich habe gemerkt, dass mir diese Themen neben der Liebe zur Wissenschaft mindestens genau so viel Spaß machen und habe daher beschlossen, mich nach Abschluss der Promotion in diesem Bereich beruflich weiterzuentwickeln.

Diese Eigenschaften sollte man für meinen Job mitbringen:
Für die Arbeit als Data Engineer im DB CargoLab sind analytisches Denken und Problemlösungsfähigkeiten ebenso essenziell wie fundierte Programmierkenntnisse, insbesondere in Python und SQL. Ein gutes Verständnis von Datentypen und Datenstrecken, gepaart mit Teamfähigkeit, Kommunikationsstärke sowie Lernbereitschaft und Offenheit gegenüber neuen Technologien sind ebenfalls von großer Bedeutung.

Das mache ich gern in meiner Freizeit: 
Ich gehe gerne kreativen Hobbies nach, zum Beispiel Stricken oder Kochen, außerdem höre ich viel Musik und Podcasts. Ich interessiere mich besonders für aktuelle News aus der Tech-Szene und die Interaktionen zwischen Technologie und Mensch. Sport darf natürlich auch nicht fehlen, wenn man den ganzen Tag am Schreibtisch verbringt.



Leidenschaft für Daten und ständige Herausforderungen

In ihrer Funktion als Data Engineer folgt Sanja Klein jeden Tag der Leidenschaft, komplexe Probleme zu lösen und effiziente Datenlösungen zu entwickeln. Gemeinsam mit ihrem Team strebt sie danach, stets am Puls der Zeit zu bleiben und neueste Methoden anzuwenden. „Dadurch gibt es immer neue Herausforderungen und es kommt nie Langeweile auf“, so Sanja Klein. Ein besonderes Projekt-Highlight war die Arbeit an einer maschinellen Analyse zur automatischen Erkennung von Schäden an Güterwagen anhand von Fotos, die von Kamerabrücken an Rangierbahnhöfen aufgenommen wurden. Außerdem hat sie an einer intelligenten Lösung zur Zuführung schadhafter Wagen an Werkstätten mitgewirkt, basierend auf mathematischen Optimierungsmethoden.

Optimistischer Blick in die Zukunft

Die notwendigen Maßnahmen der Digitalisierung und Automatisierung, im Sinne einer erfolgreichen Zukunft im Schienengüterverkehr, führen zu einem steigenden Bedarf an qualitätsgesicherten Daten. Datengetriebene Lösungen bieten Potenzial und sind das Ergebnis der Tätigkeit von Data Engineers. Die Entwicklungsmöglichkeiten in diesem Bereich sind vielfältig: ob in spezialisierten technischen Rollen, der Data Science oder im Projektmanagement. Zusätzlich eröffnen kontinuierliche Weiterbildung und Zertifizierungen zahlreiche Chancen zur beruflichen Entwicklung. „Anfang dieses Jahres habe ich zum Beispiel die Microsoft Zertifizierung als Azure Data Engineer erhalten und arbeite kontinuierlich weiter an meinem Skillset“, erzählt Sanja Klein. So bleibt sie bestens gerüstet für die Herausforderungen und Chancen der Zukunft.
 

0911_BildTextmodul AIC

Ein Blick ins System des Asset Intelligence Centers AIC: Hier werden Daten für verschiedene Projekte analysiert, aufbereitet und zur Verfügung gestellt.

Die Oberfläche eines Programms zur Datenanalyse.
Die Oberfläche eines Programms zur Datenanalyse.
Quelle: DB Cargo AG