In diesem Blogeintrag soll es mehr um die Arbeitskultur, die täglichen Aufgaben und die Räumlichkeiten gehen.
Das Team der Data Science Engineers besteht mittlerweile aus 10 Leuten. Als ich angefangen habe, waren es noch 4. Innerhalb des Teams wird Englisch gesprochen, da viele Kolleg*innen aus dem Ausland nach Deutschland für diesen Job oder ein Studium gezogen sind und nicht alle auf fachlichem Niveau Deutsch sprechen. Ich persönlich finde das cool, weil man viel über andere Kulturen lernen kann und ich die Möglichkeit habe, mich auch auf Englisch auszutauschen.
Als Data Science Engineer kann man, je nach Wohnsitz, entweder von Braunschweig oder Berlin aus arbeiten. Das Büro in Braunschweig liegt im Hauptsitz von NewYorker an der Hansestraße, wo auch ich arbeite. Die Möglichkeit, im Homeoffice zu arbeiten, gibt es zwar grundsätzlich, allerdings ist es offiziell nicht für die Mitarbeitenden in Braunschweig erlaubt. Vereinzelt, etwa bei Arztterminen, kann dies jedoch genehmigt werden. Für mich als Werkstudent ist das in Ordnung, da ich im Büro durch direktes Fragen mehr lernen kann und ich mich im Team auch wohlfühle. Bei meinen Kollegen (Vollzeitkräften) gehen die Meinungen dazu jedoch auseinander.
Es gibt auch eine Kantine, wobei man manchmal Glück mit den angebotenen Gerichten haben muss. Für manche vielleicht wichtig: Es gibt dort vegetarische Optionen, aber veganes Essen ist quasi unmöglich.
Klassische tägliche Aufgaben gibt es in unserem Team eigentlich nicht. Die einzige Routineaufgabe besteht darin, zu prüfen, ob die Daten-Pipelines (z. B. vom Data Lake) über Nacht erfolgreich durchgelaufen sind. Diese Aufgabe übernehmen bei uns sogenannte Sherlocks im Team. Ansonsten geht es darum, auf Änderungen in den Datenbanken zu reagieren und allgemein die Datenqualität zu verbessern. So entstand auch meine derzeitige Aufgabe. In der Codebase des Data Lakes werden viele Tabellen über sogenannte Primärschlüssel miteinander gejoined/verbunden. Ich teste gerade, ob die Vereinheitlichung dieser Primärschlüssel durch das Hochstellen einiger ausgewählter Spalten die Joins in der Codebase optimiert. Optimieren bedeutet in diesem Fall, dass sich mehr Zeilen in der Ergebnisstabelle befinden. Der aktuelle Stand ist, dass sich in zwei Tabellen tatsächlich mehr Zeilen befinden. Derzeit prüfe ich noch, ob die neuen Informationen dieser Zeilen sinnvoll sind, sprich, ob sie den Geschäftsprozessen von NewYorker nicht widersprechen.