Beschreibung
Aufgabe:Die Tätigkeiten fallen im Rahmen der Erweiterung einer bestehenden Targeting-Lösung an. Diese trainiert anhand von Nutzungsdaten analytische Modelle, um eine Zugehörigkeit von Nutzern zu Kundensegmenten (Familie, Single, ...) vorherzusagen. Die Anwendung ist in Scala und Python implementiert und läuft auf einem Hadoop-Cluster. Sie besteht grob aus Komponenten für Datenintegration, Modelltraining, Modellvalidierung und Segment-Vorhersage. Der Data Engineer wird in folgenden Bereichen tätig sein:
- Entwurf und Implementierung von Komponenten zur Datenintegration aus strukturierten und unstrukturierten Datenquellen
- Aufbereitung und Harmonisierung der Daten für Machine Learning Modelle
- Entwicklung von Workflows zur automatisierten Verarbeitung der Daten
- Test und Qualitätssicherung der entwickelten Komponenten
Anforderung:
- Kenntnisse im informationstechnischen Bereich (Schwerpunkt)
- Sehr gute Programmierkenntnisse in Python, Spark, Scala
- fundierte Erfahrung in der Entwicklung von ETL-Prozessen auf Big Data Infrastrukturen
Wünschenswert:
- Erfahrung in der Einrichtung und Konfiguration von Hadoop-Komponenten von Vorteil
- Methodisches Verständnis von Tracking-, Profiling- und Personalisierungstechnologien von Vorteil
Umgebung/Sonstiges:
- Auslastung 80% (3-4 Tage) davon 3 Tage onsite/ 1 Tag remote
Kontakt: bzw.
Beginn: Dezember 2017
Dauer: 28.02.2017
Branche: Medien/Unterhaltung