Beschreibung
Wir suchen für ein spannendes Projekt bei einem e-Commerce Unternehmen in Hamburg einen Data Scientist User Profiles (m/w)Projektziel:
-Lieferung von Lookalikes zur Nutzung durch interne Nutzer (als Service wie auch über ein Self Service Tool) wie externe Nutzer (via DMP)
-Lieferung von synthetischen Daten zur Unterstützung der Definition von Datenverarbeitungsstrecken im Self Service Tool
-Das Team arbeitet agil (Scrum). Der Kunde stellt den Product Owner, den Scrum Master, Data Scientists und Data Architects. Die externen Mitarbeiter arbeiten als eng eingebundener Teil des Scrum Teams vor Ort
Mit welchen kritischen Ereignissen/Themen wird der Positionsinhaber konfrontiert?
-Big Data Infrastruktur mit hoher Informationssicherheit
-Verschiedenste Quelldatensysteme sowie heterogene Quelldaten
-Heterogene Qualität der Dokumentation bestehender zu berücksichtigender Prozesse und Datenflüsse bei dem Kunden
Tätigkeiten:
-Verstärkung des BI User Profiling Teams bei der Entwicklung und Auslieferung von Nutzerprofilen (Merkmale tw. auf Basis von Machine Learning) für unsere internen wie externen Datenkonsumenten (Online Marketing, Werbemittelsteuerung, Personalisierung)
-Entwicklung von Machine Learning Modellen zur Erstellung von Nutzerprofilen und zur Ermittlung statistischer Zwillinge
-Mitarbeit an der Bereitstellung synthetischer Daten, die statistische Eigenschaften von Produktivdaten erhalten um Privacy-preserving Data Mining zu ermöglichen
-Anwendung verschiedener Methoden des Statistical Learning auf großen Datenmengen mit Python, Scikit-Learn, PySpark und Spark
-Arbeiten im Kontext von u.a. Hadoop, Scala, Java, Spark etc.
-Selbständiges, kreatives Arbeiten im Scrum-Team und Fähigkeit zur eigenständigen Konzeption und Entwicklung von Lösungsansätzen im agilen Umfeld
Erforderliche Kenntnisse:
-Fundierte Kenntnisse in der Verarbeitung großer, heterogener Datenmengen mit Hadoop Ecosystem< (Yarn, Hive, Spark SQL und Spark ML); sicherer Umgang mit relationalen Datenbanken wie PostgreSQL, MySQL oder Oracle
-Starke und bewährte Entwickler-Skill in Python und Scala
-Scrum
-Analytisches Denkvermögen
-Fähigkeit zur Übersicht
-Kreativität
-Java/J2EE
-Scala
-Hadoop/Hive
-SQL
-Python
-Apache Spark
-Kommunikationsfähigkeit
Wünschenswert:
-Hadoop/Hive
-SQL
-Unix / Linux
Bei Interesse freuen wir uns auf Ihr aktuelles Profil im Word-Format (bitte kein PDF)! Reference :J Duration :3 Monate + Option (5Tage/Woche kein Remote) Location : Hamburg Languages : Deutsch / Englisch emagine GmbH Grohe, Joy T : F :