Beschreibung
Sehr geehrte Damen und Herren,nachstehend eine Anfrage bei der wir aktuell Unterstützung benötigen.
Vielleicht ist es ja ein Thema für Sie?
Positionsbezeichnung: Data Scientist (m/w)
Projektbeschreibung: Für einen unserer Kunden suchen wir einen Data Scientist.
- Verstärkung des BI User Profiling Teams bei der Entwicklung und Auslieferung von Nutzerprofilen (Merkmale tw. auf Basis von Machine Learning) für unsere internen wie externen Datenkonsumenten (Online Marketing, Werbemittelsteuerung, Personalisierung)
- Entwicklung von Machine Learning Modellen zur Erstellung von Nutzerprofilen und zur Ermittlung statistischer Zwillinge
- Mitarbeit an der Bereitstellung synthetischer Daten, die statistische Eigenschaften von Produktivdaten erhalten um Privacy-preserving Data Mining zu ermöglichen
- Anwendung verschiedener Methoden des Statistical Learning auf großen Datenmengen mit Python, Scikit-Learn, PySpark und Spark
- Arbeiten im Kontext von u.a. Hadoop, Scala, Java, Spark etc.
- Selbständiges, kreatives Arbeiten im Scrum-Team und Fähigkeit zur eigenständigen Konzeption und Entwicklung von Lösungsansätzen im agilen Umfeld
Anforderungen: Mit welchen kritischen Ereignissen/Themen wird der Positionsinhaber konfrontiert?
- Big Data Infrastruktur mit hoher Informationssicherheit
- Verschiedenste Quelldatensysteme sowie heterogene Quelldaten
- Heterogene Qualität der Dokumentation bestehender zu berücksichtigender Prozesse und Datenflüsse
Projektziel:
- Lieferung von Lookalikes zur Nutzung durch interne Nutzer (als Service wie auch über ein Self Service Tool) wie externe Nutzer (via DMP)
- Lieferung von synthetischen Daten zur Unterstützung der Definition von Datenverarbeitungsstrecken im Self Service Tool
- Das Team arbeitet agil (Scrum). Unser Kunde stellt den Product Owner, den Scrum Master, Data Scientists und Data Architects. Unsere externen Mitarbeiter arbeiten als eng eingebundener Teil des Scrum Teams vor Ort
Berufserfahrung und besondere Kenntnisse:
- Fundierte Kenntnisse in der Verarbeitung großer, heterogener Datenmengen mit Hadoop Ecosystem< (Yarn, Hive, Spark SQL und Spark ML); sicherer Umgang mit relationalen Datenbanken wie PostgreSQL, MySQL oder Oracle
- Starke und bewährte Entwickler-Skill in Python und Scala
Einsatzort: PLZ 2
Startdatum: 01.02.2017
Enddatum: 30.04.2017
Sind Sie aktuell verfügbar und an dem Projekt interessiert?
Auf Ihr Feedback freue ich mich und stehe Ihnen selbstverständlich gerne für Fragen zur Verfügung.
Mit freundlichen Grüßen
Janine Peter
Partner Manager