Beschreibung
- Zusammenarbeit mit Developern und Data Scientists- Deployment von statistischen Modellen
- Sicherstellung des prototypischen Betriebes der Modelle
- Management Load Balancing und Performance des Hadoop Clusters
- Maintenance Repositories
- Verbesserungen der Deployment Prozesse inkl. Monitoring
- Durchführung von Schulungen (z.B. Nutzung von Git, Hadoop / Big Data Analytic Tools) für Data Scientists
- Support Data Scientists (z.B. Anwendung GIT Repository)
- Einbringen eigener Ideen zur Verbesserung Prozesse und Maintenance
- Austausch mit dem Schwester Projekt Analytic Stack auf IT Seite zu dedizierten Fragestellungen
- Eigene Ideen für Prozesse und Maintenance
Anforderung:
Apache Hadoop +++ (good), 2-4 yrs.
JavaEE (J2EE) +++ (good), 2-4 yrs.
Python +++ (good), 2-4 yrs.
Spark Mlib +++ (good), 2-4 yrs.
Hive / Impala +++ (good), 2-4 yrs.
GIT +++ (good), 2-4 yrs.
- Fundierte Erfahrungen im Big Data Umfeld mit Entwicklung und Betrieb von Big Data Applikationen und Analytics Systemen vorzugsweise Hadoop Technologie und Cloudera Distribution (z.B. Hive, Hue, Impala, Oozie, Pig, Spark, Sqoop)
- Erfahrung mit Linux Systemarchitekturen und Betriebsaufgaben im Big Data Umfeld
- Erfahrung in SCRUM Projekten
Projektstart: 18.07.2016
Projektende: 30.09.2016
Auslastung: 4 Tage / Woche
Leistungsort: Hamburg