Beschreibung
Für einen unserer Kunden sind wir auf der Suche nach einem Data Scientist (m/w)Tätigkeiten:
Entwicklung eines automatischen Quality Assessments für fein granulare Zeitreihen
Entwicklung von Big Data ETL pipelines auf Basis gängiger open source Frameworks (Hadoop, Hive, Python, Spark)
Entwicklung von SQL Statements auf Basis spezifischer Anforderungen und Speicherung der Ergebnisse in SQL Datenbanken
Entwicklung von Modellen zur Bewertung der Datenqualität
Entwicklung von Prozess Komponenten zur Textanalyse für die Generierung von Anomalie Erklärungen
Erstellung von zugehörigen Dashboards (Tableau, HTML, JS)
Erstellung von Monitoringfunktionen, sowie Dokumentationen
Anforderungen:
Hadoop, Python, Spark, Hive
SQL
ETL
Tableau