Beschreibung
Für unser Team bei unserem Kunden suchen wir Unterstützung im Data Science Bereich.Aufgaben
- Aufbau und Weiterentwicklung eines ETL- und Machine Learning-Frameworks für die automatisierte Erkennung von Anomalien bei Zeitreihendaten mit Python/Pyspark, Oracle, Hadoop und Hive
- Proof of Concepts für die Anwendung verschiedener maschineller und Deep Learning-Techniken auf Zeitreihendaten, um Kausalitäten zu erkennen
- Entwicklung von SQL Statements auf Basis spezifischer Anforderungen und Speicherung der Ergebnisse in SQL Datenbanken
- Erstellung von Monitoringfunktionen, sowie Dokumentationen
- Dockerisierung bestehender ETL-Prozesse und Integration in Continuous-Integration/Continuous-Delivery-Pipelines
Erfahrung in Python
Data Science Verständnis für Modelle, Training, Inferencing
Grundverstehen von Web Servern / REST
Arbeiten mit Containern, z.B. Docker
Erfahrung mit Public Cloud
Kenntnisse von Zeitreihenanalysen wie (S)ARIMA
Erfahrung mit Kubernetes
Erfahrung mit Java Spring oder ähnlichem
Bash-Scripting Kenntnisse
Data Science mit Python-Libraries wie statsmodels, Sklearn, pandas
Erfahrung mit Azure und insbesondere Azure Kubernetes Service
Skills in PySpark & Databricks