Der Download dieser Datei ist nur mit einem kostenpflichtigen Business- oder Enterpriseaccount möglich.
Skills
Python, Jupyter, Keras, Sklearn, Pandas
Cloud, Azure, AWS, Databricks
MLOps, DevOps, CI/CD
Infrastructure as Code
Data Engineering
ETL/ELT
Data and Machine Learning Platforms
R, Tidyverse, mlr
Machine Learning
Deep Learning
Natural Language Processing
Statistical Modelling
Data Analysis
Advanced Analytics
Clustering
Predictive Analytics
Projekthistorie
08/2023
-
08/2023
Lead Research Engineer
(Öffentlicher Dienst, 1000-5000 Mitarbeiter)
Extraktion von Sentiment über Aktienpreise aus multimodalen Daten (Text, Bilder und Metadaten)
Design einer Streaming Komponente zur Extraktion von Reddit-Posts basierend auf AWS Lambda
Design und Implementierung einer Daten-Pipeline zur Sentimentanalyse basierend auf OCR und VADER auf EC2s und DynamoDB
Aggregation und Aufbereitung der Ergebnisse mit Python und Pandas
Wissenschaftliche Veröffentlichung des resultierenden Datensatzenes: https://www.sciencedirect.com/science/article/pii/S2352340922009623#bib0005
04/2021
-
12/2022
Projektleiter und Lead Machine Learning Engineer
(Konsumgüter und Handel, 1000-5000 Mitarbeiter)
Konzeption und Implementierung einer KI-Infrastruktur zur automatisierten Berechnung eines Kundenwertmodells.
Design eines CI/CD Workflows und einer Cloud Infrastruktur zur Produktivierung der Applikation
Aufsetzen einer CI/CD Pipeline in Azure DevOps zum automatisierten Deployment der Applikation in einem Azure Machine Learning Workspace
Orchestrierung des Modells mithilfe von Pipeline-as-Code in Azure Machine Learning
Konzeption und Implementierung eines privaten Python Packages, gehosted in Azure DevOps Artifactory, zur Bündelung häufig genutzter Funktionalitäten
Konzeption und Implementierung von Daten Pipelines mit Apache Spark und Python
Fachliche Führung von bis zu drei Data Scientists / ML-Engineers
11/2021
-
04/2022
Lead Data Engineer
(Automobil und Fahrzeugbau, >10.000 Mitarbeiter)
Konzeption und Implementierung einer Daten- und Machine Learning Plattform auf Microsoft Azure zur Vorhersage der Kapazität von Knotenpunkten einer Outbound Supply Chain.
Fachliche Führung von drei Data Engineers
Design und Implementierung einer Datenplattform basierend auf Databricks Delta Lake
Orchestrierung der ETL-Prozesse mithilfe von Pipeline-as-Code in Azure Data Factory
Design eines MLOps Konzepts
Design und Implementierung einer CI/CD Pipeline in Azure DevOps zum automatisierten Deployment der Applikation in Azure Databricks
Bereitstellung der Daten über einen Databricks SQL-Endpunkt
Beratung des Kunden zu Best Practices zum Produktivieren von Machine Learning Modellen
10/2020
-
04/2021
Projektleiter und Machine Learning Engineer
(Automobil und Fahrzeugbau, >10.000 Mitarbeiter)
Konzeption und Implementierung eines Klassifikationssystems mit vorgelagerter ETL-Pipeline und anschließender Visualisierung der Ergebnisse für den Endanwender.
Weiterentwicklung der Daten-Pipeline für die Aufbereitung und Zusammenführung von Rohdaten mit Apache Spark
Weiterentwicklung der Daten-Pipeline für die Aufbereitung und Zusammenführung von Rohdaten mit Apache Spark
Training von Machine Learning Modellen zur Vorhersage bereits bekannter Schadensbilder
Clustering von nicht analysierten Schadenfällen zur Erkennung möglicher neuartiger Schadensbilder
Analyse und Bewertung der Vorhersagen des Klassifikations- bzw. Clusteringsystems
Weiterentwicklung der Machine Learning Pipelines
Workflow Orchestrierung in Azure Data Factory und Deployment von Tasks auf Databricks
Einführung der Möglichkeit eines Delta Load und Umstellung auf das Databricks spezifische Delta Format