ML
verfügbar

Letztes Update: 03.01.2024

Senior Data Scientist / Data Engineer / Software-Entwickler Machine Learning

Abschluss: Master of Science Informationswirtschaft
Stunden-/Tagessatz: anzeigen
Sprachkenntnisse: deutsch (Muttersprache) | englisch (verhandlungssicher) | französisch (Grundkenntnisse)

Skills

Programmiersprachen: Python, SQL, Scala, R, Java, JavaScript, TypeScript, PHP

Tools und Methoden: Rasa / RasaX, Langchain, OpenAI, ChatGPT, NumPy, Pandas, scikit-learn, SciPy, Matplotlib, MLflow, TensorFlow, PyTorch, Keras, Spacy, Duckling, Kedro, Apache Mahout, Akka, Elastic Search, ReactJS, Microsoft Azure, Spring Boot, Play Framework, Angular, RxJS, Google Polymer, Selenium, Weka, Jupyter Notebooks, DVC, CI/CD, Unittests, SSH, Docker, Spark, Oracle, Kubernetes, Linux, webscraping, JIRA, Confluence, Scrum, Gitlab, Github, Git

AI/ML/Data Science: Voice Bots  Chat Bots, Neuronale Netze (LSTM, RNN, CNN, Transformer, Attention-Modelle, GAN), Natural Language Understanding / Processing, Transfer Learning, Zeitreihenanalyse, Time Series Forecast, Textklassifikation, Reading Comprehension / Question Answering, Translation, Information Retrieval, Support Vector Machines, logistische Regression, Hidden Markov Models, Autoencoder, Principal Component Analysis, ETL-Prozesse, Association Rule Mining; XGBoost

Stärken: Erfahrung mit Softwareentwicklung und Machine Learning in Großkonzernen
Weitreichende Kenntnisse der Softwareentwicklung (Architektur, Backend, Frontend)
Business-orientierte Sicht

Projekthistorie

09/2023 - bis jetzt
Project Lead: AVV Prüfung
2B Advice GmbH (Internet und Informationstechnologie)

Entwicklung eines Systems zur automatisierten Prüfung von Auftragsverarbeitungsverträgen auf Basis von Large Language Models (LLMs).
                                                                  Aufgaben: Leitung des Projekts und Koordination inklusive der Kundenkommunikations und Erfassung der Anforderungen; Entwurf und Bereitstellung des Services als API innerhalb eines Docker-Containers;
                                                                  Programmiersprachen: Python

Tools: Git, Jira, GitLab CI/CD, Docker, Azure OpenAI, FastAPI, Chainlit

AI/ML/Data Science: Textextraktion, Large Language Modelle

09/2023 - bis jetzt
Senior Machine Learning Engineer: Recommender System für Mitarbeiterprofile
AMAI GmbH (Internet und Informationstechnologie)

Entwicklung eines Matching-Algorithmus, der basierend auf einer Projektanfrage passende Mitarbeiterprofile vorschlägt und die bestehende HR Infrastruktur integriert ist.
                                                                  Aufgaben: Aufbereitung und Indexierung der Mitarbeiterprofile mit Hilfe von Azure Cognitive Search; Konzeption und Entwicklung des Matching Algorithmus; Integration des Algorithmus in die bestehende HR Software.
                                                                  Programmiersprachen: Python

Tools: Git, GitLab CI/CD, Azure OpenAI, Azure Cognitive Search

AI/ML/Data Science: Textextraktion, Datenanalyse, Large Language Modelle

10/2021 - 11/2023
Data Scientist, Product Owner: Aufbau eines neuen SOX Compliance Prozesses
Telefónica (Telekommunikation)

Im Rahmen der SOX Compliance Prüfung soll ein Monitoring von umsatzrelevanten Prozessen erfolgen. Hierzu werden bestehende Prozesse durch neue Prozesse auf Basis einer internen Zeitreihen-Analyse-Plattform abgelöst. Das Projektteam übernimmt dabei die Verantwortung für den gesamten Prozesslebenszyklus von der Sichtung des bisherigen Standes, Konzeption, Entwicklung bis zum Deployment.
                                                                  Aufgaben: Konzeption des neuen SOX-Prozesses; Verstehen der bestehenden CDR-Daten innerhalb von einem umsatzrelevanten Abschnitt; Visualisieren der Fehlerfälle; Anpassung und Konfiguration der internen Zeitreihen-Analyse-Plattform; Entwicklung und Implementierung eines Workflows zur Bearbeitung auftretender Fehler; Erstellen unterschiedlicher Visualisierungen, um einen Gesamtüberblick der Prozesse zu ermöglichen.
                                                                  Programmiersprachen: Python, SQL

Tools: Tableau, Oracle, Spark, JIRA

AI/ML/Data Science: Zeitreihenanalyse und -prognose, Anomalieerkennung

01/2021 - 11/2023
Developer; Data Scientist: Absatzplanung von Telekommunikationsprodukten
Telefónica (Telekommunikation)

Neuentwicklung einer Plattform für die einfache Absatzplanung auf Regions-, Bezirks- und Händlerebene.
                                                                  Aufgaben: Schwächeanalyse der gegenwärtig eingesetzten Anwendung; Analyse und Aufnahme von Anforderungen; Entwurf und Entwicklung der neuen Anwendung.
                                                                  Programmiersprachen: JavaScript; TypeScript; Java; HTML

Tools: Spring Boot; Docker; Angular

07/2023 - 09/2023
Senior Machine Learning Engineer: Analyse von Gesetzestexten mit KI
AMAI GmbH (Internet und Informationstechnologie)

Entwicklung einer Software, die Analysten dabei unterstützt Stellungnahmen zu Gesetzesentwürfen auszuwerten.
                                                                  Aufgaben: Leitung des Projekts und Koordination; Entwurf der Software-Architektur und des ER-Schemas; Entwicklung der Steamlit-Anwendung; Deployment der Anwendung auf Kubernetes; Textextraktion und -verarbeitung mittels Large Language Modellen.
                                                                  Programmiersprachen: Python, SQL

Tools: Streamlit, Git, GitLab CI/CD, Docker, Kubernetes, Poetry, Jira, Confluence, Azure

AI/ML/Data Science: Textextraktion, Datenanalyse, Large Language Modelle

07/2023 - 07/2023
Senior Machine Learning Engineer: Voicebot für Hotel-Empfang
AMAI GmbH (Internet und Informationstechnologie)

Entwicklung eines sprachbasierten und telefonisch erreichbaren Systems zur Beantwortung von Fragen für eine Hotel unter Verwendung von Large Language Models (LLMs).
                                                                  Aufgaben: Entwicklung einer neuartigen Architektur zur Verwendung von Large Language Models in Voicebots. Evaluation und Anbindung verschiedener Streaming-STT und -TTS Dienstleistern im Bezug auf Qualität und Geschwindigkeit. Durchführung von Experimenten zur Verbesserung des User Experience.
                                                                  Programmiersprachen: Python

Tools: GitLab CI/CD, Docker, Poetry, Jira, Confluence, Azure

AI/ML/Data Science: Voice Bots, Chat Bots, ChatGPT, OpenAI, Azure, Elevenlabs, Twilio

01/2023 - 06/2023
Senior Machine Learning Engineer: "Terminfinder" Voicebot
Deutsche Telekom AG (Telekommunikation)

Entwicklung eines sprachbasierten und telefonisch erreichbaren Dialogsystems zur Buchung von Arztterminen.
                                                                  Aufgaben: Stabilitätsverbesserungen (Analyse und Behebung von Fehlern in der Business-Logik und in den ML-Komponenten, Erweiterung das Testframeworks und Erhöhung der Testabdeckung), welche maßgeblich zur Steigerung der erfolgreichen Buchungen um 15% beigetragen haben. Entwicklung und Vergleich verschiedener Modelle für die Zuordnung von Leistungsbeschreibungen / Symptomen der Nutzer zu angebotenen Leistungen. Durchführung von Experimenten zur Verbesserung der Intentstruktur und dadurch erzielte Verbesserung der Klassifikationsgenauigkeit aller Intents.
                                                                  Programmiersprachen: Python

Tools: Rasa / Rasa X, GitLab CI/CD, Docker, Poetry, Jira, Confluence, Pydantic, Azure

AI/ML/Data Science: Voice Bots, Chat Bots, Gensim, FastText, Spacy, Duckling, chatette, PyTorch, Natural Language Processing (NLP), Natural Language Understanding (NLU), Transformers (Med-BERT)

05/2020 - 12/2020
Konsistenzanalyse in Provisionierungsprozessen von Telekommunikationsanwendungen
Telefónica (Telekommunikation)

Rolle: Data Scientist
Programmiersprachen: Python
Kenntnisse: ETL-Prozesse
Eingesetzte Produkte: SQL, Oracle, Docker, PySpark

Konsistenzanalyse zwischen verschiedenen Haupt- und Subsystemen auf der Grundlage von Oracle-Datenbanken; Entwicklung mehrerer ETL-Prozesse zur kontinuierlichen Fehleranalyse zwischen den Systemen; Ad-hoc-Analyse der Surfgeschwindigkeit von Kunden; Entwicklung eines ETL-Prozesses zur kontinuierlichen Fehleranalyse zur Surfgeschwindigkeit von Kunden.

02/2020 - 05/2020
Extraktion von Schlüsselwörtern aus Webseiten
Innoscripta GmbH (Internet und Informationstechnologie)

Rolle: Data Scientist
Kenntnisse: Natural Language Processing, Information Retrieval
Programmiersprachen: Python, JavaScript
Eingesetzte Produkte: networkx, scikit-learn, Matplotlib, Numpy, Pandas, Jupyter, Lab/Notebooks, Selenium, Scrapy, Git, Excel

Entwicklung und Implementierung eines Algorithmus für die Bestimmung von Schlagwörtern für Websiten; Erstellung eines Webseitencrawlers zur Extraktion sichtbaren Textes von Websiten; Erstellung einer Demo (Frontend, API) für den Algorithmus.

01/2020 - 02/2020
Entwicklung Web-Service zur Vorhersage von Zolltarifnummern
AMAI GmbH / Kundenprojekt (Transport und Logistik)

Rolle: Data Scientist & Software-Entwickler
Kenntnisse: Natural Language Processing, Machine Learning, Deep Learning, Machine Learning as a Service
Eingesetzte Produkte: ElasticSearch, Scrapy, Web Scraping, TensorFlow, Keras, MySQL, Docker, Jupyter, Flask, NumPy, scikit-learn, SciPy, Text2Vec, Git, Microsoft Azure

Konzeption und Implementierung eines Web-Service zur Vorhersage von Zolltarifnummern anhand von Produktbeschreibungen.

• Vergleich von ElasticSearch und Maschinellen Lernverfahren
• Evaluation und Training von Textklassifikationsmodellen
• Flask Server with RESTful API Design

12/2019 - 01/2020
Evaluation ML Verfahren für Time Series Analysis
AMAI GmbH / Kundenprojekt

Rolle: Data Scientist
Kenntnisse: Machine Learning, Time Series Analysis, Deep Learning
Eingesetzte Produkte: TensorFlow, Docker, Jupyter, Git, Microsoft Azure

Komparative Evaluation von statistischen Modellen und von Deep Learning Modellen zur Vorhersage von univariaten und multivariaten Zeitreihen im Rahmen eines Kundenprojektes.

11/2019 - 12/2019
Entwicklung mehrerer ML Web-Demos
AMAI GmbH

Rolle: Data Scientist & Software-Entwickler
Kenntnisse: Machine Learning, Machine Learning as a Service, Deep Learning, Natural Language Processing, Natural Language Understanding, Computer Vision
Eingesetzte Produkte: Python, Docker, TensorFlow, PyTorch, Torch, TensorFlowJS, ReactJS, Jupyter, Git, Microsoft Azure

Veranschaulichung von KI Anwendungsfällen unter https://demos.am.ai

• Semantische Suche und Training eines deutschsprachigen Question Answering Modells
• Eigennamenerkennung und Text-Anonymisierung
• Maschinelle Übersetzung (Deutsch/Englisch, Englisch/Deutsch)
• Visuelle Segmentierung via Webcam
• Web-Oberfläche mittels ReactJS
• Cloud-Deployment via Kubernetes auf Microsoft Azure


01/2015 - 10/2019
Entwicklung eines Recommender Systems für Nutzerprofile
Price Now UG

Rolle: Data Scientist & Software-Entwickler
Kenntnisse: Recommender Systeme, Machine Learning
Eingesetzte Produkte: Scala, Apache Mahout

01/2015 - 10/2019
Plattform zur automatisierten Überwachung von Webquellen nach Produktrückrufen
Datalyxt GmbH

Rolle: Data Scientist & Software-Entwickler
Kenntnisse: Machine Learning
Eingesetzte Produkte: Java, JavaScript, Spring Boot, Weka, Google Polymer, Selenium, Web Scraping
 
  • Aufbau einer Plattform zur automatisierten Überwachung von Webquellen nach Produktrückrufen
  • Entwicklung eines Webseiten-Segmentierungsverfahrens

01/2013 - 12/2014
Anbindung eines SaaS Produktes an diverse Shopsysteme
Price Now UG

Rolle: Software-Entwickler
Eingesetzte Produkte: Scala, PHP, JavaScript, Play Framework, Google Polymer
 
  • Anbindung eines SaaS Produktes an diverse Shopsysteme
  • Entwicklung einer Administrationsoberfläche für ein E-Mail Marketing Produkt

08/2012 - 10/2012
Ausarbeitung von Analysewerkzeugen für CAD Software Bausteine
Julius Berger International

Rolle: Praktikant

Zertifikate

Apache Spark (TM) SQL for Data Analysts
Databricks
2023
Essential Design Principles for Tableau
Coursera
2021
Visual Analytics with Tableau
Coursera
2021
Fundamentals of Visualization with Tableau
Coursera
2021

Reisebereitschaft

Verfügbar in den Ländern Deutschland, Österreich und Schweiz
- grundsätzlich international verfügbar
- bevorzugt Karlsruhe + ca. 300km Radius (Frankfurt Main, München, Mannheim, Köln, Düsseldorf)
Profilbild von Anonymes Profil, Senior Data Scientist / Data Engineer / Software-Entwickler Machine Learning Senior Data Scientist / Data Engineer / Software-Entwickler Machine Learning
Registrieren