SB
verfügbar

Letztes Update: 01.02.2024

Software-Entwickler mit Fokus auf Data Science, Machine Learning, Algorithmen-Entwicklung

Abschluss: Dr. rer. nat. (Informatik)
Stunden-/Tagessatz: anzeigen
Sprachkenntnisse: deutsch (Muttersprache) | englisch (gut)

Dateianlagen

Profile-StefanBietz_010224.pdf

Skills

Software-Entwicklung, Data Science & Engineering, Machine Learning, Algorithmik, Bildverarbeitung, Computer Vision, Python, C++, Scala, R, SQL, shell scripts, Spark, Pandas, Scikit-learn, OpenCV, Git, Azure, Databricks, Docker, Jira, Confluence, Eclipse, PyCharm, VS Code

Projekthistorie

02/2021 - bis jetzt
Data Engineerung / Data Science
(Energie, Wasser und Umwelt, >10.000 Mitarbeiter)

  • Betreuung und Ausarbeitung verschiedener Machine-Learning-Anwendungen von der Problemstellungsanalyse bis zur operativen Umsetzung
  • Statistische Analyse von statischen Daten und Zeitreihendaten
  • Umsetzung der Modelle sowohl als Explorations- als auch Produktivcode
  • Pflege von Datenaufbereitungs- und Feature-Engineering-Pipelines
  • Design und Implementierung von Machine-Learning-Lösungen zur Fehlervorhersage
  • Konzeption des Software-Designs
  • Fehleranalyse und -behebung für Produktivlösungen
  • Analyse und graphische Präsentation von Ergebnissen, u.a. in Dashboards
  • Migration bestehender Produktiv-Lösungen von HDInsight zu Databricks
  • Code Reviews

07/2022 - 04/2023
Computer Vision
(Energie, Wasser und Umwelt, >10.000 Mitarbeiter)

  • Entwicklung einer Machine-Learning-basierten Analyse von Satellitenbildern
  • Implementierung von Funktionalitäten zur Bildvorverarbeitung
  • Untersuchung von Augmentierungsverfahren zur Optimierung der Modellperformanz
  • Entwicklung eines anwendungsspezifischen Bild-Registrierungs-Algorithmus
  • Erstellung und Konfiguration von Azure-ML-Pipelines
  • Ergebnisvalidierung und Problemanalyse
  • Laufzeitanalyse und -optimierung
  • Entwicklung von Unit-Tests
  • Code-Reviewing

09/2020 - 09/2020
Data Engineering
E.ON Energie Deutschland GmbH (Energie, Wasser und Umwelt)

Implementation of a Python package for marketing control optimization on the basis of a non-linear regression modelling

  • Implementation of the regression model in Python based on a prototype developed with R
  • Implementation of a Genetic Algorithm for heuristic optimization
  • Design of the software architecture
  • Automatization of data transformation processes
  • Automated generation of validation plots
  • Unit test implementation
  • Development of profiling and benchmarking tests for runtime optimization
  • Code documentation

Python (Scikit-learn, Pandas, NumPy, SciPy, statsmodels), Jupyter, Git, GitLab, Sphinx, PyCharm


03/2018 - 06/2019
Bildverarbeitung
Qiagen (Pharma und Medizintechnik)

Entwicklung eines Bildverarbeitungsmoduls im Rahmen einer Mikroservice-basierten
Biotechnologie-Software-Suite
  • Code-Migration von Windows nach Linux
  • Schnittstellenimplementierung für Komponenten der Microservice-Architektur
  • Überarbeitung und Optimierung von Bildverarbeitungsalgorithmen u.a. im Hinblick auf Laufzeit- und Speichereffizienz
  • Konzeption und Implementierung von Test- und Validierungsstrategien
  • Pflege und Erweiterung der Software-Dokumentation
  • Code-Reviewing
Software-Entwicklung, Algorithmen-Optimierung, Test-Design
C++, Python, Shell-Skripte, Docker, Git, Markdown, UML, Bitbucket, Jira, Polarion, Confluence

11/2016 - 02/2018
Parallelisierung / Skalierung
Universität Hamburg

Optimierung eines Verfahrens zur Identifizierung ähnlicher Proteinbindetaschen im Hinblick auf die Verarbeitung großer Eingabedatenmengen

  • Automatisierung und Parallelisierung von Vorberechnungen zur Vorhaltung von Ergebnisdaten

  • Entwicklung von Datenbanken zur Verwaltung von Eingabe- und Ergebnisdaten

  • Algorithmische und technische Laufzeitoptimierung

  • Methodische Optimierung des Bindetaschenvergleichs

  • Erstellung von Test- und Trainingsdatensätzen

  • Trainieren der Scoring-Funktion

  • Konzeption und Umsetzung von Test- und Validierungsstrategien

C++, Scala, Python, R, SQL, Git, Gerrit, Eclipse, IntelliJ IDEA, PyCharm


05/2014 - 01/2016
Datenbank-Entwicklung
Universität Hamburg

Entwicklung einer Software zur Suche von ähnlichen Proteinen in biologischen Struktur-Datenbanken und zur automatisierte Erstellung und Aufbereitung von Datensätzen
  • Konzeption eines relationalen Datenbankschemas zur effizienten Verwaltung der für die Problemstellung relevanten Daten

  • Extraktion und Transformation der Quelldaten aus öffentlich zugänglichen Datenbanken und Einspielen der aufbereiteten Daten in die Zieldatenbank der entwickelten Software

  • Etablierung einer periodischen Aktualisierung der Datenbank

  • Implementierung und Integration diverser Filter- und Selektionsfunktionalitäten

  • Entwurf und Implementierung von Test- und Validierungsverfahren zur Analyse der resultierenden Anwendungs-Software

  • Automatisierte Auswertung und Visualisierung der Ergebnisdaten

Datenbank-, Algorithmen- und Software-Entwicklung, Data Mining
C++, Python, R, SQL, ETL, Git, Gerrit, Eclipse, PyCharm


09/2013 - 06/2014
Data Mining
Universität Hamburg

Mustererkennung in molekularen Datensätzen

  • Detektion ähnlicher Strukturen innerhalb eines Datensatzes sowie Ableitung differenzierender Muster zur Abgrenzung von Negativbeispielen

  • Adaption, Erweiterung und Implementierung etablierter Data-Mining-Verfahren zur Ableitung generischer Muster in graph-basierten Molekülrepräsentationen

  • Konzeption und Implementierung von Testverfahren

  • Integration in hausinterne Anwendungs-Software und GUI-Anbindung

Data-Mining, Algorithmen-Entwicklung, Software-Entwicklung
C++, Python, Data Mining, Git, Gerrit, Eclipse, PyCharm


06/2012 - 08/2013
Algorithmen-Entwicklung
Universität Hamburg (Öffentlicher Dienst)

Entwicklung eines Algorithmus zur Alignierung von Proteinkonformationen
  • Ursachenanalyse zur Identifikation methodischer Defizite bestehender Verfahren
  • Konzeption und Implementierung einer anwendungsfokussierten Lösungsstrategie
  • Auswahl und Aufbereitung von Testdatensätzen
  • Statistische Korrektheits- und Performanzanalyse des resultierenden Software-Moduls
  • Automatisierte Auswertung und Visualisierung der Ergebnisdaten
Algorithmen-Entwicklung, Software-Entwicklung, Test-Design
C++, R, Git, Eclipse

09/2010 - 05/2012
Predictive Modeling
Universität Hamburg

Entwicklung und Implementierung eines Software-Moduls zur Analyse und Vorhersage von molekularen Interaktionen auf Grundlage biologischer Strukturdaten
  • Konzeptionelle Optimierung und Trainieren einer Scoring-Funktion zur Bewertung molekularer Interaktionen
  • Entwicklung eines heuristischen Optimierungsverfahrens zur Lösung zyklischer Abhängigkeiten in komplexen Netzwerken
  • Entwurf und Implementierung von Test- und Validierungsverfahren zur Analyse der Vorhersageleistung
  • Automatisierte Auswertung und Visualisierung der Ergebnisdaten
Software-Entwicklung, Machine Learning, Test-Design
C++, R, Ruby, Git, Eclipse

05/2010 - 08/2010
Software-Entwicklung
BioSolveIT GmbH

Weiterentwicklung eines Vorhersageverfahrens zur Analyse von Wasserstoffpositionen
  • Vereinheitlichung und Erweiterung des Funktionsumfangs
  • Implementierung der entwickelten Konzepte und Integration in die bestehende Software-Bibliothek
  • Anbindung der erweiterten Software-Bibliothek in die hausintern entwickelte Software-Plattform
  • Konzeption und Ausarbeitung von Testverfahren für die entwickelten Softwarekomponenten
Software-Entwicklung, Test-Design
C++, Git, Eclipse

Reisebereitschaft

Verfügbar in den Ländern Deutschland, Österreich, Schweiz, Dänemark und Niederlande
Profilbild von Anonymes Profil, Software-Entwickler mit Fokus auf Data Science, Machine Learning, Algorithmen-Entwicklung Software-Entwickler mit Fokus auf Data Science, Machine Learning, Algorithmen-Entwicklung
Registrieren