Schlagwörter
Skills
Projekthistorie
- Betreuung und Ausarbeitung verschiedener Machine-Learning-Anwendungen von der Problemstellungsanalyse bis zur operativen Umsetzung
- Statistische Analyse von statischen Daten und Zeitreihendaten
- Umsetzung der Modelle sowohl als Explorations- als auch Produktivcode
- Pflege von Datenaufbereitungs- und Feature-Engineering-Pipelines
- Design und Implementierung von Machine-Learning-Lösungen zur Fehlervorhersage
- Konzeption des Software-Designs
- Fehleranalyse und -behebung für Produktivlösungen
- Analyse und graphische Präsentation von Ergebnissen, u.a. in Dashboards
- Migration bestehender Produktiv-Lösungen von HDInsight zu Databricks
- Code Reviews
- Entwicklung einer Machine-Learning-basierten Analyse von Satellitenbildern
- Implementierung von Funktionalitäten zur Bildvorverarbeitung
- Untersuchung von Augmentierungsverfahren zur Optimierung der Modellperformanz
- Entwicklung eines anwendungsspezifischen Bild-Registrierungs-Algorithmus
- Erstellung und Konfiguration von Azure-ML-Pipelines
- Ergebnisvalidierung und Problemanalyse
- Laufzeitanalyse und -optimierung
- Entwicklung von Unit-Tests
- Code-Reviewing
Implementation of a Python package for marketing control optimization on the basis of a non-linear regression modelling
- Implementation of the regression model in Python based on a prototype developed with R
- Implementation of a Genetic Algorithm for heuristic optimization
- Design of the software architecture
- Automatization of data transformation processes
- Automated generation of validation plots
- Unit test implementation
- Development of profiling and benchmarking tests for runtime optimization
- Code documentation
Python (Scikit-learn, Pandas, NumPy, SciPy, statsmodels), Jupyter, Git, GitLab, Sphinx, PyCharm
Biotechnologie-Software-Suite
- Code-Migration von Windows nach Linux
- Schnittstellenimplementierung für Komponenten der Microservice-Architektur
- Überarbeitung und Optimierung von Bildverarbeitungsalgorithmen u.a. im Hinblick auf Laufzeit- und Speichereffizienz
- Konzeption und Implementierung von Test- und Validierungsstrategien
- Pflege und Erweiterung der Software-Dokumentation
- Code-Reviewing
C++, Python, Shell-Skripte, Docker, Git, Markdown, UML, Bitbucket, Jira, Polarion, Confluence
Optimierung eines Verfahrens zur Identifizierung ähnlicher Proteinbindetaschen im Hinblick auf die Verarbeitung großer Eingabedatenmengen
-
Automatisierung und Parallelisierung von Vorberechnungen zur Vorhaltung von Ergebnisdaten
-
Entwicklung von Datenbanken zur Verwaltung von Eingabe- und Ergebnisdaten
-
Algorithmische und technische Laufzeitoptimierung
-
Methodische Optimierung des Bindetaschenvergleichs
-
Erstellung von Test- und Trainingsdatensätzen
-
Trainieren der Scoring-Funktion
-
Konzeption und Umsetzung von Test- und Validierungsstrategien
C++, Scala, Python, R, SQL, Git, Gerrit, Eclipse, IntelliJ IDEA, PyCharm
-
Konzeption eines relationalen Datenbankschemas zur effizienten Verwaltung der für die Problemstellung relevanten Daten
-
Extraktion und Transformation der Quelldaten aus öffentlich zugänglichen Datenbanken und Einspielen der aufbereiteten Daten in die Zieldatenbank der entwickelten Software
-
Etablierung einer periodischen Aktualisierung der Datenbank
-
Implementierung und Integration diverser Filter- und Selektionsfunktionalitäten
-
Entwurf und Implementierung von Test- und Validierungsverfahren zur Analyse der resultierenden Anwendungs-Software
-
Automatisierte Auswertung und Visualisierung der Ergebnisdaten
Datenbank-, Algorithmen- und Software-Entwicklung, Data Mining
C++, Python, R, SQL, ETL, Git, Gerrit, Eclipse, PyCharm
Mustererkennung in molekularen Datensätzen
-
Detektion ähnlicher Strukturen innerhalb eines Datensatzes sowie Ableitung differenzierender Muster zur Abgrenzung von Negativbeispielen
-
Adaption, Erweiterung und Implementierung etablierter Data-Mining-Verfahren zur Ableitung generischer Muster in graph-basierten Molekülrepräsentationen
-
Konzeption und Implementierung von Testverfahren
-
Integration in hausinterne Anwendungs-Software und GUI-Anbindung
Data-Mining, Algorithmen-Entwicklung, Software-Entwicklung
C++, Python, Data Mining, Git, Gerrit, Eclipse, PyCharm
- Ursachenanalyse zur Identifikation methodischer Defizite bestehender Verfahren
- Konzeption und Implementierung einer anwendungsfokussierten Lösungsstrategie
- Auswahl und Aufbereitung von Testdatensätzen
- Statistische Korrektheits- und Performanzanalyse des resultierenden Software-Moduls
- Automatisierte Auswertung und Visualisierung der Ergebnisdaten
C++, R, Git, Eclipse
- Konzeptionelle Optimierung und Trainieren einer Scoring-Funktion zur Bewertung molekularer Interaktionen
- Entwicklung eines heuristischen Optimierungsverfahrens zur Lösung zyklischer Abhängigkeiten in komplexen Netzwerken
- Entwurf und Implementierung von Test- und Validierungsverfahren zur Analyse der Vorhersageleistung
- Automatisierte Auswertung und Visualisierung der Ergebnisdaten
C++, R, Ruby, Git, Eclipse
- Vereinheitlichung und Erweiterung des Funktionsumfangs
- Implementierung der entwickelten Konzepte und Integration in die bestehende Software-Bibliothek
- Anbindung der erweiterten Software-Bibliothek in die hausintern entwickelte Software-Plattform
- Konzeption und Ausarbeitung von Testverfahren für die entwickelten Softwarekomponenten
C++, Git, Eclipse