Entwicklung einer Plattform für den Einsatz von microservice-basierten Machine-Learning-Modellen in operativen IT-Umgebungen und den darin integrierten Geschäftsprozessen.
• High-Level-Design des Gesamtsystems
• Konzeptionelle Orchestrierung der Modulklassen
• Definition von internen und externen Schnittstellen
• Implementierung von Modulen
• Entwurf und Implementierung eines zentralen Repositorys
• Implementierung von Dienstkapselung und -orchestrierung
• Auswahl und Vorbereitung von Testdatensätzen
• Iterationsmanagement: Definition, Durchführung, Auswertung
• Definition und Bewertung von funktionalen/nicht-funktionalen Anforderungen
• Erarbeitung technische Konzeption abgeleitet aus den Anforderungen
• Erstellung von Data Pipelines für strukturierte und unstrukturierte Daten (ETL)
• Datenerfassung aus webbasierten Quellen und APIs von Drittanbietern
• Konzeption und Erstellung von Datenmodellen
• Datenexploration und -analyse
• Datenaufbereitung und Feature Engineering
• Erstellung, Auswertung und Integration von ML-Modellen
• Erstellung von Frontends für verschiedene Stakeholder
• Prozessautomatisierung und CI/CD
• Rapid Prototyping
• Betrieb und Wartung, Datenqualitätssicherung, Codequalitätssicherung
Techstack: SQL, python, pandas, sklearn, sktime, jupyter, atom, MS Visual Studio Code, Git/GitHub, DevOps, beautifulsoup, selenium, prophet, bert, spacy, matplotlib, dash, pillow, geopandas, Azure Databricks, Azure HDInsight, Azure Blob Storage, Azure Virtual Machines, Azure API Apps, Azure Functions, Azure Data Lake, Azure Synapse, Azure EH4Kafka, Azure Data Factory, Azure Machine Learning, Azure logic Apps, Power BI, Amazon EMR, Amazon Redshift, Amazon S3, Amazon EC2, Amazon API Gateway, Amazon Lambda, Amazon Sagemaker