01.05.2025 aktualisiert


100 % verfügbar
LLM & AI | Compilers | Cloud
Gründau, Deutschland
Gründau +100 km
Dr.-Ing. Informatik Gründau, Deutschland
Gründau +100 km
Dr.-Ing. InformatikProfilanlagen
cv.pdf
Skills
Künstliche IntelligenzAmazon Web ServicesMicrosoft AzureC++Cloud ComputingCUDAPythonChatbotsLarge Language ModelsTeam BuildingTeam Management
LLMs, AI, AI Agents, Chatbots, Python
C++/C, CUDA, HPC, Compiler
Cloud (AWS, Azure)
Teambuilding and Team Leadership
C++/C, CUDA, HPC, Compiler
Cloud (AWS, Azure)
Teambuilding and Team Leadership
Sprachen
DeutschMutterspracheEnglischverhandlungssicher
Projekthistorie
Implementierung und Skalierung von AI Agents auf Azure
Robert Bosch GmbH
Konsumgüter und Handel
>10.000 Mitarbeiter
Erstellung und Pflege von eLearning-Lursen zum Thema Generative AI
Match4Solutions GmbH
Sonstiges
10-50 Mitarbeiter
Optimierung von GPU-Kerneln in CUDA zur Seed-generierung
reWallet GmbH
Internet und Informationstechnologie
10-50 Mitarbeiter
Cloud-Infrastruktur-Einrichtung & Beratung im Quantencomputing
Öffentlicher Dienst
500-1000 Mitarbeiter
- Einrichtung eines Cloud-Systems in einer hybriden AWS-GCP-Umgebung, das das Batching von Tausenden von Quantencomputerexperimenten für die wissenschaftliche
Forschung
- Beitrag zur Forschung im Bereich des maschinellen Quantenlernens durch Literaturrecherche, praktisches Experimentdesign und Code-Beratung
- Unterstützung von Forschern bei der lokalen Einrichtung und Containerisierung von Experimenten
- Tech Stack: AWS, FastAPI, Docker, Celery, RabbitMQ, Qiskit, IBM Quantum
Forschung
- Beitrag zur Forschung im Bereich des maschinellen Quantenlernens durch Literaturrecherche, praktisches Experimentdesign und Code-Beratung
- Unterstützung von Forschern bei der lokalen Einrichtung und Containerisierung von Experimenten
- Tech Stack: AWS, FastAPI, Docker, Celery, RabbitMQ, Qiskit, IBM Quantum
Aufbau einer internen LLM-Infrastruktur & Entwicklung eines LLM-basierten Optimierungsassistenten
Internet und Informationstechnologie
10-50 Mitarbeiter
- Einrichtung von lokalem Hosting Modellen (Mixtral 8x7B, Deepseek Code 34b) für den internen Entwickler-Support, Modifizierung und Hosting eines Chat-Frontends, Einrichtung und Unterstützung der Entwickler bei der Integration in VS Code
- Erstellung einer Chat-App mit Mistral 7B Instruct v0.1, die Daten für ein Optimierungsproblem sammelt und einen klassischen Optimierungslöser steuert, basierend auf einem Modell, das automatisch aus Python-Code geparst wurde
- Implementierung eines agentenbasierten Workflows, um LLMs < 8B die Verwendung von Funktionsaufrufen und RAG beizubringen
- Tech stack: llama.cpp / oolama, vllm, LibreChat, LangChain, Mistral, RAG
Übersetzt mit DeepL.com (kostenlose Version)
- Erstellung einer Chat-App mit Mistral 7B Instruct v0.1, die Daten für ein Optimierungsproblem sammelt und einen klassischen Optimierungslöser steuert, basierend auf einem Modell, das automatisch aus Python-Code geparst wurde
- Implementierung eines agentenbasierten Workflows, um LLMs < 8B die Verwendung von Funktionsaufrufen und RAG beizubringen
- Tech stack: llama.cpp / oolama, vllm, LibreChat, LangChain, Mistral, RAG
Übersetzt mit DeepL.com (kostenlose Version)
Compiler-Pipeline für C/C++ - Julia-Integration
Internet und Informationstechnologie
50-250 Mitarbeiter
- Anders als der Aufruf von C/C++ aus Julia ist die Integration von Julia-Code in C/C++ aufgrund der fehlenden Typenzuordnung und des JIT-Ansatzes von Julia schwierig
- Implementierung einer Toolchain, die automatisch Typen von Julia auf STL/Strukturen in C/C++ abbildet
- Integration einer Build-Kette, die die Typzuordnungen und die Julia-Laufzeit verknüpft, um einen konventionellen Satz von Headern und Shared Library für C/C++ zu erzeugen
- Das Projekt wurde für Aurora VPU-Benutzer als Open Source zur Verfügung gestellt.
- Tech stack: Julia, C++, Makefile
- Implementierung einer Toolchain, die automatisch Typen von Julia auf STL/Strukturen in C/C++ abbildet
- Integration einer Build-Kette, die die Typzuordnungen und die Julia-Laufzeit verknüpft, um einen konventionellen Satz von Headern und Shared Library für C/C++ zu erzeugen
- Das Projekt wurde für Aurora VPU-Benutzer als Open Source zur Verfügung gestellt.
- Tech stack: Julia, C++, Makefile
Forschungscompiler für heterogene Systeme (CPU, GPU, VPU)
Internet und Informationstechnologie
50-250 Mitarbeiter
- Inspiriert von den Programmier-Idiomen, die man in hochoptimierten CUDA-Kernels für HPC und Deep Learning findet, habe ich dieses Idiom auf eine „collective Programmierung“ mit flexibler Struktur im SIMT Stil, generalisiert
- Entwicklung eines neuen COmpilers von Grund auf, der auf pycparser und LLVM basiert und das Idiom in die nativen Hardwaresprachen bzw. IR einbettet (Modi source-to-source und source-to-IR)
- In einem Paper konnten wir zeigen, dass wir aus demselben Quellcode Kernels für Optimierung/HPC/Deep Learning erzeugen konnten, die mit den schnellsten nativen Bibliotheken vergleichbar sind
- Tech stack: C++, Python, pycparser, LLVM, MLIR
- Entwicklung eines neuen COmpilers von Grund auf, der auf pycparser und LLVM basiert und das Idiom in die nativen Hardwaresprachen bzw. IR einbettet (Modi source-to-source und source-to-IR)
- In einem Paper konnten wir zeigen, dass wir aus demselben Quellcode Kernels für Optimierung/HPC/Deep Learning erzeugen konnten, die mit den schnellsten nativen Bibliotheken vergleichbar sind
- Tech stack: C++, Python, pycparser, LLVM, MLIR
Frame-frame Gesichtstracking mittels Deep Learning
Internet und Informationstechnologie
>10.000 Mitarbeiter
- Entwicklung einer neuen, GPU-basierten Methode zur isometrischen Abbildung von 3D-Gesichtsscans auf eine 2D-Oberfläche
- Training eines auf Variational Auto-Encoder basierenden CNN für das pixelgenaue Tacking von Gesichtsmerkmalen über weit entfernte Bilder innerhalb eines 4K/8K Videostreams
- Tech stack: PyTorch, Tensorboard, VAEs, CUDA, C++
- Training eines auf Variational Auto-Encoder basierenden CNN für das pixelgenaue Tacking von Gesichtsmerkmalen über weit entfernte Bilder innerhalb eines 4K/8K Videostreams
- Tech stack: PyTorch, Tensorboard, VAEs, CUDA, C++
Kontaktanfrage
Einloggen & anfragen.
Das Kontaktformular ist nur für eingeloggte Nutzer verfügbar.
RegistrierenAnmelden