Datenanalystin, Data Engineer – Datenbankanalysen
Schlagwörter
APIs
Information Engineering
Python
Deep Learning
Git
HTML
Javascript
Android
CSS
Clusteranalyse
Skills
Methoden:
Frameworks: PyTorch, Chart.js, Vue.js, Express
Analytics & KI: Python (Numpy, Pandas, Scikit-learn, Matplotlib, Seaborn, Gensim, Jieba, spaCy NLP, NLTK, Hugging Face, RapidFuzz), Overpass API, OpenAI API
Chatbot, LLM: Rasa, Rasa X, GPT-4, T5, BART, BERT
Entwicklungswerkzeuge: Git, Docker, Traefik, Postman, Node.js, SAS, SPSS
Datenbanken: PostgreSQL, MySQL, MongoDB, Informix
Reporting- und BI-Tools: Tableau
Standardsoftware: PowerPoint, Excel, Word, LaTeX
Projektmanagement & Anforderungsmanagement: Teams, Planner, OneNote, LimeSurvey
Betriebssysteme: Windows, Linux, Android
Weiteres: API, Clustering, Datenintegration, Datenvisualisierung, Deep Learning, Frontend, Git, Natural Language Processing
- Erhebung, Analyse und Interpretation von Daten, Data Engineering
- Implementierung, Training und Optimierung von Machine Learning/Deep Learning Models
- NLP-Techniken und Language Models, ROUGE Scores
Frameworks: PyTorch, Chart.js, Vue.js, Express
Analytics & KI: Python (Numpy, Pandas, Scikit-learn, Matplotlib, Seaborn, Gensim, Jieba, spaCy NLP, NLTK, Hugging Face, RapidFuzz), Overpass API, OpenAI API
Chatbot, LLM: Rasa, Rasa X, GPT-4, T5, BART, BERT
Entwicklungswerkzeuge: Git, Docker, Traefik, Postman, Node.js, SAS, SPSS
Datenbanken: PostgreSQL, MySQL, MongoDB, Informix
Reporting- und BI-Tools: Tableau
Standardsoftware: PowerPoint, Excel, Word, LaTeX
Projektmanagement & Anforderungsmanagement: Teams, Planner, OneNote, LimeSurvey
Betriebssysteme: Windows, Linux, Android
Weiteres: API, Clustering, Datenintegration, Datenvisualisierung, Deep Learning, Frontend, Git, Natural Language Processing
Projekthistorie
05/2023
-
bis jetzt
- Datenbank-Analysen und Data Engineering in verschiedenen Kundenprojekten
- Durchführung von Insight-Analysen und Dokumentation
- DB1-Berechnung und -korrektur in einem TMS-System eines Logistikunternehmens
- Federated Learning: Messung Modellgüte und Visualisierung von Lernkurven im Training von Deep Neural Networks
- Algorithmenentwicklung in Python im Rahmen der Data Science Week 2023
- Unterstützung in der Implementierung von Algorithmen und Datenbank-Applikationen
- Unterstützung bei Migration eines File- und Applikations-Servers und Aufbau einer CI/CD-Infrastruktur mit Kubernetes Cluster
- Programmiersprachen: SQL, Python
- Datenbank: PostgreSQL, Excel-Datenquellen
- Entwicklungswerkzeuge: Kubernetes
- Reporting- und BI-Tools: Tableau
08/2023
-
09/2023
Data Engineer – Chatbot Deployment
Universität
(Sonstiges, >10.000 Mitarbeiter)
- Deployment und Portierung eines Chatbots auf eine neue IT-Infrastruktur
- Skalierung der Implementierung auf sechs parallele Chatbots
- Chatbot Frameworks: Rasa, Rasa X
- Entwicklungswerkzeuge: Docker
10/2022
-
08/2023
Datenanalystin – Compliance und Anti-Money Laundering
(Banken und Finanzdienstleistungen, 50-250 Mitarbeiter)
- Erschließung des Quelldatenmodells eines Kernbankensystems und Implementierung von Maßnahmen zum Anti-Money Laundering (AML)
- Definition der fachlichen Mappings und Harmonisierungslogik für AML-Datenbank
- Implementierung der Regeln in AML-Tool
- Datenbank: Informix
- SQL-Client: DBeaver
- AML-Tool: Targens MDS
01/2023
-
05/2023
Datenanalystin, Entwicklerin – E-Mobility Applikation
I-WUNDER GmbH
(Sonstiges, < 10 Mitarbeiter)
- Mitwirkung bei der Entwicklung einer BI-Applikation zur Visualisierung der Ladensäuleninfrastruktur in Deutschland
- Durchführung von Insight-Analysen für E-Mobilität
- Regionale Unterschiede im Ausbau nach Bundesländern und Landkreisen
- Ranking der Provider und deren Entwicklung nach Marktanteilen
- Unterschiede in städtischen und ländlichen Regionen
- Entwicklung von interaktiven Charts und Visualisierungen in JavaScript
- Weiterentwicklung und Integration eines Chatbot-Prototyps
- Programmiersprachen: Chart.js, HTML, CSS
- Chatbot Frameworks: Rasa, Rasa webchat (Frontend)
- Datenbank: PostgreSQL
- Entwicklungswerkzeuge: Docker
05/2022
-
01/2023
Masterarbeit Data Science – Titel: „Self-learning E-Mobility Bot: Design and Implementation“
I-WUNDER GmbH
(Sonstiges, < 10 Mitarbeiter)
- Entwicklung und Implementierung eines selbstlernenden Chatbots
- Anforderungsanalyse und Prototyping für den Anwendungsfall E-Mobilität
- Deployment des Chatbots
- Design, Durchführung und Auswertung der Evaluierung (Heuristisch, Anwendertests)
- Programmiersprachen: Python, SQL
- Chatbot Frameworks: RASA, RASA webchat (Frontend)
- Libraries & APIs: SpacyNLP, Rapidfuzz, Overpass API
- Datenbanken: PostgreSQL, MongoDB
- Entwicklungswerkzeuge: Docker, Traefik, Postman, LimeSurvey
04/2021
-
07/2021
Softwareprojekt Mitglied vom TeamBee – Klassifizierung von Zellinhalten in einem Bienenstock
Freie Universität Berlin
- KI-unterstützte Bienenstockbildbeschriftung mit Labelbox
- Implementierung eines Convolutional Neural Networks (U-Net-Architektur) für die Bildsegmentierung
- Programmiersprache: Python
- Deep learning framework: Pytorch
- Bildbeschriftung: Labelbox
10/2020
-
03/2021
NLP-Projekt – Vergleich der modernsten NLP Language Models für Textzusammenfassung
Freie Universität Berlin
- Transfer Learning der Modelle GPT-2, T5, BART, BERT für die Textzusammenfassung von Patentdaten mit Hugging Face
- Modellbewertung durch ROUGE-Scores
- Programmiersprache: Python
- Deep Learning Framework: Pytorch
- Entwicklungswerkzeuge: Hugging Face
01/2019
-
05/2019
Bachelorarbeit Angewandte Statistik – Titel: „Stock price prediction based on big data of online public opinion“
Tianjin University of Finance and Economics
- Web Scraping von Online-Kommentaren in Börsenforen und Aufbereitung als Trainingsdatenset
- Datenverarbeitung der Textdaten (Wortsegmentierung, Stoppwortentfernung)
- Implementierung der Stimmungsanalyse mit Hilfe eines Random Forest Modells
- Dimensionsreduktion der Faktoren durch Principal Component Analysis (PCA)
- Entwicklung einer SVM-Regression zur Vorhersage von Aktienkursen
- Programmiersprache: Python
- NLP Libraries: Gensim, Jieba
- Statistisches Analytiktool: SPSS
Reisebereitschaft
Weltweit verfügbar
Sonstige Angaben
Vortrag „How Chatbots work – We need to talk!“, PyCon DE & PyData Berlin, 18.04.2023