Fragebogen online erstellen und verwalten (Sosci Survey) und anschließend die erhobene Daten auswerten
Schlagwörter
Statistiken
Tabellen
Datenvalidierung
Web Scraping
Datenvisualisierung
Grafik
Python
Latex
Regressionsanalyse
Numpy
Skills
Data Scientist :
Datenaufbereitung, Datenauswertung Datenvisualisierung , Machine Laerning, Deep Learning mittels Python (Pandas, Numpy, Matplotlib, Searbon, TensorFlow, Keras etc.) und R
Statistik :
Deskriptiv Statistik durch Tabellen und Grafiken. Multivariat Statistik, Regressionsanalyse, Überlebenszeitanalyse. Rstudio, RMarkdown, SQL, Latex.
Datenaufbereitung, Datenauswertung Datenvisualisierung , Machine Laerning, Deep Learning mittels Python (Pandas, Numpy, Matplotlib, Searbon, TensorFlow, Keras etc.) und R
Statistik :
Deskriptiv Statistik durch Tabellen und Grafiken. Multivariat Statistik, Regressionsanalyse, Überlebenszeitanalyse. Rstudio, RMarkdown, SQL, Latex.
Projekthistorie
01/2024
-
bis jetzt
- Erstellung des Fragebogens
- Auswertung der Rohdaten
2) Personalisierten Link zur Eingabe der PROMS Fragebögen, ggf. Reminder, falls keine Eingabe erfolgt
3) Zu vorgegeben Terminen wird Schritt 2 wiederholt um Verlaufswerte zu erhalten
4) Auswertung von spezifischen Gruppen, z.B. nach Geschlecht, Erkrankung, Therapieart, etc.
5) Export der Datensätze als csv Datei
10/2021
-
12/2024
Data Analyst / SQL
SAMO Verwaltungsgesellschaft mbH
(Telekommunikation, 10-50 Mitarbeiter)
Datenbankabfrage von Kundendaten und Durchführung der Kampagnenanalyse
07/2023
-
12/2023
Datenaufbereitung, Datenvisualisierung, Machine Learning, Deep Learning etc.
DataScientest Germany / Mines ParisTech
(Öffentlicher Dienst, >10.000 Mitarbeiter)
Ich habe gelernt, wie man Daten verarbeitet und in gängigen Data-Science-Sprachen richtig programmiert. Außerdem habe ich gelernt, wie man Vorhersagen mit Hilfe von Statistiken und Machine-Learning-Modellen erstellt.
○ Isolation Forest : Erkennung von Bankbetrug (SVM, scikit learn)
○ Customer Churn : Vorhersage der Kundenabwanderung aus dem Unternehmen innerhalb von sechs Monaten (Random Forest: Zufallswald)
○ Dimensionsreduktion : Datensatz Zalando MNIST (Hauptkomponentenanaly se, PCA, RandomForestClassifier). ○ Bilderkennung : Datensammlung MNIST (CNN, Keras).
○ Optimierungsverfahren : Um z.B. das Optimierungsziel zu minimie ren/maximieren (Pyomo, Gurobi). Hierbei wurden folgende Hard Skills gelernt
○ Programmieren mit Python : Jupyter Notebook, Google Colab Pandas, Numpy, scikit-learn etc.
○ Machine Learning : Supervised & unsupervised Machine Learning Machine Learning für Fortgeschrittene : Statsmodels, Text Mining, Web Scraping
○ Deep Learning : Keras, CNN, TensorFlow Datenvisualisierung : Matplotlib, Seaborn, Plotly Big Data : SQL, PySpark
○ Isolation Forest : Erkennung von Bankbetrug (SVM, scikit learn)
○ Customer Churn : Vorhersage der Kundenabwanderung aus dem Unternehmen innerhalb von sechs Monaten (Random Forest: Zufallswald)
○ Dimensionsreduktion : Datensatz Zalando MNIST (Hauptkomponentenanaly se, PCA, RandomForestClassifier). ○ Bilderkennung : Datensammlung MNIST (CNN, Keras).
○ Optimierungsverfahren : Um z.B. das Optimierungsziel zu minimie ren/maximieren (Pyomo, Gurobi). Hierbei wurden folgende Hard Skills gelernt
○ Programmieren mit Python : Jupyter Notebook, Google Colab Pandas, Numpy, scikit-learn etc.
○ Machine Learning : Supervised & unsupervised Machine Learning Machine Learning für Fortgeschrittene : Statsmodels, Text Mining, Web Scraping
○ Deep Learning : Keras, CNN, TensorFlow Datenvisualisierung : Matplotlib, Seaborn, Plotly Big Data : SQL, PySpark
02/2022
-
02/2023
Statistiker
Medizinischer Dienst Baden-Württemberg
(Versicherungen, 1000-5000 Mitarbeiter)
○ Durchführung von Prozessschritten zur Datenvalidierung, Datentransfer, Da tenaufbereitung und Datenverknüpfung (Datenquellen: Notarzt-, Rettungswa gen und Leitstellendaten)
○ Selbstst¨ andige Durchführung von Datenabfragen und Testauswertungen von Indikatoren wie z.B Blutzuckermessung und Kapnometrie
○ Hierbei verwendete ich die Statistiksoftware R (RStudio) bzw. Tinn-R und die Darstellung der Ergebnisse mit Hilfe von Excel
○ Selbstst¨ andige Durchführung von Datenabfragen und Testauswertungen von Indikatoren wie z.B Blutzuckermessung und Kapnometrie
○ Hierbei verwendete ich die Statistiksoftware R (RStudio) bzw. Tinn-R und die Darstellung der Ergebnisse mit Hilfe von Excel
03/2020
-
10/2021
Datenaufbereitung, Deskriptive Statistik, Datenvisualisierung, Regressionsanalyse etc.
Ruhr Universität Bochum (Abtei lung f¨ ur Medizinische Informatik, Biometrie und Epidemiologie)
(Sonstiges, 5000-10.000 Mitarbeiter)
○ Mitarbeit an der Dateneingabe und der Plausibilitätsprüfung der Daten
○ Erstellung von Tabellen und Grafiken (mittels ggplot2) zur beschreibenden Statistik
○ Durchführung von verschiedenen statistischen Test
○ Berechnung von verschiedenen Regressionsmodellen, z.B. lineare, logistische und Cox-Regressionsmodelle Visualisierung der Ergebnisse mittels geeigneter Grafiken, z.B. Kaplan-Meier Kurven
Hierbei verwendete ich vorwiegend die Statistiksoftware R (RStudio) und RMarkdown
○ Erstellung von Tabellen und Grafiken (mittels ggplot2) zur beschreibenden Statistik
○ Durchführung von verschiedenen statistischen Test
○ Berechnung von verschiedenen Regressionsmodellen, z.B. lineare, logistische und Cox-Regressionsmodelle Visualisierung der Ergebnisse mittels geeigneter Grafiken, z.B. Kaplan-Meier Kurven
Hierbei verwendete ich vorwiegend die Statistiksoftware R (RStudio) und RMarkdown
Reisebereitschaft
Nur Remote verfügbar