Profilbild von Eugene Tefong Statistiker / Data Scientist (Python, Rstudio, SQL, Matplotlib, Machine Learning, Deep Learning) aus Essen

Eugene Tefong

verfügbar

Letztes Update: 03.11.2024

Statistiker / Data Scientist (Python, Rstudio, SQL, Matplotlib, Machine Learning, Deep Learning)

Abschluss: B.Sc. Statistik / Data Scientist
Stunden-/Tagessatz: anzeigen
Sprachkenntnisse: Deutsch (verhandlungssicher) | Englisch (Grundkenntnisse) | Französisch (Muttersprache)

Schlagwörter

Statistiken Tabellen Datenvalidierung Web Scraping Datenvisualisierung Grafik Python Latex Regressionsanalyse Numpy + 12 weitere Schlagwörter anzeigen

Dateianlagen

Bacherlor-Urkunde_090523.pdf
Lebenslauf_031124.pdf

Skills

Data Scientist :
Datenaufbereitung, Datenauswertung Datenvisualisierung , Machine Laerning, Deep Learning mittels  Python (Pandas, Numpy, Matplotlib, Searbon, TensorFlow, Keras etc.) und R
Statistik :
Deskriptiv Statistik durch Tabellen und Grafiken. Multivariat Statistik, Regressionsanalyse, Überlebenszeitanalyse. Rstudio, RMarkdown, SQL, Latex.
 

Projekthistorie

01/2024 - bis jetzt
Fragebogen online erstellen und verwalten (Sosci Survey) und anschließend die erhobene Daten auswerten

  1. Erstellung des Fragebogens
  2. Auswertung der Rohdaten
1) Patienten wurden in der Klinik registriert und geben bei der Registrierung Kontaktinfos ein sowie krankheitsspezifische Baselineparameter (ggf. werden diese vom Klinikpersonal ergänzend eingetragen)

2) Personalisierten Link zur Eingabe der PROMS Fragebögen, ggf. Reminder, falls keine Eingabe erfolgt

3) Zu vorgegeben Terminen wird Schritt 2 wiederholt um Verlaufswerte zu erhalten

4) Auswertung von spezifischen Gruppen, z.B. nach Geschlecht, Erkrankung, Therapieart, etc.

5) Export der Datensätze als csv Datei

10/2021 - 12/2024
Data Analyst / SQL
SAMO Verwaltungsgesellschaft mbH (Telekommunikation, 10-50 Mitarbeiter)

Datenbankabfrage von Kundendaten und Durchführung der Kampagnenanalyse

07/2023 - 12/2023
Datenaufbereitung, Datenvisualisierung, Machine Learning, Deep Learning etc.
DataScientest Germany / Mines ParisTech (Öffentlicher Dienst, >10.000 Mitarbeiter)

Ich habe gelernt, wie man Daten verarbeitet und in gängigen Data-Science-Sprachen richtig programmiert. Außerdem habe ich gelernt, wie man Vorhersagen mit Hilfe von Statistiken und Machine-Learning-Modellen erstellt.


○ Isolation Forest : Erkennung von Bankbetrug (SVM, scikit learn)
○ Customer Churn : Vorhersage der Kundenabwanderung aus dem Unternehmen innerhalb von sechs Monaten (Random Forest: Zufallswald)
○ Dimensionsreduktion : Datensatz Zalando MNIST (Hauptkomponentenanaly se, PCA, RandomForestClassifier). ○ Bilderkennung : Datensammlung MNIST (CNN, Keras).
○ Optimierungsverfahren : Um z.B. das Optimierungsziel zu minimie ren/maximieren (Pyomo, Gurobi). Hierbei wurden folgende Hard Skills gelernt
○ Programmieren mit Python : Jupyter Notebook, Google Colab Pandas, Numpy, scikit-learn etc.
○ Machine Learning : Supervised & unsupervised Machine Learning Machine Learning für Fortgeschrittene : Statsmodels, Text Mining, Web Scraping
○ Deep Learning : Keras, CNN, TensorFlow Datenvisualisierung : Matplotlib, Seaborn, Plotly Big Data : SQL, PySpark

02/2022 - 02/2023
Statistiker
Medizinischer Dienst Baden-Württemberg (Versicherungen, 1000-5000 Mitarbeiter)

○ Durchführung von Prozessschritten zur Datenvalidierung, Datentransfer, Da tenaufbereitung und Datenverknüpfung (Datenquellen: Notarzt-, Rettungswa gen und Leitstellendaten)
○ Selbstst¨ andige Durchführung von Datenabfragen und Testauswertungen von Indikatoren wie z.B Blutzuckermessung und Kapnometrie
○ Hierbei verwendete ich die Statistiksoftware R (RStudio) bzw. Tinn-R und die Darstellung der Ergebnisse mit Hilfe von Excel

03/2020 - 10/2021
Datenaufbereitung, Deskriptive Statistik, Datenvisualisierung, Regressionsanalyse etc.
Ruhr Universität Bochum (Abtei lung f¨ ur Medizinische Informatik, Biometrie und Epidemiologie) (Sonstiges, 5000-10.000 Mitarbeiter)

○ Mitarbeit an der Dateneingabe und der Plausibilitätsprüfung der Daten
○ Erstellung von Tabellen und Grafiken (mittels ggplot2) zur beschreibenden Statistik
○ Durchführung von verschiedenen statistischen Test
○ Berechnung von verschiedenen Regressionsmodellen, z.B. lineare, logistische und Cox-Regressionsmodelle Visualisierung der Ergebnisse mittels geeigneter Grafiken, z.B. Kaplan-Meier Kurven
Hierbei verwendete ich vorwiegend die Statistiksoftware R (RStudio) und RMarkdown

Reisebereitschaft

Nur Remote verfügbar
Profilbild von Eugene Tefong Statistiker / Data Scientist (Python, Rstudio, SQL, Matplotlib, Machine Learning, Deep Learning) aus Essen Statistiker / Data Scientist (Python, Rstudio, SQL, Matplotlib, Machine Learning, Deep Learning)
Registrieren