Simon Streubel

Köln

verfügbar

Letztes Update: 06.04.2024

Big Data Engineer / Cloud Architect

Firma: Simon Streubel

Abschluss: Bachelor of Arts / Wirtschaft und Politik Ostasiens / Schwerpunkte Japanisch & Wirtschaft

Stunden-/Tagessatz: anzeigen

Sprachkenntnisse: deutsch (Muttersprache) | englisch (verhandlungssicher) | japanisch (gut)

Data Engineering Cloud Architect Big Data & Hadoop Apache Kafka Kubernetes AWS (Amazon WebServices) Go DevOps Marketing Analytics Terraform

Ich unterstütze Sie

In der Konzeption und Umsetzung von komplexen Microservice-Architekturen mit Kubernetes, Helm, Terraform, Apache Kafka, Schema Registry & Co.
Im Aufbau, bei der Installation und Konfiguration einer Hadoop basierten Big Data Umgebung sowohl On-Premise als auch in der Cloud
In der Konzeption und Implementierung von batch- und streaming-basierten Big Data ETL-Strecken, sowohl mit „klassischen“ ETL-Tools als auch unter Einsatz von Microservices/Docker/Kubernetes
In der Programmierung von Microservices mit Java und/oder Go
In der Datenmodellierung von „klassischen“ (relationalen) Data Warehouses
In der Leitung und Koordination von Teams (technische Führung)
Im Umfeld des Marketings, besonders in der Online-Vermarktung
Beim Halten von Schulungen & Workshops zum Thema Apache Kafka & Schema Registry

05/2022 - bis jetzt

Data Engineer / Cloud Architect

(Medien und Verlage, 1000-5000 Mitarbeiter)

Technologien

Google Cloud Platform (v.a. DataProc, Bigquery, Google Storage, Kubernetes Engine)
Apache Spark (PySpark)
Airflow
Python
Terraform
SQL
Kafka
Kubernetes
Docker
Linux / Shell-Scripting
Continuous Integration
Gitlab
Scrum
Jira/Confluence

01/2022 - 02/2024

Data Engineer / Cloud Architect

(Konsumgüter und Handel, 1000-5000 Mitarbeiter)

Konzeption und Umsetzung einer vollautomatisierten Big Data Platform „auf der
grünen Wiese“ mit Dev-, Test-, Produktions- Umgebungen mit Hilfe von Serverless/OnDemand-Technologien
Umsetzung mehrerer Beladungs-Pipelines mit Google Dataflow / Apache Beam
Berechnung von KPIs im Fachbereich
Lizenzmanagement
Bereitstellung von Kundenbezogenen Datamarts an externe Kunden / Berichtsprogramme (Tableau)
Aufbau und Umsetzung eines CI/CD Konzeptes mit Terraform/CloudBuild/gcloud/Bitbucket
Coaching eines Teams im Umgang mit Big Data Technologien

Technologien

Google Cloud Platform (v.a. IAM, Dataflow, Cloud Storage, CloudBuild, CloudFunctions, BigQuery)
Apache Beam
Terraform
Python
SQL
Docker
Linux / Shell-Scripting
Continuous Integration
Bitbucket
Scrum
Jira/Confluence

04/2020 - 12/2021

Data Engineer / Cloud Architect

(Telekommunikation, 500-1000 Mitarbeiter)

Migration einer on premise Big Data Umgebung zu AWS Cloud Umgebung
Vollautomatisierung Infrastruktur-Deployments
Nutzbarmachung von Daten aus on premise DWH, REST APIs, Google BigQuery über ETL Pipelines und Historisierung der Daten in der Cloud
Berechnung von Machine Learning Features und Aufbau eines Feature Stores mit Hilfe von Spark
Modellierung von Kundenverhalten mit Machine Learning Modellen und Berechnung von Scores
Personalisierung von E-Mail-Kampagnen
Erarbeitung und Implementierung von Datenschutzkonzepten (DSGVO/PII)
Aufbau eines zentralen Data Lakes im Unternehmen zur Unterstützung des Data Driven Company Zielbildes
Vollautomatisierung CI/CD Pipelines
Erarbeitung von möglichen Next-Steps im Ausbau vorhandener Arbeitsumgebungen und Beratung hinsichtlich möglicher Produktvisionen

Technologien

Apache Spark
AWS Cloud (v.a. IAM, Glue, EMR, Lambda, Step Functions, SageMaker, Athena, Transcribe, Comprehend, CloudWatch, CodeCommit, S3)
Terraform
Scala
Google BigQuery
Docker
Jenkins
Linux / Shell-Scripting
Continous Integration
Gitlab
Scrum
Jira/Confluence

Verfügbar in den Ländern Deutschland

Big Data Engineer / Cloud Architect