Beschreibung
Ihre Aufgaben:- Erfassung, Interpretation und Bewertung großer Datensätze
- Modellierung sowie Konvertierung bestehender Daten, ggf. durch selbstständige Programmierung eines Konverters
- Mitverantwortlich für den Auf- und Ausbau der Dateninfrastruktur für eine optimale Bereitstellung der Daten und mehr Skalierbarkeit mit Hilfe der Erstellung von ETL-Prozessen
- Verbesserung der Datenverfügbarkeit,- Qualität und -zuverlässigkeit für die Cloud-basierten Data Warehouse und Mobile Device Management Tools
- Aufbau automatisierter Datenpipelines, die die Aufnahme von großen Datensätzen sicherstellen
Ihr Profil:
- Abgeschlossenes Studium der Informatik, Mathematik, Physik, Ingenieurwesen oder einem vergleichbaren IT-Fach
Mehrjährige Berufserfahrung im Bereich Data Engineering oder Advanced Analytics, wünschenswert mit Pharma Know-How
- Erfahrung mit Datenbankmodellen wie SQL, NoSQL, Snowflake und Redshift
- Fundierte Kenntnisse in Big Data Tools z.B. HDFS, Cassandra, Hive, Hadoop, Spark, ZooKeeper oder Cloudera
- Kenntnisse in Cloud Architektur wie Azure, AWS und Google
- Gute Programmierkenntnisse in Java, Python und/oder R sowie Kenntnisse in Kafka wünschenswert
- Freude an der Zusammenarbeit mit internationalen Teams
- Erfahrung mit agilen Methoden in der Projektarbeit
- Sehr gute Deutsch- und Englischkenntnisse in Wort und Schrift