Sebastian Napiorkowski verfügbar

Sebastian Napiorkowski

Big Data Solutions Architect & Machine Learning Engineer

verfügbar
Profilbild von Sebastian Napiorkowski Big Data Solutions Architect & Machine Learning Engineer aus Aachen
  • 52062 Aachen Freelancer in
  • Abschluss: M. Sc. Computer Science, RWTH Aachen University
  • Stunden-/Tagessatz: 110 €/Std. 880 €/Tag
    Variiert mit dem Ort und den Projektspezifikationen
  • Sprachkenntnisse: deutsch (Muttersprache) | englisch (verhandlungssicher)
  • Letztes Update: 27.12.2019
SCHLAGWORTE
PROFILBILD
Profilbild von Sebastian Napiorkowski Big Data Solutions Architect & Machine Learning Engineer aus Aachen
DATEIANLAGEN
CV (05/2019)

Diese Anzeige ist nur für angemeldete Nutzer möglich.

SKILLS
Backend: Python, Django, Java, Jersey, Jetty, Java Script ES6, Node.js, Express, Android, Cloudera/Hortonworks Stack, Apache NiFi, Apache Kafka, Apache Spark
Databases: MySQL, PostgreSQL Apache HBase, Apache Hadoop, MangoDB, CouchDB, ElasticSearch, ELK-Stack, Cassandra, Memcached, Redis
Frontend: HTML 5, React, Java Script ES6, jQuery, d3.js, Android, Kibana, Tableau, Amazon Quicksight
Deployment: Docker, Amazon AWS ecosystem, EC2, S3, Google App Engine, Heroku, Apache, Linux Server
Data Science: numpy, sci-kit-learn, sci-py, pandas, machine learning, feature engineering, natural language processing, clustering
Miscellaneous: Git, Svn, Jira, Confluence, Slack, Google Analytics, IoT
PROJEKTHISTORIE
  • 07/2019 - bis jetzt

    • BASF SE
    • >10.000 Mitarbeiter
    • Sonstiges
  • Big Data Solution Architect & Information Retrieval Specialist
  • Conceptualization, architecture and development of a scalable Big Data solution (as a Datalake use case) for mass indexing file contents using bleeding edge natural language processing and machine learning algorithms on the Cloudera Hadoop Stack (HDP and HDF).

    Technologies used:
    • NiFi and MiNiFi for ETL
    • Apache Spark Processing using Scala
    • Apache HBase
    • Elasticsearch
    • Django Backend
    • React Frontend
    Features comprising i.a.
    • Content extraction
    • Language dependent indexing
    • Clustering Approaches i.a. Latent Dirichlet Allocation, Latent Semantic Indexing, Doc2Vec
    • Named Entity Recognition (i.a. chemical entities) using Neural Networks
    • Entity Linking
    • Molecular Substructure Search
    (still in development)

KONTAKTANFRAGE VERSENDEN

Ja, ich akzeptiere die AGB

Ja, ich akzeptiere die Datenschutzbestimmungen

Hinweis: der Versand ihrer Kontaktanfrage ist komplett kostenfrei