Data Scientists (m/w)

München  ‐ Vor Ort
Dieses Projekt ist archiviert und leider nicht (mehr) aktiv.
Sie finden vakante Projekte hier in unserer Projektbörse.

Beschreibung

Für unseren Kunden in München werden zwei Data Scientists (m/w) mit den folgenden Skills / Erfahrungen gesucht:

Einen seniorer Berater, der auch MR-interne Projektmitglieder fachlich anleiten kann und ein junior Berater, der das Projekt vor allem operativ unterstützen soll. Die Anforderungen, die die Berater mitbringen müssen, sind folgende:



  • Big Data / Data Science / Data Engineering



  • Text Mining



  • Spezialgebiet: Natural Language Processing (NLP)



    • Extractors



    • Relation





Informatinen über das Projekt:

Das Projekt hat zum Ziel, Text Mining von sog. „Loss Adjuster Reports“ (und nachgelagert auch anderen Dokumenten-Typen) als eigenentwickelten Service / Lösung der Abteilung(und nachgelagert dann anderen Abteilungen mit anderen Dokumenten-Typen) zur Verfügung zu stellen.

Die BigDataAnalytics Platform des Kunden ist Hortonworks-basiert.

Die Loss Adjuster Reports sind Dokumente mit einem Umfang von ca. 20-200 Seiten, die von den Loss Adjustern (Gutachtern) im Schadensfall nach einer Ortsbegutachtung erstellt werden. Sie sind nicht nur von Gutachter zu Gutachter sondern auch von Schaden zu Schaden höchst unterschiedlich. Sie beinhalten Texte, Fotos, Skizzen, Tabellen – alles ohne jegliche Vorgabe hinsichtlich Format. Die Reports liegen in Papierform oder als pdf vor. OCR wird auf der Data Analytics Platform des Kunden gemacht. Hier gibt es auch mehrere Lösungen, die unterschiedlich gute Ergebnisse abhängig von den Dokumenten-Inhalten liefern können (z.B. bei vielen Tabellen).

Der Kunde möchte jetzt selbst und mit einem relativ frei wählbaren Toolkasten ohne die Abhängigkeit von einem einzelnen Softwareanbieter ein hochkomplexes Textmining-Projekt durchführen. Ziel ist ein TextMining-Service, er dann nur noch Kunden-spezifisch (Kunden-interne Abteilungen) geringfügig adjustiert werden muss, und aus unstrukturierten Dokumenten die relevanten Informationen automatisch strukturiert ausliest.

Das erste Produkt aus dem Projekt wird ein Annotation-Tool sein, das Mitte Mai schon fertig sein soll, und mit dessen Hilfe die Loss Adjuster Reports manuell annotiert werden sollen. Erkannte Entitäten sollen darin schon automatisch markiert werden, der Anwender soll diese Markierungen dann korrigieren, ergänzen und bestätigen, um so einerseits maschinell unterstützt schon jetzt (ab Mai) leichter an die gewünschten Daten zu kommen (statt sich das ganze Dokument durchlesen zu müssen), und andererseits damit ein Trainingsset an Daten zu erstellen, mit dessen Hilfe das zu entwickelnde TextMining bewertet und trainiert werden kann.

Das Projekt braucht jemanden, der eine NLP-Lösung auf der grünen Wiese aufbauen kann, entsprechende Richtungen vorgibt und z.B. Architektur-Entscheidungen trifft (seniorer Berater). Und das Team braucht zusätzlich operative Unterstützung, ebenfalls mit NLP-Kenntnissen (juniorer Berater).

Start
ab sofort
Dauer
8 Monate
Von
Q_PERIOR AG
Eingestellt
09.04.2018
Ansprechpartner:
Daniel Mietasch
Projekt-ID:
1534986
Vertragsart
Freiberuflich
Um sich auf dieses Projekt zu bewerben müssen Sie sich einloggen.
Registrieren