Beschreibung
Wir benötigen ab sofort einen Java-Entwickler (J2SE), der unser Webcrawling-System interimsweise betreut.Das System besteht aus den folgenden Modulen:
Webcrawler, Datenextraktion (CSS, XPATH), Normalisierung, Matching und Datenbank.
Erfahrung mit Crawling und ETL ist erwünscht.
Erfahrung mit Machine Learning ist ein Plus.
Initial 40 Wochenstunden zur Einarbeitung, danach voraussichtlich 20-30 Wochenstunden.