Webcrawler benötigt

Mannheim, Baden-Württemberg  ‐ Remote
Dieses Projekt ist archiviert und leider nicht (mehr) aktiv.
Sie finden vakante Projekte hier in unserer Projektbörse.

Beschreibung

Ausführliches Briefing-Dokument vorhanden. Crawling URL steht im Briefing.

Kurzfassung:
1. Schritt: Crawling mehrerer URL's aus einem Live-Feed. Dauer: 24 Stunden lang. Duplikate können gleich aussortiert werden.
2. Schritt: Im Anschluss müssen alle gecrawlten URL's auf ihren Inhalt überprüft werden. Der Content aller URL's muss nach einem Parameter selektiert werden. Die URL's können nur über den HTML-Text aussortiert werden.
3. Ergebnis Liste mit allen URL's, die nach dem Parameter sortiert wurde. (CSV)
Start
2017
Eingestellt
26.04.2017
Ansprechpartner:
Sascha Ackermann
Projekt-ID:
1332273
Vertragsart
Freiberuflich
Einsatzart
100 % Remote
Um sich auf dieses Projekt zu bewerben müssen Sie sich einloggen.
Registrieren