Beschreibung
Es soll ein Bot / Web-Crawler programmiert werden, der:A. Prüft, ob Adressen aus der bestehenden Datenbank noch im Netz existieren (Adressabgleich).
B. Neue Adressen nach Stichwort generiert.
Zu A)
Grundlage: Firmenname vorhanden.
Der Abgleich mit Hilfe des Bots soll die Aktualität der Datenbank überprüfen. Anhand dieser Parameter aus der Datenbank soll der Bot auf die Reise geschickt werden:
• ID-Nummer (benötigen wir intern für die Identifikation)
• Firmenname
• Anschrift
Ziel: Web-Crawler findet über Firmenname die Internet-Präsenz der Firma, liest die Informationen aus dem Impressum und schreibt sie in eine CSV-Datei.
Zu B)
Grundlage: Angabe Kategorie / Thema / Branche. Zum Beispiel Architekt.
Der Bot soll Adressen generieren zu vorab definierten Stichwörtern („Architekt“). Er soll herausfinden und ausgeben (Ausgabe via Excel-Datei):
• URL
• Nummer Telefonzentrale
• Nummer Fax
• Ansprechpartner
Ziel: Web-Crawler findet über diese Angabe die Internet-Präsenz der Firma, liest die Informationen aus dem Impressum und schreibt sie in eine CSV-Datei.