Beschreibung
ZielbestimmungDas Themenrelevanz-Tool ist ein System zur Feststellung der thematischen Verwandtschaft von Keywords oder Texten. Diese Verwandtschaft muss mit Hilfe bekannter ungerichteter Verwanschaftsstrukturen von Keywords festgestellt werden. Ebenso muss das System einen Text auf die bekannten Keywords reduzieren können und aus dieser Menge Untermengen mit besonders kurzen Wegen zurückgeben können. Um so kürzer die Wege zwischen Keywords, desto größer ist die gesuchte Themenrelevanz. Die Keywords, deren Verwandtschaften und die Texte werden System zur Verfügung gestellt. Das System dient hauptsächlich der Auswertung dieser Daten (Data Mining)
Im Rahmen dieses Projektes müssen effiziente Lösungsalgorithmen entwickelt werden und in ein funktionierendes Endprodukt implementiert werden.
Musskriterien - Kurzversion
• Ein oder mehrere Keywords müssen anhand eines einfachen Keyword-Netzes bezüglich Ihrer Themenrelevanz verglichen werden.
• Ein Text muss auf die relevanten Keywords reduziert und in Form einer Keywordliste repräsentiert werden. Diese Liste ist Untermenge der (globalen) Keywordliste.
• Eine oder mehrere Aggregationen verwandter Keywords müssen in Keywordlisten identifiziert werden können.
• Texte mit großer Themenrelevanz müssen anhand eines oder mehrerer gegebener Keywords aus einer vorhandenen Menge an Texten gefunden werden.
• Das System muss eine SOAP-Schnittstelle zur Verfügung stellen um Ergebnisse zu bestimmten Anfragen zurückliefern zu können. Die Abfragen müssen synchron und somit zeitnah beantwortet werden.
Die Komplexität des Projektes ist uns bewusst. Ziel dieses Projektes muss der bestmögliche Mittelweg zwischen Geschwindigkeit und Daten-Qualität sein. Wir gewähren dem Auftragsnehmer deshalb größtmögliche Entscheidungsfreiheit in vielen Punkten.
Für weitere Details lassen wir Ihnen gerne eine detaillierteres Pflichtenheft zukommen.