Beschreibung
Ich benötige eine TF Umgebung für das automatische erkennen von immer wiederkehrenden Textphrase in Dokumenten.Es handelt sich um Adressdaten, die sich Dokumenten befinden. Diese Adressen sind jedoch zum Teil ganz unterschiedlich formatiert. Aber in ca 95% der Fälle sind die Adressdaten natürlich immer gleich strukturiert (Name, Straße Nr, PLZ, Ort, Tel)
Es gibt bereits ca 500 vollständige Daten, die zusammen mit den Dokumenten validiert sind und somit als Trainingsdaten dienen.
Zu jedem einzelnen Dokument (mit den Adressdaten) gibt es zudem noch ein Array, das eventuell auch noch Adressdaten zur Verfügung stellen kann und zusätzlich als Bestätigung des ersten Adress-Daten dienen sollte.
NodeJs oder Python