Beschreibung
Aufgabe:Aus einem Datenbestand (ca. Files) sollen Informationen, z.B. mittels OCR, extrahiert werden. Die Daten liegen in verschiedenen Ausgangsformaten vor (pdf, Tiff, hpg, jpg?) teilweise sind diese direkt durchsuchbar, teilweise muss das Format umgestellt und die Daten in Text gewandelt werden. (Idee Finereader OCR). Das Extrahieren soll automatisiert werden (Suche nach Begriff, ggf. incl. nächstes/vorheriges Wort, Ergebnis als Excel Datei zur weiteren Bearbeitung).
Ein geeigneter Mechanismus diese Suche zu nutzen (Webinterface, e-mail,?) ist als Option zu betrachten.
In einer Konzeptphase sollen obige Ideen auf Machbarkeit untersucht werden, ein Konzept zu erarbeiten und ein Plan zur Umsetzung ist zu erstellen.
In der Umsetzungsphase ist das Konzept zu realisieren.
Anforderung:
- Informatikkenntnisse
- Kenntnisse Skript-Programmierung (Powershell, Phyton o.ä.)
- Ideal: Kenntnisse Excel, Abbyy Finereader, Web-Programmierung
- Eigenständiges Arbeiten
Beginn: nach Absprache in den nächsten 3 Monaten
Dauer: 2 Wochen
Branche: Industrie