Änderungen von Dokument AutoOCR

Zuletzt geändert von Gregor Herdy am 19/11/19, 11:15

Von Version 1.1
bearbeitet von Gregor Herdy
am 14/11/19, 16:13
Auf Version 2.1
bearbeitet von Gregor Herdy
am 19/11/19, 11:15
Änderungskommentar: Es gibt keinen Kommentar für diese Version

Summary

Details

Page properties
Content
... ... @@ -45,4 +45,54 @@
45 45  
46 46  Beim Start des AutoOCR Dienstes wird die Ordnerstruktur komplett gescannt um noch nicht verarbeitete Dateien zu identifizieren. Dabei muss jede PDF Datei auf dieses "Label" hin überprüft werden. Zu beachten ist, dass bei umfangreichen Datenbeständen dieser Vorgang entsprechend lange dauert, da jede PDF Datei geöffnet und überprüft werden muss.
47 47  
48 -
48 +=== Datum/Zeit der Ursprungsdatei erhalten ===
49 +
50 +Mit dieser Option kann das Datum und die Uhrzeit der Erstellung, der Änderung und des Letzten Zugriffs von der Ursprungsdatei auf die durch den OCR Vorgang erzeugten PDF Datei übertragen werden. Das PDF Dokument wird somit ohne Änderung dieser Attribute ersetzt.
51 +
52 +=== Leere Seiten löschen ===
53 +
54 +Es gibt eine Option um vor der OCR Verarbeitung leere Seiten zu löschen. Die Erkennung einer Seite als "leer" erfolgt über einen eingestellten Schwellwert. Der voreingestellte Standardwert beträgt 1%. Einse Seite wird in dem Fall als "leer" erkannt, falls weniger als 1% der Pixel einer Seite "nicht weiß" sind. Dieser Wert muss gegebenenfalls an die zu verarbeitenden Scans angepasst werden, da es bei Scans mit Verunreinigungen auch sein kann, dass eine leere Seite mehr Pixel aufweist und dann nicht als leer erkannt wird. Wird der Schwellwert jedoch zu hoch eingestellt, so kann es sein, dass Seiten mit wenig Inhalt als leer erkannt und damit gelöscht werden.
55 +
56 +== Einstellungen ==
57 +
58 +=== Service Account konfigurieren ===
59 +
60 +Nach der Installation läuft der AutoOCR Dienst standardmößig als "Lokaler System Account". Müssen Dateien und Ordner von Netzwerk-Shares verarbeitet werden, so muss ein "User Account" angelegt und für den AutoOCR Dienst verwendet werden, der auch über die entsprechenden Rechte verfügt um auf die verwendeten Netzwerk-Shares zugreifen zu dürfen.
61 +
62 +**Was ist bei Zugriff auf Netzwerk-Ressourcen zu beachten?**
63 +
64 +* Der Dienst der auf Netzwerk Ressourcen Zugriff haben soll muss unter einem User Account laufen und nicht als System Account.
65 +* Der User unter dem der Dienst läuft muss über die entsprechenden Rechte (Lesen / Schreiben / Löschen) auf die Netzwerk Ressourcen verfügen.
66 +* Für den Zugriff auf die Netzwerk Ressourcen (Eingangs-, Ausgangs-, Fehler-, Archiv-, Log-Ordner) darf kein gemapptes Laufwerk verwendet werden, sondern es muss der direkte Netzwerk Share (UNC Pfad) verwendet werden.
67 +* Die Verarbeitungsoption für die Ordnerüberwachung muss von "Datei System Events" auf "Blockweise Verarbeitung" umgestellt werden.
68 +
69 +== Verarbeitungsoptionen ==
70 +
71 +=== Ordnerüberwachung ===
72 +
73 +Bei Anwendungen zur Überwachung von Ordnern (z.B.: AutoOCR, AutoOCRLight) gibt es Optionen die festlegen wie die Dateien zur Verarbeitung aus den Ordnern erkannt werden und wann deren Verarbeitung gestartet wird.
74 +
75 +**Datei-System Events:**
76 +
77 +Dabei wird eine Betriebssystem Funktion genutzt um Änderungen an Dateien sowie neue Dateien in einem Ordner/Ordnerstruktur zu erkennen und um die Verarbeitung unmittelbar zu starten. Diese Option sollte nur für lokale Ordner/Ordnerstrukturen, nicht jedoch für die Verarbeitung von Netzwerkfreigaben verwendet werden.
78 +
79 +**Blockweise Verarbeitung:**
80 +
81 +Dabei wird der Ordner "blockweise" eingelesen, d.h. es werden immer Blöcke in der eingestellten max. Anzahl von Dateien eingelesen und verarbeitet. Nach der Verarbeitung eines "Blocks" startet der nächste "Block" usw. bis alle Dateien abgearbeitet sind. Falls keine weiteren Dateien gefunden werden, so wird der Ordner danach alle 10msek. nach neuen Dateien abgefragt. Die "Blockweise Verarbeitung" sollte für die Ordnerüberwachung von Netzwerklaufwerken verwendet werden.
82 +
83 +**Start der Verarbeitung / Verzögerter Start:**
84 +
85 +Der Start der Verarbeitung einer neu erkannten Datei erfolgt normalerweise sofort, jedoch kann es auch Gründe geben um die Verarbeitung verzögert zu starten. Für jeden überwachten Ordner gibt es eine Einstellung um den Start der Verarbeitung um x Sekunden zu verzögern. Dabei wird zuerst die eingestellte Zeit in Sekunden abgewartet und erst dann wird die Verarbeitung gestartet. Nach Ablauf der Verzögerung werden die zu verarbeitenden Dateien geprüft ob diese bereits frei und nicht Read-Only sind. Dabei wird nochmals max. 10sek auf die Freigabe der Datei gewartet.
86 +
87 +== Web-Service ==
88 +
89 +Um die Web-Service FUnktion für AutoOCR nutzen zu können ist eine zusätzliche Lizenz erforderlich.
90 +
91 +Web-Service allgemeine Funktionen:
92 +
93 +* HTTP und abgesicherte HTTPS Kommunikation über Port 8001 und 8002 (konfigurierbar).
94 +* SOAP sowie REST Endpunkte für die Konvertier- sowie Administrator-Funktionen.
95 +* HTTP-, HTTPS-Verarbeitungs- sowie Administrator-Web-Service kann einzeln aktiviert und deaktiviert werden.
96 +* Authentifikation über HTTPS mit eigener Benutzerverwaltung über Username und Passwort.
97 +* Neben den Dateierweiterungen kann auch mit dem MIME Typ der Ein- und Ausgabe-Dateien gearbeitet werden.
98 +* Versionsinfo des Servers sowie der verwendete Lizenz Hash Wert kann abgefragt werden.
XKey Wiki 2019