Dokumentenverarbeitung
Mit IQ4docs können Sie Dokumente umfangreich bearbeiten und sie an verschiedene Ziele weiterleiten. Das Dokument kann dabei als Papiervorlage vorliegen und per Scan dem Prozess zugeführt werden - Sie können die Dokumente aber auch bereits in Dateiform dem System zuführen (Dokumenteneingang).
Um den Dokumenteneingang nutzen zu können, müssen alle Geräte mit Embedded Client eine OCR-Lizenz besitzen und die Lizenzoption OCR aus E-Mail / Verzeichnis aktiv sein, siehe Lizenzierung .
Bei der Nutzung eines Dokumenteneingangs werden die Dateien nicht wie beim Scannen über das Gerät der Dokumentenverarbeitung zugeführt, sondern liegen bereits als Datei vor und werden über ein Verzeichnis oder über ein E-MailPostfach zugeführt, siehe Dokumenteneingang.
Die Bildverbesserungen werden im Workflow durch das Modul Bildverbesserung ausgeführt.
- Nicht entfernen: Die Seiten bleiben unverändert.
- Entfernen: Die Ränder des Blattes werden durch weiß ersetzt. Dies kann z.B. bei einem Buchscan die an den Seitenrändern auftretenden dunklen Schatten entfernen. Diese Funktion kann ausschließlich auf weißen Seiten angewendet werden.
- Nicht entfernen: Die Seiten bleiben unverändert.
- Entfernen: Es wird versucht an den Blatträndern eingescannte, deutlich sichtbare Überreste von Stanzlöchern zu entfernen, die meist durch Schatten entstehen.
- Nicht korrigieren: Die Seiten bleiben unverändert.
- korrigieren: Es wird versucht den Inhalt einer leicht schräg eingescannten Seite geradezurichten. Diese Funktion wird bei der OCR-Erkennung immer automatisch ausgeführt um das Schrifterkennungsergebnis zu verbessern.
- Nicht entfernen: Die Seiten bleiben unverändert.
- Entfernen: Leere Seiten werden aus dem Dokument entfernt. Das Papier darf dazu nicht zu stark verschmutzt oder verknickt sein, da die Bildverarbeitung dies als gewünschten Seiteninhalt erkennen könnte.
- Nicht entfernen: Die Seiten bleiben unverändert.
- Entfernen: Es wird versucht weiße Ränder um das gescannte Bild zu erkennen und automatisch zu entfernen.
- Aus: Die Seiten bleiben unverändert.
- Ein: Es wird versucht die Randpixel von Linien aufzufüllen und die Linie dadurch leicht zu verstärken. Diese Funktion erfordert zwingend das Farbformat s/w (bei Graustufen oder Farbe wird die Option ignoriert).
- Aus: Die Seiten bleiben unverändert.
- Ein: Es wird versucht die Randpixel von Linien zu entfernen und die Linie dadurch leicht zu verschlanken. Diese Funktion erfordert zwingend das Farbformat s/w (bei Graustufen oder Farbe wird die Option ignoriert).
Um ein besseres Bildverbesserungsergebnis zu erhalten (z.B. beim Entfernen von Stanzlöchern) kann das Bild dazu invertiert werden.
Die Invertierung passiert intern und wird rein für die Verarbeitung verwendet. Der Scan selber wird anschließend immer normal (d.h. nicht invertiert) ausgegeben. Probieren Sie aus, welche Einstellung das beste Ergebnis für Ihre Scanvorlagen liefert.
- Auto: Das System entscheidet selber, ob die Verarbeitung mit einem normalen oder invertiertem Bild erfolgt.
- Normal: Die Verarbeitung erfolgt mit einem normalen Bild.
- Invers: Die Verarbeitung erfolgt mit einem invertierten Bild.
Die Umwandlung in das gewünschte Dateiformat wird vom Modul Dokument-Verarbeitung vorgenommen.
- JPG
- XPS
- PNG
- TIFF
- PDF - PDF-Datei enthält JPEG-Bild mit einstellbarer Kompression.
- PDF (Bild) - PDF-Datei enthält TIF-Bild mit einstellbarer Kompression.
- PDF/A (Bild) - PDF/A-konforme Datei enthält TIF-Bild mit einstellbarer Kompression.
- hcPDF - High Compression PDF.
OCR Formate (nicht lizenzfreie OCR-Formate sind am Gerät nur auswählbar, wenn das Gerät über eine OCR-Lizenz verfügt, siehe auch OCR und Barcode Erkennung)
- Portable Document Format (pdf)
Bei allen PDF-Formaten können beliebig viele Informationen als "Name: Wert"-Paare hinterlegt werden, die dann in den Dokumenteneigenschaften der PDF-Datei unveränderbar abgelegt werden.- PDF TS (OCR + Bild) (lizenzfreies OCR mit Tesseract)
- PDF/A TS (OCR + Bild) (lizenzfreies OCR mit Tesseract)
- PDF/A (nur OCR)
- PDF/A-1b (nur OCR)
- PDF/A-2b (nur OCR)
- PDF/A-2u (nur OCR)
- PDF (OCR + Bild)
- PDF/A (OCR + Bild)
- PDF/A-1b (OCR + Bild)
- PDF/A-2b (OCR + Bild)
- PDF/A-2u (OCR + Bild)
- Word (doc) OCR
- Word (docx) OCR
- Excel (xls) OCR
- Excel (xlsx) OCR
- PowerPoint (ppt) OCR
- PowerPoint (pptx) OCR
- Rich Text Format (RTF) OCR
- Text (txt) OCR
- Aus: Dateitrennung ist ausgeschaltet, alle im Dokumenteneinzug zusammen eingelesene Seiten werden in einer Datei gespeichert. Dies funktioniert nicht, wenn das Dateiformat nicht mehrere Seiten enthalten kann und bei allen Bildformaten (z.B. TIFF, JPG).
- Seitenanzahl: Die Dateitrennung ist aktiv und speichert jeweils die angegebene Anzahl Seiten in eine Datei (werden z.B. 6 Seiten gescannt und es wird 2 Seiten gewählt ergibt dies 3 Dateien mit jeweils 2 Seiten). S/W-TIFF-Dokumente werden mit LZW komprimiert. Eine Liste der resultierenden Dateinamen ist in der Variable %ResultFileNames% gespeichert.
Mit der Jpeg-Qualität legen Sie die Qualität von Jpeg-Dateien, die in PDF-Dateien eingebettet werden, fest. Diese Einstellung betrifft also nur PDF-Dateien. Mit dieser Einstellung können Sie auch die Größe der resultierenden PDF-Datei beeinflussen.
- 50%
- 75%
- 90%
- 100%
Ähnlich der Funktion Kombinieren beim Kopieren können mit dieser Funktion beim Scannen zwei Seiten hochkant nebeneinander verkleinert auf einer querformatigen Seite abgebildet werden.
- Aus: Zwei auf eins ist ausgeschaltet, die Seiten bleiben unverändert.
- Ein: Zwei Seiten werden hochkant nebeneinander verkleinert auf einer querformatigen Seite abgebildet.
Beim Dateiformat PDF kann eine Datei mit einem Kennwortschutz versehen werden. Bei anderen Dateiformaten wird diese Einstellung ignoriert. Das Kennwort wird zum Öffnen der PDF-Datei benötigt.
- Ohne: Die Datei wird ohne einen Passwortschutz erstellt.
- Gesetzt: Ein Passwort wurde angegeben. Mit diesem Passwort wird die Datei versehen.
Bei allen Archivformaten (PDF/A...) ist ein Passwortschutz gemäß der PDF-Definition nicht möglich.
Die Dateien können an verschiedenen Zielen abgelegt werden, die nachstehenden Module für die Ziele stehen zur Verfügung.
Sie können einem Dokumenten-Workflow bei Verwendung des Dokumenteneingangs Ordner zusätzlich zu einer Bilddatei eine XML-Datei übergeben, mit der Variablen an den Workflow übergeben werden können. Die Variablen können dann wie die Variablen eines Anwender-Interviews im Workflow verwendet werden (siehe auch Dokumentenverarbeitung).
Variablennamen dürfen keine Sonderzeichen enthalten. Erlaubt sind kleine und große Buchstaben (keine Umlaute o.Ä.), Zahlen und der Punkt ".".
Wird der Variablenname an mehreren Stellen verwendet, können alle Stellen den Variablenwert beeinflussen.
Die XML-Datei muss den gleichen Namen haben wie die zugehörige Bilddatei (test.tif > test.xml).
<DocumentOptions>
<UserLogin>administrator</UserLogin>
<Variables>
<variable name="Name1" value="value1" type="string"/>
<variable name="Name2" value="222" type="int"/>
</Variables>
</DocumentOptions>
- Der Hauptbereich <DocumentOptions> muss zwingend vorhanden sein.
- Der Bereich <Variables> enhält Variablendefinitionen.
- <variable name="Name1" value="value1" type="string"/> definiert eine Variable Namens Name1 mit dem Inhalt value1 vom Typ string (Zeichenkette). Ein numerischer Wert kann auch als int (integer, Ganzzahl) definiert werden.
Der Typ ist für die Formatierung der Variable interessant (fehlt er, wird string angenommen), siehe auch Variablen.