Modul Dokument-Verarbeitung
Das Modul Dokument-Verarbeitung bearbeitet die über einen Dokumenten-Eingang zugeführten Bilddateien, nimmt Dateiformatumwandlungen vor und führt - je nach Auswahl des Dateityps - auch eine OCR-Erkennung durch. Ohne dieses Modul ist die Zieldatei immer die vom Dokumenteneingang aus der zugeführten Bilddatei erzeugte TIFF-Datei.
Das Modul kann keine PDF-Dateien verarbeiten.
Das Modul kann mehrfach im Workflow vorkommen.
Das Modul kann mit allen Modulen verbunden werden (es können sich dadurch unsinnige Workflows ergeben).
Keine einschränkenden Module.
Ziel-Dateiformat, in das die zugeführte Datei gewandelt werden soll.
- JPG
- XPS
- PNG
- TIFF
- PDF - PDF-Datei enthält JPEG-Bild mit einstellbarer Kompression.
- PDF (Bild) - PDF-Datei enthält TIF-Bild mit einstellbarer Kompression.
- PDF/A (Bild) - PDF/A-konforme Datei enthält TIF-Bild mit einstellbarer Kompression.
- hcPDF - High Compression PDF.
OCR Formate (nicht lizenzfreie OCR-Formate sind am Gerät nur auswählbar, wenn das Gerät über eine OCR-Lizenz verfügt, siehe auch OCR und Barcode Erkennung)
- Portable Document Format (pdf)
Bei allen PDF-Formaten können beliebig viele Informationen als "Name: Wert"-Paare hinterlegt werden, die dann in den Dokumenteneigenschaften der PDF-Datei unveränderbar abgelegt werden.- PDF TS (OCR + Bild) (lizenzfreies OCR mit Tesseract)
- PDF/A TS (OCR + Bild) (lizenzfreies OCR mit Tesseract)
- PDF/A (nur OCR)
- PDF/A-1b (nur OCR)
- PDF/A-2b (nur OCR)
- PDF/A-2u (nur OCR)
- PDF (OCR + Bild)
- PDF/A (OCR + Bild)
- PDF/A-1b (OCR + Bild)
- PDF/A-2b (OCR + Bild)
- PDF/A-2u (OCR + Bild)
- Word (doc) OCR
- Word (docx) OCR
- Excel (xls) OCR
- Excel (xlsx) OCR
- PowerPoint (ppt) OCR
- PowerPoint (pptx) OCR
- Rich Text Format (RTF) OCR
- Text (txt) OCR
- Aus: Dateitrennung ist ausgeschaltet, alle im Dokumenteneinzug zusammen eingelesene Seiten werden in einer Datei gespeichert. Dies funktioniert nicht, wenn das Dateiformat nicht mehrere Seiten enthalten kann und bei allen Bildformaten (z.B. TIFF, JPG).
- Seitenanzahl: Die Dateitrennung ist aktiv und speichert jeweils die angegebene Anzahl Seiten in eine Datei (werden z.B. 6 Seiten gescannt und es wird 2 Seiten gewählt ergibt dies 3 Dateien mit jeweils 2 Seiten). S/W-TIFF-Dokumente werden mit LZW komprimiert. Eine Liste der resultierenden Dateinamen ist in der Variable %ResultFileNames% gespeichert.
Mit der Jpeg-Qualität legen Sie die Qualität von Jpeg-Dateien, die in PDF-Dateien eingebettet werden, fest. Diese Einstellung betrifft also nur PDF-Dateien. Mit dieser Einstellung können Sie auch die Größe der resultierenden PDF-Datei beeinflussen.
Je höher die Prozentangabe der Qualität, desto größer wird die resultierende Datei sein (nicht proportional).
- 50%
- 75%
- 90%
- 100%
Ähnlich der Funktion Kombinieren beim Kopieren können mit dieser Funktion beim Scannen zwei Seiten hochkant nebeneinander verkleinert auf einer querformatigen Seite abgebildet werden.
- Aus: Zwei auf eins ist ausgeschaltet, die Seiten bleiben unverändert.
- Ein: Zwei Seiten werden hochkant nebeneinander verkleinert auf einer querformatigen Seite abgebildet.
Beim Dateiformat PDF kann eine Datei mit einem Kennwortschutz versehen werden. Bei anderen Dateiformaten wird diese Einstellung ignoriert. Das Kennwort wird zum Öffnen der PDF-Datei benötigt.
- Passwort: Wenn die PDF-Datei passwortgeschützt sein soll geben Sie das Passwort hier an. Der Inhalt des Passwortes kann auch aus einer Variable stammen (z.B. vom Zonen-OCR oder aus XML-Dateiübergabe).
Bei allen Archivformaten (PDF/A...) ist ein Passwortschutz gemäß der PDF-Definition nicht möglich.
Der ImageService bearbeitet Bilddaten (z.B. von Scans) und führt Dateiformatumwandlungen, Bildoptimierungen und OCR Erkennung durch. Er legt Dateien in gewünschten Zielverzeichnissen ab (je nach verwendetem Modul werden dazu die Rechte des Anwenders verwendet, der seinen Anwendungspool ausführt). Seine Logdatei ist Logs\ImageService.log.