Durchsuchbare PDF-Dateien

Enthält eine reine Bild-PDF Text oder haben Sie eine PDF-Datei aus Bilddateien erstellt, die Textelemente enthalten, können Sie diese Dokumente nicht nach ihrem Inhalt durchsuchen. Um solche Dateien durchsuchen zu können, extrahieren Sie den Text mit der optischen Zeichenerkennung, OCR. Ein durchsuchbares PDF-Dokument zeigt Seitenbilder an, enthält aber gleichzeitig eine zusätzliche Textebene, in der jedes Textzeichen dem entsprechenden Zeichen auf dem Seitenbild zugeordnet ist. Dadurch wird es möglich, die PDF zu durchsuchen. Durchsuchbare PDF-Dateien sind besonders nützlich, wenn Sie auf Inhalte in Dokumenten zugreifen möchten, die mit originalgetreuem Aussehen archiviert werden müssen.

 

Hinweis

Wenn Sie Durchsuchbare PDF ausgewählt haben, wird die OCR nur durchgeführt, wenn in der Eingabedatei keine Textebene verfügbar ist. Wird eine Textebene gefunden, wird daraus ohne Durchführung der OCR eine reguläre PDF erstellt, die durchsucht werden kann, und zwar auch, wenn Durchsuchbare PDF aktiviert ist.

 

Mit dem PDF Create-Assistenten können Sie Nur-Bild-PDF-Dateien oder verschiedene Bilddateitypen in durchsuchbare PDF-Dokumente konvertieren.

Die Sprache für die OCR legen Sie im Dialogfeld Konvertierungseinstellungen für durchsuchbare PDFs fest.

Tipp

Eine Liste der unterstützten Dateitypen finden Sie im Hilfethema Der PDF Create-Assistent.

 

Der PDF Create-Assistent enthält ein vordefiniertes Profil für durchsuchbare PDFs. Sie können durchsuchbare PDF-Dateien aber auch erstellen, indem Sie in einem anderen Profil das Kontrollkästchen Durchsuchbar markieren.

 

So verwenden Sie das Profil „Durchsuchbare PDF“ im PDF Create-Assistenten:

  1. Öffnen Sie den Nuance PDF Create-Assistenten.

  2. Wählen Sie in der Dropdown-Liste PDF Converter profile Durchsuchbare PDF Dateien Profil die Option Durchsuchbare PDF.

  3. Klicken Sie auf die Schaltfläche Profile…, um die Einstellungen im Dialogfeld PDF Create-Profile anzuzeigen. Das Kontrollkästchen Durchsuchbare PDF ist standardmäßig markiert. Behalten Sie diese Einstellung bei, und nehmen Sie ggf. Änderungen an den übrigen Optionen vor (z. B. Sicherheit, Wasserzeichen usw.).

  4. Klicken Sie auf die Schaltfläche Einstellungen, um das Dialogfeld Konvertierungseinstellungen für durchsuchbare PDFs anzuzeigen. Wählen Sie die Sprache, in der das Dokument geschrieben ist. Schließen Sie das Dialogfeld.

So erstellen Sie eine durchsuchbare PDF mit anderen Profilen:

  1. Öffnen Sie den Nuance PDF Create-Assistenten.

  2. Wählen Sie in der Dropdown-Liste PDF Converter profile Durchsuchbare PDF Dateien Profil ein Profil aus.

  3. Klicken Sie auf die Schaltfläche Profile.

  4. Markieren Sie im Dialogfeld PDF Create-Profile das Kontrollkästchen Durchsuchbar.

  5. Klicken Sie auf die Schaltfläche Einstellungen, um das Dialogfeld Konvertierungseinstellungen für durchsuchbare PDFs anzuzeigen. Wählen Sie die Sprache, in der das Dokument geschrieben ist. Klicken Sie auf OK.

  6. Nehmen Sie im Dialogfeld PDF Create-Profile ggf. Änderungen an den übrigen Optionen vor (z. B. Sicherheit, Wasserzeichen usw.). Klicken Sie auf OK.

Tipp

Wenn Sie eine durchsuchbare PDF mit MRC-Komprimierung erstellen möchten, markieren Sie beide Kontrollkästchen. Wenn Sie in diesem Fall auf die Schaltfläche Einstellungen klicken, wird das Dialogfeld Konvertierungseinstellungen für durchsuchbare MRC-PDFs angezeigt.

 

 

Wenn Sie eine Nur-Bild-PDF-Datei oder eine Datei mit Nur-Bild-Seiten in PDF Converter Professional öffnen, erkennt das Programm dies automatisch und bietet folgende Optionen zur Konvertierung an:

  • Durchsuchbare PDF: Dabei werden die ursprünglichen Seitenbilder beibehalten, sodass die Darstellung erhalten bleibt, es wird jedoch eine durchsuchbare Textebene hinzugefügt.

  • PDF Normal: Erzeugt Text und behält Bilder bei, aber entfernt die ursprünglichen Seitenbilder.

  • PDF-Formular: Hier wird mithilfe von FormTyper ein Formular mit aktiven Formular-Steuerelementen erstellt.

  • PDF-Datei: Bleibt unverändert erhalten.

Weitere Informationen siehe PDF-Dokumente bearbeiten.

 

//

Durchsuchbare PDF-Dateien