Indexation de documents PDF

Un index stocke de manière compacte le contenu de nombreux fichiers PDF, afin de simplifier la recherche et l’extraction de données.

Utilisez la commande Document > Traitement avancé > Créer un index de texte complet… pour créer ou mettre à jour un index.

Les documents PDF à indexer doivent utiliser des caractères latins ou asiatiques (chinois, japonais ou coréen). Vous pouvez indexer le texte des documents, mais aussi les signets, commentaires, pièces jointes, signatures numériques, champs de formulaire, métadonnées et d’autres propriétés personnalisées des documents.

Le fichier d’index est créé à partir de tous les fichiers PDF situés dans un ensemble de dossiers que vous avez défini. Avant de lancer le processus d’indexation, choisissez le dossier où sera stocké l’index. L’indexation s’exécute en tâche de fond. Un fichier de définition d’index est créé, peu volumineux et se terminant par l’extension .zpi. Celui-ci est associé aux fichiers d’index stockés dans un sous-dossier créé automatiquement. Ce sous-dossier porte le même nom que le fichier .zpi et se termine par _index.

Ces index de recherche ne sont pas incorporés aux fichiers PDF. Pour permettre à d’autres utilisateurs de les utiliser, vous devez les enregistrer dans un emplacement partagé. Pour créer un index incorporé pour un seul document et faciliter ainsi sa distribution, vous devez utiliser une commande différente.
 

Préparation de l’indexation

Regroupez tous les documents PDF à indexer dans un ou plusieurs dossiers. Si vous utilisez des dossiers existants, assurez-vous qu’ils ne comprennent que les fichiers PDF que vous souhaitez indexer.

Si vous prévoyez de déplacer ultérieurement les fichiers PDF et leur index, il est préférable de les stocker dans un seul et même dossier.

Ajoutez des propriétés spécifiques aux documents PDF, que vous pourrez ensuite utiliser comme critères de recherche.

  • Choisissez Document > Propriétés du document > Description pour ajouter un titre, un sujet, un auteur, une URL de base et des mots-clés représentatifs du contenu du fichier. Choisissez Propriétés du document > Propriétés personnalisées pour ajouter des champs personnalisés.

Remarques

Veuillez noter que si vous créez un index de texte complet avant de biffer un document et de supprimer les informations confidentielles qu’il contient, ces informations ne seront PAS supprimées de l’index et pourront donc être faciles à retrouver. À la fin de la biffure, vous êtes invité à inspecter le document. Acceptez la proposition et supprimez l’index. Nous vous recommandons de réaliser la biffure et l’inspection sur une copie du document afin de conserver l’index dans le document d’origine.

L’indexation de centaines de fichiers PDF volumineux peut s’avérer longue et mobiliser de nombreuses ressources informatiques : profitez de votre pause déjeuner pour réaliser cette opération.

 

 

 

Indexation de documents PDF