PDF avec balises

Les fichiers PDF balisés intègrent des métadonnées décrivant la structure du document et l’ordre des différents éléments composant le document (par exemple images, blocs de texte, colonnes, titres). Les balises facilitent l’extraction du texte ou des graphiques présents dans les fichiers PDF et permettent aux lecteurs d’écran de définir l’ordre de lecture correct des différents éléments d’un PDF. Certaines normes d’accessibilité peuvent nécessiter le balisage des fichiers PDF.

 

Pour créer des PDF avec balises, procédez comme suit à partir d’un profil de l’Assistant PDF Create :

 

Dans la zone de sélection PDF Converter profile PDF avec balises Profil, sélectionnez PDF avec balises. Par défaut, l’option Baliser le PDF est activée par défaut pour ce profil.

Vous pouvez cependant sélectionner un autre profil dans la zone de sélection PDF Converter profile PDF avec balises Profil, et activer l’option Baliser le PDF dans la boîte de dialogue Profils PDF Create.

 

L’algorithme de balisage analyse le contenu du fichier PDF. Il détecte les paragraphes, les tableaux, les cellules de tableaux et les images (bitmap). Si le fichier d’entrée est un PDF comportant des annotations et/ou des champs de formulaires, ces derniers sont également balisés. Les noms standard des balises sont <div> pour une page et <p> pour le contenu considéré comme un paragraphe.

 

Dans PDF Converter Professional, vous pouvez baliser un PDF en sélectionnant Outils > Baliser le PDF. Si vous utilisez cette commande sur un PDF balisé, les balises existantes sont remplacées.

Pour étudier ou modifier les informations relatives aux balises d’un objet texte, sélectionnez-le à l’aide de l’outil PDF Converter touchuptext PDF avec balises Retoucher du texte, cliquez avec le bouton droit pour afficher un menu contextuel, sélectionnez Propriétés… pour afficher la boîte de dialogue Propriétés de retouche et accédez aux volets Contenu et Balise.

Le volet de navigation Balises permet de réaliser diverses opérations sur les balises. Utilisez-le pour vérifier si le paragraphe a été correctement détecté, pour fusionner les balises si nécessaire et pour ajouter un texte descriptif aux éléments balisés.

Le balisage d’un PDF est une opération sollicitant de nombreuses ressources (plusieurs minutes peuvent être nécessaires). Appuyez sur la touche Échap pour annuler un processus de balisage.

 

 

Remarques

Nous vous déconseillons d’utiliser la fonction de balisage avec des fichiers superposés ou contenant des filigranes. Avec ces fichiers, les paragraphes et tableaux risquent en effet de ne pas être détectés.

Il n’est pas possible de générer des fichiers PDF balisés en choisissant l’imprimante ScanSoft PDF Create! depuis une boîte de dialogue Imprimer.

Vous pouvez également générer des fichiers PDF balisés à partir de vos documents Word. Pour accéder aux options de balisage, ouvrez l’onglet Balises de la boîte de dialogue Paramètres Nuance PDF pour Word.

PDF avec balises