Un fichier PDF peut contenir deux types de contenu visuel fondamentalement différents : raster et vectoriel. La plupart des PDF contiennent les deux : des photographies stockées sous forme d'images raster, du texte et des diagrammes stockés sous forme de données vectorielles. Comprendre la différence explique pourquoi certains PDF semblent nets à n'importe quel niveau de zoom tandis que d'autres deviennent pixellisés, pourquoi certains fichiers sont volumineux et d'autres minuscules, et pourquoi certains contenus résistent à l'édition alors que d'autres contenus peuvent être modifiés avec précision.

Contenu raster : grilles de pixels
Le contenu raster est constitué de pixels – une grille fixe de points colorés. Une photographie intégrée dans un PDF est raster : chaque pixel a une valeur de couleur spécifique et ensemble, ils forment l'image. La principale caractéristique du contenu raster est qu’il a une résolution fixe. À 300 DPI, une image raster semble nette lorsqu'elle est imprimée à sa taille prévue. Agrandissez-le à 200 % et vous obtenez la moitié de la résolution : les pixels deviennent visibles sous forme de carrés, l'image semble floue.
Les PDF numérisés sont entièrement matriciels : chaque page est une photographie. C'est pourquoi les fichiers Scanned PDF sont volumineux (beaucoup de données de pixels), ne peuvent pas être recherchés (pas de texte, juste des points colorés disposés pour ressembler à des lettres) et semblent pixellisés lorsqu'ils sont agrandis de manière significative. La qualité PDF que vous voyez dépend directement du DPI auquel la numérisation a été capturée.
Essayez de modifier PDF
Aucune installation nécessaire. Fonctionne directement dans votre navigateur.
Contenu vectoriel : descriptions mathématiques
Le contenu vectoriel est défini par des formules mathématiques plutôt que par des pixels. Une ligne dans un graphique vectoriel est décrite comme « début aux coordonnées (10, 20), fin à (150, 20), largeur de trait 2 pts, couleur noire ». - pas comme une rangée de pixels noirs. Le texte d'un PDF numérique est vectoriel : chaque caractère est une forme mathématique définie par des courbes et des coordonnées, et non un bitmap de pixels.
Le contenu vectoriel étant défini mathématiquement, il s’adapte parfaitement à n’importe quelle taille. Zoomez à 1 000 % sur le texte d'un PDF numérique et il reste parfaitement net : le moteur de rendu recalcule les courbes à la nouvelle taille. Imprimez-le sur un panneau d'affichage ou une carte de visite et il est tout aussi net. Il en va de même pour les logos, diagrammes et graphiques créés dans des outils vectoriels comme Illustrator ou exportés à partir d'applications qui génèrent une sortie vectorielle PDF.
Comment un PDF typique mélange les deux types
Un PDF professionnel typique – un rapport, une présentation, une brochure – contient les deux types simultanément. Le texte est vectoriel (net quelle que soit sa taille, compact à stocker, consultable). Les graphiques et diagrammes créés dans l’application source peuvent être vectoriels. Les photographies et images copiées sur le Web sont matricielles. Les icônes et les logos peuvent l'être, selon la manière dont ils ont été créés et intégrés.
C'est pourquoi le zoom sur une page PDF affiche un texte net et des dessins au trait nets, mais des photos floues : le texte et les diagrammes sont vectoriels tandis que les photographies sont raster à leur résolution intégrée. C'est également la raison pour laquelle la compression d'un PDF réduit considérablement la taille du fichier lorsque des images sont présentes, mais affecte à peine les PDF contenant beaucoup de texte : vous compressez des données de pixels raster, pas des descriptions mathématiques vectorielles.
Pourquoi cela est important dans la pratique
- Qualité d'impression : le contenu vectoriel s'imprime de manière nette, quelle que soit la taille. Le contenu raster ne s'imprime correctement que si sa résolution intégrée est suffisante pour la taille d'impression : une image Web de 72 DPI imprimée en pleine page semble floue.
- Taille du fichier : le contenu vectoriel est compact : un diagramme complexe stocké sous forme de vecteurs peut peser quelques kilo-octets. Le même diagramme qu'une image raster à 300 DPI pourrait faire plusieurs mégaoctets. Le remplacement des images raster par des équivalents vectoriels dans un PDF réduit considérablement la taille du fichier.
- Modification : le texte vectoriel dans un PDF peut être sélectionné, copié et modifié (avec les bons outils). Le texte raster n'est constitué que de pixels : la sélection de mots individuels n'est pas possible sans traitement OCR.
- Comportement de compression : PDF La compression affecte principalement les images raster. Le contenu vectoriel est peu compressé car il est déjà mathématiquement efficace. Un PDF qui ne rétrécit pas beaucoup sous la compression est probablement principalement du contenu vectoriel.
Comment savoir quel type de contenu vous consultez
Le test du zoom est définitif : dans n'importe quel visualiseur PDF, zoomez à 400-500 % sur le contenu en question. S'il reste parfaitement net – bords nets, aucune pixellisation visible – c'est vectoriel. Si les pixels deviennent visibles sous forme de carrés ou si l'image s'adoucit et devient floue, il s'agit d'un raster.
Pour le texte en particulier : si vous pouvez cliquer dessus et sélectionner des mots individuels, il s'agit d'un texte vectoriel. Si un clic sélectionne la page entière en tant que bloc d'image, le texte est raster : il n'existe que sous forme de pixels dans une image de page, et non sous forme de données textuelles réelles. Il s'agit du même test utilisé pour déterminer si un PDF Editor peut travailler avec le contenu ou si l'OCR est nécessaire en premier.
Essayez de modifier PDF
Aucune installation nécessaire. Fonctionne directement dans votre navigateur.
