La compression d'un PDF le rend plus petit, mais "plus petit" couvre une gamme de choses qui se passent sous le capot. Ce qui est réellement modifié dépend de ce que contient le fichier et du type de compression appliqué. Comprendre cela vous aide à prédire à quoi ressemblera le résultat et explique pourquoi le même paramètre de compression produit des résultats radicalement différents sur différents documents.

A PDF contient plusieurs types de données dans un seul fichier
Avant d'aborder ce que fait la compression, il est utile de savoir ce qu'il y a à l'intérieur d'un PDF. Un document typique contient une combinaison de : des graphiques vectoriels (formes, lignes, graphiques dessinés mathématiquement), des images raster (photographies, pages numérisées, captures d'écran), du texte avec des données de police, des métadonnées du document (auteur, date de création, titre) et des informations structurelles (mise en page, signets, liens). Chacun d’eux est stocké différemment et répond différemment à la compression.
Essayez de compresser PDF
Aucune installation nécessaire. Fonctionne directement dans votre navigateur.
Qu'arrive-t-il aux images
Les images constituent l'endroit où se trouve la majeure partie de la taille du fichier PDF, et c'est là que la compression a l'effet le plus spectaculaire. Lorsque vous compressez un PDF, l'outil réencode les images intégrées à l'aide d'un algorithme de compression plus agressif, généralement JPEG pour les images en couleur, JBIG2 ou CCITT pour les images en noir et blanc. Cela réduit la quantité de données stockées pour représenter chaque image.
La compression JPEG entraîne des pertes : elle supprime définitivement certaines données d'image pour obtenir des fichiers de plus petite taille. Avec des paramètres de qualité élevée (80 à 90 %), les données rejetées se trouvent dans les zones de l'image où l'œil humain est le moins sensible : texture fine, dégradés de couleurs subtils, détails haute fréquence. Le résultat semble essentiellement identique. Avec des paramètres de qualité inférieurs, les données supprimées deviennent visibles sous forme de blocs, de flou ou de bandes de couleurs – les artefacts JPEG classiques.
Le sous-échantillonnage est une étape connexe appliquée par certains outils de compression. Il réduit les dimensions en pixels des images (une image de 300 DPI peut devenir 150 DPI), ce qui rend les fichiers beaucoup plus petits mais rend également les images plus douces si elles sont imprimées ou zoomées. Les outils de qualité PDF Compression ignorent le sous-échantillonnage ou en font un paramètre facultatif.
Qu'arrive-t-il au texte
Le texte d'un PDF est stocké sous forme de caractères avec des positions, des styles et des références de police, et non sous forme d'images de lettres. Ces données sont compressées très efficacement à l'aide d'algorithmes sans perte comme Deflate (le même algorithme utilisé dans les fichiers ZIP). La compression sans perte réduit la taille du fichier sans supprimer aucune donnée : la sortie décompressée est identique bit par bit à l'original.
Cela signifie que le texte d'un PDF compressé est exactement le même que celui de l'original : mêmes caractères, mêmes positions, même rendu de police. Le texte d'un document compressé n'est en aucun cas dégradé. Si le texte d'un PDF compressé semble différent, le problème est le rendu de la police dans la visionneuse, et non la compression.
Qu'arrive-t-il aux polices
Les polices intégrées peuvent contribuer de manière significative à la taille du fichier. Un PDF qui intègre des fichiers de polices complets pour cinq polices de caractères peut contenir à lui seul plusieurs mégaoctets de données de police. Les outils de compression peuvent résoudre ce problème en supprimant de la police intégrée tous les caractères qui ne sont pas réellement utilisés dans le document. Un document qui utilise uniquement les lettres A à Z et 0 à 9 n'a pas besoin d'intégrer le jeu de caractères Unicode complet.
Le sous-ensemble de polices est sans perte du point de vue du lecteur : le document s'affiche toujours correctement car tous les caractères qui y apparaissent sont toujours présents. Les économies dépendent du nombre de caractères incorporés dans la police d’origine par rapport au nombre réellement utilisé.
Ce qui est entièrement supprimé
Au-delà de la compression des données existantes, les outils de compression suppriment également la surcharge qui s'accumule dans les PDF au fil du temps. Chaque fois qu'un PDF est modifié et enregistré, la version précédente des éléments modifiés est souvent conservée dans la structure du fichier plutôt que supprimée. C'est ainsi que fonctionnent l'historique d'annulation et la récupération de version dans les éditeurs PDF. Un document qui a subi de nombreux cycles de modification et de sauvegarde peut comporter un poids mort important : anciennes versions d'objets, données en double, contenu supprimé qui n'a jamais été réellement supprimé du fichier.
La compression nettoie cela. L'outil reconstruit la structure des fichiers à partir de zéro, en conservant uniquement l'état actuel de chaque élément et en supprimant l'historique accumulé. C'est pourquoi les PDF fraîchement compressés sont parfois considérablement plus petits que prévu : le fichier contenait une surcharge cachée importante provenant des modifications précédentes.
Ce qui reste exactement le même
La compression ne modifie pas le contenu, la mise en page ou la structure du document. Le nombre de pages, l'ordre des pages, le contenu du texte, les graphiques vectoriels, les signets, les hyperliens et les champs de formulaire restent tous intacts. Le PDF compressé s'ouvre, s'affiche et se comporte de manière identique à l'original à toutes fins pratiques.
Ce qui peut changer, en fonction des paramètres, c'est la netteté de l'image à des niveaux de zoom élevés et les métadonnées du fichier. Certains outils de compression suppriment ou mettent à jour les métadonnées, ce qui est généralement correct, mais il vaut la peine de savoir si la date de création d'origine ou le champ de l'auteur est important pour vos enregistrements.
Essayez de compresser PDF
Aucune installation nécessaire. Fonctionne directement dans votre navigateur.
