Un PDF numérisé d'une lettre de cinq pages ne devrait pas faire 80 Mo. Mais c’est souvent le cas, et la raison tient presque toujours à la manière dont la numérisation a été configurée plutôt qu’au document lui-même. La taille du fichier d'un PDF numérisé n'a rien à voir avec la quantité de texte sur la page : elle est entièrement déterminée par les données d'image capturées par le scanner. Comprendre cette distinction pointe directement vers le correctif.

La résolution du scanner a été réglée trop élevée
Il s’agit de la cause la plus fréquente des PDF numérisés surdimensionnés et de loin. La résolution du scanner est mesurée en DPI (points par pouce). Plus le DPI est élevé, plus les données d'image sont capturées et plus le fichier résultant est volumineux. De nombreux scanners utilisent par défaut une résolution de 300 ou 600 DPI, ce qui est approprié pour l'archivage de documents que vous pourriez avoir besoin d'imprimer en grand format ou de zoomer de près. Pour un document texte standard que vous partagez par courrier électronique ou que vous téléchargez sur un portail, c'est excessif.
À 300 DPI, une seule page A4 en couleur produit environ 25 Mo de données d'image brutes avant toute compression. Multipliez cela par un document de 10 pages et vous commencez à 250 Mo avant même que le PDF ne soit enregistré. La plupart des scanners appliquent automatiquement la compression, mais le point de départ reste un grand nombre de données.
Pour les documents contenant uniquement du texte, 150 DPI suffisent pour une sortie nette et lisible. Pour les documents contenant des photos ou des diagrammes détaillés, 200 DPI est un plafond raisonnable à des fins de partage. Économisez plus de 300 DPI pour de véritables besoins d'archivage où vous devrez peut-être reproduire le document avec une qualité optimale ultérieurement.
Essayez de compresser PDF
Aucune installation nécessaire. Fonctionne directement dans votre navigateur.
Numérisation couleur au lieu des niveaux de gris ou du noir et blanc
Les numérisations couleur stockent trois canaux de données pour chaque pixel : les valeurs rouge, verte et bleue. Une analyse en niveaux de gris n’en stocke qu’un. Une numérisation en noir et blanc (bitonale) stocke un bit par pixel – soit en noir, soit en blanc, rien entre les deux. La différence de taille de fichier est significative : une numérisation couleur d'un document en texte brut peut être 10 à 20 fois plus grande que le même document numérisé en noir et blanc.
Si votre document est rédigé à l'encre noire sur du papier blanc (qui décrit la plupart des documents commerciaux, des contrats et des formulaires), la numérisation en couleur ne présente aucun avantage. La numérisation capturera la légère couleur crème du papier, les ombres grises près des trous d'agrafes et la subtile variation de densité de l'encre, dont vous n'avez pas besoin. Le passage au mode noir et blanc ou niveaux de gris dans les paramètres de votre scanner réduit considérablement la taille du fichier.
Aucune compression n'a été appliquée au moment de l'enregistrement
Certains logiciels de numérisation enregistrent les images numérisées avec une compression minimale ou nulle. Le scanner capture les données d'image brutes et les écrit dans le PDF presque telles quelles, ce qui donne un fichier inutilement volumineux pour ce qu'il contient. Cela varie selon le scanner et le logiciel : certains appliquent une compression agressive par défaut, d'autres y touchent à peine.
Si vous disposez déjà d'un PDF numérisé surdimensionné, l'exécuter via un outil PDF Compression est souvent la solution la plus rapide. Un bon outil de compression appliqué à un PDF numérisé peut réduire la taille du fichier de 60 à 80 % sans changement visible de la qualité, en particulier pour les documents texte en noir et blanc où les données d'image sont compressées de manière extrêmement efficace.
L'analyse inclut des pages inutiles ou des pages vierges
Les scanners équipés de chargeurs automatiques de documents font parfois passer des pages vierges supplémentaires, surtout si le verso du document est vide. Chaque page vierge est toujours stockée sous forme d'image complète dans le PDF, contribuant ainsi à la taille du fichier sans ajouter de contenu utile. Une numérisation de 20 pages avec 6 pages vierges accidentelles est 30 % plus grande que nécessaire.
Après la numérisation, examinez rapidement le PDF et supprimez toutes les pages vierges ou en double avant de l'enregistrer ou de le partager. La plupart des outils PDF vous permettent de supprimer des pages individuelles. Cela prend environ 30 secondes et peut réduire considérablement la taille finale.
Comment réduire la taille d'un __PDF numérisé existant__
Si l'analyse est déjà effectuée et que le fichier est trop volumineux, vous disposez de deux options principales : le compresser ou réanalyser avec de meilleurs paramètres. La nouvelle numérisation est la solution la plus propre si vous avez toujours accès au document physique et souhaitez obtenir le meilleur résultat possible. Mais si vous avez simplement besoin de ramener rapidement le fichier sous une limite de taille, la compression fonctionne bien.
L'outil PDF Compression de WukongPDF gère bien les PDF numérisés car il optimise directement les images intégrées - ce qui est exactement de quoi est composé un PDF numérisé. Téléchargez le fichier, choisissez votre niveau de compression et téléchargez le résultat. Pour un document texte numérisé typique, le résultat est généralement 70 à 85 % plus petit que l'original, sans perte de qualité visible.
Paramètres de numérisation à utiliser à l'avenir
Quelques modifications apportées aux paramètres de votre scanner permettront de conserver les fichiers gérables dès le départ :
- Documents texte uniquement : mode noir et blanc, 150 DPI
- Documents avec photos ou graphiques : niveaux de gris ou couleur, 200 DPI
- Archivage des originaux que vous pourriez avoir besoin de reproduire : 300 DPI, couleur le cas échéant
- Activez toujours la compression PDF dans votre logiciel de numérisation si l'option est disponible
Les PDF numérisés ne doivent pas nécessairement être volumineux. Les bons paramètres au moment de l'analyse permettent de conserver des fichiers petits sans sacrifier la qualité dont vous avez réellement besoin - et une passe de compression après coup gère tout ce qui s'est glissé.
Essayez de compresser PDF
Aucune installation nécessaire. Fonctionne directement dans votre navigateur.
