Others

¿Qué le sucede a un PDF cuando lo comprimes?

Comprimir un PDF lo hace más pequeño, pero "más pequeño" cubre una variedad de cosas que suceden bajo el capó. Lo que realmente se cambia depende de lo que contiene el archivo y del tipo de compresión que se aplica. Comprender esto le ayuda a predecir cómo se verá el resultado y explica por qué la misma configuración de compresión produce resultados dramáticamente diferentes en diferentes documentos.

What Happens to a PDF When You Compress It?

A PDF son varios tipos de datos en un solo archivo

Antes de entrar en lo que hace la compresión, es útil saber qué hay dentro de un PDF. Un documento típico contiene alguna combinación de: gráficos vectoriales (formas, líneas, cuadros dibujados matemáticamente), imágenes rasterizadas (fotografías, páginas escaneadas, capturas de pantalla), texto con datos de fuente, metadatos del documento (autor, fecha de creación, título) e información estructural (diseño de página, marcadores, enlaces). Cada uno de estos se almacena de manera diferente y responde a la compresión de manera diferente.

WukongPDF

Intente comprimir PDF

No se necesita instalación. Funciona directamente en su navegador.

Empezar ahora →

Qué sucede con las imágenes

Las imágenes son el lugar donde reside la mayor parte del tamaño de un archivo PDF y es donde la compresión tiene el efecto más dramático. Cuando comprime un PDF, la herramienta vuelve a codificar las imágenes incrustadas utilizando un algoritmo de compresión más agresivo, normalmente JPEG para imágenes en color, JBIG2 o CCITT para blanco y negro. Esto reduce la cantidad de datos almacenados para representar cada imagen.

La compresión JPEG produce pérdidas: descarta permanentemente algunos datos de la imagen para lograr tamaños de archivo más pequeños. En configuraciones de alta calidad (80-90%), los datos descartados se encuentran en áreas de la imagen donde el ojo humano es menos sensible: textura fina, gradientes de color sutiles, detalles de alta frecuencia. El resultado parece esencialmente idéntico. En configuraciones de calidad más bajas, los datos descartados se vuelven visibles como bloques, desenfoque o bandas de color: los clásicos artefactos JPEG.

La reducción de resolución es un paso relacionado que aplican algunas herramientas de compresión. Reduce las dimensiones en píxeles de las imágenes (una imagen de 300 DPI puede convertirse en 150 DPI), lo que hace que los archivos sean mucho más pequeños pero también hace que las imágenes sean más suaves si se imprimen o se amplían. Las herramientas de calidad PDF Compresión omiten la reducción de resolución o la convierten en una configuración opcional.

Qué sucede con el texto

El texto de un PDF se almacena como caracteres con posiciones, estilos y referencias de fuentes, no como imágenes de letras. Estos datos se comprimen de manera muy eficiente utilizando algoritmos sin pérdidas como Deflate (el mismo algoritmo utilizado en los archivos ZIP). La compresión sin pérdidas reduce el tamaño del archivo sin eliminar ningún dato: la salida descomprimida es idéntica bit a bit al original.

Esto significa que el texto en un PDF comprimido es exactamente el mismo que en el original: los mismos caracteres, las mismas posiciones, la misma representación de fuente. El texto de un documento comprimido no se degrada de ninguna manera. Si el texto en un PDF comprimido se ve diferente, el problema es la representación de la fuente en el visor, no algo que haya cambiado la compresión.

Qué sucede con las fuentes

Las fuentes incrustadas pueden contribuir significativamente al tamaño del archivo. Un PDF que incrusta archivos de fuentes completos para cinco tipos de letra puede tener varios megabytes solo de datos de fuentes. Las herramientas de compresión pueden solucionar este problema mediante subconjuntos de fuentes: eliminando de la fuente incrustada cualquier carácter que en realidad no se utilice en el documento. Un documento que sólo utiliza las letras A-Z y 0-9 no necesita el conjunto completo de caracteres Unicode incrustado.

El subconjunto de fuentes no produce pérdidas desde la perspectiva del lector: el documento aún se representa correctamente porque todos los caracteres que aparecen en él todavía están presentes. Los ahorros dependen de cuántos caracteres incrustó la fuente original frente a cuántos se utilizan realmente.

Qué se elimina por completo

Más allá de comprimir los datos existentes, las herramientas de compresión también eliminan la sobrecarga que se acumula dentro de los PDFs con el tiempo. Cada vez que se edita y guarda un PDF, la versión anterior de los elementos editados a menudo se conserva en la estructura del archivo en lugar de eliminarse; así es como funciona el historial de deshacer y la recuperación de versiones dentro de los editores de PDF. Un documento que ha pasado por muchos ciclos de edición y guardado puede tener mucho peso muerto: versiones antiguas de objetos, datos duplicados, contenido eliminado que en realidad nunca se eliminó del archivo.

La compresión limpia esto. La herramienta reconstruye la estructura del archivo desde cero, manteniendo solo el estado actual de cada elemento y descartando el historial acumulado. Esta es la razón por la que los PDF recién comprimidos a veces son dramáticamente más pequeños de lo esperado: el archivo contenía una importante hinchazón oculta debido a ediciones anteriores.

Lo que permanece exactamente igual

La compresión no cambia el contenido, el diseño o la estructura del documento. El recuento de páginas, el orden de las páginas, el contenido del texto, los gráficos vectoriales, los marcadores, los hipervínculos y los campos de formulario permanecen intactos. El PDF comprimido se abre, muestra y se comporta de manera idéntica al original a todos los efectos prácticos.

Lo que podría cambiar, según la configuración, es la nitidez de la imagen con niveles de zoom altos y los metadatos del archivo. Algunas herramientas de compresión eliminan o actualizan los metadatos, lo cual suele estar bien, pero vale la pena saberlo si la fecha de creación original o el campo de autor son importantes para sus registros.

WukongPDF

Intente comprimir PDF

No se necesita instalación. Funciona directamente en su navegador.

Empezar ahora →