Others

O que acontece com um PDF quando você o compacta?

Compactar um PDF o torna menor, mas "menor" cobre uma série de coisas que acontecem nos bastidores. O que realmente é alterado depende do que o arquivo contém e do tipo de compactação aplicada. Entender isso ajuda a prever como será a saída — e explica por que a mesma configuração de compactação produz resultados dramaticamente diferentes em documentos diferentes.

What Happens to a PDF When You Compress It?

A PDF são vários tipos de dados em um arquivo

Antes de entrar no que a compactação faz, é útil saber o que há dentro de um PDF. Um documento típico contém alguma combinação de: gráficos vetoriais (formas, linhas, gráficos desenhados matematicamente), imagens raster (fotografias, páginas digitalizadas, capturas de tela), texto com dados de fonte, metadados do documento (autor, data de criação, título) e informações estruturais (layout da página, marcadores, links). Cada um deles é armazenado de maneira diferente e responde à compactação de maneira diferente.

WukongPDF

Experimente compactar PDF

Nenhuma instalação necessária. Funciona diretamente no seu navegador.

Começar agora →

O que acontece com as imagens

As imagens são onde reside a maior parte do tamanho do arquivo de um PDF e é onde a compactação tem o efeito mais dramático. Quando você compacta um PDF, a ferramenta recodifica imagens incorporadas usando um algoritmo de compactação mais agressivo – normalmente JPEG para imagens coloridas, JBIG2 ou CCITT para preto e branco. Isso reduz a quantidade de dados armazenados para representar cada imagem.

A compactação JPEG apresenta perdas – ela descarta permanentemente alguns dados de imagem para obter tamanhos de arquivo menores. Em configurações de alta qualidade (80-90%), os dados descartados estão em áreas da imagem onde o olho humano é menos sensível: textura fina, gradientes de cores sutis, detalhes de alta frequência. O resultado parece essencialmente idêntico. Em configurações de qualidade mais baixas, os dados descartados tornam-se visíveis como blocos, desfoques ou faixas coloridas – os artefatos JPEG clássicos.

A redução da resolução é uma etapa relacionada aplicada por algumas ferramentas de compactação. Ele reduz as dimensões em pixels das imagens – uma imagem de 300 DPI pode se tornar 150 DPI – o que torna os arquivos muito menores, mas também torna as imagens mais suaves se impressas ou ampliadas. As ferramentas de qualidade PDF Compression ignoram a redução da resolução ou tornam-na uma configuração opcional.

O que acontece com o texto

O texto em um PDF é armazenado como caracteres com posições, estilos e referências de fonte – não como imagens de letras. Esses dados são compactados de forma muito eficiente usando algoritmos sem perdas como Deflate (o mesmo algoritmo usado em arquivos ZIP). A compactação sem perdas reduz o tamanho do arquivo sem remover nenhum dado: a saída descompactada é bit a bit idêntica ao original.

Isso significa que o texto em um PDF compactado é exatamente igual ao original – mesmos caracteres, mesmas posições, mesma renderização de fonte. O texto de um documento compactado não é degradado de forma alguma. Se o texto em um PDF compactado parecer diferente, o problema é a renderização da fonte no visualizador, e não algo que a compactação mudou.

O que acontece com as fontes

As fontes incorporadas podem contribuir significativamente para o tamanho do arquivo. Um PDF que incorpora arquivos de fontes completos para cinco fontes pode ter vários megabytes apenas de dados de fontes. As ferramentas de compactação podem resolver isso por meio do subconjunto de fontes – removendo da fonte incorporada quaisquer caracteres que não sejam realmente usados ​​no documento. Um documento que usa apenas as letras AZ e 0-9 não precisa do conjunto completo de caracteres Unicode incorporado.

A subconfiguração de fontes não tem perdas do ponto de vista do leitor — o documento ainda é renderizado corretamente porque todos os caracteres que aparecem nele ainda estão presentes. A economia depende de quantos caracteres a fonte original incorporou versus quantos são realmente usados.

O que é totalmente removido

Além de compactar os dados existentes, as ferramentas de compactação também removem a sobrecarga que se acumula dentro dos PDFs ao longo do tempo. Cada vez que um PDF é editado e salvo, a versão anterior dos elementos editados geralmente é retida na estrutura do arquivo em vez de excluída – é assim que o histórico de desfazer e a recuperação de versão funcionam dentro dos editores PDF. Um documento que passou por muitos ciclos de edição e salvamento pode carregar muito peso morto: versões antigas de objetos, dados duplicados, conteúdo excluído que nunca foi realmente removido do arquivo.

A compressão limpa isso. A ferramenta reconstrói a estrutura do arquivo do zero, mantendo apenas o estado atual de cada elemento e descartando o histórico acumulado. É por isso que PDFs recém-compactados às vezes são dramaticamente menores do que o esperado – o arquivo carregava um inchaço oculto significativo de edições anteriores.

O que permanece exatamente igual

A compactação não altera o conteúdo, o layout ou a estrutura do documento. Contagem de páginas, ordem de páginas, conteúdo de texto, gráficos vetoriais, marcadores, hiperlinks e campos de formulário permanecem intactos. O PDF compactado abre, exibe e se comporta de forma idêntica ao original para todos os fins práticos.

O que pode mudar – dependendo das configurações – é a nitidez da imagem em altos níveis de zoom e os metadados do arquivo. Algumas ferramentas de compactação removem ou atualizam metadados, o que geralmente é bom, mas vale a pena saber se a data de criação original ou o campo do autor são importantes para seus registros.

WukongPDF

Experimente compactar PDF

Nenhuma instalação necessária. Funciona diretamente no seu navegador.

Começar agora →