O problema com PDFs baseados em capturas de tela

Tirar uma captura de tela e salvá-la como PDF parece uma maneira rápida de capturar algo. Para uma única imagem funciona bem. Como um fluxo de trabalho para a criação de documentos – capturas de tela de planilhas, capturas de tela de páginas da web, capturas de tela de outros PDFs – ele produz arquivos com sérias limitações práticas que não são óbvias até que você tente fazer algo útil com eles. Aqui está o que está errado e o que fazer.

O que um PDF baseado em captura de tela realmente contém

Um PDF feito a partir de capturas de tela é um contêiner que contém uma ou mais imagens. Não há camada de texto, nem estrutura de documento, nem metadados sobre o significado do conteúdo. As palavras visíveis na captura de tela existem apenas como pixels – pontos coloridos organizados para se parecerem com letras. O documento não tem mais conteúdo semântico do que a fotografia de uma página.

Essa distinção – texto real versus pixels que se parecem com texto – é a causa raiz de todos os problemas que se seguem. Um problema de qualidade __PDF em uma captura de tela PDF não é uma falha do formato PDF; é uma limitação fundamental do uso de um formato de imagem onde é necessário um formato de documento.

Experimente o OCR PDF

Nenhuma instalação necessária. Funciona diretamente no seu navegador.

Começar agora →

Você não pode pesquisar

Pressione Ctrl+F em uma captura de tela PDF e a pesquisa não encontra nada. O texto visível na página não existe como conteúdo pesquisável. Se você estiver criando um PDF de um artigo de pesquisa, uma tabela de dados ou qualquer documento que precise consultar posteriormente, a incapacidade de pesquisar nele é uma limitação prática significativa.

O arquivo também não aparecerá nas pesquisas do sistema operacional por conteúdo – apenas por nome de arquivo. Uma pasta de capturas de tela PDFs é tão navegável quanto sua convenção de nomenclatura, sem a necessidade de pesquisar palavras que você lembra de estar no documento.

A qualidade diminui – e não pode ser recuperada

Uma captura de tela captura o conteúdo na resolução da tela – normalmente de 72 a 96 DPI em um monitor padrão. Documentos PDF destinados à leitura ou impressão devem ter no mínimo 150 DPI; qualquer coisa que será impressa em alta qualidade precisa de 300 DPI. Uma captura de tela PDF está abaixo do limite mínimo para qualidade de impressão confiável e o problema aumenta se o PDF for compactado.

O texto que parece aceitável na tela com zoom de 100% geralmente parece visivelmente pixelizado quando impresso ou ampliado. Os números nas tabelas – particularmente importantes para uma leitura precisa – podem se tornar ambíguos em baixa resolução. Um "6" e um "8" que são distinguíveis na resolução original podem parecer idênticos em uma captura de tela compactada PDF.

Você não pode copiar texto dele

Selecionar e copiar uma figura, uma citação, uma cláusula ou qualquer outro conteúdo de uma captura de tela PDF é impossível sem OCR. O cursor de texto não aparecerá ou selecionará a imagem inteira como um bloco. Quem recebe o documento e precisa extrair algum conteúdo dele – colar uma citação em um relatório, copiar um valor em uma planilha – enfrenta a redigitação manual.

Para documentos que você está criando para outros trabalharem — tabelas de dados, documentos de referência, resumos de pesquisas — essa limitação reduz significativamente a utilidade do documento. Um PDF com texto real é colaborativo; uma captura de tela PDF é somente leitura no sentido mais literal.

Não atende aos requisitos de acessibilidade

Leitores de tela — softwares utilizados por pessoas com deficiência visual — funcionam lendo o conteúdo textual de um documento. Uma captura de tela PDF não possui conteúdo de texto. O leitor de tela anuncia que o documento está aberto e não tem nada para ler. Em contextos profissionais ou do setor público, onde os documentos precisam atender aos padrões de acessibilidade, uma captura de tela PDF não cumpre todos os requisitos aplicáveis. Esta não é uma questão menor — em muitas jurisdições, a distribuição de documentos inacessíveis quando alternativas acessíveis são viáveis é um problema de conformidade.

O que fazer em vez de tirar capturas de tela

A abordagem correta depende do que você está tentando capturar:

Capturando uma página da web: use o recurso Imprimir > Salve como função PDF ou use o modo leitor primeiro para obter uma saída mais limpa. O resultado contém texto real, não pixels.
Capturando uma planilha: exporte diretamente do Excel ou do Planilhas Google usando Arquivo > Baixar> PDF. O resultado é um PDF formatado corretamente com texto real na resolução correta.
Capturando outro PDF: extraia as páginas necessárias usando uma ferramenta de divisão em vez de capturá-las. As páginas extraídas mantêm a resolução e a camada de texto originais.
Já tem capturas de tela PDFs em seu arquivo: execute-as por meio da ferramenta OCR PDF de WukongPDF em www.wukongpdf.com para adicionar uma camada de texto pesquisável. Ele não recupera a resolução da qualidade de impressão, mas torna o conteúdo pesquisável e copiável.

As capturas de tela têm seu lugar - mas não como documentos

As capturas de tela são úteis para capturar o estado visual - a aparência de uma tela em um determinado momento, um bug da interface do usuário, uma referência de design. Eles são a ferramenta errada para criar registros de documentos, materiais de referência ou qualquer coisa que precise ser pesquisada, copiada, impressa com qualidade ou acessada por pessoas que usam tecnologia assistiva. Para qualquer coisa nessas categorias, use a função de exportação do aplicativo de origem em vez do atalho de captura de tela.

Experimente o OCR PDF

Nenhuma instalação necessária. Funciona diretamente no seu navegador.

Começar agora →