将数据从 PDF 提取到 Excel 中是人们经常需要做的事情——银行对账单、财务报告、从未打算编辑的文档中的表格。有几种免费的方法可以做到这一点,哪种方法效果最好取决于您的 PDF 是真实文本还是扫描图像。

最快的免费方法:基于浏览器的转换器
WukongPDF 的 PDF 到 Excel 工具可将 PDF 在浏览器中转换为电子表格,无需任何下载或帐户。上传 PDF,让它处理,然后下载 Excel 文件。对于具有干净、数字化创建的表格(财务报告、价目表、数据导出)的 PDF,输出通常足够准确,只需最少的清理即可使用。列位于正确的单元格中,数字格式正确,并且工作表可以立即使用。
该工具通过在提取表格数据之前自动运行 OCR 来处理扫描的 PDF。结果不如数字 PDF 可靠,但对于中等复杂度的表格来说通常足够好。
尝试 PDF 转 Excel
无需安装。直接在您的浏览器中工作。
对于简单表格:复制和粘贴也可以
如果 PDF 具有可选择的文本并且表格很小,则复制粘贴到 Excel 中有时是最快的路径。打开PDF,选择表格内容,复制它,然后粘贴到Excel中。 Excel 通常会识别制表符分隔的数据并自动将其放入列中。您通常需要清理列对齐和格式,但对于快速的五行表,它比运行转换工具更快。
如果粘贴的数据位于一列中而不是分布在多列中,请先尝试粘贴到文本编辑器中以查看数据的结构,然后使用 Excel 的数据 → 文本到列功能将其拆分。
Google Sheets:简单表格的另一个免费选项
Google Sheets 可以直接导入一些 PDF。转到sheets.google.com,创建一个新工作表,转到文件→导入,然后上传PDF。 Google 将尝试提取表格数据。根据 PDF 的结构,这种工作方式不一致,但对于简单的单表 PDF 来说,它有时会产生可用的结果,而不需要单独的转换器。
当转换未按计划进行时
具有复杂表格结构(合并单元格、多级标题、跨多行的单元格、嵌入多列布局的表格)的 PDF 非常难以准确转换。转换器要么完全错过结构,要么产生混乱的结果,修复结果比手动输入数据需要更长的时间。
对于短表(20-30 行以下),权衡手动输入是否比清理不良转换更快是值得的。对于长表,即使是需要清理几个单元格的不完美转换也比从头开始要快。
转换后始终验证数字
在将转换后的数据用于任何重要的事情之前,请根据原始 PDF 抽查关键数据。转换工具有时会误读字符——0 变成 O,8 变成 6,相邻列中的数字出现在错误的单元格中。在将数据传递到报告或计算之前进行几分钟的验证是一种廉价的保险,可以防止以后很难发现的错误。
尝试 PDF 转 Excel
无需安装。直接在您的浏览器中工作。
