OCR — 扫描的 PDF 和图片转文字

使用设备端 OCR 从扫描文档、照片和基于图像的 PDF 中提取文字。一切都在你的浏览器本地运行，因此你的文档保持私密。英语。

100% 在您的浏览器中文件从不上传无需注册

你的文件在浏览器中处理，永不离开你的设备。

正在加载工具…

使用方法

上传扫描的 PDF 或图片（PNG/JPG）。
点击“提取文字”——首次运行会下载识别引擎（约 10 MB）。
每一页都在你的设备上本地读取。
复制文字或将其下载为 .txt 文件。

常见问题

OCR 是在我的浏览器中运行的吗？⌄

是的——它完全在你的设备上使用 Tesseract（WebAssembly）。你的文件永不上传。

支持哪些语言？⌄

目前是英语。引擎在首次使用时下载其语言模型，之后会将其缓存。

为什么首次运行很慢？⌄

识别引擎和英语模型（约 10 MB）在首次使用时下载一次。此后会快得多。

PDF 转图片

将每一页 PDF 导出为 PNG。

压缩 PDF

减小 PDF 文件大小。

拆分 PDF

将页面范围提取为新的 PDF。