OCR — 扫描的 PDF 和图片转文字

使用设备端 OCR 从扫描文档、照片和基于图像的 PDF 中提取文字。一切都在你的浏览器本地运行,因此你的文档保持私密。英语。

100% 在您的浏览器中文件从不上传无需注册

你的文件在浏览器中处理,永不离开你的设备。

正在加载工具…

使用方法

  1. 上传扫描的 PDF 或图片(PNG/JPG)。
  2. 点击“提取文字”——首次运行会下载识别引擎(约 10 MB)。
  3. 每一页都在你的设备上本地读取。
  4. 复制文字或将其下载为 .txt 文件。

常见问题

OCR 是在我的浏览器中运行的吗?

是的——它完全在你的设备上使用 Tesseract(WebAssembly)。你的文件永不上传。

支持哪些语言?

目前是英语。引擎在首次使用时下载其语言模型,之后会将其缓存。

为什么首次运行很慢?

识别引擎和英语模型(约 10 MB)在首次使用时下载一次。此后会快得多。