OCR — PDF Digitalizado e Imagem para Texto

Extraia o texto de documentos digitalizados, fotos e PDFs baseados em imagem usando OCR no dispositivo. Tudo roda localmente no seu navegador, então seus documentos permanecem privados. Idioma inglês.

100% no seu navegadorarquivos nunca enviadossem cadastro

Seus arquivos são processados no seu navegador e nunca saem do seu dispositivo.

Carregando ferramenta…

Como funciona

  1. Envie um PDF digitalizado ou imagens (PNG/JPG).
  2. Clique em Extrair texto — na primeira execução, o mecanismo de reconhecimento é baixado (~10 MB).
  3. Cada página é lida localmente no seu dispositivo.
  4. Copie o texto ou baixe-o como um arquivo .txt.

Perguntas frequentes

O OCR roda no meu navegador?

Sim — ele usa o Tesseract (WebAssembly) inteiramente no seu dispositivo. Seus arquivos nunca são enviados para servidores.

Quais idiomas são compatíveis?

Atualmente, o inglês. O mecanismo baixa o modelo de idioma no primeiro uso e depois o mantém em cache.

Por que a primeira execução é lenta?

O mecanismo de reconhecimento e o modelo de inglês (~10 MB) são baixados uma vez no primeiro uso. Depois disso, fica bem mais rápido.