OCR — PDF numérisé et image en texte

Extrayez le texte de documents numérisés, de photos et de PDF basés sur des images grâce à l'OCR sur l'appareil. Tout s'exécute localement dans votre navigateur, vos documents restent donc privés. Langue anglaise.

100 % dans votre navigateurfichiers jamais téléverséssans inscription

Vos fichiers sont traités dans votre navigateur et ne quittent jamais votre appareil.

Chargement de l'outil…

Comment ça marche

  1. Téléversez un PDF numérisé ou des images (PNG/JPG).
  2. Cliquez sur Extraire le texte — la première exécution télécharge le moteur de reconnaissance (~10 Mo).
  3. Chaque page est lue localement sur votre appareil.
  4. Copiez le texte ou téléchargez-le sous forme de fichier .txt.

Questions fréquentes

L'OCR s'exécute-t-il dans mon navigateur ?

Oui — il utilise Tesseract (WebAssembly) entièrement sur votre appareil. Vos fichiers ne sont jamais téléversés.

Quelles langues sont prises en charge ?

Actuellement l'anglais. Le moteur télécharge son modèle de langue à la première utilisation, puis le met en cache.

Pourquoi la première exécution est-elle lente ?

Le moteur de reconnaissance et le modèle anglais (~10 Mo) se téléchargent une seule fois à la première utilisation. Ensuite, c'est bien plus rapide.