OCR Grátis: Converter PDF Digitalizado para Texto, Word e TXT Editável

Extraia texto de qualquer PDF digitalizado ou baseado em imagem e baixe como documento Word ou arquivo de texto. Tudo roda no seu navegador — seus documentos nunca saem do seu dispositivo.

100% PrivadoSem CadastroGrátis Para Sempre10+ Idiomas

Última atualização: Abril de 2026

O que é OCR e o que esta ferramenta faz?

OCR (Reconhecimento Óptico de Caracteres) é a tecnologia que converte imagens de texto — como documentos digitalizados ou fotos de páginas impressas — em texto editável e pesquisável. Esta ferramenta pega um PDF digitalizado ou baseado em imagem, executa OCR em cada página e devolve arquivos Word (.docx) e texto (.txt) editáveis.

Tudo roda no seu navegador usando WebAssembly (WASM). Não há servidor, não há upload e não há cadastro. O motor OCR Tesseract é carregado uma vez no primeiro uso (~2 MB) e depois fica em cache para reutilização instantânea — a ferramenta até funciona offline depois desse primeiro carregamento.

Como funciona

  1. 1

    Envie seu PDF digitalizado

    Arraste seu PDF para a zona de upload ou clique para escolher um arquivo. Até 25 MB e 50 páginas por documento.

  2. 2

    Escolha o idioma do documento

    Escolha um ou mais idiomas para que o Tesseract carregue os dados certos. Padrão é o idioma do seu navegador; suporta 10+ idiomas.

  3. 3

    Extraímos o texto no seu navegador

    Cada página é renderizada em um canvas e passada ao Tesseract localmente. Você vê o progresso, uma miniatura ao vivo e o texto conforme ele aparece.

  4. 4

    Baixe como Word (.docx) ou texto (.txt)

    Revise e edite o texto extraído inline, depois baixe como Word, texto puro ou ambos em um ZIP. Ou envie direto para nosso serviço de tradução.

Idiomas suportados

Execute OCR em qualquer um dos idiomas abaixo — incluindo OCR em espanhol, OCR em francês, OCR em alemão, OCR em chinês, OCR em japonês, OCR em coreano, OCR em árabe e OCR em russo. Os dados do idioma são baixados na primeira vez que você usa e ficam em cache para próximas execuções.

Inglês
Espanhol
Português
Francês
Alemão
Italiano
Chinês (Simplificado)
Japonês
Coreano
Árabe
Russo

É mesmo privado?

Sim. Esta ferramenta OCR roda 100% no seu navegador usando WebAssembly. Seu PDF nunca é enviado a nenhum servidor, nós nunca vemos ele, e nenhuma conta é necessária.

Se depois você traduzir o texto extraído usando nosso serviço de tradução de documentos, esse upload é criptografado em trânsito e o arquivo original é excluído em 7 dias. OCR e tradução são separados — o OCR acontece totalmente no seu dispositivo.

Casos de uso comuns

  • Digitalizar documentos jurídicos escaneados para torná-los pesquisáveis e editáveis.
  • Converter documentos de imigração — certidões de nascimento, casamento, diplomas — antes de enviar para tradução.
  • Extrair texto de registros históricos, livros antigos ou arquivos datilografados para pesquisa.
  • Tornar livros didáticos e anotações digitalizadas pesquisáveis para estudo.
  • Preparar documentos comerciais digitalizados para tradução para outro idioma.

Dicas de precisão do OCR

  • Use digitalizações de pelo menos 300 DPI. Digitalizações de baixa resolução são a causa #1 de erros de OCR.
  • Garanta que as páginas estejam retas e não tortas. Mesmo uma pequena inclinação prejudica a precisão.
  • Maior contraste entre texto e fundo melhora os resultados. Aumente o contraste nas configurações do scanner, se possível.
  • Selecione o idioma correto antes de processar. Rodar texto em espanhol por OCR só em inglês produz muitos erros.

OCR no navegador vs. OCR na nuvem vs. Software de desktop

MétodoPrivacidadeCustoPrecisão
OCR no navegador (esta ferramenta)100% privado — roda localmenteGrátisBom em digitalizações limpas (≥ 300 DPI)
OCR na nuvem (Adobe, Google)Arquivos enviados a servidores de terceirosAssinatura ou pagamento por páginaExcelente, mas depende do fornecedor
Software de desktopPrivado — roda na sua máquinaR$ 250–R$ 2.500 único ou assinaturaExcelente com complementos para manuscritos

Já tem texto editável? Use nosso Contador de Palavras grátis →

Precisa traduzir o texto extraído?

Traduzimos documentos OCR para mais de 30 idiomas com tradução neural DeepL. Clique abaixo e carregaremos seu texto extraído no fluxo de tradução.

Traduzir um documento

Perguntas frequentes

O que é OCR?
OCR (Reconhecimento Óptico de Caracteres) é a tecnologia que converte imagens de texto em texto editável e pesquisável. Se seu PDF é um digitalizado ou foto, as páginas são só imagens — o OCR olha essas imagens e identifica quais caracteres e palavras aparecem para que você possa copiar, editar ou traduzir o texto.
Esta ferramenta OCR é mesmo grátis?
Sim — sem conta, sem cartão de crédito, sem cobrança por página. Oferecemos o OCR como complemento grátis ao nosso serviço pago de tradução, e a maioria dos usuários nunca paga nada. Se depois quiser traduzir o texto extraído, a tradução é a parte que custa.
Meu PDF é enviado a algum servidor?
Não. Seu PDF nunca sai do seu navegador. O motor OCR (Tesseract) roda totalmente no seu dispositivo usando WebAssembly. Você pode verificar abrindo a aba Rede nas ferramentas de desenvolvedor do navegador enquanto roda — não verá requisições a translateitnow.net durante o OCR.
Qual é a precisão do OCR no navegador?
Muito preciso em digitalizações impressas limpas e de alta resolução (300 DPI ou mais) — tipicamente 95%+ de acerto. A precisão cai em digitalizações de baixa resolução, páginas tortas, fontes muito pequenas ou incomuns, ou pouco contraste. Destacamos palavras de baixa confiança em amarelo para você detectar e corrigir antes de baixar.
Quais idiomas são suportados?
Atualmente: inglês, espanhol, português, francês, alemão, italiano, chinês (simplificado), japonês, coreano, árabe e russo. Você pode selecionar vários idiomas para documentos bilíngues. Os modelos de idioma são baixados na primeira vez que você os usa e ficam em cache para usos futuros.
Qual é o tamanho máximo de arquivo?
25 MB por PDF, e até 50 páginas. Esses limites são definidos para manter a memória do navegador estável. Para documentos maiores, divida-os em PDFs menores usando qualquer divisor de PDF grátis.
Posso fazer OCR de um documento manuscrito?
Limitado. O motor Tesseract usado por esta ferramenta é otimizado para texto impresso — tem dificuldade com letra cursiva e produz menor precisão mesmo em letra de forma. Para OCR manuscrito confiável, uma ferramenta paga de desktop com modelo dedicado funcionará melhor.
Por que meu resultado de OCR teve erros?
As três principais causas são: (1) baixa resolução de digitalização — menos de 300 DPI tem dificuldade, (2) páginas tortas ou rotacionadas — até pequenas inclinações prejudicam, e (3) idioma errado selecionado — rodar texto em português por OCR só em inglês produz lixo. Redigitalize com DPI maior, endireite as páginas e escolha o idioma certo.
Posso editar o texto antes de baixar?
Sim. Depois que o OCR termina, cada página é editável inline — clique no texto de qualquer página e corrija os erros diretamente. Suas edições são usadas nos arquivos Word e texto baixados e no botão 'Traduzir agora'.
Como isso difere de um OCR pago como o Adobe Acrobat?
O Adobe Acrobat usa um motor OCR na nuvem um pouco mais preciso em entradas difíceis (manuscritos, digitalizações de baixa qualidade, layouts complexos), mas custa cerca de US$ 15/mês e envia seu PDF para os servidores da Adobe. Esta ferramenta é grátis, privada (sem uploads) e lida com digitalizações impressas limpas igualmente bem — boa para uso cotidiano.