Adobe OCR não reconhece texto [Corrigir]

Se você é um profissional de TI, sabe que OCR significa reconhecimento óptico de caracteres. E você também sabe que o Adobe OCR não reconhece texto. Mas o que você pode não saber é como corrigir esse problema. Há algumas coisas que você pode tentar fazer com que o Adobe OCR reconheça o texto. A primeira coisa que você pode tentar é atualizar seu software Adobe Acrobat. Às vezes, simplesmente atualizar seu software pode resolver o problema. Se a atualização do software não funcionar, a próxima coisa que você pode tentar é alterar o idioma de reconhecimento. Para fazer isso, abra o Adobe Acrobat, clique em 'Editar' e depois em 'Preferências'. A partir daí, clique em 'Idioma' e depois em 'Reconhecimento'. Por fim, escolha o idioma que deseja usar para o reconhecimento. Se alterar o idioma de reconhecimento não funcionar, a próxima coisa que você pode tentar é alterar as configurações de OCR. Para fazer isso, abra o Adobe Acrobat, clique em 'Editar' e depois em 'Preferências'. A partir daí, clique em 'OCR' e depois em 'Configurações'. Por fim, altere as configurações para ver se isso resolve o problema. Se você tentou todas essas coisas e o Adobe OCR ainda não reconhece o texto, o problema pode estar no seu arquivo PDF. Se for esse o caso, você precisará entrar em contato com o suporte ao cliente da Adobe para obter ajuda.

Reconhecimento óptico de caracteres (OCR) pode ser melhor que pão de forma para quem precisa converter páginas de texto em texto editável. talvez você tenha páginas de texto que está digitalizando para o computador e que agora precisam ser convertidas em um formato editável. Talvez não haja tempo suficiente para digitar ou simplesmente haja muito tempo para digitar. Bem, o reconhecimento óptico de caracteres pode ajudar exatamente nisso. Você pode digitalizar páginas para o seu computador e abri-las com Adobe Acrobat e tente usar a função OCR para reconhecer o texto e fornecer uma versão editável. Assim que você estiver prestes a fazer a dança da vitória, receberá uma mensagem de erro O Acrobat não pôde executar o OCR nesta página porque ela contém texto de exibição.

Adobe OCR não reconhece texto

O Acrobat Professional possui recursos de OCR que permitem salvar documentos digitalizados como RTF ou como documentos do Microsoft Word, tanto Doc quanto Docx. Pode haver momentos em que você abre um documento no Adobe Acrobat Professional e vê algum texto, mas o Acrobat apresenta um erro. O Acrobat não pode usar OCR. Isso pode ser devido a vários motivos.

Texto renderizado/editável
Fonte distorcida ou embaçada
Original ruim
Gráficos e formulários

O Acrobat não pôde executar o OCR nesta página porque ela contém texto de exibição.

1] Texto Renderizado/Editável

O texto reproduzível é o texto editável que existe no arquivo para o qual você deseja executar o reconhecimento de caracteres. O Acrobat não pode executar OCR em um documento que contém texto de exibição. Esta é a causa menos óbvia de um erro de verificação de OCR porque sempre assumimos que o texto que está sendo lido também deve ser verificado por OCR.

Responder:

Há duas maneiras de lidar com o erro se for um problema.

Tente obter uma cópia de um documento que não tenha texto de exibição.
Converta PDF para TIFF, depois de volta para PDF e tente OCR novamente.

Para converter um PDF em TIFF, abra-o no Acrobat e escolha Arquivo e Salvar como. Quando a caixa de diálogo Salvar como for exibida, selecione TIFF (*.tif, *.tiff) na lista Tipo de arquivo. Especifique o local onde deseja salvar o arquivo e clique em Salvar. O Acrobat salva cada página de um documento PDF como um arquivo TIFF separado e numerado sequencialmente. Em seguida, abra cada um dos arquivos TIFF e use o Acrobat para reconhecê-los.

Se você deseja mesclar documentos em um, faça o seguinte:

Abra o Acrobat, selecione Arquivo então Criar PDF então De vários arquivos .
Escolher Navegar para selecionar e adicionar cada arquivo PDF. Organize os arquivos da maneira que deseja que apareçam no novo PDF.
Escolher MULTAR .

2] Fonte distorcida ou embaçada

documento borrado

webcam skype sendo usada por outro aplicativo

Outra razão pela qual o Acrobat não pode executar o OCR em um documento é porque ele é de baixa resolução. Documentos de baixa resolução podem ficar embaçados e o Acrobat não pode realizar o reconhecimento de caracteres neles.

Responder:

Obtenha a fonte do documento de alta resolução. Se você estiver digitalizando um documento em papel, ajuste a resolução do scanner para digitalizar em uma resolução mais alta.

documento distorcido

O Acrobat pode não reconhecer o texto em um documento que não esteja alinhado corretamente. O documento pode não ter sido digitalizado corretamente, então o Acrobat não pode executar o reconhecimento de caracteres nele.

Responder:

Antes de iniciar a digitalização, verifique se o papel que está sendo digitalizado é plano. Você também pode abrir um documento distorcido no Photoshop e corrigi-lo. Aqui está um post que mostrará como usar a ferramenta endireitar no Photoshop. Esta ferramenta pode ajudá-lo a endireitar o documento digitalizado antes de fazer o OCR no Acrobat.

3] Original de baixa qualidade

Se o material de origem for de baixa qualidade, como um fax, o Acrobat pode não reconhecê-lo adequadamente. Você terá que buscar uma melhor qualidade ou correr o risco de corrigir a saída.

Responder:

Obtenha a melhor fonte de qualidade para OCR. Se um documento de baixa qualidade é tudo o que você tem, pode ser necessário executar o OCR e esperar que pelo menos parte dele seja reconhecido e, em seguida, preencher as partes que faltam.

4] Gráficos e formas

Documentos que misturam gráficos e formas não terão OCR no Acrobat. Os documentos a serem usados para OCR com Acrobat não devem conter gráficos ou formas mistas, caso contrário, isso pode resultar em erro ou a saída pode ser incorreta.

Responder:

Encontre uma versão em texto do documento para executar o OCR. Você também pode precisar fazer o reconhecimento de documentos com gráficos e formas, se isso funcionar, talvez seja necessário fazer correções na saída.

O que é OCR no Adobe Acrobat?

OCR é o processo pelo qual o Acrobat valida texto ou imagens pixeladas. Cada caractere é reconhecido e convertido em texto. O Acrobat compara a forma da imagem e a espessura da linha com as fontes já instaladas em seu PC durante o OCR. A seguir estão as causas do erro de digitalização OCR.

Qual formato de arquivo não é adequado para OCR?

O formato de arquivo JPEG não é o melhor para salvar para OCR porque o JPEG tende a perder sua qualidade toda vez que é salvo. Mesmo se você estiver convertendo JPEG para PDF, ainda pode ser de baixa qualidade. É melhor salvar seus documentos como PDF ou TIFF se você pretende executar o reconhecimento de caracteres neles.