Você sabe como tornar documentos digitalizados mais acessíveis por meio da tecnologia OCR?
Ao digitalizarmos um documento no formato PDF, o conteúdo é disponibilizado como uma imagem, ou seja, os textos não são pesquisáveis e também não podem ser selecionados para ser copiados para outro documento. A tecnologia OCR (Optical Character Recognition) reconhece caracteres a partir de um arquivo de imagens e com isso permite a seleção, pesquisa e cópia de trechos do documento. Outra vantagem muito importante dos documentos criados usando OCR é que eles ficam acessíveis pelos softwares de leitura de tela usados por pessoas cegas ou com deficiência visual. Isso permite que todas as pessoas tenham acesso ao conteúdo digitalizado.
Como gerar um arquivo PDF com OCR:
Ao digitalizar um documento em uma impressora multifuncional ou scanner, devemos verificar se o equipamento já oferece uma opção de OCR. Alguns equipamentos por padrão já possuem essa ferramenta, permitindo que, ao digitalizar um documento, o mesmo já passe pelo reconhecimento de caracteres e seja gerado um arquivo em formato de texto editável.
Se o seu equipamento não possui OCR, ainda assim é possível gerar um documento pesquisável a partir de um arquivo PDF imagem com o uso de um software específico. Existem diversas ferramentas que geram documentos com OCR. Basta uma pesquisa na internet para serem listados programas e sites com serviço de OCR online e gratuito. Algumas ferramentas são pagas e disponibilizam um maior número de funcionalidades. Os aplicativos Google, como o Google Docs, também podem ser utilizados para gerar um documento pesquisável.
Essas ferramentas nem sempre realizam o reconhecimento de forma correta. Assim, quando o documento original não tiver uma boa resolução, contiver imagens de fundo, apresentar um tamanho de fonte muito pequeno ou um tipo de fonte cursiva, em itálico ou decorada, é provável que a ferramenta OCR se “engane”, trocando caracteres. Por isso, é essencial fazer uma revisão no documento. Além disso, caso o arquivo contenha imagens que transmitam conteúdo, é importante fazer uma descrição, tornando-a acessível para o leitor com deficiência visual.