[ tesseract ] - como fazer OCR em Python

preview_player
Показать описание
Neste vídeo, vou ensinar a utilizar o Tesseract em Python para reconhecimento de texto em imagens. O Tesseract é uma poderosa biblioteca de OCR (Optical Character Recognition) que permite extrair texto de imagens de forma automática. Vou mostrar passo a passo como configurar o ambiente, instalar as dependências necessárias e, em seguida, utilizaremos o Tesseract juntamente com a biblioteca pytesseract para processar uma captura de tela e extrair o texto dela.

Para começar, utilizaremos a biblioteca fast_ctypes_screenshots para realizar a captura da tela. Em seguida, faremos a configuração do caminho para o executável do Tesseract utilizando a variável tesseract_cmd. É importante garantir que o caminho esteja correto para que o Tesseract funcione corretamente.

Por fim, exibiremos o resultado no console utilizando a função print. O resultado será um DataFrame contendo informações sobre o texto identificado, como coordenadas, confiança e outros detalhes.

Espero que este tutorial seja útil para vocês! Se tiverem alguma dúvida ou sugestão, deixem nos comentários. Não se esqueçam de se inscrever no canal e ativar as notificações para acompanhar os próximos vídeos. O código utilizado estará disponível na descrição.

from fast_ctypes_screenshots import ScreenshotOfOneMonitor
from pytesseract import pytesseract
from PrettyColorPrinter import add_printer

add_printer(1)
with ScreenshotOfOneMonitor(monitor=1, ascontiguousarray=False) as screenshots_monitor:

img,
lang="eng",
pandas_config={"on_bad_lines": "warn"},
)
print(df)
Рекомендации по теме
Комментарии
Автор

olá Alemão Tudo certinho, desde já obrigado Professor por compartilhar seu conhecimento.... VLw tamo junto até de pois do fim. dito isso agora uma pergunta com OpenCV como capturar um ROI sem "zoom" para o ROI não ficar pixelado atrapalhando a extração do texto/caracteres, em outras palavras quero dizer que ao recortar a minha região de interesse o Opencv faz uma espécie de zoom na imagem distorcendo a imagem, no meu código eu percorri cada caractere fazendo um bounding box e recortando ROI e vou fazendo a extração do caracteres.

laudemirferreira
Автор

Professor brigadão por essa aula. Uma duvida, para a conversão de um PDF digitalizado para extrair os textos seja para um df ou txt ou ate uma tabela (Assistir sua aula de extrair dados de PDF para tabela). Estou com dificuldades pois só PDF que não são digitalizados a o código se comporta bem, já PDF digitalizado não rola. Como proceder?

PauloMesquita_code