filmov
tv
[ tesseract ] - como fazer OCR em Python
Показать описание
Neste vídeo, vou ensinar a utilizar o Tesseract em Python para reconhecimento de texto em imagens. O Tesseract é uma poderosa biblioteca de OCR (Optical Character Recognition) que permite extrair texto de imagens de forma automática. Vou mostrar passo a passo como configurar o ambiente, instalar as dependências necessárias e, em seguida, utilizaremos o Tesseract juntamente com a biblioteca pytesseract para processar uma captura de tela e extrair o texto dela.
Para começar, utilizaremos a biblioteca fast_ctypes_screenshots para realizar a captura da tela. Em seguida, faremos a configuração do caminho para o executável do Tesseract utilizando a variável tesseract_cmd. É importante garantir que o caminho esteja correto para que o Tesseract funcione corretamente.
Por fim, exibiremos o resultado no console utilizando a função print. O resultado será um DataFrame contendo informações sobre o texto identificado, como coordenadas, confiança e outros detalhes.
Espero que este tutorial seja útil para vocês! Se tiverem alguma dúvida ou sugestão, deixem nos comentários. Não se esqueçam de se inscrever no canal e ativar as notificações para acompanhar os próximos vídeos. O código utilizado estará disponível na descrição.
from fast_ctypes_screenshots import ScreenshotOfOneMonitor
from pytesseract import pytesseract
from PrettyColorPrinter import add_printer
add_printer(1)
with ScreenshotOfOneMonitor(monitor=1, ascontiguousarray=False) as screenshots_monitor:
img,
lang="eng",
pandas_config={"on_bad_lines": "warn"},
)
print(df)
Para começar, utilizaremos a biblioteca fast_ctypes_screenshots para realizar a captura da tela. Em seguida, faremos a configuração do caminho para o executável do Tesseract utilizando a variável tesseract_cmd. É importante garantir que o caminho esteja correto para que o Tesseract funcione corretamente.
Por fim, exibiremos o resultado no console utilizando a função print. O resultado será um DataFrame contendo informações sobre o texto identificado, como coordenadas, confiança e outros detalhes.
Espero que este tutorial seja útil para vocês! Se tiverem alguma dúvida ou sugestão, deixem nos comentários. Não se esqueçam de se inscrever no canal e ativar as notificações para acompanhar os próximos vídeos. O código utilizado estará disponível na descrição.
from fast_ctypes_screenshots import ScreenshotOfOneMonitor
from pytesseract import pytesseract
from PrettyColorPrinter import add_printer
add_printer(1)
with ScreenshotOfOneMonitor(monitor=1, ascontiguousarray=False) as screenshots_monitor:
img,
lang="eng",
pandas_config={"on_bad_lines": "warn"},
)
print(df)
Комментарии