[ tesseract ] - como fazer OCR em Python

Показать описание

Neste vídeo, vou ensinar a utilizar o Tesseract em Python para reconhecimento de texto em imagens. O Tesseract é uma poderosa biblioteca de OCR (Optical Character Recognition) que permite extrair texto de imagens de forma automática. Vou mostrar passo a passo como configurar o ambiente, instalar as dependências necessárias e, em seguida, utilizaremos o Tesseract juntamente com a biblioteca pytesseract para processar uma captura de tela e extrair o texto dela.

Para começar, utilizaremos a biblioteca fast_ctypes_screenshots para realizar a captura da tela. Em seguida, faremos a configuração do caminho para o executável do Tesseract utilizando a variável tesseract_cmd. É importante garantir que o caminho esteja correto para que o Tesseract funcione corretamente.

Por fim, exibiremos o resultado no console utilizando a função print. O resultado será um DataFrame contendo informações sobre o texto identificado, como coordenadas, confiança e outros detalhes.

Espero que este tutorial seja útil para vocês! Se tiverem alguma dúvida ou sugestão, deixem nos comentários. Não se esqueçam de se inscrever no canal e ativar as notificações para acompanhar os próximos vídeos. O código utilizado estará disponível na descrição.

from fast_ctypes_screenshots import ScreenshotOfOneMonitor
from pytesseract import pytesseract
from PrettyColorPrinter import add_printer

add_printer(1)
with ScreenshotOfOneMonitor(monitor=1, ascontiguousarray=False) as screenshots_monitor:

img,
lang="eng",
pandas_config={"on_bad_lines": "warn"},
)
print(df)

Рекомендации по теме

Комментарии

olá Alemão Tudo certinho, desde já obrigado Professor por compartilhar seu conhecimento.... VLw tamo junto até de pois do fim. dito isso agora uma pergunta com OpenCV como capturar um ROI sem "zoom" para o ROI não ficar pixelado atrapalhando a extração do texto/caracteres, em outras palavras quero dizer que ao recortar a minha região de interesse o Opencv faz uma espécie de zoom na imagem distorcendo a imagem, no meu código eu percorri cada caractere fazendo um bounding box e recortando ROI e vou fazendo a extração do caracteres.

laudemirferreira

Professor brigadão por essa aula. Uma duvida, para a conversão de um PDF digitalizado para extrair os textos seja para um df ou txt ou ate uma tabela (Assistir sua aula de extrair dados de PDF para tabela). Estou com dificuldades pois só PDF que não são digitalizados a o código se comporta bem, já PDF digitalizado não rola. Como proceder?

PauloMesquita_code

[ tesseract ] - como fazer OCR em Python

How to Install and Use Tesseract OCR on Windows - Optical Character Recognition

Como transformar imagem em texto usando OCR em Python com OpenCV , Tesseract reconhecendo caracteres

How to use Tesseract OCR in a Python script (pytesseract)

Tesseract LED Infinty Mirror Art Sculpture by Nicky Alice 4K Hypercube

Tesseract - Hypercube 4th dimension Infinity Mirror Art Sculpture by Nicky Alice

Understanding 4D -- The Tesseract

Tesseract OCR - Lesson 2: Training Tesseract for new font

[ tesseract ] - como fazer OCR em Python

Test Training Tesseract OCR

TESSERACT: COMO A JOIA DO ESPAÇO FOI DE CAPITÃ MARVEL A GUERRA INFINITA

How to install and use Tesseract OCR on Windows - Optical Character Recognition

What Does a 4D Ball Look Like in Real Life? Amazing Experiment Shows Spherical Version of Tesseract

Tesseract Art Installation by Nicky Alice Hypercube Infinity Mirror Art Sculpture Burning Man 2023

“Tesseract” Burning Man Art installation by Nicky Alice 2023 Hypercube Infinity Mirror 4th dimension...

Cómo Instalar Tesseract OCR

LINHA DO TEMPO OFICIAL DO TESSERACT

How to Install Tesseract OCR on Windows and use it with Python

How to install tesseract-ocr on windows10

RECONOCIMIENTO de DOCUMENTOS de IDENTIDAD en TIEMPO REAL con Python OpenCV Tesseract(OCR)

Extrae texto com OCR, tesseract, python y opencv. #programacion #tesseract #opencv #python

Como usar el el reconocimiento optico (TESSERACT)

Print to Text com Tesseract OCR, NÃO PRECISA BAIXAR!

COMO CONSEGUIR UMA TESSERACT SEM GASTAR ROBUX NO PRÓXIMO UPDATE DE A Universal Time (Eu mostro como)...

De Imágenes a Texto: Tesseract.js