Распознавание текста с картинки на Python | Оптическое распознавание символов Tesseract

preview_player
Показать описание
В данном видео разбираем как можно распознавать текста на разных языках с картинок при помощи Python и tesseract.

💰 Поддержать проект:

🔥 Стать спонсором канала:

*****Команды*****
Установка tesseract Linux:
sudo apt install tesseract-ocr

Установка tesseract Windows:

Опции конфига tesseract:

Разные словари tesseract:

Скачать словарь в Linux:

Переместить словарь в корень tesseract на Linux:

*****Ссылки*****
Пишем Telegram бота на Python + Загружаем Telegram бота на сервер(хостинг):

Плейлист по парсингу сайтов на Python:

Код проекта на github:

*****Соц.сети*****
Рекомендации по теме
Комментарии
Автор

Моя дипломная работа, которую я делал 3 месяца за 4 минуты на ютуб. Спасибо.... я немного шокирован.

KYCT-zk
Автор

Хочу выразить огромную благодарность за данное видео)))) Я начинаю первые шаги в программировании. Ролик 4 мин, я просидела почти 2 часа, вникала, что куда и как, но разобралась и это так приятно))) Спасибо)

ТатьянаСавушкина-чф
Автор

Благодарю за познавательный контент здесь и в телеграме.

creatorwizard
Автор

такие видео добавляют мотивации обучаться программированию с огромным интересом) спасибо, Автор! однозначно подписка!

chiklfkif
Автор

Как же сильно мне помогло это видео, я долго долбался, чтобы добавить Tesseract в переменную среды PATH, так и не получилось, хотя вроде бы все правильно сделал.. И тут оказывается, что все можно было решить одной строчкой кода, я уже и не верил, что получится, спасибо огромное автору!!!

alexrostov
Автор

Долго искал решение для распознавания текста с фото. Можно сделать самому камеру + микроконтроллер, там уже вшит чип, но есть свои тонкости. Есть уже готовый софт, платный, но работает только в определенных условиях и с конкретными процессорами. Есть еще камеры за 10-18к евро. А есть вот это видео, где за 4 минуты составляется база для моего решения. Удивительно, благодарю )

xdeadcde_Gameplays
Автор

Использовал тессеракт для распознования текста на скриншотах ошибок которые пользователи в жалобах пишут. Это была вторая супень отбора) НА первой ступени был pyimage для определения приложения, где возникала ошибка по шаблону картинки.
Короче хотели сделать ИИ для помощи в решении проблемы, а сделали удобный сепаратор для машрутизаци заявок по проблемам от пользователей.

TheSergWolf
Автор

Ух. Спасибо. А то я почитал файл ридми тессеракта, а там надо билд делать из командной строки, колдовать, бубен найти и всё это так сложно, что я расплакался и сложил лапки

spanev
Автор

автор очень хороший и понятный контент красава

senpai
Автор

Видео супер, если всё будет работать без багов, нам не придётся использовать API или ИИ для своего проекта, спасибо огромное

_terror_
Автор

при отдачи команды sudo apt install tesseract-ocr на мак пишет ThЖe operation couldn’t be completed. Unable to locate a Java Runtime that supports apt.

NikolayN
Автор

Не первый день смотрю Ваши видео. Начинающий разработчик на python с базой знаний на с++. Подскажите несколько книг по которым Вы обучались. Я лично читаю (автоматизация рутинных задач с помощью python, и скраппинг на python). Просто хотелось бы больше узнавать за модули и их спецификации в работе. Заранее спасибо!)

beatzamshanatoliy
Автор

А где можно найти документацию по созданию своего OCR? Нигде, буквально никто ничего об этом не пишет, просто все толдычат про тессеракт или на форумах про keras-ocr, а это мое задание. С чего начать или как или самое главное что нужно в модель пихать, разительно не понятно, уже в депресссию с этого вхожу...

Responsible_Show-off
Автор

в WINDOWS тоже можно скачивать языки и закидывать в папку с языками

woxaz
Автор

Братишка жду видосы про инстаграм бот, спасибо!

Абдуль-бж
Автор

как делать так чтоб другой алгоритм или другой модуль мог выплнять при обнаружение, или другими словами как использывать в условиях

vitalimanjur
Автор

Возможно ли при помощи этого обходить капчу селениумом?
Например в Mail

yosh
Автор

Неплохое решение. А если 100 картинок, 1000 картинок?
К примеру, интересует распарсить счёт на оплату. Вытащить из картинки контрагента, наименование позиций, цену, дату. Таких картинок очень много

АлександрКоновалов-бб
Автор

Можете помочь? У меня после строки появляется вот такой символ: ♀. Изменения config не помогают

fastcode
Автор

Отличное видео спасибо! только вопрос не совсем могу понять, что такое oem ? и что такое psm я нашел в документации, но psm N - N принимает параметры от 1 до 10, почему на видео было psm 13

stannisfoch