Голосовой помощник на Python

preview_player
Показать описание
Как сделать голосового помощника на Python? В этом видео есть ответ! )))
В новом коде используется API Speechkit Yandex Cloud - для генерации речи
SpeechRecognition - для распознавания речи
pydub - для конвертации ogg файла в mp3
playsound - для проигрывания mp3
gTTS (в старом коде) - для генерации речи
Рекомендации по теме
Комментарии
Автор

Круто! Это же можно голосовые заметки для себя сделать.

MrVovak
Автор

Олег Шпагин, можете пожалуйста выложить следующее видео про то, как создать свой модуль? Мне кажется это будет интересно🤣🤣🤣

jurassicworld
Автор

Подобное я делал в 1999, голосовой запрос новостей читал мне, голосом торговал.

homealone
Автор

Добрый день, Олег. Спасибо за видео, но расширять код имеет смысл только в 1 сторону - делать клиент-серверное приложение и на стороне сервера заполнять базу данных с ответами и синтаксический анализ так же отдать серверу. На клиенте останется только распознавание речи и преобразование текста, полученного от сервера в звук. Но тут просто беда - все учат 1 и тому же - как поднять socket сервер на localhost. А вот как его поднять на статическом внешнем IP при работе через роутер - нигде нет. Могли бы вы записать видео или дать ссылку на пример кода TCP-сервера, работающего на внешнем адресе, так, чтобы можно было в телефонный клиент задать вопрос, а с домашнего компа из базы данных получить ответ. Вот такое видео станет, если и не первым, то точно 1 из первых на эту тему. Полагаю, многим будет интересно. Если с роутером - никак, то можно и без роутера дать пример. Могу, хоть и с большим гемором, подключиться напрямую в розетку, которой пока нет (хреновы ремонтеры оставили висячие коротенькие провода из стены в очень неудобном месте.).
Если кто-то из сообщества знает ответ, напишите пожалуйста или дайте ссылку.
Проброс портов пробовал - не работает, метода gethostname() в Python 3.10 - нет. Если вдруг, на Ubuntu работает, могу перейти и на нее в терминале есть она у меня. Поставил ради Buildozer-а. для сборки apk

zhzeiwn
Автор

Здравствуйте вы можете использовать библиотеку vosk для распознавания речи он работает офлайн и быстрее чем speech_recognition

qaqasozun_var
Автор

Ты мой герой пишу диплом по твоим видео😊

kamni_s_dorogi
Автор

Олег, подскажите, а возможно ли обучить голосовой помощник распознавать не просто сущности как слова, а звуки в слове? Можно было бы тренировать английское произношение - голосовой помощник возвращал бы ошибку при неверно произнесенном звуке.

chuguevskij
Автор

Можно ли сделать программу для распознавания текста в аудио на основе Api Speechkit Yandex Cloud?

nwjmwxg
Автор

Алоо сделай быстрее все видосы трансляции в одну неделю запусти хотя бы 4 видео очень нужен мне видео твое

-it
Автор

Вспомнил момент с голосовым помошником из сериала : "жуки" кто смотрел, тот поймёт))

fqutwro
Автор

Видео через 5 лет:
Как сделать робота который будет управлять АЭС и МКС при помощи 3g на Python 2.2 в блокноте

blendanimations
Автор

Дополню. В текущей реализации бот полностью зависит от наличия интернета и доступа с серверам Гугла/Яндекса. Если планируется не просто поиграться, но и что-то автоматизировать дома - это самый плохой выбор, потому что ваша автоматизация сразу получает кучу точек отказа. Для того, чтобы все работало полностью автономно есть оффлайн модели (на гитхабе - snakers4 / silero-models ), они неплохо распознают голос и синтезируют текст, еще есть выбор из нескольких голосов.

ytmhxgr
Автор

*Привет! А под Mac OS будет ваш код работать ? который вы выложили ?*

cartoonforkids-usa
Автор

Классный контент! Спасибо! Подскажите пожалуйста, очень нужно, может вы знаете: вот этот модуль playsound, что вы используете в этой программе, чем его можно заменить, т.к. если его использовать вместе с kivy и потом делать андроид приложение, то он не работает, не проигрывает mp3 файл. Если его заменить на SoundLoader, то он не проигрывает mp3 файлы, может только wav или ogg. Как это решить можно? Чем можно проиграть mp3, чтоб работало в андроид, или может как-то сконвертировать mp3 в ogg?

BossVspMax
Автор

Добрый день.Подскажите, пожалуйста, может кто-то сможет подсказать.Или может кто-то пытался разобрать код.6 лет назад выпустили машинку Маквин с приложением, с которого она запускалась, 1, 5 года назад приложение сняли, теперь внук захотел с машинкой поиграть, но приложение закрыли.Может кто-то вывел код.

irinaste
Автор

Олег Шпагин а какой язык программирования очень хорошо подходит для геймдева?

jamshid
Автор

No module named 'gtts' что за ошибка и что она значит?подскажите пож я новичек в питоне

zpnghrx