Yandex Speechkit + Python = Синтез озвучки из текста, API

preview_player
Показать описание
Yandex Speechkit - сервис для создания аудио контента из текста. То что называется Text-To-Speech (tts). Speechkit доступен через API
Yandex Cloud, через обычные HTTP POST запросы.
~~~
~~~
🤑 Спасибо автору
~~~
✔️ Сегодня покажу:
- Как создать Облако в Yandex Cloud
- Как получить Грант в 4000 рублей
- Как получить токены для доступа к Yandex SpeechKit
- Как работать с API Speechkit на Python через requests
- Как конвертировать lpcm ответ от SpeechKit в WAV с помощью SOX из Python
~~~
⏲️ Таймкоды
00:00 Содержание
01:42 Демо Yandex SpeechKit без Python и программирования Бесплатно
03:12 Конкурент - Tinkoff VoiceKit, бесплатное демо
04:34 Зачем нужен Text-To-Speech engine? Как можно на этом заработать или внедрить в бизнес процессы.
06:14 Монетизация автоматически озвученных роликов на YouTube
07:49 Калькулятор стоимости использования Yandex SpeechKit
10:04 Гранты Yandex Cloud на первое использование
13:19 Регистрация в Yandex Cloud, создание Облака и Папки. Структура ресурсов Yandex Cloud
15:20 Начинаем работать с API SpeechKit
17:09 Платежный аккаунт в Yandex Cloud
18:23 Получение токенов (IAM токен, Yandex Cloud CLI )
24:05 Мой код на Python для работы с Yandex SpeechKit
30:42 Конвертация lpcm от Yandex SpeechKit в wav на Python с помощью SOX

.
.
.
#yandexspeechkit #tts #python
Рекомендации по теме
Комментарии
Автор

Огромное спасибо! Такие как ты двигают прогресс в массы. За всем уследить в наше время просто нереально, а еще и изучить самостоятельно до уровня применения - необходимо куча времени, проб и ошибок. А ты помогаешь пройти этот путь за кратчайшее время и с минимумом усилий!

sergesc
Автор

Ты прям мееня обучил, крутяк, вопросов еще куча осталось кконечно. но все работает. КРУТЯЯЯЯЯЯЯЯЯЯЯЯК
Пасыба сенсей

SHADOWXO
Автор

Вот прямо сейчас вот не жду и пишу в комментариях "Хочу продолжения"!

alko_xo
Автор

Ничего не нужно конвертировать включаешь запись в камстасии и запускаешь синтез речи потом в видеоредакторе отделяешь звук от видео одним кликом и готовый твой голос на полосе редактора в нужном формате мп3 или любой другой пишешь сразу внужный формат

realnueprikolu
Автор

Не понял в видео самого главного. Куда в вашем коде вставлять параметры iam token, folder id. Понятно что есть creds какая то подпапка ... и там есть какой то файл _init_.py. Но как это все делать и куда его класть этот файл не сказано.

prosvetis
Автор

Здарова.
Сейчас бесплатно ли TTS с лимитам.

davidsuragan
Автор

Эта тема особо востребованная сегодня, в условиях развития видео контента. Трафика может мало, или по другим запросам ищут эту тему. Мне лично интересно и необходимо, английская озвучка текстов для моих видео.

AlbertCartel
Автор

Спасибо за видео! Хотелось бы увидеть модель распознования текста из видео.

АлександрВолков-ьт
Автор

Спасибо за видео! могу ли пополнить свой счет например на 200 руб и оплатить с этих денег озвучку?

АнсорИкрамов
Автор

Доброго времени суток, Все сделал по инструкции а получаю такой ответ: line 6, in <module>
import requests
ModuleNotFoundError: No module named 'requests'
Почему такое может быть?

apilotf
Автор

Спасибо за статью, очень помогла в написании проги. Не планируется такой же, но по api v3? Говорят, там гораздо круче качество звука. Я попробовал сам сделать все по инструкции от Яндекса, но он ругается, что нету Folder_ID. А у меня он есть, но я не пойму, куда его указывать, куда не пробовал, везде не подходит

StariyHren
Автор

разница между этим и демкой с сайта только в рекламных вставках? все равно все придется прописывать в ручную

Pavluntik
Автор

Как подключить к Asterisk в синхронном режиме?

filya
Автор

На кого рассчитаны ролики? Если на начинающих, то пояснений мало очень. Что делает функция которая у Яндекса в документации прописана. В какой последовательности идут Ваши функции и что выполняют и почему именно так написаны. С костылем по sox вообще нужно больше времени было уделить. (вроде для Python есть вообще sox библиотека) Прятать токены в Creds, новичку вообще это будет не понятно, где они прописан и что импортируются. В общем не получилось у Меня с первого раза повторить Ваш проект, если убрать команду конвертора (sox) из Вашего кода она тоже не работает. Пишу как есть просто.

LapshinOfficial
Автор

Спасибо за видео, хочу такую интеграцию для Ubuntu!

ИванЯкунин-сж
Автор

Совсем недавно испортился голос у Филиппа, стал сильно роботизированным и менее качественным. Вы не знаете, это только в демо версии так или везде?

ЕвгенСпицын
Автор

Здравствуйте, подскажите пожалуйста начинающему питонщику, если не сложно, два дня уже мучаюсь пытаюсь понять где ошибка в коде?
Скрипт читает файл Test.txt: (Привет мир!) и преобразует его в mp3 файл.
Проблема в том что mp3 файл звучит так: РџСЂРёРІРµ РјРёСЂ
В чём проблема не могу понять.
Подскажите если не сложно, буду признателен!

Nik_tvnow
Автор

Можно тоже самое сделать на Tinkoff speechkit?

mikhailv
Автор

а это нормально если регистрируешь платежный акк и вводишь данные карты свой то он 10 руб забирает?

Scout_SZ
Автор

File "C:\Users\Iverh\Desktop\SpeechKit\__main__.py", line 9
target_path =
^
SyntaxError: (unicode error) 'unicodeescape' codec can't decode bytes in position 2-3: truncated escape
[Finished in 87ms]
Что делать?

Iverh