Обработка аудио 2023. Лекция 1. (Введение + Digital Signal Processing)

Показать описание

Лекцию ведет Северилов Павел
Тема: Введение + Digital Signal Processing.

Deep learning in audio course (Speech-to-text, Text-to-speech, STT, TTS, ASR, keyword spotting, KWS, Voice Conversion, NLP, signal processing, neural networks, Unsupervised learning)

Machine Learning – Intelligent Systems

Рекомендации по теме

Комментарии

Если у вас есть желание немного покопаться в звуках речи и понять где так какие фонемы, как они переходят от одной к другой, зависят от пола и тд то можно порекомендовать небольшой познавательный курс

weFromRussia

Стоит обратить внимание что движок генерации речи был содран с речевых кодеков. Гриффин, Лим первоначально работали именно в этой области. Их известный алгоритм - это версия от которой они отказались в пользу немного другого принципа который можно видеть в кодеках группы AMBE - IMBE. Сегодня вы применяете конечный синтез речи, который широко применяется в кодеках ACELP группы (и очевидно от туда изначально и пришел). Как я посмотрел на его структуру - там весьма прямолинейное и вычислительно затратное решение.

weFromRussia

Обработка аудио 2023. Лекция 1. (Введение + Digital Signal Processing)

Обработка аудио 2023. Лекция 1. (Введение + Digital Signal Processing)

Обработка аудио 2023. Семинар 1. (Spectrograms, Griffin-Lim Algorithm)

Обработка аудио 2023. Лекция 2. (ASR 1: WER, CTC, LAS, Beam Search)

Редкие кадры Путина с женой #путин #президент #shorts

Математика это не Ислам

Обработка аудио. Семинар 1. Spectrograms and the Griffin-Lim Algorithm

Лекция. Введение. Задачи обработки естественного языка и аудио...

шок оригинал карты Европы!!! кто просил держите

Обработка аудио 2023. Семинар 2. (Levenstein distance, WER, CER)

Золотые слова Алины Кабаевой 😍

удаление неизвестного объекта

Обработка аудио 2023. Лекция 3. (ASR 2: RNN-T, Conformer, Whisper, LMs in ASR)

макияж для удовлетворения кого-то или для себя❓

Баянист поддержал бабушку с домрой! Незаменимая реакция людей!...

В этом главная проблема большинства людей #деньги #инвестиции #shorts...

Работа в Adobe Audition с нуля. Основа. Вся база знаний за 21 минуту. Remake...

Вагнеровцы после обороны Бахмута #shorts

Обработка аудио 2023. Лекция 5. (Text-to-speech: Tacotron2, FastSpeech, Guided Attention)...

Делаю маникюр в школу 😁 #ногти #маникюр #красота

Выздоровление от Всех Болезней и укрепление иммунитета / Всеисцеляющая Матрица Гаряева...

Как выглядит 70 кг сухой мышечной массы в футболке и без неё....

Как сделать двойника в CapCut

Топ 3 худших программиста на YouTube! #код #айти #программист...

Обработка аудио 2023. Семинар 5. (Text-to-speech: Tacotron2)