Нейросеть для перевода аудио в текст. Транскрибация от OpenAI: Whisper

preview_player
Показать описание
OpenAI – передовая лаборатория по разработке нейросетей. Достаточно сказать, что ChatGPT является одним из продуктов OpenAI. Whisper это еще одна нейросеть от OpenAI, которая умеет переводить аудиофайлы в текст.

Делает она это весьма хорошо, но транскрибация – не единственное ее достоинство. Кроме того, что она прекрасно понимает речь на разных языках, она еще и выложена в открытый доступ и любой желающий может скачать Whisper, установить на свой компьютер и пользоваться абсолютно бесплатно и автономно. Рассказываем, как установить Whisper из-под Python.

#Whisper #OpenAI #python

Установить Whisper: pip install -U openai-whisper

Таймкоды видео:
00:06 Whisper что это
00:22 Как работает Whisper
00:49 Начало. Установка Python
01:51 Установка PyTorch
02:28 Установка FFmpeg
04:17 Установка Git
04:39 Как прописать пути (Path)
05:22 Установка Whisper

Видео Теплицы - это уроки на русском по всем программам, которые могут вам пригодиться.

Подписывайтесь на еженедельную рассылку Теплицы и получайте лучшие видеоуроки, полезные статьи и анонсы возможностей для саморазвития и командной работы:

Музыка: Javier Suarez (jahzzar) "Please Listen Carefully" ©
Рекомендации по теме
Комментарии
Автор

Четко и лаконично! Очень помогла ваша инструкция! Спасибо!!!

rsppbnd
Автор

Большое спасибо! Установила Whisper - это какое-то волшебство!

linamikhailova
Автор

Здоровья и процветания Вам! Все получилось даже у чайника) От всей души благодарю!

imqytlm
Автор

Желаю вам миллион подписчиков и миллион просмотров под каждым видео! Благодарю!

rikkavoin
Автор

быстро понятно и без воды, пол дня обыскался такое видео, спасибо😹

forsietsforsiyskayarepubli
Автор

Да ты просто гений, бро! Огромная благодарность!!!

mdqssby
Автор

Спасибо!
Пришлось повозиться с разными ошибками, хоть и делал всё по инструкции.
Ошибки гуглил, переустанавливал и обновлял версии программ, в итоге всё работает!

Pasheka_
Автор

Потрясающий гайд! Не забывайте обновлять и прописывать пути, тогда всё сработает как по маслу!

iuliiailina
Автор

Спасибо автору за такой серезный контент. Пробовал несколько разных файлов, одни работали, а другие почемуто не хотели запускаться. ВНИМАНИЕ если название файла имеет пробел(тогда не работает данная программа), то необходимо исправить, переименовать так, чтобы заполнить эти пробелы или их сократить. Ещё раз спасибо автору.

oleksandr.regresolog
Автор

Спасибо огромное! сделала все по инструкции, заработало с первого раза.

nuqjkzf
Автор

Спасибо! Это очень круто. У меня заработало

AnteyOxy
Автор

Бро! Ты крут! Лайк, подписка, колокольчик! Быть добру! Желаю тебе платиновую кнопку!

wxuxwiu
Автор

Для тех кого сильно пугает Использование питона и консольной команды, то... есть программа для субтитров -
Subtitle Edit.
В ней есть возможность через неё же скачать эту Whisper и использовать. Так же доступна другая Ai для субтитров - VOSK/Kaldi.
Как конкретно включается:
Запуск программы -> Видео -> Audio to text (Whisper) -> Выберите язык -> выберите модель -> "..." -> скачать нужную модель ( Tiny ... Large )
Может кому помогло упростить себе деятельность.

koryginagrobova
Автор

Камраду большущий респект за данный нужный и подробный ролик.
Вот только камрад пренебрёг некоторыми, весьма важными, техническими подробностями.
А именно:
про PyTorch
1) под Windows требует только и исключительно х64 версию.
2) CUDA = Nvidia видеокарта.
(Один из главных недостатков CUDA состоит в том, что она является эксклюзивной платформой для работы на GPU компании NVIDIA. Это означает, что программа, написанная на CUDA, не будет работать на машинах с графическими процессорами других производителей, например - AMD или Intel).
А в последней стабильной версии PyTorch в наличии только CUDA, а CPU - отсутствует, как класс. И найти версию под Intel, тот ещё квест.
С уважением, Панки - ХОЙ!

emulechoh
Автор

Спасибо за видео!
Как можно добавить автоматическое разделение спикеров?

tfztrem
Автор

Сделал по видео все работает. Подскажите, пожалуйста, а как через pycharm настроить? И через Anaconda jupyter notebook?

semendyakonov
Автор

Большое спасибо! по инструкции всё получилось установить))) Подскажите пожалуйста, как записать команду, чтобы при расшифровке использовалась large модель для лучшего качества, когда звук не очень записан?
И еще вопрос, просто чтобы понимать) Расшифровка происходит через интернет или полностью на самом компьютере?

Domino
Автор

02:47 путь к папке для ffmpeg
04:01 разархивируем эти файлы в этот путь
04:21 скачиваем гит
05:20 проверяем
5:40 адрес папки для трнаскрибации

rcsinzy
Автор

есть ли модель или нейронка, которая разделяет спикеров по голосам? Шрифтом, к примеру. Можете подсказать сторонние модели или нейронки, которые лучше модели large на русском? Спасибо

abusingAIForArt
Автор

Спасибо, боярин! Сильно время сэкономил.