OpenAI Whisper | Python ile Çok Dilli Konuşma Tanıma Sistemi

preview_player
Показать описание
Merhabalar, OPENAI, Whisper adındaki konuşma tanıma modelini yayınladı. Geliştirdikleri sistem kaydettiğiniz bir ses kaydı veya video dosyasını girdi olarak alıyor ve size çıktı olarak ses kaydının transkriptini veriyor. Bu sistemlere genel adıyla Otomatik Konuşma Tanıma Sistemi deniyor. Kısaca (ASR).

Youtube, Meta, Amazon, Google gibi birçok dev şirket, ürünlerinde son derece yetenekli konuşma tanıma sistemlerini zaten kullanıyordu. O nedenle Whisper çok da büyük bir yenilik değil. Yoksa öyle mi?
 
Whisper’ı bu devasa şirketlerin ürünlerinden farklı kılan açık kaynak bir proje olması. Bunların üstüne bir de performansı ve sunduğu özellikler var.

00:00 Whisper Nedir?
01:28 Whisper'ın GitHub Sayfasında Paylaşılanlar
04:32 Whisper ile Şarkılar Üzerinde Deneme ve Model Karşılaştırması
10:08 Konuşma Tanıma Modellerinde Performans Metriği (WER)
13:35 WAV2VEC (53k - 960h) vs Whisper (base model)
17:07 Son Düşünceler

Bana özel olarak soru sormak isterseniz instagram adresimden DM atabilirsiniz: pumpingcode

►Destek olmak istersen videolarımızı paylaşmayı unutma;);)

Bana özel olarak soru sormak isterseniz instagram adresimden DM atabilirsiniz: pumpingcode

►Destek olmak istersen videolarımızı paylaşmayı unutma;);)
Рекомендации по теме
Комментарии
Автор

Merhabalar mikrofondan altyazı çıkarabileceğimiz bir proje örneği var mı?

onurk
Автор

Çok güzel bir video olmuş. Böyle gelişmeleri öğrenebileceğimiz takip edebileceğimiz bide üstüne nasıl kullanabileceğimizi gösteren türkçe kaynakların, videoların olması bu kadar kaliteli bilginin anlatılması çok güzel bir şey. Elinize ağzınıza sağlık araştırmayı ve geliştirmeleri takip etmeyi seven bir üniversite öğrencisi olarak başarılar dilerim.

yusufziya
Автор

hocam whisperi pip ile ekledim ama import edince visual studio da görmüyor kütüphaneyi nedendir acaba ?

erenbaran
Автор

hocam kod yazdıgınız sayfa hangi site?

OmsiCaptain
Автор

Yep yeni projelere kapı arayacak bir video olmuş.
Tebrik ve teşekkürler...🤲🤲🌷🌷🌹🌹

hamzabayrakl
Автор

Hocam ben bu whisperda bir konuşma dosyasını large olarak atlyazıya çevirdim fakat daha sonra türkçeye çevirmek istiyorum birde altyazı olarak large şeklinde ama kod hata veriyor beceremiyorum bir türlü kodu nasıl yazmam lazım ?

heredotcevdet
Автор

açık kaynak, translate.google.com ve diğerleri çeviri konusunda çok iyi durumda.

hala bir sorun var :
telefonda uygulamayı açıp kişiye uzatmamız gerekiyor.
Bu durum büyük bir sorun.
Şöyle bir uygumla daha iyi olabilirdi:
f kullanıcı telefon kulaklığı kullanır ve ek bir telefon mikrofonunu yakasında taçtır.
X translate uygulaması açılır ve acıdığında sürekli mikrofonu açık tutar,
(ekran kili dahil)
e kişi konuşur, uygumla sesi mikrofondan alır ve çevirir ve otomatik olarak sesli iletir.
Böyle bir uygulama yoksa sizden bekleriz:

Not :
youtube dan yorum olarak yazdım yorum silindi.

leventkorkmaz