filmov
tv
VoiceSwap (echange de voix) par NeMo NVIDIA | L'édition française
Показать описание
✅ Étape 2 : Attendez que le GTC démarre et rejoignez le livestream Keynote.
✅ Étape 3 : Assistez aux sessions GTC. REMARQUE : Les prix ne seront attribués qu'aux personnes qui s'inscrivent au GTC en utilisant le lien ci-dessus et assistent à certaines sessions.
✅ Étape 4 : Abonnez-vous à ma chaîne YouTube.
L'événement comprendra le discours d'ouverture de Jensen rempli d'actualités et diffusé en direct le 22 mars à 15h00 GMT et 16h00 HNE et sera disponible sur demande par la suite.
Ce GTC se concentrera sur l'informatique accélérée, l'apprentissage en profondeur, la science des données, les jumeaux numériques, la mise en réseau, l'informatique quantique et l'informatique dans le centre de données, le cloud et la périphérie. Il y aura plus de 20 sessions dédiées sur la façon dont l'IA peut aider à visualiser et à faire avancer la science du climat. Vous pouvez en savoir plus sur GTC dans ce communiqué de presse.
📚📚À propos
Dans ce didacticiel, nous allons créer une application python d'échange de voix sur Google Colab, appelée VoiceSwap, à l'aide de la puissante boîte à outils d'IA conversationnelle, de NeMo et de modèles d'IA pré-formés pour l'IA conversationnelle, tels que QuartzNet pour la reconnaissance automatique de la parole, FastPitch pour la génération de spectrogrammes. , et HifiGAN pour notre modèle Vocoder. L'application lit des échantillons audio de voix génériques et les convertit (ou les échange) en un échantillon généré par ordinateur.
⏲⏲Contour
00:00 Introduction
00:33 Annonce du cadeau GPU
00:53 Étapes pour participer au Giveaway
02:52 Qu'est-ce que NeMo ?
04:54 Vérification du GPU
05:19 Installer NeMo
06:18 Téléchargement d'un échantillon audio
07:04 Instanciation de modèles d'IA pré-entraînés
09:36 Convertir l'audio en texte
11:19 Texte vers audio
12:20 Échange de voix
13:31 Fin
CRÉDITS x MENTIONS :
📚📚 MES COURS GRATUITS EN LIGNE :
📚📚 AUTRES COURS RECOMMANDÉS
SOIT MON AMI:
QUI SUIS JE:
Je suis un ingénieur électricien et YouTuber avec un doctorat en génie électrique du département des systèmes de communication @EURECOM, Sophia Antipolis en France. Je suis également alumni EURECOM, avec un Master de @CentraleSupélec (Summa Cum Laude). J'ai de nombreuses publications dans des conférences @IEEEorg bien connues, y compris un prix de nomination et je suis co-inventeur de plusieurs brevets. Je suis également un ancien membre étudiant de @IEEE Signal Processing Society. Je consacre également du temps à publier des conférences de haut niveau sur les mathématiques (y compris l'optimisation convexe) et la programmation. Je me concentre également sur les mathématiques pour l'apprentissage automatique, l'optimisation convexe, l'algèbre linéaire, Python, SymPy, NumPy, Pandas, CVXOPT, MATLAB, etc.
ENTRER EN CONTACT:
Je fais de mon mieux pour répondre à chaque commentaire ici sur YouTube, vous êtes ma famille ❤️
#GTC22 #AI #nemo
✅ Étape 3 : Assistez aux sessions GTC. REMARQUE : Les prix ne seront attribués qu'aux personnes qui s'inscrivent au GTC en utilisant le lien ci-dessus et assistent à certaines sessions.
✅ Étape 4 : Abonnez-vous à ma chaîne YouTube.
L'événement comprendra le discours d'ouverture de Jensen rempli d'actualités et diffusé en direct le 22 mars à 15h00 GMT et 16h00 HNE et sera disponible sur demande par la suite.
Ce GTC se concentrera sur l'informatique accélérée, l'apprentissage en profondeur, la science des données, les jumeaux numériques, la mise en réseau, l'informatique quantique et l'informatique dans le centre de données, le cloud et la périphérie. Il y aura plus de 20 sessions dédiées sur la façon dont l'IA peut aider à visualiser et à faire avancer la science du climat. Vous pouvez en savoir plus sur GTC dans ce communiqué de presse.
📚📚À propos
Dans ce didacticiel, nous allons créer une application python d'échange de voix sur Google Colab, appelée VoiceSwap, à l'aide de la puissante boîte à outils d'IA conversationnelle, de NeMo et de modèles d'IA pré-formés pour l'IA conversationnelle, tels que QuartzNet pour la reconnaissance automatique de la parole, FastPitch pour la génération de spectrogrammes. , et HifiGAN pour notre modèle Vocoder. L'application lit des échantillons audio de voix génériques et les convertit (ou les échange) en un échantillon généré par ordinateur.
⏲⏲Contour
00:00 Introduction
00:33 Annonce du cadeau GPU
00:53 Étapes pour participer au Giveaway
02:52 Qu'est-ce que NeMo ?
04:54 Vérification du GPU
05:19 Installer NeMo
06:18 Téléchargement d'un échantillon audio
07:04 Instanciation de modèles d'IA pré-entraînés
09:36 Convertir l'audio en texte
11:19 Texte vers audio
12:20 Échange de voix
13:31 Fin
CRÉDITS x MENTIONS :
📚📚 MES COURS GRATUITS EN LIGNE :
📚📚 AUTRES COURS RECOMMANDÉS
SOIT MON AMI:
QUI SUIS JE:
Je suis un ingénieur électricien et YouTuber avec un doctorat en génie électrique du département des systèmes de communication @EURECOM, Sophia Antipolis en France. Je suis également alumni EURECOM, avec un Master de @CentraleSupélec (Summa Cum Laude). J'ai de nombreuses publications dans des conférences @IEEEorg bien connues, y compris un prix de nomination et je suis co-inventeur de plusieurs brevets. Je suis également un ancien membre étudiant de @IEEE Signal Processing Society. Je consacre également du temps à publier des conférences de haut niveau sur les mathématiques (y compris l'optimisation convexe) et la programmation. Je me concentre également sur les mathématiques pour l'apprentissage automatique, l'optimisation convexe, l'algèbre linéaire, Python, SymPy, NumPy, Pandas, CVXOPT, MATLAB, etc.
ENTRER EN CONTACT:
Je fais de mon mieux pour répondre à chaque commentaire ici sur YouTube, vous êtes ma famille ❤️
#GTC22 #AI #nemo
Комментарии