Cómo transcribir audio y video gratis usando Whisper y Python | Tutorial paso a paso

preview_player
Показать описание
------------------------------------
👉 Whisper es una IA que permite transcribir cualquier audio o video a texto. En este tutorial Carlos te enseña a usarlo desde Python.

----------------------------------------------------------------------
Síguenos

@recent-platzi
Рекомендации по теме
Комментарии
Автор

amigo, muy buen video y en verdad gracias por su tiempo y conocimiento, pero creo que varios tenemos el mismo problema, el repositorio se actualizo y no podemos convertir los archivos a formato srt y demas para subtitulos, le agradeceriamos de corazón que pudiese actualizar el video con esos cambios, feliz día =)

DalajaaBtk
Автор

Está bueno !! Habrá algún ejemplo para la transcripción de llamadas ? O alguna manera de identificar cambios de tonos en la voz ? Ya que sería necesario saber que persona está hablando.

luisdatec
Автор

Interesante, eso me recuerda cuando hice un software donde solo ponías el link de un video y lo transcribía (Creo que lo buscare para mejorarlo con este video :D )

LastMiau
Автор

Hay una parte para identificar voces distintas?

Лабораторныйприбордляредактиро
Автор

Actualizaron el repositorio y ahora no están esas utilidades :( alguien me ayuda a obtener el txt, vtt y srt ?

yorius
Автор

que significa y que puedo hacer? Si me aparece lo siguiente cuandp ejecuto: UserWarning: FP16 is not supported on CPU; using FP32 instead
warnings.warn("FP16 is not supported on CPU; using FP32 instead")

juanjosegomez
Автор

Como el repo de whisper cambio, ahora hay que ejecutar el siguiente codigo:
import whisper

!whisper --model medium

Automaticamente se va a guardar el transcript en todos los formatos permitidos por whisper.

benditascolmenas
Автор

Cambió todo el github de whisper :c logré importar las utils con: import WriteTXT, WriteVTT, WriteSRT pero para que genere los archivos no pude, no reconoce file=vtt o file=srt

nadietepregunto
Автор

Muy buen video !!. me pregunto cómo hace la transcripción Whisper, es decir, importamos el modelo etc., pero para hacer las traducciones entiendo que se conectará a una API de OpenAI no ?, si no no entiendo cómo puede hacer la traducción en cualquier idioma sólo descargándonos el modelo. Alguién lo sabe ?, muy buen video Platzi, genial ! voy a estar pendiente de la escuela de Data Science de Platzi, se vienen cosas muy interesantes !!

dcorralf
Автор

Excelente servicio, te agregare a mis favoritos, gracias por el aporte felicidades

miguelangelbelloavila
Автор

Chevere y todo, pero algo mas facil es subir el video a youtube y dejar que salgan los subtitulos y descargar el archivo

danielavila
Автор

Alguien sabe cómo hace eso de 7:28 la parte donde solo selecciona el espacio para eliminar, a mí se me selecciona todo :(

emmanuelbarba
Автор

buena su explicacion.. pero realmente es mucho mas simple de lo que ud explica son solo tres pasos en la pagina gracias

hectorcortes-sr
Автор

bastante interesante este mini proyecto!

nicolashomez
Автор

Gran video! ahora tutorial de texto a voz :D

javieralvarez
Автор

Hola! esta es mi primera vez programando, cuando pego los códigos es necesario ponerle el "!" que se ve en el video? Por otro lado, luego de que ejecuto el modelo me aparece este texto:
UserWarning: FP16 is not supported on CPU; using FP32 instead
warnings.warn("FP16 is not supported on CPU; using FP32 instead") Agradecería su ayudita :) gracias!

antoniaprado
Автор

Si funciona, solo la parte final ya cambio

uzielmenaperez
Автор

Impresiona el proceso de transcripción de los archivos disponibles en youtube (copiar y pegar), sin embargo, la segmentación de frases todavía le falta exactitud, sobre todo en guiones no redactados previamente. Creo tener ya un proyecto decente para Platzi. Hasta ahora no he encontrado en la literatura recomendada por el curso de NLP nada sobre la distinta entonación de las mismas palabras según su posición en el segmento, es decir si van inmediatamente antes o después de una coma, punto, o signos exclamativos. Ya se por donde ir. Amo python.

mariostel
Автор

Se puede instalar en una Raspberry Pi 5?

Jamesmass
Автор

Es posible transcribir todos los videos de una pagina de youtube a texto de forma automatica?

MONJE