Características de Buzz
- Transcripción y traducción en tiempo real a partir del micrófono de tu ordenador a texto. Trascribe mientras hablas.
- Importación de archivos de audio y video y exportación de transcripciones a TXT, SRT y VTT. Puedes agregar archivos mp3, mp4 y más formatos de audio y video.
- Compatible con los modelos Whisper, Whisper.cpp y Hugging Face compatibles con Whisper
Cómo se instala Buzz
Buzz está disponible para Mac y Windows. En la página de descarga (tienes el enlace arriba), puedes descargar el .DMG para Mac o el .EXE para Windows. Una vez lo tengas descargado es tan simple como continuar el proceso habitual de instalación de software y listo, sin complicaciones.
Entendiendo el programa
Campo | Opciones | Descripción |
---|---|---|
Tarea | «Transcribir», «Traducir» | «Transcribir» convierte el audio de entrada en texto en el idioma seleccionado, mientras que «Traducir» lo convierte en inglés. |
Idioma | Ver documentación de Whisper para ver la lista completa de idiomas compatibles | «Detectar idioma» intentará detectar el idioma hablado en el audio a partir de los primeros segundos. Se recomienda seleccionar un idioma (si se conoce) ya que mejorará la calidad de la transcripción en muchos casos. |
Calidad | «Muy baja», «Baja», «Media», «Alta» | La calidad de la transcripción determina el modelo Whisper utilizado para la transcripción. «Muy baja» utiliza el modelo «tiny»; «Baja» utiliza el modelo «base»; «Media» utiliza el modelo «small»; y «Alta» utiliza el modelo «medium». |
Como ves, la interfaz es simple. Ha cambiado en las últimas actualizaciones, agregando la función de poner en cola diferentes archivos. Esto ha sido una genialidad que nos permite agregarle una cola de tareas larga para dejar a la IA trabajando durante horas sin parar en un paquete de archivos de audio o video.