audio a texto

Transcribir discurso a texto con inteligencia artificial (IA) y obtenerlo en inglés

La inteligencia artificial (IA) no deja de sorprenderme. Y entre las herramientas de IA que te dejan con la boca abierta y dices WTF está este transcriptor de discurso a texto de Open AI. ¿Te imaginas tener que transcribir una entrevista de una hora? Quien lo haya hecho sabe que se tarda como 5 horas y es una labor tediosa y aburrida. Ahora con la IA puedes transcribirla en unos minutos, y además obtenerla en inglés para realizar análisis cualitativo.

Solo debes abrir una cuenta en Open AI playground. Es gratis por un tiempo. Si ya estabas registrado en Open AI y te pasó el tiempo de prueba, puedes o pagar o abrir una nueva cuenta con otro email y otro número de teléfono.

Transcribir discurso a texto

Hay varias maneras de pasar de audio a texto, por ejemplo, la herramienta de dictado de Word en la que vas hablando al micrófono y se va transcribiendo a texto lo que dices. Quizás la hayas usado. Es buena ya que aísla el ruido y la música de fondo, pero depende que el discurso que realices sea casi perfecto. Si en el speech (discurso) que estás haciendo se te escapa un "Joder..." queda registrado (aunque transcribe ****), o si repites palabras quedan doblemente escritas. Otro problema de la herramienta de transcripción de Word es la puntuación. No identifica comas ni puntos a no ser que lo indiques expresamente. Y si hablas en inglés y tu inglés no es tan bueno, el texto que obtengas será poco útil.

Discurso a texto con inteligencia artificial

Open AI playground, la famosa inteligencia artificial que genera texto, ha incorporado una herramienta de discurso a texto (speech to text) que transcribe audio a texto. Este audio puede ser:

  • Un vídeo en mp4 u otro formato
  • Una grabación en mp3
  • Un dictado mediante el micrófono

La gran maravilla de esta herramienta es que puedes subir un vídeo (o audio) en español y la herramienta de IA transcribe el audio a texto en inglés. Pero genera un texto bien redactado, con todos los signos de puntuación, y eliminando muletillas y sonidos raros. Veamos un ejemplo.

He descargado un vídeo de Youtube en el que yo hablaba en castellano sobre desigualdad, élites y otros temas. He usado este vídeo ya que conocía el discurso y en él se me escapan muletillas (al principio digo un largo eeeehh), no hago pausas, y a ratos se escucha regular.

Posteriormente lo he subido a Open AI Playground pinchando sobre el icono del micrófono (speech to text).

Este es el texto que genera: directamente en inglés, con un inglés muy aceptable y corregido, sin muletillas, con signos de puntuación, leíble. Casi listo si tuviera que dar el discurso en inglés o si quisiera presentarlo como ensayo. Ni he tenido que traducirlo con Google, ni pedir a alguien que me corrija el inglés, ni reescribirlo.

Esta herramienta de IA abre grandes posibilidades para transcribir largos discursos, hacerlos accesibles para personas sordas, incluso para transcribir entrevistas de una investigación y realizar análisis cualitativo. En fin, la inteligencia artificial sigue haciendo tambalear la educación y los procesos de investigación como vimos en el repaso de herramientas de IA para la investigación e innovación.

Si te sirvió esta entrada, por favor, compártela por Twitter, LinkedIn, Facebook o WhatsApp. Seguimos

Publicado por

Julian Cardenas

Profesor de investigación cuantitativa y análisis de redes. Doctor en Sociología. Aficionado al fútbol y escuchar música. @juliancardenasx

Uso de cookies

Este sitio web utiliza cookies para que usted tenga la mejor experiencia de usuario. Si continúa navegando está dando su consentimiento para la aceptación de las mencionadas cookies y la aceptación de nuestra política de cookies, pinche el enlace para mayor información.plugin cookies

ACEPTAR
Aviso de cookies