Nuevas gafas pueden transcribir voz en tiempo real

Cuando Paul Shuttleworth se compró un par de anteojos muy caros para Navidad el año pasado, fue un regalo peculiar. Las gafas no mejoraban su vista, no eran particularmente elegantes y le presionaban incómodamente la nariz.

Pero estas gafas son una herramienta vital para él.

Shuttleworth, de 40 años, residente de Manchester, Inglaterra, es profundamente sordo de ambos oídos y utiliza una aplicación móvil de transcripción de audio en vivo como su principal herramienta de conversación. Pero las gafas le han ayudado a hablar y participar en conversaciones como nunca antes había podido hacerlo. Estos tonos elegantes transcribe automáticamente las palabras que alguien dice y muestra el texto como subtítulos en las lentes frente a sus ojos.

Cada vez hay más rumores sobre este tipo de “gafas de subtítulos en vivo”, y una gran cantidad de empresas han lanzado sus propias versiones en los últimos años. Estas gafas de alta tecnología tienen el potencial de ayudar a las personas sordas o con problemas de audición a comunicarse de forma más fluida con las personas oyentes. Pero no son perfectos y es posible que nunca reemplacen por completo a los traductores humanos.

En julio, Tom Pritsky, cofundador de TranscribeGlass, publicó un vídeo de tiktok eso demostró las gafas de subtítulos en vivo de su compañía que proporcionaban subtítulos para las palabras que decía, y se volvió viral. Estas gafas no son sólo una moda tecnológica para Pritsky, que tiene una pérdida auditiva bilateral de moderada a grave. Mejoran activamente su calidad de vida y su capacidad para conversar con la gente. “Me ayuda a llenar los espacios en blanco”, dice Pritsky, estudiante de posgrado en informática biomédica en la Universidad de Stanford. También usa audífonos. “Los audífonos me dan audio, pero no es claro y me faltan palabras”, dice Pritsky. “Si puedo completar algunas de esas palabras mediante leyendas y subtítulos, me ayudará a seguir entendiendo la conversación y no perder el hilo”.

Crédito: Vidrio XRAI

Las gafas con subtítulos en vivo están comenzando a llegar al mercado gracias a las mejoras en la tecnología de reconocimiento de voz y la duración de la batería. Se prevé que casi 2.500 millones de personas tendrán algún tipo de pérdida de audición para 2050. Los expertos dicen que las personas mayores con pérdida auditiva son las que tienen más probabilidades de beneficiarse de estas gafas. Muchas personas mayores necesito audífonos pero no los uses debido al estigma y dificultad para adaptarse a la tecnología. Las gafas con subtítulos en vivo suelen parecerse a las gafas normales, que ya están más normalizadas en la sociedad que los audífonos.

Dar acceso a subtítulos en vivo a las personas mayores con pérdida auditiva relacionada con la edad puede mejorar su relación social con familiares y amigos, dice Thad Starner, profesor de informática en el Instituto de Tecnología de Georgia. A principios de la década de 2010, Starner ayudó a desarrollar Google Glass, un dispositivo ahora descontinuado parecido a anteojos que proyectaba información en un pequeño prisma frente al ojo del usuario.

Un punto de inflexión

Los subtítulos en tiempo real no son una tecnología totalmente nueva. Las personas sordas o con problemas de audición utilizan habitualmente aplicaciones como Otter para transcribir una conversación mientras la mantienen. Pero tener que hacer ping-pong entre la persona con la que estás hablando y su teléfono puede resultar frustrante y agotador. Tener subtítulos en tu campo de visión cambia las reglas del juego, dice Pritsky.

La mayoría de las gafas de subtítulos en vivo se componen de las propias gafas, un pequeño micrófono, una computadora a bordo que procesa el habla, una batería y alguna forma de mostrar texto. Algunas gafas contienen todos estos componentes, mientras que otros dispositivos se colocan encima de un par de gafas normales. Las mejoras en el software de reconocimiento de voz realmente han permitido estos avances tecnológicos, dice Dan Scare, director ejecutivo de XRAI Glass, una empresa que fabrica una aplicación de procesamiento de voz que se puede utilizar con una variedad de gafas de subtítulos en vivo. “No creo que estemos a más de seis meses de tener una pieza de hardware excelente que puedas usar absolutamente para esto. Entonces sólo será cuestión de encontrar gente que quiera utilizarlo”, afirma.

A pesar de los rumores en los medios, se ha vendido una cantidad relativamente modesta de gafas con subtítulos en vivo. Scare dice que más de 5.000 personas forman parte del programa piloto de XRAI Glass y Pritsky dice que “miles” han pedido TranscribeGlass.

Sin embargo, estas ventas representan un importante paso adelante para la tecnología, afirma Starner, que ha formado parte de este campo desde sus inicios. Starner, un aficionado a la informática portátil, ha estado usando algún tipo de pantalla montada en la cabeza casi todos los días durante 30 años. “Antes, para tener una pantalla en la cabeza que tuviera algún tipo de duración de batería, terminabas llevando contigo alrededor de siete libras de peso de plomo”, dice Starner, quien solía llevar una batería en un bolso al hombro. . “Literalmente, mi primera batería fue una batería de motocicleta”.

Starner ha visto muchos fracasos tecnológicos durante las últimas tres décadas. Pero ahora cree que la cosecha actual es prometedora y que las gafas con subtítulos en vivo pronto serán una tecnología doméstica normalizada debido a más baterías portátiles y actualizaciones de reconocimiento de voz. Para que esto suceda, las actitudes de la sociedad hacia las gafas deben seguir cambiando. Los dispositivos deben pasar a ser anodinos, afirma. “Supongamos que me acerco a alguien en el aeropuerto y le pregunto: ‘¿Puedo obtener indicaciones para llegar al baño?’ Y la persona dice: ‘Oh, ¿es esa la nueva pantalla frontal de Apple?’ Lo que realmente quieres hacer es llegar al baño. Quieres que la conversación sea sobre la conversación, no sobre la tecnología”, dice Starner.

Una herramienta importante pero imperfecta

Si bien las gafas de subtítulos en vivo podrían ser una herramienta increíblemente poderosa para millones de personas, no son una solución completa. Para muchas personas con pérdida auditiva, entender a un amigo oyente en un restaurante lleno de gente es una pesadilla. De manera similar, el software de subtítulos en vivo tiene dificultades para capturar conversaciones precisas en estos espacios. El ruido de fondo sigue siendo un tema espinoso que estas gafas aún no resuelven del todo.

Muchas personas sordas o con problemas de audición están entusiasmadas con esta tecnología, pero algunas la ven como una amenaza para las solicitudes de intérpretes de lengua de signos. Los subtítulos no muestran la identidad, las emociones o las inflexiones del hablante; los intérpretes pueden transmitir todo ese contexto.

Estas gafas también imponen la carga de la comunicación a las personas que las usan: expectativas que las personas sordas están cansadas de tener que cumplir, dice Raja Kushalnagar, profesor y director del programa de Tecnología de la Información de la Universidad Gallaudet. “La persona que escucha podría pensar, ya sabes, ‘¿Qué te pasa? ¿Qué les pasa a las gafas?’”, dice. “Creen que no son las herramientas sino la [Deaf people] ellos mismos son el problema”.

Estas gafas son principalmente una herramienta para interactuar con el público oyente en general; las comunidades sordas que utilizan principalmente el lenguaje de señas no las necesitan. Pero Kushalnagar ya ha visto el impacto de la tecnología en su vida cotidiana cuando conversa con su hijo oyente. “Digamos que ahora estoy cocinando, cortando verduras o algo en la cocina. Podré leer los subtítulos mientras sigo cortando”, afirma. “Nunca antes habría podido tener esa conversación así con mi hijo. Ahora puedo caminar y puedo hablar con mi hijo al mismo tiempo”.

Cuando Shuttleworth tomó un examen hace unos años para convertirse en técnico de TI, lo aprobó con distinción porque le habían proporcionado los recursos necesarios para comprender la información. Shuttleworth ahora usa sus gafas junto con su aplicación móvil en su trabajo. Desea desesperadamente haber tenido acceso a estas herramientas cuando era niño, herramientas que podrían haber cambiado toda la trayectoria de su vida. “Si tuviera esa aplicación móvil y las gafas, no estaría sentado aquí hablando contigo ahora”, dice.

2023-10-10 14:00:00
#Nuevas #gafas #pueden #transcribir #voz #tiempo #real,

Leave a Comment

This site uses Akismet to reduce spam. Learn how your comment data is processed.

This website uses cookies to improve your experience. We'll assume you're ok with this, but you can opt-out if you wish. Accept Read More

Privacy & Cookies Policy