Home » Empresa de Toronto inventa un detector de audio con IA

Empresa de Toronto inventa un detector de audio con IA

by admin
Empresa de Toronto inventa un detector de audio con IA

Los ojos pueden ser las ventanas del alma, pero en Klick Labs todo gira en torno a la voz.

La rama de investigación de la firma de tecnología de ciencias biológicas Klick Health, con sede en Toronto, ha encontrado una manera de analizar las voces de una manera tan granular que puede determinar si se trata de una persona o de una máquina impulsada por inteligencia artificial.

La capacidad surge cuando la cantidad de deepfakes (videos, clips de audio o fotos producidos por IA que parecen reales) se ha disparado con el reciente lanzamiento de varios chatbots de IA. Todos, desde la estrella del pop Taylor Swift hasta el presidente estadounidense Joe Biden y el Papa, han sido víctimas del fenómeno.

Y no se espera que disminuya pronto. La agencia policial de la Unión Europea, Europol, predijo recientemente que hasta el 90 por ciento del contenido en línea podría generarse sintéticamente para 2026 y el Servicio de Inteligencia de Seguridad de Canadá ha calificado la situación como “una amenaza real para el futuro canadiense”.

Pero Yan Fossat, vicepresidente senior de investigación y desarrollo de salud digital de Klick Labs, tiene la esperanza de que su empresa pueda ayudar a hacer que el mundo de la IA sea un poco más seguro.

“Toda tecnología que no está regulada es peligrosa y esto se está moviendo un poco más rápido que muchas cosas”, dijo, mientras se encontraba en el laboratorio de Klick en el centro de Toronto.

Fue en ese espacio, lleno de cables, aparatos electrónicos domésticos e impresoras 3D ruidosas, donde Fossat y un equipo de tres personas comenzaron a pensar en cómo sus películas de ciencia ficción favoritas podrían ayudarlos a abordar los deepfakes.

“En ‘Terminator’, usan perros para oler si las personas parecen humanos y en ‘Blade Runner’ está la máquina Voight-Kampff y siempre quise hacer una máquina Voight-Kampff”, dijo Fossat, haciendo referencia a una Prueba ficticia utilizada en la película para medir respuestas fisiológicas, como el movimiento de los ojos y el tiempo de reacción, para determinar si un personaje era humano o replicante.

Para su propio proyecto, el equipo de Klick reunió a 49 humanos con diversos orígenes y acentos, cuyo audio alimentaron a un generador de deepfake para crear clips sintéticos.

Los clips se analizaron en función de sus biomarcadores vocales: características integradas en las voces que nos dicen algo sobre la salud o la fisiología del hablante.

Por ejemplo, si alguien acaba de subir corriendo un tramo de escaleras, respira más rápido, lo que se puede escuchar en su voz. La voz también puede indicar cuando alguien recién se está despertando o se siente cansado.

Klick Labs ha identificado 12.000 de estos biomarcadores, pero para diferenciar al hombre de la máquina, Jaycee Kaufman, científica principal de Klick, dijo que hasta ahora se basa en cinco: la duración y variación del habla, los índices de micropausas y macropausas y la proporción general de tiempo. gastado hablando versus haciendo pausas.

Las micropausas duran menos de medio segundo y las macropausas duran más que ese tiempo, dijo. A menudo ocurren de forma natural cuando alguien está hablando y simplemente respira o busca palabras.

“Realmente no le prestamos atención, pero está sucediendo”, añadió Fossat.

“Tenemos un cerebro y necesita pensar y tenemos pulmones y necesitamos respirar. Las máquinas no tienen eso, por eso no lo hacen”.

Hasta ahora, el método de Klick Labs para identificar deepfakes tiene una tasa de éxito del 80 por ciento, pero es posible que no dure mucho.

Cada vez es más difícil saber si un clip es deepfake o no porque la IA evoluciona constantemente y “se vuelve cada vez mejor en sonar como voces de humanos”, dijo Fossat.

“Por ejemplo, OpenAI, la compañía que fabrica ChatGPT (chabot de IA generativa), lanzó hace un par de semanas una nueva voz deepfake que es tan buena que respira”, dijo.

“Finge esas microrespiraciones, lo cual es bastante sorprendente”.

Insiste en que el desarrollo no ha inutilizado la investigación de Klick Labs porque hay miles de otros biomarcadores, como la frecuencia cardíaca, que se pueden probar para la detección de deepfake.

Otros dieciséis estudios sobre biomarcadores vocales y enfermedades que está realizando Klick Labs también podrían ayudar en su investigación.

Uno de esos estudios ha utilizado biomarcadores vocales para diagnosticar diabetes con una precisión del 89 por ciento en mujeres y del 86 por ciento en hombres.

Esa investigación pronto continuará con un estudio que Klick llevará a cabo con el Hospital Humber River en Toronto y Fossat dijo que eventualmente podría formar la base de herramientas telefónicas que cualquiera puede usar para descubrir qué riesgo tiene de tener la enfermedad.

Cada avance en la investigación de Klick significa más oportunidades de aprender sobre biomarcadores y aplicarlos nuevamente para la detección de enfermedades y deepfakes, que están resultando difíciles de seguir.

“Se mueve tan rápido cada vez que haces algo, cuando terminas… todo ha cambiado y tenemos que hacerlo de nuevo”, dijo Fossat.

Este informe de The Canadian Press se publicó por primera vez el 26 de mayo de 2024.

2024-05-26 13:17:40
#Empresa #Toronto #inventa #detector #audio #con,

You may also like

Leave a Comment

This site uses Akismet to reduce spam. Learn how your comment data is processed.

This website uses cookies to improve your experience. We'll assume you're ok with this, but you can opt-out if you wish. Accept Read More

Privacy & Cookies Policy