Podemos aprender mucho de la naturaleza si la escuchamos más, y los científicos de todo el mundo están tratando de hacer precisamente eso. Desde los picos de las montañas hasta las profundidades del océano, los biólogos están colocando cada vez más grabadoras de audio para escuchar discretamente los gemidos, chillidos, silbidos y cantos de ballenas, elefantes, murciélagos y especialmente pájaros. Este verano, por ejemplo, más de 2.000 oídos electrónicos grabarán el paisaje sonoro de la cordillera de Sierra Nevada de California, generando casi un millón de horas de audio. Para evitar pasar varias vidas humanas decodificándolo, los investigadores confían en la inteligencia artificial.
Tales grabaciones pueden crear instantáneas valiosas de las comunidades animales y ayudar a los conservacionistas a comprender, con vívidos detalles, cómo las políticas y las prácticas de manejo afectan a toda una población. La recopilación de datos sobre la cantidad de especies e individuos en una región es solo el comienzo. El paisaje sonoro de Sierra Nevada contiene información crucial sobre cómo los incendios forestales históricos del año pasado afectaron a las aves que viven en diferentes hábitats y condiciones ecológicas en toda el área. Las grabaciones podrían revelar cómo varias poblaciones de animales resistieron la catástrofe y qué medidas de conservación ayudan a las especies a recuperarse de manera más efectiva.
Tales grabaciones también pueden capturar detalles sobre interacciones entre individuos en grupos más grandes. Por ejemplo, ¿cómo se encuentran los compañeros en medio de una cacofonía de consortes? Los científicos también pueden usar el sonido para rastrear cambios en el tiempo de migración o rangos de población. También están llegando cantidades masivas de datos de audio de investigaciones en otros lugares: se están llevando a cabo proyectos basados en el sonido para contar insectos, estudiar los efectos de la contaminación lumínica y acústica en las comunidades de aves, rastrear especies en peligro de extinción y activar alertas cuando las grabadoras detectan el ruido de la caza furtiva ilegal o actividades de tala.
“Los datos de audio son un verdadero tesoro porque contienen grandes cantidades de información”, dice el ecologista Connor Wood, un investigador postdoctoral de la Universidad de Cornell, que lidera el proyecto Sierra Nevada. “Solo tenemos que pensar de forma creativa sobre cómo compartir y acceder [that information]. ” Este es un problema inminente porque a los humanos les lleva mucho tiempo extraer información útil de las grabaciones. Afortunadamente, la última generación de sistemas de inteligencia artificial de aprendizaje automático, que pueden identificar especies animales a partir de sus llamadas, puede procesar miles de horas de datos en menos de un día.
“El aprendizaje automático ha sido un gran cambio para nosotros”, dice Laurel Symes, directora asistente del Centro de Bioacústica de Conservación del Laboratorio de Ornitología de Cornell. Ella estudia la comunicación acústica en animales, incluidos grillos, ranas, murciélagos y pájaros, y ha acumulado durante muchos meses grabaciones de saltamontes (saltamontes de cuernos largos que son famosos por su voz y que son una parte esencial de la red alimentaria) en las selvas tropicales del centro de Panamá. Los patrones de la actividad reproductiva y la variación estacional de la población están ocultos en este audio, pero analizarlo lleva mucho tiempo: a Symes y tres de sus colegas les llevó 600 horas de trabajo clasificar varias especies de saltamontes a partir de solo 10 horas de sonido grabadas. Pero un algoritmo de aprendizaje automático que está desarrollando su equipo, llamado KatydID, realizó la misma tarea mientras sus creadores humanos “salían a tomar una cerveza”, dice Symes.
Las configuraciones de aprendizaje automático como KatydID son sistemas de autoaprendizaje que utilizan una red neuronal: “una aproximación muy, muy aproximada del cerebro humano”, explica Stefan Kahl, experto en aprendizaje automático del Centro de Bioacústica de Conservación de Cornell y la Universidad Tecnológica de Chemnitz. en Alemania. Creó BirdNET, uno de los sistemas de reconocimiento de sonido de aves más populares que se utilizan en la actualidad. El equipo de Wood se basará en BirdNET para analizar las grabaciones de Sierra Nevada, y otros investigadores lo están utilizando para documentar los efectos de la contaminación lumínica y acústica en el coro del amanecer en el Parque Natural Regional de Brière en Francia.
Dichos sistemas comienzan analizando muchas entradas, por ejemplo, cientos de llamadas de aves registradas, cada una “etiquetada” con su especie correspondiente. La red neuronal luego se enseña a sí misma qué características se pueden usar para asociar una entrada (en este caso, la llamada de un pájaro) con una etiqueta (la identidad del pájaro). Con millones de características extremadamente sutiles a menudo involucradas, los humanos ni siquiera pueden saber cuáles son la mayoría de ellas.
Las versiones anteriores del software de detección eran semiautomáticas. Escanearon espectrogramas (representaciones visuales de una señal de audio) en busca de características establecidas, como el rango de frecuencia y la duración, para identificar un pájaro por su canto. Esto funciona bien para algunas especies. La canción del cardenal del norte, por ejemplo, comienza consistentemente con unas pocas notas largas que aumentan de tono, seguidas de notas breves y rápidas con una clara caída en el tono. Se puede identificar fácilmente a partir de un espectrograma, al igual que una canción compuesta se puede reconocer a partir de una partitura. Pero otras llamadas de aves son más complejas y variadas y pueden confundir a los sistemas más antiguos. “Se necesitan mucho más que firmas para identificar la especie”, dice Kahl. Muchas aves tienen más de un canto y, al igual que otros animales, a menudo tienen “dialectos” regionales. Un gorrión de corona blanca del estado de Washington suena muy diferente a sus primos californianos. Los sistemas de aprendizaje automático pueden reconocer esos matices. “Digamos que hay una canción de los Beatles aún inédita que se publica hoy. Nunca antes has escuchado la melodía o la letra, pero sabes que es una canción de los Beatles porque así es como suenan ”, explica Kahl. “Eso es lo que estos programas también aprenden a hacer”.
Estos sistemas, de hecho, se han beneficiado de los avances recientes en la tecnología de reconocimiento de voz y música humana. En colaboración con Andrew Farnsworth del Laboratorio de Ornitología de Cornell, los expertos del Laboratorio de Investigación de Música y Audio de la Universidad de Nueva York aprovecharon su experiencia musical para construir un sistema de identificación de llamadas de aves llamado BirdVox. Detecta e identifica aves que migran por la noche y distingue el canto de los pájaros de los ruidos de fondo, incluidos los cantos de ranas e insectos, el transporte terrestre y aéreo humano y fuentes como el viento y la lluvia, todos los cuales pueden ser sorprendentemente fuertes y variables.
Lo bien que aprende cada sistema depende en gran medida de la cantidad de grabaciones preetiquetadas disponibles. Ya existe una gran cantidad de estos datos para las aves comunes. Kahl estima que alrededor de 4,2 millones de grabaciones están disponibles en línea para 10,000 especies. Pero la mayoría de las más de 3.000 especies que BirdNET puede identificar se encuentran en Europa y América del Norte, y BirdVox reduce aún más su enfoque a los cantos de las aves estadounidenses.
“En otros lugares, para las especies más raras o las que no tienen datos bien clasificados, [BirdNET] no funciona tan bien ”, dice el ecologista con sede en India VV Robin. Está siguiendo el rastro del corcel de Jerdon, un ave nocturna en peligro crítico que no ha sido avistada oficialmente durante una década. Robin y sus colaboradores han colocado grabadoras en un santuario de vida silvestre del sur de la India para intentar capturar su llamada. También ha estado registrando aves en las colinas de Western Ghats, un punto de acceso de biodiversidad global también en el sur de la India, desde 2009. Estas grabaciones se anotan minuciosamente para entrenar algoritmos de aprendizaje automático desarrollados localmente.
Los científicos ciudadanos también pueden ayudar a llenar los vacíos en el depósito del canto de los pájaros. BirdNET impulsa una aplicación para teléfonos inteligentes que ha sido un gran éxito entre los observadores de aves aficionados. Graban fragmentos de audio y los envían a la aplicación, que les dice la especie del cantante y agrega la grabación a la base de datos de los investigadores. Más de 300.000 grabaciones han estado llegando diariamente, dice Kahl.
Estos algoritmos de aprendizaje automático aún tienen margen de mejora. Aunque analizan el audio mucho más rápido que los humanos, todavía se quedan atrás en la selección de sonidos superpuestos para localizar una señal de interés. Algunos investigadores ven esto como el próximo problema que debe abordar la IA. Sin embargo, incluso las versiones imperfectas actuales permiten proyectos de gran alcance que requerirían demasiado tiempo para que los humanos los abordaran solos. “Como ecologistas”, dice Wood, “herramientas como BirdNET nos permiten soñar en grande”.