Saltar al contenido
VI 2
Future-shaping projects

Detectando el error de la IA

Identificación de insectos mediante análisis de audio impulsado por IA

Los ganadores del Global Data Science Challenge 2023 comparten sus experiencias en la competencia, que implicó el desarrollo de un modelo impulsado por inteligencia artificial para identificar sonidos de insectos.

Estás parado en medio de un bosque. Cierra los ojos: ¿qué oyes? Hojas susurrando con el viento, cantos de pájaros… el chirrido de diminutas alas vibrando a velocidades imposibles. Podría ser el latido del corazón de la naturaleza.

Estos diminutos músicos (insectos) podrían ser la clave para proteger nuestros espacios salvajes, dice Lucas Unterberger, ingeniero de datos del equipo Insights & Data de Capgemini en Austria.

“Los científicos han encontrado un vínculo entre la variedad de insectos presentes en un lugar determinado y el nivel general de biodiversidad de ese espacio”, explica. “Sin embargo, simplemente no hay suficientes entomólogos capacitados para clasificar insectos in situ a gran escala”.

¿Se podrían aprovechar la inteligencia artificial y el aprendizaje automático para identificar de forma fiable especies de insectos únicamente a través de sus chirridos?

El “rumor de la biodiversidad”

Esta fue la pregunta central del Global Data Science Challenge (GDSC) de Capgemini para 2023, que se lanzó en asociación con investigadores del Centro de Biodiversidad Naturalis en Leiden, Países Bajos.  

Dominik Lemm, científico de datos también radicado en Austria y parte del equipo ganador, describe la tarea específica: “Se pidió a los equipos competidores que diseñaran un modelo que pudiera clasificar con precisión las grabaciones de audio de los ‘chirridos’ de cigarras y saltamontes en uno de 66 subespecie. El equipo con la tasa de identificación más alta sería el ganador”.

Según Dominik, este es sólo un pequeño paso hacia un objetivo más amplio: ayudar a los investigadores de Naturalis a desarrollar un sistema económicamente viable para identificar diferentes tipos de insectos mediante el análisis de archivos de audio grabados por micrófonos colocados en ambientes exteriores.

“Si los científicos pueden identificar especies de insectos rápidamente utilizando IA, podrán monitorear la calificación de biodiversidad de un área, dando un impulso a los esfuerzos de conservación global”, explica.

¡Científicos de datos, reúnanse!

Una vez más, el GDSC recibió un gran interés por parte de colegas de Capgemini de todo el mundo. Lucas, que ya había participado anteriormente, dice que el número de participantes se disparó de unos pocos cientos a más de mil. “Con tanta competencia internacional, es increíblemente difícil ganar. Pero es la oportunidad perfecta para aprender nuevas habilidades y tecnologías”, afirma.

Cuando se anunció el evento de este año, rápidamente reunió un “equipo de ensueño”, que, además de Dominik, incluía a Raffaela Heily, matemática y científica de datos, y Lukas Kemetinger, quien participó como estudiante consultor con un enfoque en IA.

Dominik, con experiencia en investigación de aprendizaje automático, fue contratado casi tan pronto como se unió a la empresa. “Quizás fue mi primer día cuando Lucas me preguntó si sabía algo sobre el aprendizaje automático de audio. Me fascinó el desafío y tenía muchas ganas de sumergirme directamente en el tema”.

Con Lucas actuando como director de proyecto (una experiencia nueva para él), el equipo rápidamente dividió las responsabilidades entre ellos, centrándose en sus especialidades, y programó reuniones semanales para discutir ideas y avances.

Una fórmula ganadora

“El equipo de Naturalis nos preparó el conjunto de datos”, afirma Dominik. “Pero dependía de nosotros encontrar la mejor manera de procesarlo. Según las reglas, pudimos recurrir a recursos de Amazon Web Services (AWS), por un valor de hasta 100 dólares por semana, para perfeccionar nuestros modelos”.

La estrategia del equipo de crear un prototipo lo más rápido posible pareció dar sus frutos. “Después de que Lucas mencionó la idea de los sonidos de los insectos, comencé a leer la literatura y a considerar posibles enfoques”, dice. “Después de la segunda o tercera semana, teníamos un modelo que funcionaba bastante bien, lo que nos dejó tiempo para realizar ajustes”.

El hecho de que todos trabajaran en la oficina de Viena también les dio una ventaja. “Nos comunicamos y armonizamos de forma muy eficaz”, confirma Lukas. “Por ejemplo, los viernes por la tarde hablábamos del proyecto mientras tomábamos una cerveza. Tuvimos una gran relación y espíritu de equipo”.

IA positiva

Si bien su solución actualmente se limita a la identificación de cigarras y saltamontes, algún día podría ampliarse para identificar casi cualquier sonido de insecto o animal. “Como parte del premio, estamos planeando un viaje a los Países Bajos para reunirnos con los científicos de Naturalis y discutir cómo llevar nuestro modelo al siguiente nivel”, dice Lucas.

Y este es realmente el objetivo del GDSC: cerrar la brecha entre la investigación científica y la industria, enfocando intensamente a las mentes científicas de datos más brillantes del mundo en un solo problema social o ambiental. “Es una manera maravillosa de acelerar la innovación en el área de la sostenibilidad y una clara demostración de las ventajas que el aprendizaje automático puede aportar a los desafíos de la biodiversidad”, afirma Lucas. “Con tanta incertidumbre en torno a la IA, es fantástico mostrar cómo esta tecnología podría dar forma a un futuro mejor, para las personas y el planeta”.

Historias internas

DATOS E INTELIGENCIA ARTIFICIAL

Activar datos. Aumentar la inteligencia. Amplificar los resultados.