DolphinGemma, un innovador modelo de lenguaje desarrollado por Google, está revolucionando la forma en que los científicos abordan el estudio de la comunicación de los delfines. Desde hace décadas, entender los clicks y silbidos de estos inteligentes mamíferos ha sido un desafío en la ciencia. ¿Te imaginas poder no solo escuchar a los delfines, sino también comprender sus conversaciones?
En el Día Nacional del Delfín, Google, en colaboración con investigadores de Georgia Tech y el Wild Dolphin Project (WDP), ha dado un gran paso en la búsqueda de la comunicación interspecies. DolphinGemma es un modelo AI que se entrena para aprender la estructura de las vocalizaciones de los delfines, generando secuencias sonoras que imitan sus estilos de comunicación.
Investigando la sociedad de los delfines durante décadas
Para entender a cualquier especie, se necesita un contexto profundo, y el WDP ha proporcionado eso desde 1985. Este proyecto de investigación subacuática ha estado estudiando a los delfines manchados del Atlántico en las Bahamas, creando un extenso conjunto de datos que incluye videos y audios de su comportamiento.
El enfoque del WDP es observar y analizar la comunicación natural de los delfines. Al estar en su entorno, los investigadores pueden vincular sonidos específicos con comportamientos observados, buscando patrones que podrían indicar un lenguaje. Este análisis a largo plazo es la base de su investigación y proporciona el contexto necesario para cualquier análisis realizado por la IA.
Presentando DolphinGemma
El análisis de la comunicación compleja de los delfines es un desafío monumental, y el vasto conjunto de datos etiquetados del WDP ofrece una oportunidad única para utilizar IA de vanguardia. DolphinGemma utiliza tecnologías de audio de Google para representar eficientemente los sonidos de los delfines, procesando estos datos a través de un modelo diseñado para secuencias complejas. Con aproximadamente 400 millones de parámetros, este modelo está optimizado para funcionar en los teléfonos Pixel que se utilizan en el campo.
Este modelo se basa en los conocimientos de Gemma, una colección de modelos abiertos de última generación de Google. Entrenado extensamente con la base de datos acústica del WDP, DolphinGemma funciona como un modelo de entrada-salida de audio, procesando secuencias de sonidos naturales de delfines para identificar patrones y prever los sonidos que probablemente seguirán en una secuencia.
Usando teléfonos Pixel para analizar sonidos de delfines
Además de analizar la comunicación natural, el WDP está explorando una interacción bidireccional usando tecnología en el océano. Esto ha llevado al desarrollo del sistema CHAT (Cetacean Hearing Augmentation Telemetry), que busca establecer un vocabulario compartido más simple entre los investigadores y los delfines.
El sistema CHAT asocia silbidos sintéticos con objetos que los delfines disfrutan. Mediante esta técnica, los investigadores esperan que los delfines aprendan a imitar estos silbidos para solicitar objetos. A medida que se comprenden más sonidos naturales, estos también se integrarán en el sistema.
Compartiendo DolphinGemma con la comunidad investigadora
Reconociendo el valor de la colaboración en el descubrimiento científico, se planea compartir DolphinGemma como un modelo abierto este verano. Aunque se ha entrenado con sonidos de delfines manchados del Atlántico, se anticipa su utilidad para investigadores que estudian otras especies de cetáceos. Esta apertura permitirá la adaptación y mejora del modelo para diferentes vocalizaciones.
La combinación de investigación de campo del WDP, la experiencia de ingeniería de Georgia Tech y el poder de la tecnología de Google está abriendo nuevas y emocionantes posibilidades. Nos encontramos en la cúspide de no solo escuchar a los delfines, sino de comenzar a entender los patrones dentro de sus sonidos, acercándonos un poco más a la comunicación entre humanos y delfines.