
Google dévoile DolphinGemma, une IA conçue pour décrypter et reproduire les sons des dauphins, ouvrant la voie à une future communication homme-cétacé.
L’intelligence artificielle se met désormais au service de l’étude des communications marines grâce à DolphinGemma, le nouvel outil développé par Google en collaboration avec Georgia Tech et le Wild Dolphin Project. Ce modèle, issu de la gamme Gemma, est spécialement entraîné sur des vocalisations de dauphins tachetés de l’Atlantique, depuis une collecte de données qui remonte à 1985. L’objectif est d’analyser, de décoder et même de reproduire de manière synthétique les divers signaux sonores utilisés par ces mammifères marins, ouvrant ainsi la voie à une compréhension plus fine de leur langage complexe.
Depuis toujours reconnus pour leur intelligence et leur système de communication sophistiqué, les dauphins utilisent différents types de signaux – des sifflements signatures pour se reconnaître, des cris pulsés lors des affrontements et des cliquetis précis en contexte de parade amoureuse ou de chasse. Contrairement aux modèles traditionnels basés sur le texte, DolphinGemma se concentre uniquement sur l’aspect sonore. Il utilise le tokenizer SoundStream qui transforme les sons en représentations exploitables par l’IA, permettant ainsi de prédire la suite d’une séquence vocale de manière similaire à l’autocomplétion utilisée dans les systèmes de langage humain. Ce modèle unique offre également l’avantage d’être suffisamment léger pour fonctionner sur des smartphones, facilitant ainsi son utilisation en plein environnement marin.
Une véritable avancée dans la communication animale
L’intégration de DolphinGemma dans des dispositifs mobiles tels que le Pixel 9 révolutionne les méthodes de recherche en permettant l’analyse en temps réel des vocalisations sous-marines. Le système dénommé CHAT, ou Cetacean Hearing Augmentation Telemetry, illustre parfaitement cette innovation. En adoptant cette technologie, les chercheurs pourront détecter et interagir rapidement avec les sons émis par les dauphins, tout en envoyant des réponses sonores calibrées. Ce procédé ouvre la perspective d’un « vocabulaire partagé » entre les humains et les dauphins, dans le but de faciliter la communication et, potentiellement, d’initier de nouvelles méthodes d’interaction entre les deux espèces.
L’approche open source de DolphinGemma pourrait également permettre d’étendre cette technologie à d’autres espèces de dauphins, tels que le tursiops ou encore le dauphin à long bec. En automatisant l’analyse de milliers d’heures d’enregistrements, cette innovation pourrait faire gagner plusieurs années de recherche aux scientifiques, tout en minimisant les coûts et la complexité logistique.
Partagez cet article