Als hoofd van de divisie smartphone, tablet en connected watch bij JVTECH vind ik het leuk om nieuwe functies te ontdekken die min of meer nuttig zijn en erover te schrijven.
Al bijna 40 jaar werkt een groep onderzoekers aan het slechten van de barrières tussen de taal van mensen en die van… zeedieren. In het geval van dolfijnen is dit nu mogelijk dankzij de AI van Google.
Wordt de taal van dolfijnen binnenkort vertaald?
Wetenschappers en zeebiologen dromen er al lang van om de geheimen van de taal van dolfijnen te ontrafelen. Deze zeezoogdieren, die bekend staan om hun uitzonderlijke intelligentie en uitgebreide sociale interacties, fascineren ons allemaal. Ze zenden een verscheidenheid aan complexe geluiden uit, waaronder fluitjes en klikken, die worden gebruikt voor echolocatie en communicatie binnen hun groep.
Het Wild Dolphin Project (WDP) probeert dolfijnen al sinds 1985 te begrijpen. Onder leiding van zeebiologe Denise Herzing is het WDP uitgegroeid tot het langst lopende onderwateronderzoeksproject ooit, waarbij bijna veertig jaar werd besteed aan het observeren van Atlantische gevlekte dolfijnen in het heldere water van de Bahama’s. Met behulp van een niet-intrusieve methode – “in hun wereld, op hun voorwaarden” – hebben de onderzoekers geleidelijk een unieke database opgebouwd, waarin geluidsopnamen, video’s en gedragsnotities worden gecombineerd.
De wetenschappers koppelen deze opnames vervolgens aan specifiek gedrag. Onder de geanalyseerde geluiden waren de “kenmerkende fluitjes” die dolfijnen gebruiken als eigennamen; hoogfrequente klikken, typisch voor echolocatie; en uitbarstingen van impulsen die vaak worden uitgezonden in de context van agressie of spel. Deze elementen leken een vorm van taal te structureren, maar hun complexiteit ontging elke poging tot coherente vertaling.
Kunstmatige intelligentie heeft nu een echt keerpunt in deze studies gemarkeerd. In samenwerking met Google zijn onderzoekers erin geslaagd om een taalmodel te ontwikkelen dat niet alleen dolfijnentaal kan vertalen, maar er ook mee kan communiceren: Dolphin Gemma.
DolphinGemma, de algoritmische stem van dolfijnen
In samenwerking met Georgia Tech en het Wild Dolphin Project heeft Mountain View DolphinGemma onthuld, een kunstmatig intelligentie model geïnspireerd op de grote taalmodellen zoals Gemini. In het kort past DolphinGemma dezelfde principes die onze tekstchatbots besturen toe op de akoestische wereld van dolfijnen. Het doel is om de geluidsequenties van deze zoogdieren te identificeren, structureren en voorspellen met de finesse van een virtuele tolk.
Het model, met zijn 400 miljoen parameters, wordt getraind met behulp van de enorme archieven van WDP. Het gebruikt SoundStream, een Google-technologie die geoptimaliseerd is voor het coderen van complexe audiosignalen, om de vocalisaties van de dolfijnen om te zetten in interpreteerbare eenheden. Deze eenheden worden dan verwerkt zoals een zin in een menselijke taal: het model analyseert de opeenvolging en voorspelt wat er daarna komt. Een klik, een fluit, een vlaag? Net als een taalmodel anticipeert DolphinGemma op geluiden, gebaseerd op hun akoestische en gedragsmatige context.
De eerste versie van dit systeem wordt momenteel ingezet in het veld, direct ingebouwd in de Pixel smartphones die door de onderzoekers worden gebruikt. Het nieuwste model, de Pixel 9, kan tegelijkertijd geluid opnemen, in realtime analyseren, synthetiseren en met spraak interageren, allemaal onder water dankzij een beengeleidingssysteem.
Maar het doel is niet alleen om te decoderen. Het idee is ook om een gemeenschappelijke grammatica te creëren, een gedeelde taal tussen mensen en dolfijnen. Dankzij het CHAT-systeem worden synthetische fluitjes geassocieerd met objecten die de dolfijnen waarderen – zeewier, sjaals of zelfs ballen. Als een dolfijn een overeenkomstig fluitje uitzendt, informeert het systeem de onderzoeker in realtime via auditieve feedback. In ruil daarvoor wordt het object aan de dolfijn gepresenteerd. Zo ontstaat een lus die de basis legt voor een echt interspecifiek lexicon.
DolphinGemma is niet alleen voorbehouden aan dit project. Google is van plan om dit model deze zomer als open source te publiceren, zodat andere onderzoeksteams die gespecialiseerd zijn in andere walvisachtigen, zoals tuimelaars of spindolfijnen, het kunnen aanpassen aan hun eigen akoestische corpus.