原文链接:
Google’s new AI model could someday let you understand and talk to dolphins
by:
Eric Hal Schwartz
AI助力人类与海豚跨物种交流:DolphinGemma项目突破
Google’s new AI model could someday let you understand and talk to dolphins
by:
Eric Hal Schwartz
1. 历史性突破
人类与海豚的交流长期处于单向状态,如今Google联合佐治亚理工学院和野生海豚项目(WDP)开发出AI模型DolphinGemma,首次实现海豚声音的识别与生成。
2. 数据基础
基于WDP自1985年以来收集的野生大西洋斑点海豚音频/视频数据,该模型采用Google开源的Gemma架构,通过SoundStream音频标记器实现海豚声音的预测(类似”海豚版自动补全”)。
3. 实时应用
轻量化模型可在Google Pixel手机运行,今夏已投入实地测试,通过防水设备实时识别声纹模式并标记关键序列。
4. 双向通信系统
CHAT系统创造性地建立人豚”共享语言”:为海豚喜爱的物体(如海草、丝巾)分配人工哨音,观察海豚是否模仿这些声音提出需求。
5. 未来计划
Google计划年内开源模型,虽暂不能实现复杂对话,但能高效分析多年音频数据。模型经调整后或可应用于其他海洋物种。
6. 跨物种交流延伸
类似技术已用于解码猪的情绪发声,但海豚因其高智商和社交性成为更受关注的交流对象,未来或实现航海时的简单”问路”。