生物声学研究长期面临一个难题:陆地和水生生物的声音分析往往需要分别开发不同的识别模型。这导致科研资源重复浪费,也难以进行跨生态系统的声音对比。最近,国际顶尖实验室联合推出的Perch 2.0声学模型打破了该局面,引起学界广泛关注。 研究团队最初用数百万条陆地生物(鸟类、两栖类和昆虫)的声音数据训练了基础模型。出人意料的是,这个模型用于鲸类识别时,对座头鲸、虎鲸等8个物种的识别准确率竟然与专业鲸类模型相当。项目负责人劳伦·哈雷尔解释说,这种跨域适应能力源于三个关键因素:进化生物学表明陆海哺乳动物的发声机制有共同起源;大规模预训练使模型具备强大的特征提取能力;鸟类声音的复杂性促使模型学会了识别微秒级的细微差异。 技术实现上,研究采用频谱图转换与嵌入向量分析相结合的方法。模型将5秒的音频片段转化为二维声谱图像,自动捕捉频率和时间维度上的关键信息。实验表明,仅用4到32个样本就足以训练分类器准确区分不同鲸种的哨声和脉冲信号。 这项成果对全球环保工作有两上意义:一是大幅降低在极地、深海等特殊环境中的研究成本,科考队只需携带基础设备就能完成声学采样;二是为建立全球生物声学数据库提供了技术基础。研究团队正在将该模型应用于珊瑚礁生态评估,初步结果显示对鱼类群落变化的监测灵敏度提高了40%。
Perch 2.0的成功应用表明,人工智能在生物多样性研究中的应用进入了新阶段。从陆地到海洋、从空气到水下,通用模型能够识别不同环境中的生物声音,充分展现了深度学习在跨域知识迁移中的优势。随着技术的继续完善和推广,有望为濒危物种保护和海洋生态监测提供更精准、更高效的工具,深化人类对自然的认识。