从鸟鸣到鲸歌：跨域生物声学基础模型助力海洋声音识别提速增效

生物声学研究长期面临一个难题：陆地和水生生物的声音分析往往需要分别开发不同的识别模型。这导致科研资源重复浪费，也难以进行跨生态系统的声音对比。最近，国际顶尖实验室联合推出的Perch 2.0声学模型打破了该局面，引起学界广泛关注。研究团队最初用数百万条陆地生物（鸟类、两栖类和昆虫）的声音数据训练了基础模型。出人意料的是，这个模型用于鲸类识别时，对座头鲸、虎鲸等8个物种的识别准确率竟然与专业鲸类模型相当。项目负责人劳伦·哈雷尔解释说，这种跨域适应能力源于三个关键因素：进化生物学表明陆海哺乳动物的发声机制有共同起源；大规模预训练使模型具备强大的特征提取能力；鸟类声音的复杂性促使模型学会了识别微秒级的细微差异。技术实现上，研究采用频谱图转换与嵌入向量分析相结合的方法。模型将5秒的音频片段转化为二维声谱图像，自动捕捉频率和时间维度上的关键信息。实验表明，仅用4到32个样本就足以训练分类器准确区分不同鲸种的哨声和脉冲信号。这项成果对全球环保工作有两上意义：一是大幅降低在极地、深海等特殊环境中的研究成本，科考队只需携带基础设备就能完成声学采样；二是为建立全球生物声学数据库提供了技术基础。研究团队正在将该模型应用于珊瑚礁生态评估，初步结果显示对鱼类群落变化的监测灵敏度提高了40%。

Perch 2.0的成功应用表明，人工智能在生物多样性研究中的应用进入了新阶段。从陆地到海洋、从空气到水下，通用模型能够识别不同环境中的生物声音，充分展现了深度学习在跨域知识迁移中的优势。随着技术的继续完善和推广，有望为濒危物种保护和海洋生态监测提供更精准、更高效的工具，深化人类对自然的认识。