上海GAS2026聚焦近耳交互新赛道 歌尔发布智能眼镜语音分离技术,完善全栈声学方案

智能终端加速普及、应用场景持续外延的背景下,音频能力正从“听得见”迈向“听得清、听得懂、听得沉浸”。25日至26日举行的GAS2026以“声态+智能化”为主题,集中讨论智能眼镜、开放式耳机等近耳设备的关键技术与产业路径。与会业内人士认为——随着多模态交互需求增长——近耳设备正在成为连接信息服务与现实场景的重要入口,音频体验已从附属功能转变为核心竞争力。 问题:近耳设备音频体验短板仍制约规模化应用。当前,智能眼镜在通话、翻译、会议记录、导航提示等典型场景中高度依赖语音输入与输出,但行业长期面临几类共性难题:一是公共环境中人声混叠、背景噪声复杂,导致拾音不稳、语音识别准确率下降;二是轻薄化外形压缩声学腔体空间,造成响度不足、失真与杂音突出;三是缺乏稳定的空间化与环绕感,难以满足沉浸式内容消费与提示音定位需求。这些短板直接影响产品易用性与用户黏性,也抬高了商业化推广成本。 原因:形态约束叠加智能化门槛,技术链路需要系统重构。业内分析指出,智能眼镜不同于传统耳机:其拾音点位更靠前、佩戴方式更开放,麦克风阵列布局受镜腿、鼻托等结构限制;同时,设备需要兼顾功耗、重量与散热,算法算力与实时性要求更为苛刻。再加上终端侧智能化能力持续增强,用户对“可对话、可翻译、可理解”的期望上升,语音前端处理、模型适配、声学器件与整机调校必须形成闭环协同,单点优化难以覆盖全场景需求。 影响:政策与市场共振,推动音频从硬件竞争转向系统能力竞争。我国对应的政策已明确提出深化拓展“智能化应用”,并推动新一代智能终端加快普及。产业端则呈现两大趋势:一上,智能能力向终端侧下沉,语音交互更强调本地或弱网环境下的稳定性与隐私安全;另一上,消费端对“通话清晰、交互高效、空间沉浸”的综合体验提出更高标准。由此,近耳声学不再只是扬声器与麦克风的参数比拼,而是围绕“语音采集增强+播放渲染增强+工具链效率”的全链路能力较量。 对策:以系统方案回应行业痛点,打通语音与音效全链路。歌尔股份在大会期间展示了面向智能眼镜的全栈声学解决方案,并首次发布自研智能眼镜双路语音分离算法。该算法强调对佩戴者与对讲人双向语音的实时分离,面向嘈杂环境下的对话、翻译等应用,适配多种麦克风阵列组合,并结合深度神经网络降噪技术,提升目标人声锁定与拾取稳定性。另外,方案集成通话降噪、骨传导鼻托模组、立体声录音以及全向/近端/远端拾音等配置,意在实现多场景语音交互一致性,降低“场景切换即体验波动”的行业顽疾。 在音效侧,针对轻薄智能眼镜受限于体积与结构导致的声学表现不足,歌尔定制开发高性能扬声器,并融合低音增强、动态杂音抑制、失真消除、立体声空间化等自研算法,提升低频听感、控制杂音与失真,强化空间环绕效果,补齐轻薄形态下响度与沉浸感的短板。业内人士指出,在开放式佩戴与小型化器件条件下实现稳定的音效一致性,对算法、器件与调音的协同提出更高要求,系统方案将更具落地价值。 此外,面向产业协同与效率提升,歌尔在现场展示覆盖算法设计、仿真调试到量产的一站式音频工具链,目标是缩短应用开发与工程验证周期,提升跨团队、跨环节协作效率。随着智能眼镜进入多品牌、多形态并行阶段,工具链与工程化能力将成为供应链竞争的重要一环,有助于降低创新试错成本,加快产品迭代。 前景:近耳交互有望成为新一代终端入口,产业将走向“标准化+差异化”并进。展望未来,智能眼镜、开放式耳机等产品形态仍将持续演进,语音分离、降噪与空间化音效等关键能力将向更低功耗、更强实时性、更高鲁棒性方向发展,并与视觉、定位、手势等多模态能力深度融合。与此同时,行业或将加快形成面向特定场景的性能评测与调校方法,推动关键技术从“可用”走向“好用、耐用、易量产”。在此过程中,具备全链路整合能力与规模化制造经验的企业,将更可能在全球竞争中占据主动。

歌尔股份在GAS2026的展示,标志着智能眼镜音频技术进入新阶段;随着AI与终端设备的深度结合,近耳音频技术将持续提升人机交互体验,推动行业发展,助力中国企业在全球产业链中提升竞争力。