上海GAS2026聚焦近耳交互新赛道歌尔发布智能眼镜语音分离技术，完善全栈声学方案

智能终端加速普及、应用场景持续外延的背景下，音频能力正从“听得见”迈向“听得清、听得懂、听得沉浸”。25日至26日举行的GAS2026以“声态+智能化”为主题，集中讨论智能眼镜、开放式耳机等近耳设备的关键技术与产业路径。与会业内人士认为——随着多模态交互需求增长——近耳设备正在成为连接信息服务与现实场景的重要入口，音频体验已从附属功能转变为核心竞争力。问题：近耳设备音频体验短板仍制约规模化应用。当前，智能眼镜在通话、翻译、会议记录、导航提示等典型场景中高度依赖语音输入与输出，但行业长期面临几类共性难题：一是公共环境中人声混叠、背景噪声复杂，导致拾音不稳、语音识别准确率下降；二是轻薄化外形压缩声学腔体空间，造成响度不足、失真与杂音突出；三是缺乏稳定的空间化与环绕感，难以满足沉浸式内容消费与提示音定位需求。这些短板直接影响产品易用性与用户黏性，也抬高了商业化推广成本。原因：形态约束叠加智能化门槛，技术链路需要系统重构。业内分析指出，智能眼镜不同于传统耳机：其拾音点位更靠前、佩戴方式更开放，麦克风阵列布局受镜腿、鼻托等结构限制；同时，设备需要兼顾功耗、重量与散热，算法算力与实时性要求更为苛刻。再加上终端侧智能化能力持续增强，用户对“可对话、可翻译、可理解”的期望上升，语音前端处理、模型适配、声学器件与整机调校必须形成闭环协同，单点优化难以覆盖全场景需求。影响：政策与市场共振，推动音频从硬件竞争转向系统能力竞争。我国对应的政策已明确提出深化拓展“智能化应用”，并推动新一代智能终端加快普及。产业端则呈现两大趋势：一上，智能能力向终端侧下沉，语音交互更强调本地或弱网环境下的稳定性与隐私安全；另一上，消费端对“通话清晰、交互高效、空间沉浸”的综合体验提出更高标准。由此，近耳声学不再只是扬声器与麦克风的参数比拼，而是围绕“语音采集增强+播放渲染增强+工具链效率”的全链路能力较量。对策：以系统方案回应行业痛点，打通语音与音效全链路。歌尔股份在大会期间展示了面向智能眼镜的全栈声学解决方案，并首次发布自研智能眼镜双路语音分离算法。该算法强调对佩戴者与对讲人双向语音的实时分离，面向嘈杂环境下的对话、翻译等应用，适配多种麦克风阵列组合，并结合深度神经网络降噪技术，提升目标人声锁定与拾取稳定性。另外，方案集成通话降噪、骨传导鼻托模组、立体声录音以及全向/近端/远端拾音等配置，意在实现多场景语音交互一致性，降低“场景切换即体验波动”的行业顽疾。在音效侧，针对轻薄智能眼镜受限于体积与结构导致的声学表现不足，歌尔定制开发高性能扬声器，并融合低音增强、动态杂音抑制、失真消除、立体声空间化等自研算法，提升低频听感、控制杂音与失真，强化空间环绕效果，补齐轻薄形态下响度与沉浸感的短板。业内人士指出，在开放式佩戴与小型化器件条件下实现稳定的音效一致性，对算法、器件与调音的协同提出更高要求，系统方案将更具落地价值。此外，面向产业协同与效率提升，歌尔在现场展示覆盖算法设计、仿真调试到量产的一站式音频工具链，目标是缩短应用开发与工程验证周期，提升跨团队、跨环节协作效率。随着智能眼镜进入多品牌、多形态并行阶段，工具链与工程化能力将成为供应链竞争的重要一环，有助于降低创新试错成本，加快产品迭代。前景：近耳交互有望成为新一代终端入口，产业将走向“标准化+差异化”并进。展望未来，智能眼镜、开放式耳机等产品形态仍将持续演进，语音分离、降噪与空间化音效等关键能力将向更低功耗、更强实时性、更高鲁棒性方向发展，并与视觉、定位、手势等多模态能力深度融合。与此同时，行业或将加快形成面向特定场景的性能评测与调校方法，推动关键技术从“可用”走向“好用、耐用、易量产”。在此过程中，具备全链路整合能力与规模化制造经验的企业，将更可能在全球竞争中占据主动。

歌尔股份在GAS2026的展示，标志着智能眼镜音频技术进入新阶段；随着AI与终端设备的深度结合，近耳音频技术将持续提升人机交互体验，推动行业发展，助力中国企业在全球产业链中提升竞争力。

上海GAS2026聚焦近耳交互新赛道 歌尔发布智能眼镜语音分离技术，完善全栈声学方案

上海GAS2026聚焦近耳交互新赛道歌尔发布智能眼镜语音分离技术，完善全栈声学方案