曦望科技获30亿元B轮融资 加码推理芯片研发助力国产GPU突破

当前,生成式人工智能的快速发展正推动芯片产业进入新一轮创新周期。鉴于此,推理芯片成为资本与技术投入的热门方向。曦望的融资进展显示出市场对推理芯片细分赛道的持续看好,也折射出国内芯片产业在应用端优化上的新尝试。 从融资规模看,曦望在一年内完成近30亿元融资,投资方覆盖面广。除三一集团华胥基金、范式智能等产业投资方外,还引入IDG资本、高榕创投等知名机构,并获得诚通混改基金、杭州金投等国资背景资本支持。多元化的投资结构表明,其发展方向获得产业链上下游与资本市场的共同认可。 曦望成立于2020年——前身为商汤科技大芯片部门——2024年底正式分拆并独立运营。公司聚焦高性能GPU及多模态场景推理芯片的研发与商业化。目前员工超过200人,技术与研发人员占比超过80%,部分来自AMD、百度、华为海思等企业。核心技术团队平均拥有15年行业经验,硕士及以上学历占比超过80%。 在领导层上,董事长徐冰曾任商汤科技联合创始人,参与推动商汤累计超66亿美元融资及港交所IPO。联席CEO王勇为集成电路领域技术专家,拥有20余年芯片行业经验,曾任AMD dGPU首席架构师、百度昆仑芯核心架构师。另一位联席CEO王湛曾在百度任职16年,为百度创始团队成员、前资深副总裁。该团队在资本运作、芯片设计与互联网应用等具备复合经验。 与英伟达等传统GPU厂商主打“训推一体”不同,曦望选择“纯推理”的技术路线,核心在于聚焦推理成本该产业痛点。当前,大模型推理已成为AI应用的重要成本来源,降低推理成本需求迫切。曦望在调度机制、缓存设计、片上SRAM、芯片互联与编译器等环节围绕推理场景进行原生优化,并结合LPDDR内存技术,推动单位Token推理成本明显下降。 从产品矩阵看,曦望已形成三代芯片体系。2020年量产的S1芯片为国内首款视觉推理芯片,可适配千余种计算机视觉模型,已获得索尼、小米等头部客户IP授权。2024年量产的S2芯片对标主流A/H系列GPU,兼容CUDA生态,已适配DeepSeek、Qwen等主流大模型。计划于2026年推出的S3芯片定位“推理性价比之王”,在单位Token成本与能耗上实现数量级下降,原生支持FP8/FP4低精度推理,目标指向“百万Token一分钱”的行业新基准。 曦望表示,本轮融资将主要用于下一代推理GPU研发、规模化量产及生态共建,覆盖技术迭代、产能推进与合作拓展等方向。公司过去数年已累计投入20亿元用于芯片研发,为后续持续创新提供支撑。

算力竞争的重点正从“算得更快”转向“算得更划算、更稳定、更可获得”;推理GPU的价值不仅在参数与峰值指标,更在于能否有效重塑产业成本结构。资本、产业与政策力量的汇聚,为国产推理芯片带来窗口期,但最终决定成败的仍是工程能力、生态协作与面向真实场景的持续迭代。只有把“可用、好用、耐用”作为硬标准,算力红利才能更广泛转化为高质量发展的新动能。