曦望科技获30亿元B轮融资加码推理芯片研发助力国产GPU突破

当前，生成式人工智能的快速发展正推动芯片产业进入新一轮创新周期。鉴于此，推理芯片成为资本与技术投入的热门方向。曦望的融资进展显示出市场对推理芯片细分赛道的持续看好，也折射出国内芯片产业在应用端优化上的新尝试。从融资规模看，曦望在一年内完成近30亿元融资，投资方覆盖面广。除三一集团华胥基金、范式智能等产业投资方外，还引入IDG资本、高榕创投等知名机构，并获得诚通混改基金、杭州金投等国资背景资本支持。多元化的投资结构表明，其发展方向获得产业链上下游与资本市场的共同认可。曦望成立于2020年——前身为商汤科技大芯片部门——2024年底正式分拆并独立运营。公司聚焦高性能GPU及多模态场景推理芯片的研发与商业化。目前员工超过200人，技术与研发人员占比超过80%，部分来自AMD、百度、华为海思等企业。核心技术团队平均拥有15年行业经验，硕士及以上学历占比超过80%。在领导层上，董事长徐冰曾任商汤科技联合创始人，参与推动商汤累计超66亿美元融资及港交所IPO。联席CEO王勇为集成电路领域技术专家，拥有20余年芯片行业经验，曾任AMD dGPU首席架构师、百度昆仑芯核心架构师。另一位联席CEO王湛曾在百度任职16年，为百度创始团队成员、前资深副总裁。该团队在资本运作、芯片设计与互联网应用等具备复合经验。与英伟达等传统GPU厂商主打“训推一体”不同，曦望选择“纯推理”的技术路线，核心在于聚焦推理成本该产业痛点。当前，大模型推理已成为AI应用的重要成本来源，降低推理成本需求迫切。曦望在调度机制、缓存设计、片上SRAM、芯片互联与编译器等环节围绕推理场景进行原生优化，并结合LPDDR内存技术，推动单位Token推理成本明显下降。从产品矩阵看，曦望已形成三代芯片体系。2020年量产的S1芯片为国内首款视觉推理芯片，可适配千余种计算机视觉模型，已获得索尼、小米等头部客户IP授权。2024年量产的S2芯片对标主流A/H系列GPU，兼容CUDA生态，已适配DeepSeek、Qwen等主流大模型。计划于2026年推出的S3芯片定位“推理性价比之王”，在单位Token成本与能耗上实现数量级下降，原生支持FP8/FP4低精度推理，目标指向“百万Token一分钱”的行业新基准。曦望表示，本轮融资将主要用于下一代推理GPU研发、规模化量产及生态共建，覆盖技术迭代、产能推进与合作拓展等方向。公司过去数年已累计投入20亿元用于芯片研发，为后续持续创新提供支撑。

算力竞争的重点正从“算得更快”转向“算得更划算、更稳定、更可获得”；推理GPU的价值不仅在参数与峰值指标，更在于能否有效重塑产业成本结构。资本、产业与政策力量的汇聚，为国产推理芯片带来窗口期，但最终决定成败的仍是工程能力、生态协作与面向真实场景的持续迭代。只有把“可用、好用、耐用”作为硬标准，算力红利才能更广泛转化为高质量发展的新动能。

曦望科技获30亿元B轮融资 加码推理芯片研发助力国产GPU突破

曦望科技获30亿元B轮融资加码推理芯片研发助力国产GPU突破