《21世纪经济报道》记者 赵娜
GPU芯片领域再现大规模融资。
1月22日,GPU芯片公司曦望(Sunrise)宣布已在一年内完成近30亿元人民币融资,投资方包括三一集团旗下华胥基金、范式智能、杭州数据集团、正大机器人、协鑫科技等产业投资方,以及IDG资本、高榕创投、无极资本、中金资本、普华资本、松禾资本、易方达资本、工银投资、心资本等知名VC/PE机构,同时亦有诚通混改基金等国资背景资本参与。
曦望是国内首家专注于推理领域的All-in公司。公司成立于2020年,前身为商汤科技芯片部门,致力于高性能GPU及多模态推理芯片的研发与商业化。本轮融资所得将用于下一代推理GPU研发、规模化量产及生态共建。
资料显示,联席首席执行官王勇是前AMD、昆仑芯核心架构师,加入商汤后,带领百人团队成功主导了曦望两代芯片的研发和量产;另一位联席首席执行官王湛则是百度创始团队成员、原集集团副总裁,加入曦望后主要负责公司产品化与商业化。
目前,曦望团队规模约300人,骨干多来自英伟达、AMD、昆仑芯、商汤等行业领先企业。在资本进程方面,团队在今年7月曾披露规模近10亿元的融资,投资方包括三一集团旗下华胥基金、第四范式、游族网络、北京利尔、松禾资本、海通开元等。
在技术路线选择上,曦望并未参与训练推理一体化GPU的参数竞赛,而是明确聚焦于推理场景,对GPU架构进行原生重构,在调度、缓存、片上SRAM、互连及编译器路径上进行针对性优化,旨在降低单位Token的推理成本。
据介绍,曦望选择深耕推理芯片赛道,其核心是基于训练与推理场景的本质差异进行精准布局:训练芯片侧重极致算力与高比特精度,以支撑模型参数迭代优化;而推理作为人工智能落地的“最后一公里”,更需适配多场景、支持低能耗、高并发与低延迟需求。不仅如此,曦望的推理专用GPU兼具通用性与极致性价比,能够为大模型提供更低成本、更低功耗、更高稳定性的推理服务。
在产品进展上,公司目前已形成完整的推理GPU产品矩阵。其中,S1云边视觉推理芯片已实现量产并出货超2万片;S2大模型推理通用GPU也已量产,可完全兼容CUDA生态,性能对标英伟达A100。公司正在研发的新一代产品S3,聚焦多模态大模型推理,计划于2026年量产,目标是将推理计算成本降至原有的十分之一。
王湛表示:“如果能让推理成本下降90%,并提供更稳定的服务,我们的竞争就不再是‘又一个芯片’,而是‘重新定义中国AI产业的损益表’。团队的目标是极致降低大模型推理成本与门槛,让算力变得普惠且可广泛获取,从而释放AGI的全部潜力。”
