来自IT之家1月27日的报道显示,近日国产GPU厂商曦望科技(Sunrise)正式发布了新一代推理GPU芯片——启望S3。这标志着该公司在成功完成近30亿元战略融资后,首次集中公开亮相其最新成果。

据了解,启望S3是一款面向大模型推理场景的定制化GPGPU芯片。在典型推理任务中,其整体性价比相比上一代产品提升超过10倍。在算力与存储架构方面,该芯片支持从FP16到FP4的精度灵活切换,并采用了LPDDR6显存方案,显存容量较上一代提升了4倍。
在实际应用层面,启望S3在DeepSeek系列大模型的满血版推理场景中表现突出,单位Token的处理成本较上一代降低约90%。
曦望科技同时发布了面向大模型推理的巅峰SC3-256超节点解决方案,可适配千亿乃至万亿参数规模的多模态MoE推理需求。此外,公司还与商汤科技、第四范式等生态伙伴合作,共同发起了一项旨在降低推理成本的联合计划。曦望科技还与浙江大学签署了战略合作协议,联合成立“智能计算联合研发中心”。
曦望科技的前身是商汤科技的大芯片部门,近期宣布已在一年内完成近30亿元战略融资。2025年,该公司芯片交付量已突破万片大关。
