今天AI圈又一个重磅消息:墨芯人工智能刚刚宣布完成近10亿软妹币的C轮融资。在国产AI芯片这条赛道上,这可以说是近期分量最足的一笔融资了。
看看这次的投资阵容,深创投这样的头部国资机构领头,还有岩山科技、大湾区共同家园、力鼎资本、蕴盛资本这些产业资本和市场机构加持。老股东凯旋创投、创享投资、盛景嘉成也都选择继续跟投。资本的嗅觉总是最灵敏的,这么多不同背景的机构同时反赌,本身就说明了问题。
当然,一家公司值不值得投,最终还得看产品和市场。墨芯这次同时也放出了一个硬核消息:今年年底,他们全新一代的高性能AI通用推理卡SparsePrime将会正式发布。
墨芯在国内AI芯片圈子里,走的是差异化路线。当大多数玩家都在堆算力、卷制程的时候,他们选择了一条更难但更根本的路——稀疏计算。从自研的稀疏计算芯片到AI计算卡,再到落地场景,这套"技术自研+场景落地"的双轮驱动模式,已经跑通了不少标杆客户。
坐不住的是,数据不会骗人。在全球最权威的AI评测集MLPerf中,墨芯的AI加速卡已经连续三次拿下冠军。他们的S30、S40,无论是单卡还是多卡集群,算力表现都超越了英伟达的A100和H100。单卡性能超了,多卡性能也超了,分布式计算效率也上去了。
更关键的是商业化。墨芯在云端、边缘端、算力网络侧已经拿下了不少真实订单,在全国多个区域完成了千卡集群的部署。在国产替代和AI应用加速落地的双重风口下,墨芯应该是少数几家真正跑通了商业化闭环的初创公司之一。
在这个关键节点上,我们和墨芯的董秘兼企业发展及资本市场部总经理王率宇、商业化副总裁尚勇聊了聊,试图拆解他们在差异化算力赛道上的突围逻辑。
01. 多元资方入局,新一代计算卡年底落地
算力时代的红利正在加速释放,资本持续涌入国产AI芯片赛道,行业IPO节奏也在不断加快。墨芯这次在资本和产品两端同步提速,显然是憋着一股劲。
现在的算力需求结构和前两年已经完全不一样了。多家行业机构的测算数据是一致的:国内推理算力需求已经飙升到训练算力的10到15倍。推理,正在成为算力竞争的新主战场。与此同时,算力网络作为数字经济的核心底座,建设也在全面提速。
瞄准了这波算力红利,墨芯的战略布局已经相当清晰。
王率宇透露,新一轮资金将全力投入新一代AI推理计算卡和算力网络的部署。这里有两个重点值得关注。
首先是产品。墨芯今年将推出的SparsePrime计算卡,定位是智算中心和数据中心场景。这是一款高性能的AI通用推理卡,基于他们自研的Antoum2.0芯片架构打造,专门为了适配大模型和各种复杂推理任务而生。这笔资金会贯穿从研发、量产到市场落地的全链条,为后续的市场拓展提供充足的粮草弹药。
SparsePrime可以看作是墨芯给市场的一份最新答卷。它能够很好地适配当前主流的Transformer模型,而且客户几乎是零接受成本——开发者只需要基于PyTorch、TensorFlow的代码,配合vLLM这样的高效推理框架,几乎不用改任何代码就能完成迁移和部署。如果开发者想要自定义算子,也可以用Triton语言来开发,上手门槛很低。
再来看算力网络。墨芯目前已经在西北、西南、华东、华北四大片区的数据中心完成了部署,覆盖了多个行业场景。按照他们的规划,未来1到2年内,要在国内东、中、西全域完成更广泛的算力网络布局。
融资落地、新产品即将上市、算力网络版图持续扩张——这些都是墨芯阶段性成果的集中体现。当然,他们也没闲着,稀疏化生态的构建、产学研合作、开发者社区,都在同步推进。云端基模、垂类客户、算力网络三管齐下的布局,让墨芯稳稳站在了算力赛道的核心位置。
02. AI加速卡性能超主流GPU,已跑通真实场景验证、落地闭环
放眼整个行业,AI算力体系正在加速分化。未来的竞争核心,早就不再是算力和功耗的简单叠加,而是算力利用率——这才是真正的壁垒。
墨芯的自研双稀疏计算技术,走的就是这条路。他们通过底层创新打破算力瓶颈,打造出高算力、低功耗、高性价比的方案。稀疏计算的原理其实不难理解:人脑处理不同任务时,只会激活大脑皮层的相应区域,不会调用整个神经网络。类比到芯片上,就是在不同任务上进行稀疏激活,简单说就是通过软硬协同设计,让神经网络模型自动消减冗余的计算线程,从而提高效率。
墨芯和别人不一样的地方在于,他们的稀疏计算不是停留在算法层面的简单剪枝,而是直接从软硬协同的角度,把稀疏计算内嵌到芯片的计算核里。这样做,效果才是最优的。
效果好不好,评测结果说了算。在MLPerf评测中,墨芯S40在特定场景下的峰值吞吐量性能,相比英伟达A100有2.9倍的提升,比H100也有1.4倍的领先。多卡方面,4卡S30的算力表现是4卡H100的1.8倍,甚至比8卡A100集群还高出1.2倍。

从芯片到计算卡再到行业解决方案,墨芯已经实现了全链条自研。这,才是他们能给客户提供差异化价值的根基。
但说实话,技术攻关只是第一步。真正难的,是在真实场景里反复验证和打磨。尚勇说得直白:墨芯这条路,不只是纯技术难题,更是一个复杂的工程落地问题。
他举了一个例子:去年墨芯参与了一个算力集群项目,客户是一家制造业企业,对AI本身并不熟悉。企业老板的核心诉求很简单——在有限预算内,拿到能效比最优的算力解决方案。墨芯的团队经过分析,给出的整体方案,相比市面上其他方案能降低30%到50%的成本,而且完全能满足该企业的细分场景需求。
这种技术深耕和场景打磨,才是让算力价值被真正释放出来的关键。尚勇用"两条腿并行"来概括墨芯的策略:技术端,依靠独特的稀疏计算架构突破算力瓶颈,提升算力利用效率和硬件密度;市场端,聚焦AI推理这个黄金赛道,和客户深度绑定,完成芯片的定制化落地和规模化商用。
现在墨芯的产品矩阵已经相当完善——从S4到S40,形成了梯度化的算力布局。既能满足传统小模型的需求,也能支撑小尺寸大模型,甚至为未来3到5年的超大规模模型需求做好了准备。今年年底将推出的新产品,就是瞄准了未来一到两代模型迭代的算力需求。

说到底,真正能够重构算力成本、突破性能上限的,一定得是建立在底层架构级计算范式上的革新。
03. 瞄准AI降本刚需,墨芯已拿下多领域商业化订单
AI产业从技术尝鲜走向了产业普及,降本、增效、适配、盈利,已经成为检验AI芯片价值的核心标准。而墨芯的打法,恰好和这一趋势一脉相承——他们已经具备了可规模化、可盈利、可复制的商业化落地能力。
增效已经体现在了MLPerf的两次夺冠上。降本的重点,则聚焦在单token使用成本上。
国家数据局的数据显示,今年3月底,国内日均Token调用量已经突破了140万亿。这个数字相比2024年初,增长了超过1000倍。面对这么庞大的调用需求,墨芯的稀疏计算可以在保证模型精度不变的前提下,大幅精简计算线程。落地到真实业务场景中,他们的单token运行成本远低于主流GPU产品,在部分特定场景里优势更加明显。
基于此,王率宇也透露,墨芯已经在云端、边缘端和算力网络侧拿下了不少商业化订单,并且预期明后年就能实现盈亏平衡。
墨芯能快速成长,本质上是因为他们契合了AI产业的核心变革趋势。在行业的变化和不变之中,他们始终坚守稀疏计算的核心路线。
所谓不变,就是稀疏计算技术的价值正在加速释放。AI应用要大规模落地,前提条件是边际成本持续下降。墨芯所做的,正是通过技术创新不断降低应用成本,而不是盲目追逐风口。所谓变化,则是AI产业本身的日新月异。产品的形态必须加速迭代,打造通用化的产品体系,兼容不同客户、不同场景的差异化需求。尚勇的观点很清晰:没人能精准预测模型的演进方向,所以墨芯始终坚持从客户出发,保证产品在设计阶段就能满足他们的需求。
放眼整个AI领域,模型厂商的商业化路径基本成型,降本已经成为全行业的刚需。再加上GPU的霸权正在松动,国内多路径AI芯片正在迎来商业化爆发期。墨芯所在的赛道,红利正在持续释放。
04. 结语:AI推理需求爆发,稀疏计算乘风而起
AI推理市场,正在迎来真正的爆发风口。去年9月,黄仁勋在接受采访时说过一句话——AI推理的增长不是100倍、1000倍,而是100亿倍。这个数字听起来很夸张,但从现在的趋势来看,一点都不夸张。
墨芯布局的稀疏计算技术,在这一波浪潮中有着天然的优势。这项技术天然适配推理场景对增效和降本的核心需求,而且墨芯已经以此为核心,构建起了软硬协同、场景验证、生态完善的差异化壁垒。
可以说,随着推理需求井喷,稀疏计算赛道正式进入了爆发窗口期。
