墨芯获近10亿融资加速稀疏计算商业化闭环年底推新一代加速卡

时间：2026-05-31 10:25

今天AI圈又一个重磅消息：墨芯人工智能刚刚宣布完成近10亿软妹币的C轮融资。在国产AI芯片这条赛道上，这可以说是近期分量最足的一笔融资了。看看这次的投资阵容，深创投这样的头部国资机构领头，还有岩山科技、大湾区共同家园、力鼎资本、蕴盛资本这些产业资本和市场机构加持。老股东凯旋创投、创享投资、盛景嘉成

今天AI圈又一个重磅消息：墨芯人工智能刚刚宣布完成近10亿软妹币的C轮融资。在国产AI芯片这条赛道上，这可以说是近期分量最足的一笔融资了。

看看这次的投资阵容，深创投这样的头部国资机构领头，还有岩山科技、大湾区共同家园、力鼎资本、蕴盛资本这些产业资本和市场机构加持。老股东凯旋创投、创享投资、盛景嘉成也都选择继续跟投。资本的嗅觉总是最灵敏的，这么多不同背景的机构同时反赌，本身就说明了问题。

当然，一家公司值不值得投，最终还得看产品和市场。墨芯这次同时也放出了一个硬核消息：今年年底，他们全新一代的高性能AI通用推理卡SparsePrime将会正式发布。

墨芯在国内AI芯片圈子里，走的是差异化路线。当大多数玩家都在堆算力、卷制程的时候，他们选择了一条更难但更根本的路——稀疏计算。从自研的稀疏计算芯片到AI计算卡，再到落地场景，这套"技术自研+场景落地"的双轮驱动模式，已经跑通了不少标杆客户。

坐不住的是，数据不会骗人。在全球最权威的AI评测集MLPerf中，墨芯的AI加速卡已经连续三次拿下冠军。他们的S30、S40，无论是单卡还是多卡集群，算力表现都超越了英伟达的A100和H100。单卡性能超了，多卡性能也超了，分布式计算效率也上去了。

更关键的是商业化。墨芯在云端、边缘端、算力网络侧已经拿下了不少真实订单，在全国多个区域完成了千卡集群的部署。在国产替代和AI应用加速落地的双重风口下，墨芯应该是少数几家真正跑通了商业化闭环的初创公司之一。

在这个关键节点上，我们和墨芯的董秘兼企业发展及资本市场部总经理王率宇、商业化副总裁尚勇聊了聊，试图拆解他们在差异化算力赛道上的突围逻辑。

01. 多元资方入局，新一代计算卡年底落地

算力时代的红利正在加速释放，资本持续涌入国产AI芯片赛道，行业IPO节奏也在不断加快。墨芯这次在资本和产品两端同步提速，显然是憋着一股劲。

现在的算力需求结构和前两年已经完全不一样了。多家行业机构的测算数据是一致的：国内推理算力需求已经飙升到训练算力的10到15倍。推理，正在成为算力竞争的新主战场。与此同时，算力网络作为数字经济的核心底座，建设也在全面提速。

瞄准了这波算力红利，墨芯的战略布局已经相当清晰。

王率宇透露，新一轮资金将全力投入新一代AI推理计算卡和算力网络的部署。这里有两个重点值得关注。

首先是产品。墨芯今年将推出的SparsePrime计算卡，定位是智算中心和数据中心场景。这是一款高性能的AI通用推理卡，基于他们自研的Antoum2.0芯片架构打造，专门为了适配大模型和各种复杂推理任务而生。这笔资金会贯穿从研发、量产到市场落地的全链条，为后续的市场拓展提供充足的粮草弹药。

SparsePrime可以看作是墨芯给市场的一份最新答卷。它能够很好地适配当前主流的Transformer模型，而且客户几乎是零接受成本——开发者只需要基于PyTorch、TensorFlow的代码，配合vLLM这样的高效推理框架，几乎不用改任何代码就能完成迁移和部署。如果开发者想要自定义算子，也可以用Triton语言来开发，上手门槛很低。

再来看算力网络。墨芯目前已经在西北、西南、华东、华北四大片区的数据中心完成了部署，覆盖了多个行业场景。按照他们的规划，未来1到2年内，要在国内东、中、西全域完成更广泛的算力网络布局。

融资落地、新产品即将上市、算力网络版图持续扩张——这些都是墨芯阶段性成果的集中体现。当然，他们也没闲着，稀疏化生态的构建、产学研合作、开发者社区，都在同步推进。云端基模、垂类客户、算力网络三管齐下的布局，让墨芯稳稳站在了算力赛道的核心位置。

02. AI加速卡性能超主流GPU，已跑通真实场景验证、落地闭环

放眼整个行业，AI算力体系正在加速分化。未来的竞争核心，早就不再是算力和功耗的简单叠加，而是算力利用率——这才是真正的壁垒。

墨芯的自研双稀疏计算技术，走的就是这条路。他们通过底层创新打破算力瓶颈，打造出高算力、低功耗、高性价比的方案。稀疏计算的原理其实不难理解：人脑处理不同任务时，只会激活大脑皮层的相应区域，不会调用整个神经网络。类比到芯片上，就是在不同任务上进行稀疏激活，简单说就是通过软硬协同设计，让神经网络模型自动消减冗余的计算线程，从而提高效率。

墨芯和别人不一样的地方在于，他们的稀疏计算不是停留在算法层面的简单剪枝，而是直接从软硬协同的角度，把稀疏计算内嵌到芯片的计算核里。这样做，效果才是最优的。

效果好不好，评测结果说了算。在MLPerf评测中，墨芯S40在特定场景下的峰值吞吐量性能，相比英伟达A100有2.9倍的提升，比H100也有1.4倍的领先。多卡方面，4卡S30的算力表现是4卡H100的1.8倍，甚至比8卡A100集群还高出1.2倍。

从芯片到计算卡再到行业解决方案，墨芯已经实现了全链条自研。这，才是他们能给客户提供差异化价值的根基。

但说实话，技术攻关只是第一步。真正难的，是在真实场景里反复验证和打磨。尚勇说得直白：墨芯这条路，不只是纯技术难题，更是一个复杂的工程落地问题。

他举了一个例子：去年墨芯参与了一个算力集群项目，客户是一家制造业企业，对AI本身并不熟悉。企业老板的核心诉求很简单——在有限预算内，拿到能效比最优的算力解决方案。墨芯的团队经过分析，给出的整体方案，相比市面上其他方案能降低30%到50%的成本，而且完全能满足该企业的细分场景需求。

这种技术深耕和场景打磨，才是让算力价值被真正释放出来的关键。尚勇用"两条腿并行"来概括墨芯的策略：技术端，依靠独特的稀疏计算架构突破算力瓶颈，提升算力利用效率和硬件密度；市场端，聚焦AI推理这个黄金赛道，和客户深度绑定，完成芯片的定制化落地和规模化商用。

现在墨芯的产品矩阵已经相当完善——从S4到S40，形成了梯度化的算力布局。既能满足传统小模型的需求，也能支撑小尺寸大模型，甚至为未来3到5年的超大规模模型需求做好了准备。今年年底将推出的新产品，就是瞄准了未来一到两代模型迭代的算力需求。

说到底，真正能够重构算力成本、突破性能上限的，一定得是建立在底层架构级计算范式上的革新。

03. 瞄准AI降本刚需，墨芯已拿下多领域商业化订单

AI产业从技术尝鲜走向了产业普及，降本、增效、适配、盈利，已经成为检验AI芯片价值的核心标准。而墨芯的打法，恰好和这一趋势一脉相承——他们已经具备了可规模化、可盈利、可复制的商业化落地能力。

增效已经体现在了MLPerf的两次夺冠上。降本的重点，则聚焦在单token使用成本上。

国家数据局的数据显示，今年3月底，国内日均Token调用量已经突破了140万亿。这个数字相比2024年初，增长了超过1000倍。面对这么庞大的调用需求，墨芯的稀疏计算可以在保证模型精度不变的前提下，大幅精简计算线程。落地到真实业务场景中，他们的单token运行成本远低于主流GPU产品，在部分特定场景里优势更加明显。

基于此，王率宇也透露，墨芯已经在云端、边缘端和算力网络侧拿下了不少商业化订单，并且预期明后年就能实现盈亏平衡。

墨芯能快速成长，本质上是因为他们契合了AI产业的核心变革趋势。在行业的变化和不变之中，他们始终坚守稀疏计算的核心路线。

所谓不变，就是稀疏计算技术的价值正在加速释放。AI应用要大规模落地，前提条件是边际成本持续下降。墨芯所做的，正是通过技术创新不断降低应用成本，而不是盲目追逐风口。所谓变化，则是AI产业本身的日新月异。产品的形态必须加速迭代，打造通用化的产品体系，兼容不同客户、不同场景的差异化需求。尚勇的观点很清晰：没人能精准预测模型的演进方向，所以墨芯始终坚持从客户出发，保证产品在设计阶段就能满足他们的需求。

放眼整个AI领域，模型厂商的商业化路径基本成型，降本已经成为全行业的刚需。再加上GPU的霸权正在松动，国内多路径AI芯片正在迎来商业化爆发期。墨芯所在的赛道，红利正在持续释放。

04. 结语：AI推理需求爆发，稀疏计算乘风而起

AI推理市场，正在迎来真正的爆发风口。去年9月，黄仁勋在接受采访时说过一句话——AI推理的增长不是100倍、1000倍，而是100亿倍。这个数字听起来很夸张，但从现在的趋势来看，一点都不夸张。

墨芯布局的稀疏计算技术，在这一波浪潮中有着天然的优势。这项技术天然适配推理场景对增效和降本的核心需求，而且墨芯已经以此为核心，构建起了软硬协同、场景验证、生态完善的差异化壁垒。

可以说，随着推理需求井喷，稀疏计算赛道正式进入了爆发窗口期。

来源：https://36kr.com/p/3828243885707913

加速卡

上一篇外媒称黄仁勋任清华经管学院顾问 下一篇2026款尚界H5预售16.98万起最亲民鸿蒙智行SUV

本站内容用于信息整理与展示，如有侵权或内容问题请及时联系处理。