首页 游戏 软件 资讯 排行榜 专题
首页
科技数码
存算一体芯片赛道解析:后摩的核心竞争壁垒|WAIC 2025

存算一体芯片赛道解析:后摩的核心竞争壁垒|WAIC 2025

热心网友
67
转载
2025-12-16

热闹的存算一体芯片赛道里,后摩的竞争壁垒是什么? |WAIC 2025

“四年前创业时,我常被问道:存算一体那么好,为什么别人不做?”后摩智能创始人兼CEO吴强深有体会,“现在一些上市公司或者即将上市的公司都说要布局存算一体,没有人再问四年前的问题,大家意识到了存算一体芯片对于大模型的优势。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

存算一体芯片的赛道过去几年确实十分热闹,国内就有十多家公司布局不同技术路线、不同算力的存算一体芯片。

后摩的壁垒是什么?吴强说,“看论文做一个测试芯片,证明技术原理不难。我们的壁垒是将存算一体芯片量产,过去四年我们趟过无数的坑,解决了一个又一个量产难题。

世界人工智能大会2025(WAIC)前夕,后摩智能发布了即将在今年第四季度量产的端边大模型AI芯片——后摩漫界M50,这是一款单芯片就能运行百亿参数大模型的存算一体芯片。

吴强透露,后摩智能已启动下一代 DRAM-PIM 技术研发。

热闹的存算一体芯片赛道里,后摩的竞争壁垒是什么? |WAIC 2025

率先起跑,一次转向,后摩智能建起壁垒

2020年吴强创业时,选择存算一体技术路线有两个核心原因,一个原因是吴强博士论文的方向是高能效比计算芯片以及编译器,吴强甚至要解决功耗墙和存储墙问题,必须走存算一体路线。另一个是看到英伟达的强大,决定用创新的架构另辟蹊径,尝试弯道超车。

存算一体技术在学术界研究很多,但要将学术研究转化成商业化落地的产品,中间还有巨大的鸿沟。

“论文里能看到理论和原理,但要把存算一体技术转化为量产产品,必须解决可测性和可靠性问题,中间有无数的坑。”吴强说,“没有人做过存算的DFT(Design for Testability,可测性设计),也不知道怎么做BIST(Built-in Self-Test,内建自测试技术),如何解决小面积大算力带来的电源稳定性问题?”

业界没有人遇到这些问题,也没有对应的制造工艺和EDA软件,后摩智能的团队就只能用普通的工艺和EDA软件填补中间巨大的鸿沟。

“我们非常希望友商一起做,把存算一体芯片的生态做好。”吴强说。

靠着后摩研发团队攻克一个个难题,2023年后摩发布了国内首款大算力存算一体智驾芯片鸿途H30,最高物理算力256TOPS,典型功耗35W。

此后虽有后摩智能融资的消息,但一直没有后摩智能产品和落地方面的消息,直到2025年7月的世界人工智能大会2025(WAIC)。

热闹的存算一体芯片赛道里,后摩的竞争壁垒是什么? |WAIC 2025

谈及此事,吴强告诉,2023年下半年整个自动驾驶赛道竞争非常激烈,格局逐渐稳定,给新入局者的机会越来越少。

“我们第一代芯片为了体现存算一体的优势,算力很高,也意味着成本高。但当时市场都在讲低成本,我们的大算力芯片和汽车芯片市场的需求有鸿沟。”吴强坦言,“那时候在纠结要不要转型,放弃汽车市场到一个新领域很痛苦,但又知道自动驾驶芯片对我们来说是一条走不通的路。”

“最后生存的压力战胜了面子,2023年下半年开始转型。”吴强说,“我们看到了端边大模型的新兴市场,没有巨头公司,与存算一体芯片的适用场景又很契合,2024年初快速调整第一代芯片,针对大模型优化推出了漫界M30。

在股东中国移动的帮助下,后摩智能的漫界M30随中国移动在2024年的世界移动通信大会(MWC)亮相,这款芯片能够运行60B参数的模型,给了吴强和团队信心。

于是后摩智能就坚定转到端边大模型芯片的市场,经过近两年时间,推出了第二代IPU架构的存算一体量产芯片漫界M50。

热闹的存算一体芯片赛道里,后摩的竞争壁垒是什么? |WAIC 2025

无论是将存算一体芯片从学术界推向商业市场,还是芯片应用落地的选择,其中趟过的坑,走过的弯路积累下来的经验,都是后摩在存算一体赛道和国产芯片公司里的壁垒。

热闹的存算一体芯片赛道里,后摩的竞争壁垒是什么? |WAIC 2025

这个壁垒,帮助后摩智能能够更好设计第二代芯片。

单芯片160TOPS,能运行百亿参数大模型

后摩漫界M50采用的是自研的第二代IPU 架构——天璇,实现了160TOPS@INT8、100TFLOPS@bFP16的物理算力,搭配最大48GB内存与153.6 GB/s的超高带宽,典型功耗仅10W,相当于手机快充的功率,就能让PC、智能语音设备、机器人等智能移动终端高效运行1.5B到70B参数的本地大模型。

热闹的存算一体芯片赛道里,后摩的竞争壁垒是什么? |WAIC 2025

得益于存算一体通过把计算和存储单元集成在一起,让数据就近处理,能从根本上解决传统芯片“数据传输慢、功耗高”问题的特性,和传统架构相比,M50的能效提升5~10倍,能充分满足端边设备"算得快又吃得少"的需求。

为了能够最大程度发挥存算一体架构的优势高效运行大模型,后摩智能进行了一系列的优化,吴强重点分享了两个优化。

一个是弹性加速,这个技术与GPU的稀疏加速有点类似。GPU的稀疏加速,是在遇到权重参数为“0”时,跳过计算,实现加速。但这种方式权重必须严格为“0”,在现实应用中,要让大量权重都恰好为“0”是非常困难的,因此GPU的稀疏加速效果往往不尽如人意。

SRAM存算一体技术是按照一个比特(bit)一个比特进行串行计算,这意味着后摩可以做到更细粒度的优化。

“我们并不需要整个权重是0,只要它在bit里面有0,就可能做弹性加速。”吴强介绍,这让加速的机会大大增加,也让量化变得更加灵活,可以实现7bit、6bit甚至5bit的超低精度量化,从而在不牺牲太多精度的情况下,将性能压榨到极致。

据悉,天璇架构最高可实现160%的加速效果。

热闹的存算一体芯片赛道里,后摩的竞争壁垒是什么? |WAIC 2025

热闹的存算一体芯片赛道里,后摩的竞争壁垒是什么? |WAIC 2025

另一个优化是直接支持浮点运算。“基于存算的架构做浮点运算,并把它量产,我们在业内应该是第一个。”吴强解释,芯片直接支持浮点运算,意味着开源或者FP16的浮点模型可以直接运行,能够提升适配和应用的效率,只有特殊需要的情况下才会做额外的量化,这进一步降低了漫界M50芯片应用落地的难度。

热闹的存算一体芯片赛道里,后摩的竞争壁垒是什么? |WAIC 2025

对于用户来说,易用性还是取决于上层的软件,包括编译器。

“第一代编译器用传统的方案做,很多功能发挥不出来,所以中间重构了一遍,完全从0-1。”吴强说,“我们也是逐渐地摸索,这种经验在外面看不到,这是我们积累的壁垒。”

传统的NPU编译器有几百个选项,手动调优困难,导致上手门槛高、使用不便。

后摩重构的编译器后摩大道,应用了自动的优化算子,只要给一些输入的图Graph,它就能自动搜索最优化的策略,无需开发者手动尝试,支持浮点运算,无需量化参数和精度调优,让开发者更容易上手。

热闹的存算一体芯片赛道里,后摩的竞争壁垒是什么? |WAIC 2025

从硬件到软件,后摩解决了AI芯片落地的技术难题,市场策略成为后摩走向商业化成功的下一个关键。

多元产品组合,重点拓展三大领域

基于漫界M50内建的高速多芯互联技术,后摩智能推出了覆盖端侧到边缘的多元算力方案。

热闹的存算一体芯片赛道里,后摩的竞争壁垒是什么? |WAIC 2025

力擎LQ50 M.2 卡以口香糖大小的标准 M.2 规格,为 AI PC、AI Stick、陪伴机器人等移动终端提供 "即插即用" 的端侧 AI 能力,支持 7B/8B 模型推理超 25tokens/s。

力擎LQ50 Duo M.2 卡集成双 M50 芯片,320TOPS 的算力,突破 14B/32B 大模型端侧部署瓶颈。

力谋LM5050 加速卡与力谋LM5070 加速卡分别集成 2 颗、4 颗 M50 芯片,为单机及超大模型推理提供高密度算力,最高达 640TOPS。

BX50 计算盒子则以紧凑机身适配边缘场景,支持 32 路视频分析与本地大模型运行。

目前后摩智能比较看重三个领域,一是平板和电脑这种消费终端类,这是大模型生产力工具,对AI性能有刚需。二是智能语音系统,大模型语音会议也是重点布局的一个方面。三是运营商的边缘计算,看中了5G+AI是一个趋势。

“目前这几个方面都有早期客户,消费终端、智能办公、智能工业我们重点布局的领域。”吴强说,“我们精力有限,先把这三个领域做好,未来只要对大模型有需要,对功耗敏感,都是会逐步拓展的客户。”

在世界人工智能大会(WAIC)后摩的展台上,后摩也展示了单颗漫界M50芯片运行端侧大模型的应用,比如基于Qwen3-14b模型的Chatbot知识问答;还有基于Qwen-8b模型的会议纪要,支持2K左右的上下文,一小时的会议,目前五六分钟可以生成会议纪要;还有专门为信创市场提供服务的公文写作,采用纯国产芯片和操作系统,运行Qwen2.5-7b模型,速度十分理想。

热闹的存算一体芯片赛道里,后摩的竞争壁垒是什么? |WAIC 2025

目前,联想的下一代AI PC,科大讯飞的讯飞听见下一代智能语音设备,以及中国移动的新一代5G+AI边缘计算盒子,都是后摩智能的意向客户。

热闹的存算一体芯片赛道里,后摩的竞争壁垒是什么? |WAIC 2025

吴强告诉,目前后摩和算法合作伙伴以及OS都有合作,后摩的策略是每个领域与头部客户直接对接,腰部以及长尾客户用编译器工具链降低客户开发的难度。

接下来,后摩将研发下一代DRAM-PIM 技术,通过将计算单元直接嵌入 DRAM 阵列,使计算与存储的协同更加紧密高效,这一技术将突破 1TB/s 片内带宽,能效较现有水平再提升三倍,推动百亿参数大模型在终端设备实现普及,让更强大的 AI 算力能够融入 PC、平板等日常设备。

热闹的存算一体芯片赛道里,后摩的竞争壁垒是什么? |WAIC 2025

从最初的孤独求证,到如今的大模型端侧芯片量产,后摩智能让存算一体不再只是学术概念,而成为国产AI芯片攻入新场景的“潜航器”。

来源:https://www.leiphone.com/category/chips/r2pEdaGO0tftSPTZ.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

AI+具身智能“造血”成功:极智嘉(02590)成为To B智能机器人赛道首个“盈利样本”
科技数码
AI+具身智能“造血”成功:极智嘉(02590)成为To B智能机器人赛道首个“盈利样本”

当下,全球AI领域的竞争早已告别“拼参数”的粗放阶段,资本市场的考量愈发务实——谁能将AI研发投入转化为真实利润,谁就能抢占先机。在这场从“技术概念”到“商业实效”的转型竞赛中,率先跑通商业闭环的企

热心网友
04.07
国产万卡智算集群破局背后:99.99%超高可用性如何实现?
科技数码
国产万卡智算集群破局背后:99.99%超高可用性如何实现?

走进上海智能算力科技有限公司(下称“智算科技”)位于上海松江区的国产万卡集群智算中心,刚踏入机房大门,浑厚而持续的风扇轰鸣声便扑面而来。目光所及,数万张GPU在机柜里整齐排列、鳞次栉比;高速网络线缆

热心网友
04.07
实现99.99%超高可用性,上海智算科技团队建成国内第一批万卡集群
科技数码
实现99.99%超高可用性,上海智算科技团队建成国内第一批万卡集群

机房内风扇的轰鸣声日夜不息,上万张GPU设备整齐排列。在这里,每张芯片每秒执行上万亿次运算,它们两天汇聚的能量,相当于三峡水电站一台机组整整一小时的发电量。这幅震撼景象,来自上海松江的一座万卡集群—

热心网友
04.07
获京基智农控股后,汇博机器人加速具身智能从轻量到重型全谱系产品落地
科技数码
获京基智农控股后,汇博机器人加速具身智能从轻量到重型全谱系产品落地

来源:环球网【环球网科技综合报道】据36氪研究院预测,2026年中国具身智能产业将迎来两大里程碑:市场规模正式突破万亿元大关,人形机器人出货量有望冲击十万台量级,行业正式从技术探索期迈入规模化落地的

热心网友
04.07
机器人保姆“上岗”,现存机器人相关企业超108万家
科技数码
机器人保姆“上岗”,现存机器人相关企业超108万家

雷达财经讯,我国首个机器人保洁员在深圳“上岗”,具身智能技术走进家庭。在养老场景,按摩、艾灸等机器人受老年人欢迎,满足多元需求;普通家庭中,机器人保洁员与保洁阿姨组成“黄金搭档”,开启家庭服务新模式

热心网友
04.07

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

2026年十大加密货币交易所排名与安全选择指南
web3.0
2026年十大加密货币交易所排名与安全选择指南

本文梳理了2026年主流数字资产交易平台的特点与选择策略。重点从安全性、资产丰富度、交易体验、创新功能及合规性等维度进行分析,旨在帮助用户根据自身需求,在众多平台中做出明智选择,而非简单罗列排名。选择平台需综合考量资金安全、操作习惯与长期发展愿景。

热心网友
05.14
2026年全球十大现货交易所排名与深度评测
web3.0
2026年全球十大现货交易所排名与深度评测

本文梳理了2026年现货交易所的竞争格局,从交易深度与流动性、资产安全与合规性、用户体验与产品创新三个维度进行深度分析。文章指出,头部平台在合规与技术创新上持续领跑,新兴交易所在细分市场寻求突破,行业整体呈现出专业化、合规化与用户体验并重的发展趋势,为不同需求的用户提供了多元选择。

热心网友
05.14
2026年最佳加密货币交易平台权威评测与推荐指南
web3.0
2026年最佳加密货币交易平台权威评测与推荐指南

本文梳理了2026年主要数字资产交易平台的综合表现,从安全性、资产多样性、用户体验及创新服务等维度进行分析。榜单反映了行业向合规与专业化发展的趋势,头部平台在技术架构与风控体系上持续投入,新兴平台则凭借细分领域创新获得关注。投资者需结合自身需求,理性评估平台特点与风险。

热心网友
05.14
Aria Networks CEO解读推理技术如何改变AI网络格局
AI
Aria Networks CEO解读推理技术如何改变AI网络格局

今年四月,AI网络初创公司Aria Networks携1 25亿美元融资高调登场,并向业界抛出了一个直指核心的判断:下一阶段AI基础设施的竞争,焦点已不仅仅是堆砌更多的GPU,而在于能否构建一个能充分释放这些算力潜能的“神经网络”。 这家由前Arista和Juniper高管创立、总部位于帕洛阿尔托的

热心网友
05.14
英伟达MIT华人团队开源技术大幅降低大模型推理内存消耗
AI
英伟达MIT华人团队开源技术大幅降低大模型推理内存消耗

仅凭一张家用RTX 4090显卡的24GB显存,就能流畅运行一个拥有320亿参数的AI大模型,一口气读完6份长文档并自动生成周报?这并非极客魔改,而是来自MIT、英伟达与浙江大学研究者的最新突破。 这项名为TriAttention的技术,精准瞄准了大模型推理中的核心瓶颈——KV缓存显存占用。其核心思

热心网友
05.14