中国团队研制新型芯片突破:特定任务算力超GPU千倍,攻克模拟计算世纪难题
“作为通用‘总指挥’的CPU,凭借着成熟的技术架构和经济性,始终在计算生态中占据着核心位置。GPU则专注于加速并行计算,尤其在处理海量矩阵乘法上表现卓越。而我们研发的这款模拟计算芯片,则瞄准了AI等前沿领域中最耗能的矩阵逆运算,旨在更高效地解决此类问题,为现有算力体系提供重要的补充。”
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
编辑 | 云昭
在数字计算统治计算机世界半个多世纪后,一场颠覆性的技术变革正在中国悄然上演。
北京大学人工智能研究院孙仲团队,携手集成电路学院研究力量,成功研制出全球首个基于阻变存储器的高精度、可扩展模拟矩阵计算芯片。该芯片首次将模拟计算精度提升至24位定点级别,让这项曾被视作“老旧技术”的计算范式重新焕发活力。
图片
实测数据显示,在求解大规模MIMO信号检测等关键科学问题时,这款芯片的计算吞吐量与能效相较顶级GPU提升了百倍至千倍。相关突破性成果已于10月13日发表在国际顶级期刊《Nature Electronics》(《自然·电子学》)上。
图片
一项“教科书技术”的重生
论文通讯作者、北大人工智能研究院孙仲教授介绍道,
“模拟计算是早期计算机的核心技术框架,通过物理定律直接进行运算,具备高并行、低延迟、低功耗的先天优势。”
但随着数字计算在精度和可编程性方面的快速崛起,传统模拟计算因精度受限、扩展性不足而逐渐淡出历史舞台。
“如何让模拟计算兼具高精度与可扩展性,进而在现代计算任务中充分发挥其潜能,始终是困扰全球科学界的‘世纪难题’。”他进一步解释道,“数字计算虽精度可控,但存在速度瓶颈,且受冯·诺依曼架构中‘内存墙’的制约,这已成为制约人工智能、科学计算和6G通信发展的瓶颈。”
那么模拟计算究竟有何独特之处?
为了更直观地说明这个问题,孙仲打了个形象的比方:
“数字芯片在处理信息时,都需要先将数据转换成0和1的符号串。例如数字‘十’,就要编译成‘1’和‘0’的组合,记为‘1010’。”
如果用二进制书写“1+1=2”,实际上它呈现的是“1+1=10”的结果。
而模拟计算则采用了完全不同的原理。
“模拟计算无需这层‘翻译’过程,它是一种‘类比计算’,可以直接用连续的物理量来对应数学上的数值。举例来说,数学上的‘十’,可以直接用十伏或十毫伏的电压来表示。”
简单来说,数字计算通过符号来表征世界,而模拟计算则直接“让物理世界自己完成计算”。
这项技术在计算机发展的早期阶段——上世纪30至60年代曾被广泛应用。当时的科学家们巧妙地运用电压、电流、齿轮和旋钮来求解复杂方程。然而随着计算任务变得日益庞大而精密,模拟计算的“精度短板”逐渐暴露,最终被数字计算全面取代,成为教科书中尘封的篇章。
孙仲指出,此项研究的核心突破正是要攻克模拟计算“算不准”这一根本痛点。
提升五个数量级,破解“精度困境”
面对这一技术瓶颈,研究团队并未沿袭传统思路,而是选择了“融合创新”的突破路径。
他们在新型信息器件、原创电路架构和经典算法之间建立协同设计体系,首次实现了可与数字计算相媲美的高精度模拟计算系统——将传统模拟计算的精度提升了整整五个数量级。
“我们研发的新方案在保持模拟计算低复杂度优势的同时,实现了与数字FP32处理器相媲美的计算精度。”
在实验室环境中,团队成功实现了16×16矩阵的24位定点精度求逆,经过10次迭代后,相对误差可低至10⁻¹¹量级。
图片
“团队还创新性地提出了块矩阵模拟计算方法,如同拼图游戏般将复杂问题分解到多个芯片上协同解决,成功突破了模拟计算的规模限制,实验实现了16×16矩阵方程的求解。”
算力超越GPU,能效高出百倍
更令人震撼的是性能测试结果。
在算力表现方面尤为突出:
“当求解32×32矩阵求逆问题时,该芯片算力已超越高端GPU的单核性能;当问题规模扩大至128×128时,计算吞吐量更是达到顶级数字处理器的1000倍以上。”
换句话说——传统GPU需要运算一整天的任务,这款芯片只需一分钟就能完成。
孙仲补充说明:
“在同等精度下,该技术的能效比传统数字处理器高出100倍以上,为算力中心应对能耗瓶颈提供了关键技术支撑。”
通向“算力新范式”的钥匙
我们熟知的计算机,无论是CPU还是GPU,本质上都属于“数字芯片”范畴。它们遵循冯·诺依曼架构——将计算和存储分离,通过“0”和“1”的数字流来完成编译、运算与传输。
这种模式已经持续了半个多世纪。但随着人工智能和6G通信对算力需求的急剧膨胀,这种架构的局限性日益凸显——数据在计算单元和存储单元之间来回搬运,能耗与延迟不断攀升。
而北大孙仲团队的突破,正是要从根本上“重构”这种算力逻辑。
“这项工作的核心价值在于,它用事实证明模拟计算能够以极高效率和精度解决现代科学与工程中的核心计算难题。”
他们研发的基于阻变存储器的模拟计算芯片,跳出了“将数据转换成二进制再运算”的繁琐过程,也不再依赖“过程性存储”。
在这里,计算与存储融为一体——电流流过的那一瞬间,就是运算本身。这意味着算力得到彻底释放:在6G通信中,它能让基站在低功耗下实时处理海量天线信号,提升网络容量与能效;在人工智能领域,有望加速大模型训练中的二阶优化算法,显著提高训练效率;而在边缘计算设备中,它的低功耗特性意味着AI训推一体化将更易落地。
“更重要的是,低功耗特性也将为复杂信号处理和AI训推在终端设备上的直接运行提供强力支持,从而大幅降低对云端的依赖,进而推动边缘计算迈向新阶段。”
从实验室到产业化:算力革命的起点
据悉,孙仲团队已启动产业化进程,计划将这一突破性技术从实验室推向市场。
“这项突破的意义远不止于一篇顶刊论文,其应用前景覆盖多元计算场景,有望重塑算力格局。”
“可以说,我们为算力提升探索出了一条极具潜力的路径,有望打破数字计算的长期垄断,开启一个算力无处不在且绿色高效的新时代。”
谈及与现有计算架构的关系,孙仲强调未来将是互补共存,而非替代:
“作为通用‘总指挥’的CPU,因其成熟性与经济性而难以被淘汰。GPU专注于加速矩阵乘法计算。我们的模拟计算芯片,则致力于更高效地处理AI等领域最耗能的矩阵逆运算,这是对现有算力体系的有力补充。”
参考链接:
https://www.zhihu.com/question/1964688206738978150
相关攻略
紫光展锐与吉利汽车成立联合创新实验室,剑指下一代智能汽车核心 近日,汽车与半导体行业传来一则重磅合作消息。紫光展锐与吉利汽车在宁波吉利汽车研究院正式签署协议,共同为双方的联合创新实验室揭牌。这一动作,无疑为智能汽车产业链的协同创新树立了一个新的标杆。 根据官方信息,这个实验室的使命相当明确:它不仅要
近日,2026年国际显示技术大会(ICDT)在重庆圆满落幕。云英谷VTDR6135 AMOLED显示驱动芯片凭借在显示组件领域的技术实力与创新表现,荣获SID中国区显示行业六大奖项(China Display Industry Award, 简称CDIA)中的“年度最佳显示组件产品奖”银奖。 SID
苹果AI芯片新突破:测试玻璃基板技术,强化自研供应链布局 最新行业消息显示,全球科技巨头苹果公司在自研AI硬件领域取得了重要进展。据The Elec报道,苹果已启动对先进玻璃基板的测试评估,这一举措与其代号为“Baltra”的AI服务器芯片项目紧密相关。 报道进一步指出,这款备受瞩目的AI芯片Bal
忆联发布国内首款8通道PCIe 5 0企业级固态硬盘UH713a 数据中心存储领域迎来新突破。近日,忆联(Union Memory)宣布即将推出其UH713a固态硬盘,这被业界视为国内首款支持8通道的PCIe Gen5数据中心级固态硬盘(dSSD)。 这款产品的核心看点,在于其搭载了忆联自研的PCI
小米18系列前瞻:8500mAh电池与双2亿像素影像的“性能怪兽” 最近,关于小米下一代旗舰的讨论又热闹了起来。根据知名博主@数码闲聊站的最新爆料,代号为小米18 Pro Max的工程机,其电池规格已经基本确定,目标容量设定在惊人的8500mAh左右。这可不是个小数目,意味着在续航能力上,新机很可能
热门专题
热门推荐
清算热力图实战指南:精准预判加密市场变盘点的五大核心步骤 在波动剧烈的加密货币合约市场中,清算热力图正成为专业交易者洞察市场潜在“火药桶”的关键可视化工具。它通过动态展示不同价格区间的潜在清算头寸密度,将多空杠杆博弈的脆弱地带清晰呈现。掌握其核心用法,能有效辅助交易者识别价格可能发生剧烈转向或加速突
《刺客信条:黑旗 Resynced》2026年发售,经典海盗传奇完全重制回归 据知名游戏爆料人Tom Henderson最新透露,备受玩家期待的《刺客信条:黑旗 Resynced》已正式定档,将于2026年7月9日全球同步发售。需要明确的是,本次项目并非简单的高清复刻版,而是对爱德华·肯威经典加勒比
币安Binance现货合约交易官网入口、App下载、注册与认证全指南 对于想要进入加密货币交易世界的新手来说,找到正确的起点至关重要。本文将为你清晰指引币安(Binance)的官方入口,并手把手带你完成从下载App、注册账户到完成身份认证的全过程。所有步骤都基于官方渠道,确保你的每一步操作都安全、可
洛克王国新手开局必看:前期神宠选择攻略与重要性解析 对于刚刚踏入洛克王国的新手玩家来说,开局阶段选择一只强力的前期神宠,是决定冒险旅程是否顺畅的关键。一只优秀的前期宠物不仅能让你轻松应对主线任务和日常挑战,更能帮助你快速理解游戏的核心战斗机制与属性克制关系。那么,在洛克王国前期,哪些宠物值得优先培养
深度解析:Web3合约交易中的强平引擎与保险基金核心机制 在波澜云诡的加密货币合约交易市场中,“强制平仓”是每一位交易者都极力避免却又必须深刻理解的风险事件。这背后并非一个简单的风控开关,而是一套被称为“强平引擎”的复杂、自动化、多层级风险管理系统。它的高效运作,直接关系到交易平台的稳健性与用户的资





