游乐游手机版
首页/科技数码/文章详情

科学家开发记忆搜索引擎,搜索速度提升一亿倍,计算在存储内完成

时间:2026-03-07 16:46
每一天无论我们是在微信聊天记录里找一句话,还是在手机相册里找一张照片,背后都是手机在一行一行比对数据,这个过程不仅费电而且费时。如果有一种芯片能在存储数据的地方直接完成搜索,不需要把数据搬来搬去,速

每一天无论我们是在微信聊天记录里找一句话,还是在手机相册里找一张照片,背后都是手机在一行一行比对数据,这个过程不仅费电而且费时。

如果有一种芯片能在存储数据的地方直接完成搜索,不需要把数据搬来搬去,速度能快多少?能耗又能节约多少?近日,香港大学李灿教授和合作者造出了一种名为模拟内容寻址存储器的芯片,在搜索上快了大约一亿倍。


图 | 李灿(来源:受访者)

该芯片由二硫化钼这种比发丝还细几万倍的二维材料打造而来。芯片里集成了 256 个闪存单元,组成一个 8×16 的阵列。当你输入一个查询值,所有存储单元同时开始比对。而且,该模拟芯片单元存储的不是数字计算机上的 0 和 1,而是我们直接感知世界的连续模拟值。

比对的过程中,哪个单元里的数据是匹配的,对应的那条路线就保持高电压。哪个单元里的数据是不匹配的,对应的那条线路电压就会瞬间降低。整个搜索过程只需要 36 皮秒。

一皮秒是一万亿分之一秒,光在真空中一皮秒只能走 0.3 毫米。也就是说,这几个芯片完成一次搜索的时间,光还没来得及从这头跑到那头。

此次芯片的能耗同样惊人,每搜索一个单元,只消耗不到 0.1 飞焦。一飞焦是一千万亿分之一焦耳,这种级别的能耗,比传统静态随机取存储器做的内容寻址存储器低了上万倍。


(来源:https://doi.org/10.1038/s41565-025-02089-7)

李灿告诉 DeepTech:“从应用端来看,搜索有很大的价值。一方面是数据库搜索,另一方面和人工智能里面的注意力机制相关。注意力机制是支撑大语言模型的 Transformer 模型的 building block,本质上就是去学习到的压缩知识里面做搜索,然后取出来。我们在论文里演示的 KNN 分类应用也很有解释性,可以用于医疗诊断等对安全性非常敏感的应用。同时,在大数据时代大规模搜索也有很强的需求。”

为什么能够这么快和这么省电?关键在于他们优化了晶体管和金属之间的接触。

在传统芯片里,金属电极和半导体材料接触的地方,会形成一个叫做肖特基势垒的障碍,这就像一堵墙,电子要翻过去才能流动。这堵墙会让电阻变大、电流变小、速度变慢。

他们选择使用锑这种半金属作为电极。锑有个特点,它的电子态密度几乎为零,能够抑制金属诱导的能隙态,把费米能级从钉死状态解放出来。简单说,就是那堵墙被拆掉了,电子可以自由进出,接触电阻降到只有 400 到 700 欧姆每微米,接近了理论极限。

结果就是,单个闪存单元的开态电流能够达到 60 微安每微米,开关比超过 10 的 9 次方,这组数字在同类二维材料闪存里是最高的。

有了这么猛的器件,他们搭出了 256 个单元的阵列,成品率为 89.45%,每个单元的阈值电压可以被精确调节,存成不同的值。在搜索的时候,输入电压落在哪个单元的范围内,那个单元就判定为匹配。


(来源:https://doi.org/10.1038/s41565-025-02089-7)

为了验证这套系统能否用在真实场景,他们做了一个 k 近邻分类的演示。把四个经典数据集的手写数字、鸢尾花、乳腺癌、葡萄酒的特征值存入芯片,然后输入查询向量。结果芯片直接算出汉明距离,也就是算出了两个向量有多少位不同,然后找出最近的三个邻居投票决定分类,准确率分别是 98.89%、93.33%、97.37% 和 100%。

他们还展示了两个进阶版本。一个是双栅结构的闪存,上下两个栅极都能控制沟道,开关比又提高了一个量级,电流也更大。另一个是三维堆叠的互补闪存,把 n 型的二硫化钼和 p 型的二硫化钨上下叠起来,做成一个单元。这一面积可以节约一半,互连更短,延迟更低。


(来源:https://doi.org/10.1038/s41565-025-02089-7)

那么,这套技术能用在哪里?最直接的场景是边缘计算。手机、摄像头、传感器这些设备,不需要把数据传到云端,直接在本地就能快速搜索对比。比如刷脸解锁,设备里存了你的脸部特征向量,然后可以和摄像头刚拍摄到的特征向量做对比,找到匹配的就予以通过。整个过程都在芯片里完成,不用上传隐私,也不怕网络延迟。

还可用于网络路由。数据包过来之后,要通过查询路由表决定往哪里转发。传统方式是一行一行对比,速度非常慢吞。而使用内容寻址存储器,所有表项可以同时对比,一个时钟周期就能找到匹配的下一跳。

再比如数据库加速、机器学习推理、基因序列对比,只要是需要快速查找相似数据的场景都有用武之地。


(来源:https://doi.org/10.1038/s41565-025-02089-7)

当然,距离真正走进手机还有一定距离。目前的阵列只有 256 个单元,要跑到上百万甚至上亿,还得解决良率、封装、驱动电路等一系列工程问题。但至少原理走通了,性能数据也摆在那里。

李灿表示:“注意力机制本质上也是搜索,我们也在探索能不能用搜索机制来实现大模型,这样二维材料高性能搜索硬件就更有优势。同时,我们也会持续跟二维材料和存内计算以及 AI 硬件的工业界沟通,看看有没有商业化的机会。”

参考资料:

相关论文 https://doi.org/10.1038/s41565-025-02089-7

排版:刘雅坤

来源:https://www.163.com/dy/article/KNE8MM9F05119734.html
上一篇未来5年,这6大前沿科技创新将重塑世界 下一篇叶红义代表建言:AI赋能基层治理,重在实用而非摆设
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
宫本茂亲签3DS XL拍卖价破两万美元
科技数码 · 2026-05-29

宫本茂亲签3DS XL拍卖价破两万美元

今天来说一件挺有意思的事:2015年任天堂世界锦标赛冠军约翰·戈德堡,近日将他当年夺冠时赢得的宫本茂亲笔签名版3DS XL掌机放上了拍卖平台。截至2026年5月29日,这台签名掌机的竞拍价已突破两万美元,并且价格还在持续攀升。戈德堡在社交媒体上发布声明表示,经过相当长时间的慎重考虑,他决定将这台对自

七彩虹隐星P16 Pro游戏本新配置仅售7799元
科技数码 · 2026-05-29

七彩虹隐星P16 Pro游戏本新配置仅售7799元

七彩虹近期推出隐星P16Pro游戏本新配置,售价7799元。其搭载酷睿i9-13900HX处理器与RTX5060显卡,配备16英寸2 5K高刷电竞屏及高效散热系统。存储组合为16GB内存与1TB固态硬盘,支持后续扩展。该配置主打高性能性价比,适合预算有限但追求强劲性能的游戏玩家与轻度创作者。

苹果iPhone Hikawa握把支架448元重新上架
科技数码 · 2026-05-29

苹果iPhone Hikawa握把支架448元重新上架

苹果公司重新上架了与艺术家贝利·桧川及PopSockets合作设计的iPhone专用握把支架。该配件采用磁吸设计,兼具握持与支架功能,旨在通过人性化设计降低握持负担,并提供三种配色可选,售价448元。

苹果体育应用扩展至170市场 为2026世界杯引入对阵图
科技数码 · 2026-05-29

苹果体育应用扩展至170市场 为2026世界杯引入对阵图

苹果体育应用新增覆盖90多个国家和地区,全球可用市场总数超过170个。为迎接2026年世界杯,应用加入了完整的赛程对阵图和可视化阵型卡片,方便用户追踪赛事与战术。同时,应用支持实时活动功能,可将比分固定在锁屏或表盘,并新增一键跳转至新闻的入口。目前该应用仍仅限iPhone用户使用。

小米史上最强国产巅峰芯片玄戒O3 6月台积电3nm投产
科技数码 · 2026-05-29

小米史上最强国产巅峰芯片玄戒O3 6月台积电3nm投产

据博主爆料,小米下一代自研玄戒芯片计划于今年6月正式进入量产阶段,此次将采用台积电3nm工艺。初代玄戒O1累计出货量已突破100万颗,量产验证十分扎实。新一代芯片的产能将显著提升,这意味着供货问题基本得到解决。 根据现有曝光信息,这颗迭代芯片极有可能命名为玄戒O3,首发搭载机型预计为小米MIX Fo