AI推理芯片新创公司Positron日前正式推出第二代专用芯片“Asimov”。公司宣称,这款产品在单次推理效能与性价比上,均能做到英伟达下一代Rubin架构GPU的五倍水平。
Positron指出,当前Transformer模型在推理运算时,主要瓶颈在于内存带宽而非纯粹算力。因此Asimov在设计之初便以内存优先为核心理念,其内存带宽利用率高达90%,并能从架构层面消除不必要的数据远程移动开销。

Asimov芯片由一对计算单元模块构成,内部集成了支持多样化数据格式的张量处理阵列。每个计算单元直接连接432GB的LPDDR5x内存,并通过PCIe 6.0与CXL 3.0接口扩展出最高720GB的键值缓存空间。整颗芯片热设计功耗为400瓦,内存总容量达2304GB,带宽总和为2.76TB/s,并支持风冷散热方案。
Positron Asimov支持通过多样化的拓扑架构实现芯片间互连,互联带宽高达16Tbps。其Titan推理服务器系统采用19英寸4U机架规格,可聚合四颗Asimov芯片,支持最高160亿参数模型的推理任务,上下文窗口长度达1000万token,单一系统最多可部署4096套Titan计算单元。

Positron表示,Asimov芯片计划在2026年底前完成流片,并于2027年初投入量产。
