安谋科技Arm China近日正式发布新一代NPU IP"周易"X3,标志着其"All in AI"产品战略全面落地。这款专为大模型计算设计的AI芯片基于全新的DSP+DSA架构,在性能、能效和软件生态层面实现显著突破,旨在为算力基础设施、智能汽车、移动终端和智能物联网等前沿领域提供端侧AI计算的全新标杆。
"周易"X3的硬件架构经过全面优化升级,单集群最高支持4个核心,算力范围覆盖8至80+ FP8 TFLOPS,并可根据实际应用需求灵活配置。其单核带宽高达256GB/s,相比前代产品"周易"X2,CNN模型推理性能提升30%至50%,多核算力线性度达到70%至80%。在同算力规格下,AIGC大模型处理能力较上一代增长10倍,这得益于FP16算力提升16倍、计算核心带宽扩展4倍,以及Softmax和LayerNorm性能提升超过10倍的综合优化效果。
实测数据显示,在Llama2 7B大模型推理任务中,"周易"X3在Prefill阶段算力利用率达72%,配合安谋科技自研的解压硬件WDC,在Decode阶段有效带宽利用率突破100%,远超行业平均水平,充分满足大模型解码阶段对高吞吐量的严苛要求。产品研发副总裁刘浩表示,公司将持续加大投入,整合顶尖研发资源,为合作伙伴提供从芯片设计到应用服务的端到端解决方案,助力AI产品创新与商业化落地。
软件层面,"周易"X3搭载全新升级的Compass AI软件平台,完整支持TensorFlow、PyTorch、ONNX等主流框架,覆盖超过160种运算子和270多种模型架构,包括当前热门的LLM、VLM等大模型架构。该平台提供GPTQ量化、动态Shape支持等优化工具,并将Parser、Optimizer等核心组件开源,支持自定义算子与编译流程,帮助开发者实现白盒化部署。产品总监鲍敏骞强调,该平台遵循"软硬协同、全周期服务"的设计理念,通过专业团队与深度技术服务,助力客户产品成功上市。
应用场景方面,"周易"X3覆盖四大核心领域:在算力基础设施领域支持加速卡高效推理;在智能汽车领域为ADAS自动泊车和智能座舱系统提供算力支撑;在移动终端实现AI PC与手机的超级渲染和AI智能体流畅运行;在智能物联网领域推动智能安防、物联网网关等设备的本地化低延迟推理。此次产品发布标志着安谋科技以"AI Arm CHINA"为发展方向,为各行各业的智能化转型注入核心驱动力。
