5月19日,联想在北京隆重举办了“天禧 AI 一体多端全场景超能之夜”新品发布会。当晚的焦点,是一款专为智能体(Agent)时代设计的AI原生设备——联想AI主机P7。这款革命性产品的核心驱动力,来自一颗名为后摩智能M50的AI芯片。正是凭借其创新的存算一体架构,这台仅手掌大小的轻薄设备,得以在本地流畅运行最高达1220亿参数的庞大语言模型,实现了端侧AI算力的重大突破。

随着后摩智能M50芯片进入量产阶段,联想P7的发布传递出一个清晰信号:高能效的端边侧AI推理能力,正将AI创新硬件带入一个崭新时代,让千亿参数大模型高效运行于本地终端成为现实。
M50:撑起千亿参数大模型的端侧算力核心
在联想AI主机P7仅约300克的轻巧机身内,蕴藏着高达190TOPS的澎湃本地AI算力,这完全得益于后摩智能M50芯片的强大性能。它使得设备最高能够支持1220亿参数大模型的本地化部署与推理。即使在完全离线的无网络环境下,其本地自主推理速度仍可达到每秒50个Token。配合最高80GB的大容量内存和128K的超长上下文窗口,处理各类复杂多轮对话与任务也能保持行云流水般的流畅体验。更值得称道的是其卓越的能效表现:整机最大功耗仅30瓦,一个普通的移动电源即可轻松驱动,运行时的噪音更是低于35分贝,堪称静音。
当前,我们正全面步入智能体(Agent)时代,但云端算力成本高昂、Token消耗激增、网络延迟与隐私安全等问题也日益凸显。后摩智能M50芯片所提供的、可媲美云端性能的端侧算力解决方案,以其极致的能效比和灵活多样的部署形态,正成为AI硬件厂商打造下一代高算力、低功耗创新终端的优先选择与核心基石。
一机双模:口袋里的“免费Token工厂”
基于后摩智能M50芯片提供的高性能算力基座,联想AI主机P7创新性地采用了“一机双模”的智能形态。在智能体模式下,P7在本地高效运行联想自研的“天禧Claw”智能体系统,尽可能将复杂的逻辑推理与任务规划在本地执行完毕,减少对云端的依赖。而当用户切换至大模型模式后,P7则提供开放的API Key接口,支持无缝接入各类第三方AI应用和智能体,瞬间变身为一个本地的“免费Token工厂”,让用户彻底摆脱对云端付费API服务的依赖与成本焦虑。
此外,联想P7支持7×24小时不间断连续执行任务,其极致轻小便携的特性,使得用户可以将其作为口袋里的随身AI工作站,随时随地调用强大算力。即便在飞机、野外等没有网络信号的场景下,P7也能持续提供稳定、可靠的端边侧AI推理服务。更重要的是,所有用户数据均在本地设备内进行存储和处理,实现了真正的“数据不出端”,从硬件层面有效保障了用户的数据隐私与安全,解决了企业及个人用户的核心关切。
据悉,联想AI主机P7将于7月1日正式开启众筹。它的量产上市,标志着后摩智能M50芯片成功突破了端侧算力的传统壁垒,真正推动了千亿级参数大模型从昂贵的云端服务器下沉,走进普通的消费级AI终端。凭借其卓越的能效比与强大的端边侧推理能力,M50让AI硬件能够以更低的功耗承载更高密度的智能算力,这无疑大幅降低了端侧和边缘侧AI规模化应用与普及的门槛。展望未来,以极致能效推动端边侧硬件创新,用最小的能耗释放最大的智能潜能,将是AI产业持续演进与发展的关键路径。
