蚂蚁集团最新推出的全模态通用AI助手“灵光”,在移动端实现了30秒生成小应用的突破性功能,用户可以自由编辑、交互和分享内容。这款产品不仅是业界首个具备全代码生成能力并支持多模态内容创作的AI助手,更通过三大核心功能重新定义了通用型AI的生产力边界。
“灵光对话”功能搭载结构化思维引擎,能将纷繁复杂的信息转化为逻辑清晰的分层展示。以教育场景为例,当用户询问科学原理时,系统不仅能提炼核心知识点,还能自动生成三维动态模型、交互式图表等可视化内容。这种立体化的知识呈现方式让学习效率成倍提升,尤其在需要空间想象的学科领域表现尤为突出。
在系统架构层面,灵光采用多智能体协同的Agentic架构,动态调度图像生成、三维建模、动画渲染等专业模块。每当用户发起请求,系统就会实时组合多个专业智能体的能力,确保输出结果既包含精准信息,又提供沉浸式体验。这种设计突破了传统AI助手单一模态输出的局限,实现了从文字到三维空间的完整覆盖。
最具创新性的“闪应用”功能,让普通用户通过日常对话就能快速创建个性化工具。比如输入“计算溏心蛋烹饪时间”后,系统能在30秒内生成包含鸡蛋规格、熟度偏好等参数的交互式计算器。无论是养车成本测算还是健身计划制定,该系统都能实时调用后端算法模型,实现数据动态更新与外部系统交互。
“灵光开眼”功能融合的AGI视觉技术,将AI对物理世界的感知能力推向新高度。在旅行场景中,当用户拍摄古建筑时,系统可实时识别建筑特征并叠加历史信息标注;在创作模式下,系统支持文生视频、图生3D等跨模态转换,为内容创作者提供全链路工具支持。这种实时解析能力,标志着AI从数字世界向物理空间渗透取得关键进展。
作为蚂蚁集团AGI战略的重要落地产品,灵光的研发团队攻克了多模态代码生成、智能体协作等核心技术瓶颈。目前该产品已在安卓和iOS平台同步上线,其“化繁为简”的设计理念,正在重塑人机交互的底层逻辑。此前蚂蚁集团已布局AI医疗管家等多个专业领域,此次灵光的正式推出,进一步验证了其在通用人工智能领域从基础研究到场景落地的完整能力链。
