
中国科学院自动化研究所与武汉人工智能研究院联合研发的紫东太初4.0多模态推理大模型于近日正式发布。该模型在核心技术上实现重要突破,推动人工智能从传统的被动数据处理迈向具备“边看、边识、边思”能力的主动思考阶段。
紫东太初4.0在六大核心能力维度及十六项国际权威基准测试中均达到当前最优水平,整体性能处于国际领先地位。模型实现了从纯文本推理、图文简单协同到细粒度多模态语义理解的三阶段演进。通过模拟人类的交叉注意力机制,系统可对图像进行平移、缩放、区域定位等精细化操作,在处理长达180分钟的视频内容时,能够准确识别关键片段并生成内容摘要。
在音频理解方面,模型可自动操作应用程序完成如预约挂号等实际任务,并能在真实物理环境中驱动汽车、机器人等设备执行动作,构建出“任务自主规划—多模态交错推理—动态执行—综合反馈”的完整闭环,整个推理过程具备高度可解释性。
为加快技术应用转化,同步推出了“紫东太初云”平台。该平台是国内首个集多模态大模型原生协同与全栈国产化万卡智算能力于一体的云计算平台,涵盖算力供给、大模型训练与推理、应用支持等四大服务体系,为企业提供端到端的技术支撑。
目前,紫东太初4.0已在具身智能、低空经济、智慧医疗等多个领域展开应用,服务超过千家企业,助力其实现数字化与智能化转型。未来,该技术将持续深化全栈国产化布局,推动人工智能技术在更广泛场景中的落地与创新。
