复旦团队首创AI推理新方法，提升通用思维能力

首页

热心网友

转载

2025-10-12

科学研究再现重要突破：国际团队最新开发的AI训练方法通过解析代码逻辑，成功培养了模型的跨领域推理能力。这项发表在顶级学术期刊的研究(arXiv:2502.07316v4)显示，采用新训练范式的AI系统在14项认知测试中均获得稳健提升，为构建更接近人类思维的人工智能提供了可行方案。

当前人工智能的发展面临一个显著瓶颈：专业领域表现出色却难以融会贯通。研究者发现这与训练数据的组织方式密切相关——就像专注刷题却不懂知识迁移的学生。为解决这一根本性问题，科研人员将目光投向了代码这一天然的思维训练场。

CodeI/O创新框架跳出了传统代码生成的局限，转而要求AI基于自然语言描述，推测代码行为的因果关系。这种训练不仅包含常见的"输入→输出"正向推理，更独创性地增加了"输出→输入"的逆向思考。通过这种双重训练，AI系统能够真正理解代码背后的思维逻辑，而非简单模仿行为模式。

数据集建构体现了工程创新的精髓。研究团队从GitHub等开放平台精选81万份代码，运用智能过滤系统保留45万个标准函数，并通过质量控制系统生成了350万个训练样本。每个样本都包含详尽的自然语言解释，特别设计的错误修正机制更使系统具备自主优化的能力。

实验结果展示了该方法的显著优势。以70亿参数模型为例，科学推理准确率提升1.8个百分点至43.3%，代码预测得分更是提高了14.5%。优化后的CodeI/O++系统更是将整体表现提升至57.7%，且各领域能力同步增长，破除了AI发展面临的"跷跷板效应"。

为确保研究严谨性，团队实施了13词重叠检测等多种数据隔离措施。结果表明测试集与训练集的重叠率低于0.1%，有效排除了数据污染的嫌疑。这套验证体系为研究成果的可信度提供了坚实保障。

这项研究的理论价值主要体现在三个方面：其一验证了代码作为思维训练载体的独特价值；其二建立了正向与逆向思维的双轨训练机制；更重要的是首次实现了单一训练框架下跨认知维度的能力迁移。

技术实现上，该研究攻克了多项关键难题：智能过滤系统实现了代码质量的自动评估；思维链技术将抽象逻辑转化为可学习的步骤；动态输入生成器则确保了训练样本的多样性。

这一突破性成果已在学界引发强烈反响。专家认为该框架为解决AI推理能力这一核心难题提供了新思路，其高效的训练策略对科研资源的优化利用具有重要启示。随着技术的完善，这种方法有望在需要复杂认知的医疗诊断、金融决策等专业领域实现突破性应用。研究详情可通过指定论文编号获取。

来源:https://www.itbear.com.cn/html/2025-10/983723.html

免责声明：游乐网为非赢利性网站，所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系youleyoucom@outlook.com。

热门推荐

科技

2025年10月31日，近期，网易率土之滨项目负责人、第十事业部主管李凯明确认离职创业，成为继Zen事业部总裁金韬、天下事业部总裁少云之后，一年内第三位离开的事业部级核心管理人员。三人虽分管不同业务

热心网友

10.31

科技

2025年10月31日，小米云服务推出年度优惠活动，会员连续包年方案低至三折，活动时间为10月31日至11月14日。本次促销涵盖多个存储容量选项，其中50GB版本连续包年价格为29元，折合每月约2

热心网友

10.31

web3.0

市场情绪与价值基础最近不少人在讨论数字资产领域的龙头代币，特别是那些在头部交易平台流通的品种。说实话，这种话题总让我想起2021年那

热心网友

10.31

手游攻略

三国志战棋天下第一章低氪无伤开6资源地实例：低氪开局可用赵云（主C）、关羽、张飞、诸葛亮阵容无损开6级地。核心是利用赵云“云之怒+醉酒”高额AOE，配合诸葛亮全队再动，先手秒杀集群

热心网友

10.31

web3.0

关于OPPO手机获取数字资产工具这件事儿前两天隔壁部门的小王神神秘秘地凑过来，问我用OPPO手机该怎么装那个叫币安的应用。我愣了下，这小

热心网友

10.31