人大清华DeepAnalyze：用大模型实现数据分析智能升级

首页

热心网友

转载

2025-10-31

DeepAnalyze-8B+具备模拟数据科学家行为的能力，能够在真实环境中自主编排和优化各类操作流程，最终独立完成复杂的数据科学研究任务。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新！ 👉 点此立即查看 👈

来自人民大学与清华大学的研发团队近日发布了DeepAnalyze，这是首个面向自主数据科学能力的agentic LLM。该模型的问世迅速引发了业内的广泛讨论，上线仅一周便收获1000余个GitHub星标，社交媒体浏览量突破20万次。

DeepAnalyze项目正处于持续完善阶段，我们诚邀各位专家学者交流合作！欢迎研究人员和从业者在GitHub平台提交改进方案，成为项目贡献者，共同推动DeepAnalyze的发展！

DeepAnalyze-8B+能够模拟数据科学家的思维方式，在真实场景中主动规划执行路径、动态调整操作策略，最终攻克复杂的数据科研难题。该模型全面支持各类以数据为核心的关键任务：

数据任务：自动化数据预处理、深度数据分析、智能建模、可视化呈现、数据洞见发现与专业报告生成；数据研究：支持对任意数量的结构化数据（数据库、CSV、Excel）、半结构化数据（JSON、XML、YAML）及非结构化数据（TXT、Markdown）进行开放式深度探索，并生成分析师级别的研究报告；

DeepAnalyze作为真正的agentic LLM，无需任何预设工作流触发机制，即可自主完成复杂的数据科学全流程任务。

论文链接：https://arxiv.org/pdf/2510.16872 代码、Demo链接：https://github.com/ruc-datalab/DeepAnalyze 模型链接：https://huggingface.co/RUC-DataLab/DeepAnalyze-8B 数据链接：https://huggingface.co/datasets/RUC-DataLab/DataScience-Instruct-500K

DeepAnalyze的完整论文、源代码、预训练模型及数据集均已开源，诚邀社区用户亲身体验！

DeepAnalyze: 自主实现数据科学全流程

DeepAnalyze支持本地化部署，可作为您专属的私有数据科学助手！

DeepAnalyze 是什么？

现有将LLMs应用于自主数据科学的方法，主要分为两大类别：

领域特定的LLM：面向数据科学的代码生成LLM、结构化数据理解LLM... 基于工作流的智能体：人工预设执行流程，通过提示词调用闭源LLM完成任务

现有方案在实践层面面临双重局限：

仅支持单点任务（例如数据清洗、模型训练），无法实现端到端的完整数据科学流程。闭源模型未在真实环境中的数据科学任务上专门训练，难以编排和优化各种复杂操作。

DeepAnalyze致力于推动基于LLM的数据科学系统从预设流程的智能体范式，转变到可训练的agentic LLM范式。

数据科学领域的复杂性为训练agentic LLM提出了新的挑战，主要包括：

奖励稀疏：数据科学的复杂性使得LLMs在训练的早期阶段基本无法成功完成任务，难以获取正向奖励信号，从而导致agentic LLM训练过程崩溃。路径稀缺：数据科学的解决过程通常依赖长链推理，求解轨迹的稀缺使得LLMs缺少足够的指导，导致其在庞大的搜索空间中进行低效且盲目的试错式探索。

针对这两个核心问题，DeepAnalyze创新性地引入了：

课程化的智能体训练：在真实环境中从单一任务到复合任务渐进式训练LLM，让大模型逐步提升能力，避免在复杂任务上奖励信号为0导致的强化学习失效。数据支撑的轨迹合成：自动化生成500K数据科学领域的推理过程与环境交互数据，在庞大的搜索空间中提供正确路径的明确指引。

通过在真实环境中的agentic训练，DeepAnalyze具备了自主编排和自适应优化操作的能力，能端到端地完成数据科学全流程，包括具体的数据任务和开放式的数据研究。

DeepAnalyze 在数据科学基准测试中表现优异

1. DeepAnalyze-8B在DataSciBench（端到端数据科学基准）上优于所有开源模型，与GPT-4o相媲美

2. DeepAnalyze在DSBench数据分析和数据建模任务上超越基于工作流的智能体

3. DeepAnalyze在面向数据的深度研究中取得最佳表现，能生成分析师级别的分析报告

例如：

更多实验结果请参阅DeepAnalyze完整论文。

总结

DeepAnalyze是首个面向自主数据科学的agentic LLM，具备两项核心能力：自主编排和自适应优化。作为一个基础模型，DeepAnalyze可以直接部署使用，也可通过提示词工程或监督微调进一步定制以适应特定场景。项目提出的课程化智能体训练范式与数据支撑的轨迹合成方法，有效解决了复杂场景下的奖励稀疏和轨迹稀缺问题，实现了对需要多种能力的高复杂度任务的有效学习。

来源:https://www.51cto.com/article/828526.html

免责声明：游乐网为非赢利性网站，所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系youleyoucom@outlook.com。

上一篇：ICCV 2025：港科与牛津推出AlignGuard，革新文生图模型对齐框架下一篇：Minimax M2开源Agent模型：高性价比首选方案

热门推荐

web3.0

美国SEC主席Paul Atkins证实：加密货币安全港提案已送交白宫审查

加密货币行业翘首以盼的监管里程碑，终于有了实质性进展。美国证券交易委员会（SEC）主席保罗·阿特金斯（Paul Atkins）近日证实，那份允许加密项目在早期获得注册豁免权的“安全港”框架提案，已经正式送抵白宫，进入了最终审查阶段。在范德堡大学与区块链协会联合举办的数字资产峰会上，阿特金斯透露了这

热心网友

04.08

web3.0

微策略Strategy报告：第一季录得144.6亿美元浮亏再斥资约3.3亿美元买进4871枚比特币

微策略Strategy报告：第一季录得144 6亿美元浮亏再斥资约3 3亿美元买进4871枚比特币市场震荡的威力有多大？看看Strategy的最新季报就明白了。根据其最新向美国证管会(SEC)提交的8-K报告，受市场剧烈波动影响，这家公司所持的比特币在第一季度录得了一笔惊人的数字——144 6亿

热心网友

04.08

web3.0

稳定币发行商Tether再扩Web3版图！Paolo Ardoino：正开发去中心化搜索引擎Hypersearch

稳定币巨头Tether的动向，向来是加密世界的风向标。这不，它向Web3基础设施的版图扩张，又迈出了关键一步。公司执行长Paolo Ardoino在社交平台X上透露，其工程团队正在全力“烹制”一个新项目——去中心化搜索引擎 “Hypersearch”。这个消息一出，立刻引发了行业的广泛猜想。采用D

热心网友

04.08

web3.0

Base链首个原生DeFi借贷协议Seamless Protocol倒闭将于2026年6月30日下线

基地位于Coinbase旗下以太坊Layer2网络Base的Seamless Protocol，日前正式宣告了服务的终结。这个曾经吸引了超过20万用户的原生DeFi借贷协议，在运营不到三年后，终究没能跑赢时间。它主打的核心产品是Integrated Leverage Markets（ILMs）——一

热心网友

04.08

web3.0

PAAL代币如何参与治理？社区投票能决定哪些事项？

PAAL代币揭秘：深度解析Web3社区治理的核心钥匙在去中心化自治组织的浪潮中，谁真正掌握了项目的话语权？PAAL代币提供了一套系统化的答案。它不仅是生态内流转的价值媒介，更是开启链上治理大门的核心凭证。通过持有并质押PAAL代币，用户能够对协议升级、资金分配乃至战略方向等关键事务投出决定性的一票

热心网友

04.08