首页 游戏 软件 资讯 排行榜 专题
首页
手机教程
AI编程已杀疯,机器学习论文代码自动生成,100%开源,支持DeepSeek!

AI编程已杀疯,机器学习论文代码自动生成,100%开源,支持DeepSeek!

热心网友
69
转载
2025-07-03
AI编程已杀疯,机器学习论文代码自动生成,100%开源,支持DeepSeek!图片

大家好,我是 ai 学习的老章

之前推荐过 N 多读论文神器,比如可以用大模型下载论文、总结论文,效率飞起的 ArXiv MCP 服务器、整篇译并保留样式的看论文神器,一键译,体验很爽、还有最近刚刚分享的斯坦福学生搞出的论文神器太逆天!秒搜热门论文,3分钟搞定论文总结、译,效率飙升100倍!的 AlphaXiv

今天再推荐一个更强大的,可以复现机器学习论文代码的工具——Paper2Code

开源代码不支持 DeepSeek ,稍作修改就可以使用 DeepSeek API 了

AI编程已杀疯,机器学习论文代码自动生成,100%开源,支持DeepSeek!https://arxiv.org/pdf/2504.17192

https://arxiv.org/pdf/2504.17192

一句话总结,PaperCoder 旨在通过利用大型语言模型(LLM)在多代理系统中直接从机器学习研究论文中生成完整的、可执行的代码库。

AI编程已杀疯,机器学习论文代码自动生成,100%开源,支持DeepSeek!PaperCoder 框架的三阶段方法,展示了它如何通过规划、分析和编码阶段将研究论文转换为代码库

PaperCoder 框架的三阶段方法,展示了它如何通过规划、分析和编码阶段将研究论文转换为代码库

顶级机器学习会议的分析表明,只有一小部分被接受的论文提供了相应的代码:

AI编程已杀疯,机器学习论文代码自动生成,100%开源,支持DeepSeek!在 ICLR 2024 上接受的论文中只有 21.2%,在 NeurIPS 2024 上接受的论文中只有 10.9%,在 ICML 2024 上接受的论文中只有 31.6% 提供了公开发布的代码

在 ICLR 2024 上接受的论文中只有 21.2%,在 NeurIPS 2024 上接受的论文中只有 10.9%,在 ICML 2024 上接受的论文中只有 31.6% 提供了公开发布的代码

PaperCoder 通过将研究库生成形式化为软件开发问题来解决可重复性挑战。

该框架可以表示为 M(R) = C,其中:

R 是包含方法和算法的研究论文C 是生成的代码库M 是执行转换的基于 LLM 的模型

该系统采用三阶段方法,该方法反映了人类的软件开发过程:

规划阶段:创建高级路线图,包括架构设计(类图和序列图)、文件依赖关系识别和配置文件生成。分析阶段:对每个文件和函数进行细粒度的解释,分析输入、输出、交互和算法约束。生成阶段:根据规划期间确定的执行顺序合成整个代码库。

每个阶段都使用专门的 LLM 代理来实现,这些代理协同工作以完成任务,这使得 PaperCoder 成为一个复杂的多代理系统。

AI编程已杀疯,机器学习论文代码自动生成,100%开源,支持DeepSeek!图片

效果怎么样呢?

PaperCoder 的性能优于软件开发工作基线,如 ChatDev 和 MetaGPT,表明其专门设计的有效性。

作者与专家(包括原始论文作者)进行了评估,以评估生成代码的质量。结果显示:

PaperCoder 生成的存储库中有 77% 被人类评估者评为最佳85% 的人类评审员报告说生成的存储库很有帮助
AI编程已杀疯,机器学习论文代码自动生成,100%开源,支持DeepSeek!图片

如何使用呢?

AI编程已杀疯,机器学习论文代码自动生成,100%开源,支持DeepSeek!图片

安装

代码语言:javascript代码运行次数:0运行复制
pip install openaiexport OPENAI_API_KEY=""git clone https://github.com/going-doer/Paper2Codecd Paper2Codegit clone https://github.com/allenai/s2orc-doc2json.gitcd scriptsbash run.sh
登录后复制

输出结果如下

代码语言:javascript代码运行次数:0运行复制
outputs├── Transformer│   ├── analyzing_artifacts│   ├── coding_artifacts│   └── planning_artifacts└── Transformer_repo  # Final output repository
登录后复制

系统的工作流程是:

将 PDF 论文转换为 JSON 格式 0_pdf_process.py:4-17分析论文内容并生成实现计划 1_planning.py:26-36进行逻辑分析 2_analyzing.py:49-54生成代码实现 3_coding.py:43-50
AI编程已杀疯,机器学习论文代码自动生成,100%开源,支持DeepSeek!图片

不过这个项目是默认 OpenAI 的 api,本地运行也只支持 vllm 拉起的模型

我看了一下,其实该起来也非常简单

比如把 OpenAI 切换为 DeepSeek,需要修改的脚本不多

修改 API 客户端初始化和调用:

codes/1_planning.py - 规划生成组件 1_planning.py:1-16codes/2_analyzing.py - 逻辑分析组件 2_analyzing.py:1-20codes/3_coding.py - 代码生成组件 3_coding.py:1-19

代码语言:javascript代码运行次数:0运行复制
client = OpenAI(api_key = os.environ["OPENAI_API_KEY"])
登录后复制

修改为下面即可

代码语言:javascript代码运行次数:0运行复制
client = OpenAI(api_key = os.environ["OPENAI_API_KEY"],base_url="https://api.siliconflow.cn/v1")
登录后复制

如果你用的是 DeepSeek 最新 API,base_url 改为 https://api.deepseek.com_/v1

其他类似

然后修改scripts/run.sh中的环境变量设置: run.sh:1-3

代码语言:javascript代码运行次数:0运行复制
export OPENAI_API_KEY="sk-XXXXXX"GPT_VERSION="deepseek-ai/DeepSeek-R1"
登录后复制

然后就全部 ok

最后推荐一个我正在学习的Cusor快速入门与实战

来源:https://www.php.cn/faq/1384909.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

Git钩子自动部署配置指南 Linux服务器实战教程
系统平台
Git钩子自动部署配置指南 Linux服务器实战教程

直接说结论:使用 post-receive 钩子配合 GIT_WORK_TREE 环境变量,是实现 Git 自动部署最稳定可靠的方案。至于 post-update 钩子或在裸仓库中直接执行 checkout 的方法,强烈建议避免使用——它们不仅容易失败,而且错误信息往往不明确,排查过程极其耗时。 为

热心网友
05.18
柴犬币未来两年价格能否上涨十倍突破关键阻力位
web3.0
柴犬币未来两年价格能否上涨十倍突破关键阻力位

柴犬币(SHIB)两年内有望达到0 0001美元?深度解析其路径与挑战 柴犬币(SHIB)两年内有望达到0 0001美元,多家机构预测其2026至2028年可能实现破零,核心动力来自通缩销毁机制、Shibarium网络推动及生态扩展,但面临高流通量、市场竞争和实用性验证等挑战,需结合市场环境与长期发

热心网友
05.18
Git分支管理与合并操作指南
AI资讯
Git分支管理与合并操作指南

如果你曾尝试使用Perplexity这类AI工具来学习Git分支管理,但总觉得得到的回答过于笼统、缺乏可操作的细节——例如,它可能只告诉你“使用merge合并分支”,但具体的操作步骤、遇到冲突时的处理方法却语焉不详——那么问题很可能出在你的提问方式上。AI并非真人导师,它需要更精确的指令才能输出有价

热心网友
05.17
Linux配置Git提交模板的详细步骤与实用技巧
系统平台
Linux配置Git提交模板的详细步骤与实用技巧

配置Git提交模板,本意是让每次提交信息都清晰、规范,但实际操作中,几个隐蔽的“坑”常常让这个功能形同虚设。今天,我们就来把这些坑一个个填平。 路径写错就静默失效,这是第一个大坑 配置项 commit template 对路径的敏感度超乎想象。写错一点,它不会报错,只会默默地“罢工”。结果就是你兴冲

热心网友
05.17
Linux配置Git提交规范与Commit模板设置指南
系统平台
Linux配置Git提交规范与Commit模板设置指南

配置 git commit template 来统一团队提交信息的格式,是建立 Git 工作流规范的第一步。然而,如果你认为仅靠一个模板文件就能一劳永逸,那可能陷入了一个常见的误区。实际上,这个配置的作用非常基础:它仅在你不使用 -m 参数、通过编辑器进行交互式提交时,将模板内容预填到提交信息编辑器

热心网友
05.17

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

刑事案件电子数据取证密码获取程序拟明确
业界动态
刑事案件电子数据取证密码获取程序拟明确

公安部就电子数据取证规则公开征求意见,拟将网络安全等行政案件纳入适用范围,并规范取证流程与核心概念。新规特别明确了获取密码、调取通讯内容等特殊程序,需经严格审批并保障当事人权利。配套法律文书也同步优化,以构建更规范且注重权利保障的取证体系。

热心网友
05.23
小鹏G9降价12万背后何小鹏的豪赌与挑战
业界动态
小鹏G9降价12万背后何小鹏的豪赌与挑战

理想L9和LIvis的定价策略刚掀起波澜,小鹏GX的最终价格就给出了更猛烈的回应——从近40万元的预售价直降至27万元起。用小鹏产品矩阵负责人吴安飞的话说,这叫“9系的产品,8系的价格”。 这12万元的下调,效果堪称立竿见影。发布会次日,小鹏集团港股股价一度大涨超8%。更关键的是市场订单:上市12小

热心网友
05.23
魏建军感谢于东来支援环塔拉力赛 红牛千箱胖东来厨师助阵
业界动态
魏建军感谢于东来支援环塔拉力赛 红牛千箱胖东来厨师助阵

5月21日,环塔拉力赛新疆且末赛段大营迎来了一位备受瞩目的访客——知名零售企业胖东来的创始人于东来。他专程前往长城汽车车队营地,与参赛车手及后勤团队进行了深度交流。据悉,于东来此次自驾越野之旅已历时一月,随行车队中包含多款国产越野车型。经过实地驾驶与多维度对比,他对以长城汽车为代表的国产越野车品质给

热心网友
05.23
2026年比特币官方APP下载入口及官网安全访问指南
web3.0
2026年比特币官方APP下载入口及官网安全访问指南

比特币官方入口在哪里?一个核心门户的权威指南 说起比特币,很多人第一反应是去找它的“官网”或“官方App”。但这里有个关键点需要先理清:比特币本质上是一种去中心化的全球数字货币,它不属于任何一家公司或机构,而是由一个庞大的、遍布全球的社区共同维护。因此,它并没有传统意义上由某个企业运营的“官方网站”

热心网友
05.23
蚂蚁开源万亿参数思考模型Ring-2.5-1T详解
AI资讯
蚂蚁开源万亿参数思考模型Ring-2.5-1T详解

Ring-2 5-1T是什么 在当今大模型技术激烈竞争的赛道上,追求更长的上下文处理能力和更强大的深度推理性能已成为核心焦点。近日,蚂蚁集团旗下的inclusionAI团队重磅开源了Ring-2 5-1T模型,这是一个参数规模高达万亿级别的混合线性思考大语言模型。该模型基于先进的Ling 2 5架构

热心网友
05.23