AI编程已杀疯,机器学习论文代码自动生成,100%开源,支持DeepSeek!
图片大家好,我是 ai 学习的老章
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
之前推荐过 N 多读论文神器,比如可以用大模型下载论文、总结论文,效率飞起的 ArXiv MCP 服务器、整篇翻译并保留样式的看论文神器,一键翻译,体验很爽、还有最近刚刚分享的斯坦福学生搞出的论文神器太逆天!秒搜热门论文,3分钟搞定论文总结、翻译,效率飙升100倍!的 AlphaXiv
今天再推荐一个更强大的,可以复现机器学习论文代码的工具——Paper2Code
开源代码不支持 DeepSeek ,稍作修改就可以使用 DeepSeek API 了
https://arxiv.org/pdf/2504.17192https://arxiv.org/pdf/2504.17192
一句话总结,PaperCoder 旨在通过利用大型语言模型(LLM)在多代理系统中直接从机器学习研究论文中生成完整的、可执行的代码库。
PaperCoder 框架的三阶段方法,展示了它如何通过规划、分析和编码阶段将研究论文转换为代码库PaperCoder 框架的三阶段方法,展示了它如何通过规划、分析和编码阶段将研究论文转换为代码库
顶级机器学习会议的分析表明,只有一小部分被接受的论文提供了相应的代码:
在 ICLR 2024 上接受的论文中只有 21.2%,在 NeurIPS 2024 上接受的论文中只有 10.9%,在 ICML 2024 上接受的论文中只有 31.6% 提供了公开发布的代码在 ICLR 2024 上接受的论文中只有 21.2%,在 NeurIPS 2024 上接受的论文中只有 10.9%,在 ICML 2024 上接受的论文中只有 31.6% 提供了公开发布的代码
PaperCoder 通过将研究库生成形式化为软件开发问题来解决可重复性挑战。
该框架可以表示为 M(R) = C,其中:
R 是包含方法和算法的研究论文C 是生成的代码库M 是执行转换的基于 LLM 的模型该系统采用三阶段方法,该方法反映了人类的软件开发过程:
规划阶段:创建高级路线图,包括架构设计(类图和序列图)、文件依赖关系识别和配置文件生成。分析阶段:对每个文件和函数进行细粒度的解释,分析输入、输出、交互和算法约束。生成阶段:根据规划期间确定的执行顺序合成整个代码库。每个阶段都使用专门的 LLM 代理来实现,这些代理协同工作以完成任务,这使得 PaperCoder 成为一个复杂的多代理系统。
图片效果怎么样呢?
PaperCoder 的性能优于软件开发工作基线,如 ChatDev 和 MetaGPT,表明其专门设计的有效性。
作者与专家(包括原始论文作者)进行了评估,以评估生成代码的质量。结果显示:
PaperCoder 生成的存储库中有 77% 被人类评估者评为最佳85% 的人类评审员报告说生成的存储库很有帮助
图片如何使用呢?
图片安装
代码语言:javascript代码运行次数:0运行复制pip install openaiexport OPENAI_API_KEY="登录后复制"git clone https://github.com/going-doer/Paper2Codecd Paper2Codegit clone https://github.com/allenai/s2orc-doc2json.gitcd scriptsbash run.sh
输出结果如下
代码语言:javascript代码运行次数:0运行复制outputs├── Transformer│ ├── analyzing_artifacts│ ├── coding_artifacts│ └── planning_artifacts└── Transformer_repo # Final output repository登录后复制
系统的工作流程是:
将 PDF 论文转换为 JSON 格式 0_pdf_process.py:4-17分析论文内容并生成实现计划 1_planning.py:26-36进行逻辑分析 2_analyzing.py:49-54生成代码实现 3_coding.py:43-50
图片不过这个项目是默认 OpenAI 的 api,本地运行也只支持 vllm 拉起的模型。
我看了一下,其实该起来也非常简单
比如把 OpenAI 切换为 DeepSeek,需要修改的脚本不多
修改 API 客户端初始化和调用:
codes/1_planning.py - 规划生成组件 1_planning.py:1-16codes/2_analyzing.py - 逻辑分析组件 2_analyzing.py:1-20codes/3_coding.py - 代码生成组件 3_coding.py:1-19把
代码语言:javascript代码运行次数:0运行复制client = OpenAI(api_key = os.environ["OPENAI_API_KEY"])登录后复制
修改为下面即可
代码语言:javascript代码运行次数:0运行复制client = OpenAI(api_key = os.environ["OPENAI_API_KEY"],base_url="https://api.siliconflow.cn/v1")登录后复制
如果你用的是 DeepSeek 最新 API,base_url 改为 https://api.deepseek.com_/v1
其他类似
然后修改scripts/run.sh中的环境变量设置: run.sh:1-3
代码语言:javascript代码运行次数:0运行复制export OPENAI_API_KEY="sk-XXXXXX"GPT_VERSION="deepseek-ai/DeepSeek-R1"登录后复制
然后就全部 ok
最后推荐一个我正在学习的Cusor快速入门与实战
相关攻略
FDUSD脱锚惊魂夜:币安生态稳定币的信任危机与系统性风险 2025年4月2日夜间,加密货币市场经历了一场突如其来的“压力测试”。由香港First Digital Trust Limited发行的美元稳定币FDUSD,在市场上演了惊心动魄的脱锚跳水,其兑USDT价格一度暴跌至0 8726美元。这场震
最近又折腾了下 Obsidian 的 Git 插件,虽然也有点麻烦,但它是适合我的。下面介绍下怎么配置和使用。 第一次使用 Obsidian 是在 2024 年,这是翻阅之前的文章 《Obsidia
这项由华为技术有限公司、南洋理工大学、香港大学和香港中文大学联合完成的突破性研究发表于2026年1月,论文编号为arXiv:2601 01426v1。研究团队通过一种名为SWE-Lego的创新训练方
12 月 27 日消息,科技媒体 NeoWin 今天(12 月 27 日)发布博文,报道称 AI 代码编辑器 Windsurf 本周发布 Wave 13 版,通过大幅升级多智能体工作流、性能可访问
NEO(小蚁区块链)旨在构建智能经济网络。NEO通过资产数字化和智能合约实现自动化管理,用户需在支持NEO交易的平台注册账户并获取数字货币,选择合适的交易对后,即可下单交易并确认。交易完成后,可在账户中查看NEO资产,或转移至个人数字储存中安全保管NEO。
热门专题
热门推荐
速览攻略:世界圣羽翼王核心打法与全面解析 本攻略将为你完整呈现《洛克王国》世界圣羽翼王的通关秘籍,深度剖析两种高效实战打法:追求极致速度的“燃薪虫四回合速通”与稳定输出的“酷拉无限连击流”。文章将进一步解析这位翼系精灵王的技能机制、属性克制关系及其在PVE与PVP中的实战定位,帮助你彻底掌握应对其隐
速览:工程系统核心机制解析 在《异种航员2》中,工程系统是整个抵抗力量赖以运转的“战略后勤中枢”。无论是研发新武器、生产重型装甲还是制造先进飞行器,所有实体装备的产出都依赖于此。简言之,该系统的核心运作围绕着两大关键:工程师人力的高效配置与全球稀缺资源的精细化调度。工程师的数量直接决定了每个项目的建
核心速览 在《洛克王国世界》中,治愈兔是一位兼具功能性任务角色与实战辅助能力的精灵。它的价值不仅在剧情推进中体现,更在于对战里出色的治疗与防护表现。本文将为你全面解析治愈兔的精准获取位置、种族属性特点以及实战技能搭配,助你顺利捕捉并最大化其在队伍中的作用。所有关键信息将通过清晰的图文内容详细展示,确
速览 在《红色沙漠》中,挑战传说之狼这一强大的任务BOSS,需要玩家进行充分的准备并遵循完整的任务流程。整个过程环环相扣,你必须首先参与塞莱斯特家族的势力任务,通过完成任务将家族声望提升至指定等级,才能解锁【传说之狼】的专属讨伐任务,最终直面这个传说中的强大生物。 红色沙漠传说之狼怎么打 归根结底,
【宝可梦Pokopia】舒适度全解析:快速提升环境等级的核心秘诀 你是否正在探索《宝可梦Pokopia》世界,并希望有效提升宝可梦栖息地的舒适度?舒适度不仅是衡量宝可梦快乐程度的晴雨表,更是解锁游戏核心内容、加速发展的关键驱动指标。本攻略将系统性地为你揭示提升舒适度的核心途径,涵盖从装饰栖息地、建造





