抱抱脸24小时复刻Deep Research，一个团队完成_AI热点日报

抱抱脸24小时复刻Deep Research，一个团队完成

类型：热点整理2026-06-29

HuggingFace团队在24小时内开源了OpenDeepResearch智能体，对标OpenAI每月200美元且闭源的DeepResearch。该项目在GAIA基准测试中取得了54%的准确率，远超普通GPT-4仅7%的表现。采用纯文本浏览器与CodeAgent架构，代码已完全开源至GitHub，便于复现和二次开发，推动技术普惠。

HuggingFace团队24小时极限挑战，复刻OpenAI Deep Research，开源AI工具生态迎来新变革！

你一定会有这种感觉：昨天刚看到一个很酷的AI产品，今天开源社区就把它的平替方案摆上了桌。这次的主角，是HuggingFace和OpenAI的Deep Research。

昨天凌晨，HuggingFace扔下一枚重磅冲击波——正式开源了一个名为“Open Deep Research”的自主研究智能体。这个项目的目标非常直接：对标OpenAI那个每月200美元、还闭源的Deep Research。更让人惊讶的是，从立项到发布，整个团队只用了24小时。开源社区这闪电般的速度，正在实实在在地改写AI工具的生态版图。

开源特攻队的极限时速

事情是这样的。OpenAI前天刚发布了Deep Research——一个能自动爬遍全网、生成研究报告的智能体。能力确实很强，但门槛也真不低：每月200美元的订阅费，外加完全闭源的模式。

HuggingFace实验室的科学家们一看，直接拍板：“24小时之内，我们要用开源的方式复刻这个产品！”

这个听起来有点疯狂的计划，最终演变成了一场争分夺秒的极限开发：

凌晨2点，完成基础架构设计
早上7点，成功接入OpenAI的o1模型
下午3点，攻克了网页自主滚动的技术难题
晚间9点，实现文件动态解析模块

在GAIA基准测试中，这个仓促上阵的项目竟然交出了相当亮眼的成绩单：

OpenAI的Deep Research：67.36%
HuggingFace的开源版本：54%
作为对照的普通GPT-4（不带Agent能力）：仅7%

解剖这只“开源猎豹”

项目是完全开源的，代码托管在GitHub上：https://github.com/huggingface/smolagents/tree/gaia-submission-r1/examples/open_deep_research

它的内核用到了HuggingFace自家的CodeAgent。相比输出一堆冗长的JSON，用代码来控制模型显然更顺畅。

第一版的设计思路很有特点：使用纯文本浏览器，绕开渲染开销；页面元素会被自动转成Markdown格式。同时配备了一个解析器，能自动读取文本，支持PDF、CSV、JSON等格式的自动转换，连数学引擎都能处理复杂的公式推导。记忆模块还保留了跨会话的上下文信息。

很多人会好奇，模型为什么选择了o1，而不是更快更便宜的o3-mini？官方给出的回应很直接：“o3-mini确实很快，但在困难任务上的表现，不如o1和GPT-4o。我们觉着模型太小了，能力还不够。”至于有没有试过Deepseek R1？官方也坦诚地回答：“试过了，但效果不如o1。这倒不是模型本身能力不行，更多是它对框架的指南不太适应。所以我们正在考虑通过微调来解决这个问题。”

最后，官方博客里还有一句让人印象深刻的调侃：“o1模型的API调用费，已经超过了实验室的咖啡预算。但我们需要证明，开源框架的天花板到底在哪里。”

来源：https://www.53ai.com/news/OpenSourceLLM/2025020584902.html

ai 人工智能

延伸阅读

补充最近整理过的热点入口。