游乐游手机版
首页/AI热点日报/热点详情

抱抱脸24小时复刻Deep Research,一个团队完成

类型:热点整理2026-06-29
HuggingFace团队在24小时内开源了OpenDeepResearch智能体,对标OpenAI每月200美元且闭源的DeepResearch。该项目在GAIA基准测试中取得了54%的准确率,远超普通GPT-4仅7%的表现。采用纯文本浏览器与CodeAgent架构,代码已完全开源至GitHub,便于复现和二次开发,推动技术普惠。

HuggingFace团队24小时极限挑战,复刻OpenAI Deep Research,开源AI工具生态迎来新变革!

你一定会有这种感觉:昨天刚看到一个很酷的AI产品,今天开源社区就把它的平替方案摆上了桌。这次的主角,是HuggingFace和OpenAI的Deep Research。

昨天凌晨,HuggingFace扔下一枚重磅冲击波——正式开源了一个名为“Open Deep Research”的自主研究智能体。这个项目的目标非常直接:对标OpenAI那个每月200美元、还闭源的Deep Research。更让人惊讶的是,从立项到发布,整个团队只用了24小时。开源社区这闪电般的速度,正在实实在在地改写AI工具的生态版图。

开源特攻队的极限时速

事情是这样的。OpenAI前天刚发布了Deep Research——一个能自动爬遍全网、生成研究报告的智能体。能力确实很强,但门槛也真不低:每月200美元的订阅费,外加完全闭源的模式。

HuggingFace实验室的科学家们一看,直接拍板:“24小时之内,我们要用开源的方式复刻这个产品!”

这个听起来有点疯狂的计划,最终演变成了一场争分夺秒的极限开发:

  • 凌晨2点,完成基础架构设计
  • 早上7点,成功接入OpenAI的o1模型
  • 下午3点,攻克了网页自主滚动的技术难题
  • 晚间9点,实现文件动态解析模块

在GAIA基准测试中,这个仓促上阵的项目竟然交出了相当亮眼的成绩单:

  • OpenAI的Deep Research:67.36%
  • HuggingFace的开源版本:54%
  • 作为对照的普通GPT-4(不带Agent能力):仅7%

解剖这只“开源猎豹”

项目是完全开源的,代码托管在GitHub上:https://github.com/huggingface/smolagents/tree/gaia-submission-r1/examples/open_deep_research

它的内核用到了HuggingFace自家的CodeAgent。相比输出一堆冗长的JSON,用代码来控制模型显然更顺畅。

第一版的设计思路很有特点:使用纯文本浏览器,绕开渲染开销;页面元素会被自动转成Markdown格式。同时配备了一个解析器,能自动读取文本,支持PDF、CSV、JSON等格式的自动转换,连数学引擎都能处理复杂的公式推导。记忆模块还保留了跨会话的上下文信息。

很多人会好奇,模型为什么选择了o1,而不是更快更便宜的o3-mini?官方给出的回应很直接:“o3-mini确实很快,但在困难任务上的表现,不如o1和GPT-4o。我们觉着模型太小了,能力还不够。”至于有没有试过Deepseek R1?官方也坦诚地回答:“试过了,但效果不如o1。这倒不是模型本身能力不行,更多是它对框架的指南不太适应。所以我们正在考虑通过微调来解决这个问题。”

最后,官方博客里还有一句让人印象深刻的调侃:“o1模型的API调用费,已经超过了实验室的咖啡预算。但我们需要证明,开源框架的天花板到底在哪里。”

来源:https://www.53ai.com/news/OpenSourceLLM/2025020584902.html

相关热点

继续查看同栏目近期热点。

延伸阅读

补充最近整理过的热点入口。