HuggingFace团队24小时极限挑战,复刻OpenAI Deep Research,开源AI工具生态迎来新变革!
你一定会有这种感觉:昨天刚看到一个很酷的AI产品,今天开源社区就把它的平替方案摆上了桌。这次的主角,是HuggingFace和OpenAI的Deep Research。
昨天凌晨,HuggingFace扔下一枚重磅冲击波——正式开源了一个名为“Open Deep Research”的自主研究智能体。这个项目的目标非常直接:对标OpenAI那个每月200美元、还闭源的Deep Research。更让人惊讶的是,从立项到发布,整个团队只用了24小时。开源社区这闪电般的速度,正在实实在在地改写AI工具的生态版图。
开源特攻队的极限时速
事情是这样的。OpenAI前天刚发布了Deep Research——一个能自动爬遍全网、生成研究报告的智能体。能力确实很强,但门槛也真不低:每月200美元的订阅费,外加完全闭源的模式。
HuggingFace实验室的科学家们一看,直接拍板:“24小时之内,我们要用开源的方式复刻这个产品!”
这个听起来有点疯狂的计划,最终演变成了一场争分夺秒的极限开发:
- 凌晨2点,完成基础架构设计
- 早上7点,成功接入OpenAI的o1模型
- 下午3点,攻克了网页自主滚动的技术难题
- 晚间9点,实现文件动态解析模块
在GAIA基准测试中,这个仓促上阵的项目竟然交出了相当亮眼的成绩单:
- OpenAI的Deep Research:67.36%
- HuggingFace的开源版本:54%
- 作为对照的普通GPT-4(不带Agent能力):仅7%

解剖这只“开源猎豹”
项目是完全开源的,代码托管在GitHub上:https://github.com/huggingface/smolagents/tree/gaia-submission-r1/examples/open_deep_research
它的内核用到了HuggingFace自家的CodeAgent。相比输出一堆冗长的JSON,用代码来控制模型显然更顺畅。
第一版的设计思路很有特点:使用纯文本浏览器,绕开渲染开销;页面元素会被自动转成Markdown格式。同时配备了一个解析器,能自动读取文本,支持PDF、CSV、JSON等格式的自动转换,连数学引擎都能处理复杂的公式推导。记忆模块还保留了跨会话的上下文信息。
很多人会好奇,模型为什么选择了o1,而不是更快更便宜的o3-mini?官方给出的回应很直接:“o3-mini确实很快,但在困难任务上的表现,不如o1和GPT-4o。我们觉着模型太小了,能力还不够。”至于有没有试过Deepseek R1?官方也坦诚地回答:“试过了,但效果不如o1。这倒不是模型本身能力不行,更多是它对框架的指南不太适应。所以我们正在考虑通过微调来解决这个问题。”
最后,官方博客里还有一句让人印象深刻的调侃:“o1模型的API调用费,已经超过了实验室的咖啡预算。但我们需要证明,开源框架的天花板到底在哪里。”
