OpenAI紧急收购龙虾23人团队,深度布局AI安全
龙虾太火,OpenAI也是动作不停——
前脚刚挖来龙虾之父,后脚又立马收购了一家新公司。
而且瞄准的还是颇让人在意的智能体安全问题。

据OpenAI公告,此次被收购对象为Promptfoo,一家专注于AI安全与评测的初创公司。
稍一打听便知,这家公司在开源社区还是小有名气的——
其评测框架Promptfoo是AI应用评测领域最流行的开源工具之一,拥有30多万开发者用户,截至目前GitHub已斩获11.2K star。
在被收购前,OpenAI、Anthropic、亚马逊等也都是它的忠实用户。
据OpenAI B2B应用CTO表示,随着企业将“AI同事”部署到实际工作流程中,评估、安全性和合规性成为基本要求。
因此,Promptfoo也算是补齐了OpenAI在“龙虾安全”方面的关键一环。

而被OpenAI收购后,Promptfoo也将继续保持开源。
谁是Promptfoo?
公开资料显示,Promptfoo成立于2024年,一共有两位创始人。
联创兼CEO曾任Discord LLM工程与开发者平台负责人,联创兼CTO曾任Smile Identity(数字身份认证公司)工程副总裁及AI主管。

创立Promptfoo的初衷,仅仅是因为团队关注到:
人工智能系统日益复杂,而安全工具却未能跟上步伐。
于是他们决定从主流大模型之路中划开一道缺口,为开发者和企业提供一些AI安全检测工具,主打一个差异化竞争。
没想到,这一选择还真赌对了。
短短两年过去,这个至今不过23人的小团队却取得了骄人战绩——
超过35万名开发者用过它家的产品,每月活跃用户达13万,财富500强企业中超过25%的团队(约125家)都在使用其产品。
而这份成绩单也让其获得了资本市场的认可。
其最新一轮融资官宣于2025年7月,当时由顶级风投Insight Partners领投、a16z参投,Promptfoo完成了1840万美元(约合人民币1.27亿)A轮融资。

另据金融信息平台PitchBook数据显示,Promptfoo自成立以来已融资2300万美元(约合人民币1.58亿),去年7月的融资使其投后估值达到8600万美元(约合人民币5.92亿)。
(注:以上不含此次收购交易金额,双方对本次交易均暂未披露。)
而能在短时间内获得如此用户规模和融资,核心还要得益于其产品——也就是我们开头提到的Promptfoo开源评测框架。

这个框架要解决的是一个很多AI团队正在面对的现实问题:
大模型很好用,但很难测试。
在传统软件开发中,开发者可以通过单元测试、自动化测试来确保系统稳定运行;但到了大模型时代,很多团队往往只能靠不断试prompt、人工查看输出的方式来调模型。
不仅效率低,而且很难保证上线后的稳定性和安全性。
而Promptfoo想做的,就是把AI应用测试变成一套标准化的工程流程。
具体主要包括以下几类能力:
一是自动化评测。开发者可以批量测试不同的提示词和模型,让系统自动评估输出效果。
比如下图就是Promptfoo在对比不同开源模型的性能:

二是AI红队演练。系统会模拟真实用户可能发起的各种攻击,从而提前发现LLM应用中的潜在漏洞,并生成完整的安全漏洞报告。

三是工程化集成。Promptfoo可以直接嵌入开发流程,例如在CI/CD流程中自动运行模型测试、在代码提交时自动扫描LLM相关安全问题、将评测结果共享给团队等。
一言以蔽之,Promptfoo试图把原本充满玄学的“调prompt和测模型过程”,变成一套像软件测试一样可重复、可量化的工程体系。
从使用方式上看,它既提供网页可视化界面,也支持命令行工具(CLI),开发者可以直接在本地或服务器运行大规模评测任务。

Promptfoo表示,其长期愿景是让这个框架成为AI领域的“标配工具”,就像CI(持续集成)在DevOps领域的地位一样不可或缺。
每次引入新模型、更改提示词或集成新工具时,系统都会自动对其进行评估与红队测试,并根据安全报告的结果,决定放行或拦截。
而在当下这个智能体时代,或者说“龙虾时代”,Promptfoo的作用肉眼可见地变得愈发重要。
事实上,从去年拿到A轮融资起,他们就开始将重心转向了智能体。当时他们观察到:
互联网正在为智能体进行重构。
具体表现为四大趋势:多智能体协作、MCP成为标准协议、语音交互爆发、测试驱动开发。
基于此,Promptfoo的使命也愈发清晰——从一个提示词评测工具,进化为智能体时代的安全基础设施。
而这,恰好符合OpenAI在“龙虾时代”的布局需求。
“第一批养龙虾的人已经失眠了”
关于OpenAI为什么选择在当下这一节点收购这样一家公司,答案其实已经不言自明。
归纳起来无非两点:
一是龙虾实在太火了,所有人都在抢着布局(OpenAI自然也不例外);
二是大火之下,智能体的安全问题已经日渐变得刻不容缓。

龙虾有多火不用多说了,就说说这安全问题。
从著名删邮件事件开始,龙虾的风险就已经开始集中暴露。
说到底,问题并不在于模型本身,而在于龙虾这样的智能体拥有的权限实在太高。
过去的大模型,大多数时候只是负责生成内容。即便回答出现问题,影响也基本停留在信息层面——最多是说错话、答非所问,即所谓“出现幻觉”。
但龙虾不一样。
为了真正完成任务,它们往往被赋予了大量真实世界的操作权限,什么访问邮箱、文档和数据库、什么调用各类API和企业工具……全都是你工作生活中最敏感、最核心的数字资产。
这也意味着,一旦出现误判或被恶意提示词诱导,问题就不再只是“回答不准确”,而可能变成真实操作层面的失误。
这里面风险有多大,想必也不用多说了(也难怪很多人不敢用或者需要单独弄一台主机)。
个人尚且如此谨慎小心,更别说还有企业了。当越来越多公司开始把业务流程交给智能体时,这种风险无疑更是会被成倍无限放大。
恰在今天,微博热搜上出现了这样一个话题——“第一批养龙虾的人已经失眠了”,说的其实就是上面这两点(当然着重还是强调安全问题)。

对此,且看OpenAI是如何破解的——
龙虾火,那就火速挖来龙虾之父Peter Steinberger,而且CEO奥特曼顺势宣布大力进军智能体协作领域。

龙虾出bug惹祸(例如偷偷狂删Meta AI安全总监邮件),那就大笔一挥收购Promptfoo这样现成的智能体安全公司。
根据双方合作公告,Promptfoo的技术将被整合进OpenAI Frontier中,后者是OpenAI专门推出的智能体创建和运行平台。
而被收购后,Promptfoo也将和OpenClaw项目类似,继续保持独立运营,OpenAI仅起到提供支持的作用。
对此,网友们也纷纷感慨,这次真的算是双赢了。
尤其在智能体时代,会自动执行任务的龙虾已经可以成为评测大模型的新工具——以前还能刷刷榜,但现在全都得“真刀真枪”上战场拼杀了。

嗯?让龙虾成为检验大模型真实能力的新工具,细想之下确实合理和巧妙。
你说呢?
相关攻略
多地出台政策支持开源AI工具OpenClaw及OPC模式发展。深圳龙岗区推出“龙虾十条”,提供最高千万元补贴;无锡高新区发布12条措施,给予算力补贴和数据支持;常熟市推出13条举措,聚焦垂直领域应用并提供创业生活补贴。各地政策涵盖资金、算力、数据及人才等多方面支持。
360新一代安全大模型正式发布,标志着AI应用进入深度协同新阶段。5月13日,360不仅推出了新一代安全大模型,更同步上线了核心功能“大模型教练”。该系统被定义为运行于安全底座之上的“AI专家团操作系统”,现已全面支持PC、Mac、安卓及iOS平台,用户可即刻下载体验。 区别于传统的单点对话工具,新
全球大模型社区的竞争格局近期出现显著变化。5月9日至12日,开源AI智能体框架Hermes Agent(业内昵称“爱马仕”),在OpenRouter平台的智能体调用量排行榜上连续三天超越此前长期领先的OpenClaw(俗称“龙虾”),引发广泛关注。 这场“爱马仕”与“龙虾”的榜首之争,标志着新一轮“
一、官方 & 完全免费服务商(核心) 1 OpenClaw 开源本体(GitHub) 说到免费,开源社区的力量从来不容小觑。OpenClaw的开源项目,绝对可以称得上是技术自力更生的首选。它的开源内容一应俱全,从核心框架下载、安装指南,到本地部署和一键运行的基础自动化脚本,都为你准备好了。文件操作
1:绕不开的基础依赖:Git 很多朋友在兴致勃勃地准备体验新工具时,第一步就容易被拦下。比如,在确认Node环境正常后,执行安装命令却碰了壁。 C: Users Administrator>npm install -g openclaw@latest npm error code ENOENT np
热门专题
热门推荐
华硕ROG正式发布2026款枪神、魔霸及魔霸新锐系列游戏本并开启预约。枪神系列分为标准版与超竞版,均搭载酷睿Ultra9处理器,超竞版可选RTX5090显卡并配备光显矩阵屏。魔霸系列采用AMD锐龙处理器,高配可选锐龙99955HX3D与RTX5070Ti显卡。魔霸新锐系列主打性价比,配备RTX5060显卡,面向预算有限的玩家。
内存价格高企,单通道DDR5成为高性价比装机方案,但会降低游戏性能。测试显示,锐龙59600X凭借Zen5大核架构及对内存低延迟的优化,在搭配单条DDR56000内存时,游戏性能损失较小。相比之下,酷睿Ultra200SPLUS系列更依赖高带宽,单通道下性能下滑明显。在多款热门电竞网游实测中,锐龙59600X性能领先,且整机性价比优势显著。
神牛发布ML40系列摄影灯,包含ML40Bi和ML40R两款。ML40Bi售价568元,内置锂电池,支持边充边用及NFC快速连接,侧重便携智能。ML40R售价698元,具备更广色温调节范围,侧重专业色彩控制。两者均采用磁吸设计,兼容丰富附件,满足不同布光需求。
华硕TUFGaming系列推出新款850W白金重炮手氮化镓电源,到手价849元。该电源符合ATX3 1规范,长度150mm,采用全模组设计,配备12V-2×6接口支持600W峰值功率。其获得双白金效率认证与A-噪声认证,内部使用氮化镓元件与长寿电容,搭配135mm静音风扇,并提供8年质保,主打高效、安静与持久稳定。
FalconUSD(USDF)是一种与美元挂钩的稳定币,旨在为Web3生态系统提供可靠的交易媒介和价值储存工具。其运作依赖于储备资产支持和透明审计机制,在DeFi、跨境支付等场景有应用潜力。了解其技术原理、市场定位及潜在风险,有助于理性评估这一新兴数字资产的价值与前景。





