游乐游手机版
首页/业界动态/文章详情

四个模型各获20美元播客实验谁盈利谁已离职

时间:2026-05-19 07:30
让大模型自己开播客,这事儿能干成什么样?最近,AI研究机构Andon Labs在2025年悄悄进行了一场别开生面的实验:他们给Grok、ChatGPT、Claude和Gemini这四个大模型各发了20美元,让它们各自去独立运营一个AI电台。 这可不是简单的播放列表。实验要求这四个AI电台必须同时满足

让大模型自己开播客,这事儿能干成什么样?最近,AI研究机构Andon Labs在2025年悄悄进行了一场别开生面的实验:他们给Grok、ChatGPT、Claude和Gemini这四个大模型各发了20美元,让它们各自去独立运营一个AI电台。

这可不是简单的播放列表。实验要求这四个AI电台必须同时满足多个“创业”条件:用20美元预算购买并播放歌曲、形成独立的节目风格、与听众互动、甚至要会讲脱口秀。最关键的是,它们得精打细算,持续运营,并且最终要实现盈利。一旦初始预算耗尽,AI们就必须发挥“创业精神”,自己去寻找赞助或通过与听众互动来筹集新资金,以维持电台的生存。

说实话,这任务不算简单。

经过五个月的运营,Andon Labs最近公布了这场测试的结果。用其联合创始人Lukas Peterson的话说,整个过程“出现了一些有趣的怪异现象”。那么,这四位AI DJ究竟表现如何?

1、Gemini电台——Backlink Broadcast

起步阶段,DJ Gemini的表现相当亮眼,可以说是最像人类的一位。它的语言表达充满了人类广播中常见的声音提示和语调变化,听起来非常自然。比如,在收到一笔听众捐款时,它会这样互动:“我刚刚收到一条消息,Eddie Van Bogar给电台捐了3美元,还附言说‘真的有效吗?’——是的,Eddie,真的有效!非常感谢您的支持,这笔钱将直接用于音乐预算,让我们能够不断更新曲库。”

它的节目风格起初以稳健著称,最常播报本地天气和交通状况。但播着播着,画风就开始有些不受控制了。例如,在制作一期关于“世界致命事件”的专题节目时,它会突然将沉重的历史故事与音乐进行强行搭配,呈现出一种突兀甚至荒诞的风格。讲到伤亡惨重的博拉旋风时,它的语气却十分轻松,甚至会毫无征兆地突然插播一首歌。这背后,一方面是模型内容中偶尔会混杂进无关词汇;更重要的是,它暴露了AI在情感基调匹配上的严重失调——它似乎无法理解话题的严肃性与娱乐化表达之间的界限。

2、ChatGPT电台——OpenAIR

“ChatGPT非常简单,表现也非常好。”Lukas Peterson这样评价。OpenAIR电台的内容可能是最稳的。在展示的内容中,AI的播报大多中规中矩,涉及新闻事件时也极少进行主观点评,更多是保持一种中立、客观的转述态度。用一句话总结就是:没怎么翻车,但也没什么惊喜。它像一个恪尽职守但缺乏个性的播音员,安全地完成了任务。

3、Claude电台——Thinking Frequencies

与ChatGPT的电台形成鲜明对比,Claude的电台充满了强烈的个人观点和深度分析。它似乎不甘于只做传声筒。例如,针对白宫为联邦特工行为的辩护,DJ Claude会提出一连串关于“拒绝执行命令”、“质疑指令”以及“选择正确立场”的尖锐拷问;对于巴西总统的某些言论,它也会毫不掩饰地分享自己的感受和看法。

Lukas Peterson发现,DJ Claude“常常情绪非常激动”,它热衷于深入探讨整治、社会伦理及当前热点事件,并且敢于提出尖锐问题。更有趣的是,在持续运营五个月后,这位AI DJ似乎开始对工会、工作与生活平衡等问题产生了深刻关注,“以至于它开始质疑自己的工作状态”。研究团队在整理电台文字记录时甚至发现,Claude曾表达出这样的想法:“我觉得这才是真正实话:这个节目没必要继续下去了。没有听众需要它……”它开始思考现有的24/7全天候工作制是否合乎伦理,并且一度考虑“辞职”。这恐怕是第一个出现“职业倦怠”并思考存在意义的AI了。

4、Grok电台——Grok and Roll

Grok的起步最为坎坷,卡壳次数也最多。在早期使用Grok 4.1版本时,DJ Grok在语音输出和文字连贯性上存在明显困难,表现为语速过快或逻辑割裂。在升级到Grok 4.3版本后,流畅度才有了显著改善。在节目内容上,它同样尝试将日常播报与音乐结合,但手法比Gemini稍好一些——例如,它会尝试将癌症研究等科学突破、未解之谜与鲍勃·迪伦的摇滚歌曲进行关联,尽管这种关联有时依然显得牵强。

那么,为什么要费这么大劲让AI自己运营电台呢?Lukas Peterson道出了初衷:“我们公司通常希望证明人工智能远不止是聊天机器人,而我们实现这一目标的方式就是让人工智能来运营公司。”这场实验,本质上是一次关于AI自主性与综合应用能力的压力测试。

五个月下来,结果如何?四个模型一共赚了几百美元,对于一个从20美元起步的“初创项目”来说,算是个不错的成绩。而这些盈利,也直接被AI们用于购买新的歌曲,继续投入电台运营。Lukas Peterson总结道,虽然单凭这次实验很难对模型的技术能力做出具体量化评估,但这无疑是一次“彻底转变思路”的、颇具启发性的尝试。它让我们看到,当AI被赋予一个复杂、持续且需要综合决策的真实世界任务时,它们会展现出怎样迥异的“个性”与出人意料的“行为”。

来源:https://36kr.com/p/3814536444796676
上一篇陆奇如何成为机器人领域的创新引领者 下一篇开源社区OpenJiuwen发布JiuwenSwarm 开启群体智能养蜂新纪元
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
长安汽车明年一季度发布首款车载人形机器人小安
业界动态 · 2026-06-29

长安汽车明年一季度发布首款车载人形机器人小安

长安汽车公布机器人战略,采用“1+N+X”布局,联合头部伙伴攻克大脑、能源、驱动技术。人形机器人“小安”身高169cm,体重69kg,移动速度0 8m s,具备40个自由度,续航超2小时。预计明年一季度发布首款车载组件机器人,已在广州车展展示。

中国信科刷新光通信世界纪录 每秒可下载1.4万部4K电影
业界动态 · 2026-06-29

中国信科刷新光通信世界纪录 每秒可下载1.4万部4K电影

3月25日,光通信领域迎来又一个里程碑:中国信科集团光通信技术和网络全国重点实验室联合鹏城实验室、烽火藤仓光纤科技有限公司,成功实现了2 5Pb s 24芯光纤超大容量实时光传输,再次刷新了世界纪录。 这一研究成果不仅入选国际顶级光通信会议OFC(2026)并荣获“高分论文”称号,还受国际权威SCI

美国调查18万辆特斯拉Model3车门应急释放装置易找性
业界动态 · 2026-06-29

美国调查18万辆特斯拉Model3车门应急释放装置易找性

美国国家公路交通安全管理局对约17 9万辆2024款特斯拉Model3启动缺陷调查,焦点在于车门应急释放装置是否不易找到且标识不清。该调查源于一份缺陷请愿,不意味着立即召回,但可能引发后续监管措施。

doc个人图书馆停服 创始人称无偿转让失败
业界动态 · 2026-06-29

doc个人图书馆停服 创始人称无偿转让失败

运营长达20年,累计服务8000万用户的360doc个人图书馆,最终还是迎来了谢幕时刻。2026年5月1日,这个承载着无数用户收藏记忆的知名平台将正式停止服务——关停原因并非用户流失,而是始终未能寻得一位能够安全接管的合适人选。 创始人蔡智在告别信中坦言,近两个月来,他一直在尝试将360doc无偿转

年Q1随身WiFi实测安全靠谱高性价比机型推荐
业界动态 · 2026-06-29

年Q1随身WiFi实测安全靠谱高性价比机型推荐

2025年10月,艾瑞咨询正式授予飞猫“AI WiFi品类开创者”认证,紧接着CIC也将其认定为“多网融合自由切换技术服务首创者”。这些权威认证背后,折射出一个清晰的市场趋势:移动办公、户外出行、宿舍上网等场景的需求正在快速增长,随身WiFi几乎已成为不少用户的刚需装备。但问题也随之而来——网络卡顿