汗青:也不太一样。AI的出现,是之前产业结构里不太可能出现的一个范式。与MCN相比,我们更侧重于围绕艺人生成内容,不只是经营形象,我更看重叙事本身。我是80后,那个年代一个偶像出来——比如姜文拍了电影,王菲唱了首歌——背后一定有一个叙事。我感兴趣的是能否真的做出一个数字人格,背后有相应的内容去支撑。
凤凰网科技:AI创作的歌曲,与流行的“抖音神曲”是一回事吗?
汗青:大模型生成的内容,理论上会更谄媚人的听觉——它的一部分逻辑就是如何让你更爱听,这是客观现实。再加上所有模型都建立在数据基础之上,流行歌曲的占比肯定高。但这并不是说AI写不出不流行的东西。实际上,AI写出过一些我觉得挺好听、但可能拿出去没流量的作品。我们很快也会上线一些不那么“流行味”的歌曲,或许是一些纯音乐。
凤凰网科技:现在短剧这么火,你们为什么不考虑做?
汗青:拿AI做短剧,图什么?一方面AI可能会吸引眼球,但现在可能也没那么新鲜了。和行业里很多前辈聊过,大家更感兴趣的是降低成本。今天拍一部短剧,说实话花不了太多钱——60到100万左右,还有更便宜的。当你想做一个100到120分钟的AI短剧,又想保证质量,我不确定能比这个便宜很多。便宜很多,质量可能就相当堪忧了。过去两年没做,是因为商业上这笔账算不回来。短剧不像电影和音乐,它建立在ROI逻辑之上,更像产品,而不是作品。我经常开玩笑说,AI在中国普及的一个阻力,是人工成本比较便宜。去横店参加影视节时,有个做短剧的朋友在演讲,结束后过来两个小姑娘,说“导演我们就想拍剧,不要钱”,我当时就觉得:难啊……短剧当然是一桩好生意,我们也不排斥去做,但必须很理性。至少过去两年,用AI做短剧这件事我们非常慎重。短剧是很结构化的东西,有很多值得尊重的方法和经验,但我不觉得我们团队懂这个市场。没必要非去碰自己没有优势的地方。我们下半年也会推出影视内容,但一定得有自己独特的东西,有AI的鲜明特点。
03
“不像真人才有价值,AI美学为何不能成为一种风格”
凤凰网科技:前些日子你在一席演讲,标题是“AI不会杀死创作,但会杀死平庸”。但大模型训练后呈现的是更平均的能力,生产出的内容会有创新性突破吗?
汗青:这个问题问得很好。复杂之处在于,你不能让AI负责所有事情。如果完全交给它,也许就会出现你说的那种情况。AI本身是一个工具,当然这个工具的进化速度非常惊人——我们还没上线的那些剧本,有些已经相当令人震撼了。我们不是让它仅仅做生产,而是把它当作放大器和杠杆。正因为不像真人,才更有趣。我们做的东西不是想让观众真假难辨,那意义不大——到头来无非是个假的真人。今天互联网上有那么多真人可以关注,各有各的性格。如果能做出一个非常好玩的东西,恰好是真人不会这样思考的,那才有趣味性。
凤凰网科技:有人说Yuri的长相比较韩范,风格也是女团风。所谓AI创新的基调是否仍然基于当下真实世界已有的模板?
汗青:我们主要做东亚市场,肯定不会做一张让人感觉陌生的脸。今天让模型画出各种各样的人理论上都能实现。有人跟我说,一听Yuri这首歌就知道是AI写的。我一开始有点担心——我们自己觉得已经可以当正常歌曲来听了——问他为什么?他说,歌词都在讲硅基和碳基啊。我松了一口气——歌词是我们自己写的,真正的AI参与反而是在旋律、编曲和演唱这些不那么“表象”的环节上。
未来可能会出现一种新的AI美学,类似于二次元。二次元的人都是假的,你会发现当二次元真人化时,大众反而很反感——二次元真人化的电影基本上都失败了。今天AI还没有到成熟阶段,但到了某个阶段之后,为什么一定要去掉AI的味道?为什么AI味本身不能变成一种风格或滤镜?就像今天大家喜欢用徕卡相机拍出胶片感的照片——胶片当年本身就是技术缺陷,显影技术做不到高度还原,颜色偏灰偏绿,但今天胶片风已经成了一种美学风格。动漫也一样,有很多种风格,有偏写实的,有偏卡哇伊的。AIGC内容未来也会如此。现在不讨喜,是因为它本身有缺陷、不够好。你不能拿一个不够好的东西说这就是我的风格——就像唱歌难听,不能非说走音就是风格。但当技术达到一定程度之后,一定会出现多种风格供你选择。
凤凰网科技:Yuri在国内的接受度其实不如海外,700万播放量里有五六百万来自美国和日本,这是为什么?
汗青:首先是语言门槛——Yuri发布的是英文歌。我们的粉丝大部分在国内,但最初选择英文歌,是希望在创作上最大化模型的能力。从模型生成质量来看,英文目前是最佳选项。另外,我们作为中国品牌形象想去海外拓展,英文是通用语言,全世界都能听懂。我们80万粉丝中大部分还是中文区用户,但体感很明显:国内用户对AI的要求更高。Yuri比较特殊,第一次的流量结构与之前相反了。

图|Yuri首期“出道视频”拿下知名户外品牌赞助
国内的反响也还可以——B站连续两期上了热门,网易云音乐基本上在打榜,视频号和抖音的量也不小。但我第一次意识到,全球是一个更大的市场,尤其是日本,对虚拟偶像文化的接受度更高。语言确实是传播的阻碍。所以后来上线自述采访视频时,考虑到北面(The North Face)要面向中国市场,就用了中文配音。
有人说AI是一个特别少见的新生事物,在它还没彻底进入全民生活之前,大家就已经有点厌倦了。和当年移动互联网与互联网那两波浪潮相比——我都是从业者——感受完全不同。不知道为什么,可能短视频和自媒体把信息宣传放大了,大幅压缩在一个时间段上,大家反而有些反感?
凤凰网科技:可能和前两波浪潮不一样的是,那个阶段大家明显能感觉到从PC端到移动端,对生活有帮助,自己是受益方。但现在AI给人的感觉是来抢工作的。
汗青:目前来看,AI还没有进入百姓生活刚需的服务层面。AI在某种意义上更像是一种让你生产内容的技术,而不像移动互联网那样让大家在手机上消费内容。这也是乔布斯当年在硅谷受到的一个争议——以前做MacBook,是让人更有创造力地生产内容,但后来影响力更大的iPhone,则是让人消费内容。今天显然不能说我们拿iPhone主要用来办公,更多是刷东西、消费内容、听歌这些娱乐活动。AI的大部分能力集中在生产内容上,但生产本身很难直接影响衣食住行。还有一个大问题是,它似乎会影响到很多人的职业,带来替代危机感。再结合现在的大环境,难免让人敏感。我接触过很多做音乐、美术的朋友,有的有危机感,有的则不屑一顾。但未来AI能产出的东西,不一定比很多专业人士差太多。
04
“所有东西重做一遍,在AI时代是否还能成立?”
凤凰网科技:决定是否上线、成品能否推出来,最终决定权还是只有你一个人?更像是你在借助各项AI工具来完成自己的审美表达?
汗青:有点惭愧,在创作上我们是一家“一言堂”的公司。我的表达欲很强,这基本上是非常个人风格化的东西。
凤凰网科技:你说用AI的能力做IP,最大壁垒在于审美力。但审美很难复制。你和资方聊的时候,应该也会被问到:Yuri是第一个IP,之后的IP矩阵如何考虑?
汗青:我们也在思考质量与效率之间的平衡问题。首先,我们不是技术公司,不可能只有你会用这个技术。如果你用技术能快速生产内容,别人也可以。所以门槛还是在于人——无论是人的审美还是对内容的感受力。做AI这两年,我也在想能不能按传统移动互联网的逻辑来做点事。说实话,今天还是觉得很难。不光是我,身边很多做工具类创业的朋友,也认为太不一样了——彻头彻尾的不一样。
功利地讲,首先流量结构发生了巨大变化。移动互联网和互联网刚出现时,人的注意力市场是高度真空的。互联网刚出来时,大家还在看电视、听广播,到处找东西看——我是85后,小时候找到一本杂志就疯狂地看,因为没东西可看。人的眼睛是饥饿的,在寻找信息消费品。互联网的出现解决了这个问题。移动互联网出现时,原来每天只能看三四个小时剧,现在可以躺在床上刷手机直到睡觉,注意力不断被填满。那是一个人均手机设备从1亿增长到10亿的过程。今天不一样了——我们根本看不过来,技术再怎么增长,人的时间是不变的。这是第一个问题。
今天想做新东西,人的迁移成本变得很高,做的本质上都是注意力的存量市场。对独立创业者来说非常难——大部分独立开发者不太可能具备投流优势。移动革命解决的是分发问题,带来了新渠道。但AI不一样,AI是生产的革命。这会导致:今天用AI做的所有东西,还是得在抖音、B站、小红书这些APP上分发。目前没有增量渠道,对创业者来说就非常困难。移动时代搭了一个台子,有各种东西值得重新做一遍。今天的问题是,大模型可能一更新,就直接淹没了许多垂直领域里你能做的事。
凤凰网科技:AI人格这个理念,你会担心变成一种噱头吗?就像上一代数字人那样热度很快过去?
汗青:当然不希望这样。但我也觉得,这个新东西用户能接受多少、未来能否成为流行,都是不确定的。到今天,我都觉得用AI做IP这件事成功率不到一半,甚至更低。我们是一个预期非常低、非常悲观的团队。Yuri发布之后,最近的反馈基本都是正向的,但我觉得还没有真正破圈。说句大家可能不爱听的——AIGC内容到今天为止,我个人的看法是还没有真正破圈。我们最好的节目播放量也就一两千万,真正的破圈应该是走在路上旁边有人讨论、大家都知道的程度。
凤凰网科技:前段时间MIT有个研究,结论是越依赖AI创作,大脑活跃度越下降。你会担心过度依赖吗?
汗青:我特别反对用AI做读书摘要、文章总结,总觉得有点偷懒,担心到最后大家会变得越来越迟钝。但你能不能把AI本身当作一本书来读?有问题就去跟它聊,这种依赖是良性的——就像老师或朋友,对话是一种很能激发思考的模式。看书其实也是一种对话,它不会影响深度思考和表达,反而会拓宽你的视野。
