当AI学会使用工具,人类只需指挥AI
2023年初,阿里巴巴智能信息事业群总裁吴嘉发现了一个棘手的问题:随着夸克用户量激增,用户需求变得越来越复杂多样。学生与职场人士尝试借助大模型撰写文章,但当时模型能力有限,AI直接生成的作文、报告根本无法达到合格标准。团队不得不手动为模型提炼工作流程,强制模型按照“大纲—资料检索—写作”的顺序与用户逐步交互。“非常痛苦,我们只能一个个抽象出工作流,但这种场景永远无穷无尽。”吴嘉坦言。
一年多后,深度思考等AI技术浪潮席卷而来,产品需求与技术实现之间的鸿沟终于被填平。面对千变万化的任务场景,夸克交出了一份答卷——3月13日,阿里正式推出AI旗舰应用“新夸克”。本次升级主打“超级框”,一个超越传统搜索形态的创新尝试。吴嘉称之为“彻底摒弃传统搜索的理念”。这个“超级框”既非聊天机器人,也非搜索引擎,而是一个希望直接交付结果的“超级Agent”——你在框中表达意图,AI会调用一切可用的工具和方法,直接帮你完成工作报告、旅行计划,或是一份就医指南。
人、工具(AI)、任务——夸克试图重塑这三者的关系。吴嘉的核心理念是:“AI使用工具,而人,使用AI。”“很多人说在AI时代把所有产品重新做一遍,其实真正内涵是,为了让AI更好地使用工具,要把这些工具重做一遍。”他打了个比方:以前的AI Agent更多是模仿人类,先打开浏览器,输入文字,一个个搜索;但如果重做工具,“浏览器”的界面都可以不存在,直接调用API,AI可以同时使用搜索引擎、文档等多个工具。“超级框”整合了夸克的多个AI“原子能力”——AI搜索、AI浏览器、AI写作、AI讲题、AI PPT、AI健康助手、多端协同工具等,都内化为超级框的能力。未来,“超级框”也会成为一个超级入口,与阿里体系内更多业务联动,形成开放生态。
“超级框”发布后在C端用户中引发巨大反响,也激发了更多行业讨论。一方面,这意味着阿里在To C产品中终于重注一子,是这家巨头AI战略的重要版图;另一方面,“超级框”承载了更符合未来演进方向的全新AI产品形态。知名投资人、金沙江创投董事总经理朱啸虎近期接受采访时提到:“夸克迭代速度很快,而且非常务实。夸克一出来的时候,我就一直关注,这个是阿里里面的一股年轻力量。我觉得阿里拿夸克作为C端的一个突破口,是一个非常好的布局。”
这种反差感也来自此前的低调。自上线以来,夸克几乎没有做过大面积宣传。直到被升级成为阿里AI To C的战略核心,许多人才发现,这已经是一个用户数超过2亿的产品。据七麦数据,2024年夸克累计下载量超过3.7亿。最新数据显示,夸克月活用户已经超过两亿,并且还在快速增长。
为了适配AI To C的整体战略,相关业务也在近几个月完成了多轮组织调整。2024年,天猫精灵所属的智能互联事业群由吴嘉统管,通义C端产品融合进夸克所在的智能信息事业群。作为阿里“85后”少壮派高管,吴嘉2010年从浙江大学毕业后通过校招进入阿里,十五年内先后经历阿里云搜索产品、UC事业部、智能信息事业群、淘天,再回到集团,如今带队阿里AI To C业务。他在阿里体系内积累了丰富的一线产研经验,拥有带领业务持续成长的战略思维,懂得如何将技术、产品组合成最佳的业务形态。一位接近阿里的人士表示,吴嘉行事果断,敢于砍掉不值得做的业务,也擅长在业务中拿结果。吴嘉所带领的阿里智能信息事业群包括夸克、通义App、UC浏览器、书旗小说、超级汇川等多元业务,智能互联事业群则以天猫精灵为核心产品。在接手UC事业部后,他主导了夸克的早期定位和发展——2018年,在已经杀成红海的搜索市场,夸克凭借极简、快速、干净的产品风格,很快拿下一片天地。
这也是吴嘉首次接受访谈,对外讲述夸克的理念与愿景。以下为对话全文,经36氪整理编辑:
告别传统搜索
36氪:2020年的时候,你就说过:“要敢于面向未来定义智能搜索,不是把老的搜索改造成新的搜索,而是面向未来定义产品。”现在这个“超级框”的产品形态,可能很多用户的第一反应是:这还是个搜索框。你们现在的这个“框”,内涵有什么不同?
吴嘉:我们定义的超级框,你可以理解它是超级智能体与用户交互的界面,搜索只是AI使用的其中一个工具。我们希望未来是“AI使用工具,人使用AI”。超级框的能力边界,远远超越传统搜索。对于“AI搜索”这个概念,行业的认知也都不一样。我们内部讨论的时候,对AI搜索里的“搜索”这个词,永远会打一个双引号,因为它和搜索不是一个物种。
36氪:你们这次有一张海报文案是“告别搜索”,怎么理解?
吴嘉:超级框远不仅是搜索,搜索只是我完成任务的手段,不是目的。用户不需要在意我到底用不用搜索,把“超级框”称为AI搜索,是把这件事说小了。
36氪:我可以理解为,这是更偏工具型的定位吗?
吴嘉:我们倾向于帮用户解决真正的问题,但我不太想把夸克仅仅定义为一个实用的“工具”。没有绝对的闲聊,也没有绝对的实用。中国有非常多的人,大部分人每天都需要在工作场景里深度思考一下吗?不一定,但他会有很多生活化的需求。比如用户会问我们“我的妈妈为什么更爱我的姐姐?”这类问题,用户既需要情感上的安慰,也需要一定的建议来如何面对。同样,学习工作中也需要一个写PPT的工具。夸克的核心定位还是希望成为一个服务广大用户的有用的AI产品。有用和实用还是有区别的,我们会旗帜鲜明地跟用户讲:我们就是你的生活工作学习的全能助手,而且可以24小时不停歇、不会累、不会抱怨。
36氪:大家都在做助手,你们在产品上的差异化是什么?
吴嘉:夸克是一个天然超级智能体,给用户提供服务的方式就是超级框。领先的模型PLAN和正确选择工具与参考资料的能力,加上这么多年积累下来的全面的内容和工具——搜索、浏览器、网盘、扫描、拍题等——并且这些工具经历了多年大规模真实用户需求的校验和优化,这些都是我们的巨大优势。夸克就是一个超级入口。比如今天我要做学术报告、写行业分析,我有非常多的资料存在网盘里,我就可以跟超级框说“调取使用这些素材”,其他产品做不到这点。
36氪:用一句话或者几个关键词,你会给“超级框”打什么标签?
吴嘉:一是Smart(聪明),二是专业,三是万能。
36氪:你刚提到“万能”,这等于通用吗?
吴嘉:我觉得是能做非常多的事情,实现“All in One”,所有需求都能在这个框里执行、解决。万能在AI时代是非常重要的特质。我们希望这个框能服务的人群是普惠的。我说的“万能”,不仅仅是能写学术报告——学术报告只有少数人会用到,它也可以做旅行计划——是每个人都可以用的工具。
36氪:“超级框”这个形态,目前还是以文字输入为主的框,未来会改变吗?
吴嘉:会变。用户以后只需要发起指令就行了,我们可以处理多模态的任务。站在用户的角度,就是“不好描述的就拍照,不好打字的就语音”,用户的输入方式可以多样,我们背后要有能处理多模态数据的能力。
36氪:极端地说,它最后会“杀死”搜索吗?
吴嘉:我觉得不会。传统的搜索会是超级框的一部分,总有一些场景是非常直接的,短搜索就能满足。搜淘宝你总得给我上淘宝,搜天气,要给我天气情况,这些需求不用多么深度思考。但是传统搜索引擎的那种模式确实不太需要了,这些需求会被超级框的形态承接过来。
如何打造超级框
36氪:你们这次主打的“超级框”,为了做到这种“All in One”的能力,需要做多大的改变?
吴嘉:很多产品都要用AI重新做一遍。这句话其实很多人都在说,但我们所理解的真正内涵是:很多产品,为了让AI更好地使用它们,我们要把这些产品重做一遍。将来的使用场景,会是人用AI,AI用工具。所以对于夸克而言,用一个超级框,链接夸克内部的所有工具能力、合作伙伴提供的服务,来聪明、专业地解决各种用户的需求,这就是我们要实现的超级框。
36氪:基于“让AI去用工具”去重构,而不是模仿人的操作。这个思路是怎么形成的?
吴嘉:首先,现在模型的能力很强大,它可以自主规划,并且在执行过程中反思迭代来实现正确的结果,这使得之前开发工作流无法覆盖所有场景的问题得到了完全的解决。2023年初的时候,我们已经发现夸克上有大量复杂需求,比如长文写作。但那时大模型能力还比较弱,我们就把工作流抽象出来,强制让模型先写大纲,给用户看。用户看到大纲后需要检索资料,检索完成后,我们再让模型根据材料重写内容。我们还专门为用户做了素材库。用户对这个场景反馈非常好,他们觉得太棒了,不仅能看到写作成果,还能了解写作思路。但这个工作流设计是很痛苦的,当时我们只能做一些基本的工作流,无法穷尽所有可能的场景。但模型能力上来之后,模型会自己规划,自己给出思路,然后自己去执行,这是完全不同量级的体验。其次,随着超级框成为超级入口,各个工具和应用会主动适配超级框,从而形成和超级框如何交互的标准和商业模式。
36氪:你觉得真正的Agent需要达到哪些标准?
吴嘉:逻辑推理的能力、端到端的实时交互能力、还有记忆能力,比如长记忆和短记忆都要有,能结合起来。最近,我们在超级框上了深度思考的能力,有一定突破。下一步,就是把多模态能力与深度思考结合,超级框就可以执行更复杂的任务。
如何完成阿里AI使命
36氪:有什么短期目标吗?
吴嘉:今年还是以用户体验为主,夸克还是要给用户创造足够厚的价值。
36氪:我在使用夸克识图功能时,会跳转到电商页面。你在做产品的时候,会需要考虑如何与阿里集团的业务打通/联动吗?
吴嘉:“超级框”背后会连接各种服务,这是集团一个很重要的优势。我们说夸克是一个超级Agent,AI可以利用夸克各种原子能力,来实现用户广泛场景的需求,集团的服务也是一类原子能力。
36氪:从阿里集团的层面来说,对夸克这款AI产品的期待是什么?
吴嘉:集团一直以来对夸克的要求,是实现更大的用户价值,其他都是水到渠成。我们的目标始终是成为AI时代体验领先的“超级入口”,让夸克通过“AI超级框”重构人与信息和任务的交互方式,成为覆盖工作、学习、生活的“全能助手”。这一入口不仅整合落地通义系列大模型的最新能力,更要成为阿里在AI时代的C端标杆,让AI作为“无处不在的服务”,在用户侧落地。
