首页 游戏 软件 资讯 排行榜 专题
首页
科技数码
AI下一步演进方向:迈向“看懂世界”的能力新探

AI下一步演进方向:迈向“看懂世界”的能力新探

热心网友
97
转载
2026-04-01

过去一年,AI在数字世界里几乎无所不能。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

它能写代码、做PPT、整理会议纪要,也能调用工具、操作网页,完成一整套复杂流程。人们逐渐用“Agent”来概括这种能力,并开始期待,它进一步接管更多工作。

但热闹之外,一个更现实的问题开始浮现。

这些能力之所以成立,是因为它们处理的,是一个已经被“整理好”的世界。文本是结构化的,网页是可解析的,数据库是标准化的。AI并不是在理解现实,而是在处理人类已经翻译过的信息。

一旦离开这个环境,问题就变了。

你用手机拍下一张照片,画面清晰、光影准确,甚至可以还原氛围。但手机并不知道,这个人为什么站在这里,也无法理解这张照片背后发生了什么。你用长焦拉近远处的一个身影,细节纤毫毕现,但它依然无法判断,这个人是在赶路,还是在犹豫。

换言之,目前的AI可以处理信息,但还无法理解世界。

在博鳌亚洲论坛2026年年会期间,vivo与多位技术负责人反复谈到同一个问题:如果AI要真正进入物理世界,它需要的第一步,不是更强的算力,而是获得“看懂世界”的能力。

而手机,可能是这件事最现实的起点。

第一财经《总编看博鳌》节目邀请到vivo AI和影像产品负责人,以及商汤科技联合创始人、大晓机器人董事长王晓刚,开启了关于“AI竞速下半场:感知决胜”的对话。

AI为什么还没有真正改变手机?

如果只看技术演进路径,手机本应是AI最先发生质变的终端。它拥有最广泛的用户基础、最完整的使用场景,以及最密集的数据入口,从语音、图像到位置与行为轨迹,几乎覆盖了人与数字世界交互的全部维度。

但现实却是,AI在手机上的表现始终停留在“有用,但不惊艳”的阶段。

“手机上的AI能力是存在的,但这些能力之间是割裂的,用户的交互方式并没有发生根本变化。”在vivo AI副总裁张飞看来,问题并不在于能力是否存在,而在于这些能力并没有形成一个统一的结构,也没有改变用户与设备之间的基本关系。

过去十年,智能手机逐渐固化出一套以应用为中心的使用路径:用户解锁设备、进入App、执行操作,再返回系统。这一模式将功能拆分为无数独立入口,也让用户始终处在“主动操作”的位置。AI的加入,并没有重构这一流程,而只是嵌入其中,成为某些环节的效率工具。

这也是为什么,大多数用户并没有真正感知到“AI时刻”的到来。

在vivo内部,这一问题也被反复思考,它被进一步拆解后,答案逐渐清晰。首先是任务结构的复杂性。与目标单一的系统不同,手机承载的是高度分散且不断切换的任务集合。沟通、娱乐、搜索与决策往往同时发生,并不存在一个统一目标。

“机上的任务是高度多样化、分散且多线程的。”张飞指出,这使得模型不仅要理解指令,还需要在复杂上下文中进行推理与调度,而这一能力直到近期才逐步成熟。

交互方式的滞后也是原因之一。尽管AI已经具备一定理解能力,但用户依然需要通过寻找入口、点击按钮、组织语言来驱动系统运行。

“用户仍然要去找入口、点按钮、发指令,这本质上没有变化。”张飞认为,这意味着人与机器的关系并未发生根本转变,真正的突破应当是由设备主动理解用户,而不是用户不断适应设备。

更深层的问题,则来自数据本身的分布方式。手机中的信息被封装在不同应用之中,每一个App都是一个相对封闭的系统。AI若要跨应用完成复杂任务,就必须打破这种边界,但这又不可避免地触及隐私与平台规则。

在这一背景下,vivo选择将更多智能能力部署在端侧。

“不是把数据带到智能那里,而是把智能带到数据所在的地方。”张飞的这一判断,走的是一种以本地理解为核心的路径,也重新定义了手机在AI时代的角色。AI不再只是应用的容器,而是一个能够整合信息、完成推理的智能中枢。

但即便完成这些调整,手机仍然缺少一项更基础的能力:对现实世界的理解。

这也是AI尚未真正改变手机的根本原因。

AI正在离开手机,走向现实世界

如果把AI的发展划分阶段,它正在经历一次关键的方向转移。

“AI 1.0依赖人工标注,AI 2.0依赖互联网数据,而AI 3.0将进入物理世界。”商汤科技联合创始人、执行董事,大晓机器人董事长王晓刚用这一划分描述了AI的演进路径。在这一框架中,当前的大模型仍然建立在“被数字化信息”的基础之上。

“智能是在与物理环境的交互中产生的。”他说。

这一判断意味着,仅依赖文本与图像训练的模型,虽然能够在表达与生成层面表现出色,但依然无法真正参与现实。它们可以解释世界,却无法行动;可以生成答案,却难以完成任务。

这也是为什么,今天的Agent可以处理复杂文档,却难以完成现实中的简单行为。寻找物品、判断情绪或应对动态环境,这些问题之所以困难,并不在于逻辑复杂,而在于它们发生在一个非结构化的世界之中。空间关系在变化,环境在波动,而力、触觉、摩擦等关键变量难以被标准化描述。

王晓刚以一个具体动作举例:抓起一瓶水。这一过程涉及重量判断、接触方式与角度控制,而这些因素在不同情境中不断变化。对于当前模型而言,这类信息几乎不存在于训练数据中。

在这样的背景下,从“理解信息”到“理解世界”,成为AI必须跨越的一道鸿沟。

它不仅要求AI能够理解物理规律,还需要具备对环境变化的预测能力,以及在不确定条件下做出决策的能力。这已经不再是模型规模的简单扩展,而是数据来源与训练方式的根本转变。

“我们需要第一视角的数据。”王晓刚指出,与互联网数据不同,这类数据来自人与环境的真实互动过程,包含连续的行为、空间关系与情境变化。只有在这样的数据基础上,AI才可能逐步建立起对现实的认知。

在这一过程中,手机的重要性开始凸显。它并非算力最强的设备,也不是执行动作的终端,但它是最贴近用户、最频繁参与现实互动的入口。作为一个随身设备,手机持续记录人与世界之间的关系,这使其在新一轮数据范式转移中占据关键位置。

张飞也从另一个角度强调了这一趋势。他认为,AI要进入具身智能阶段,就必须同时理解数字世界与物理世界,而后者是不可回避的基础。“AI真正需要知道的是,你是谁,你在哪里,你在做什么,你周围发生了什么。”

这也解释了为什么,影像能力在这一轮AI演进中,被重新放到核心位置。

影像成为AI理解世界的起点

在过去十年里,手机影像的竞争,本质是“拍得更好”。更高像素、更强防抖、更真实的色彩还原,构成了主要技术路径。但在AI语境下,影像的意义正在发生变化。

“影像是AI进入物理世界的一扇门。”张飞说。

这一判断背后,是影像能力的重新定义。

vivo 影像高级产品规划专家李卓指出,影像的核心价值正在从“记录”转向“获取信息”。随着能力增强,影像系统不再只是服务拍摄需求,而是开始具备对环境的分析能力。

他举了一个已经落地的例子:通过摄像头,系统可以实时识别环境结构,帮助视障人士理解周围空间,包括物体位置与相对关系。这种能力,本质上已经超出了传统影像的范畴。

“相机不再等你按快门,它在打开的一瞬间,就开始理解环境。”李卓的这句话,描述的是影像系统工作方式的改变——从拍摄后的处理,转向拍摄过程中的实时理解。设备开始结合环境信息,对用户行为做出响应,甚至参与到决策之中,从而使相机逐渐从工具转变为协作者。

这种变化,也在具体产品上得到体现。3月30日刚刚发布的vivo X300 Ultra,围绕影像能力进行了系统性升级。该机搭载行业最远的400mm增距镜,并配合专业兔笼等模块化设备,使手机在远距离拍摄与稳定性上进一步接近专业设备水平。

在视频能力方面,vivo X300 Ultra支持全焦段4K 120fps 10bit Log与杜比视界录制,并在防抖、对焦与高像素成像之间实现协同,形成更完整的动态影像体系。同时,其专业摄影机模式与视频调色能力,将拍摄与后期流程进一步整合,使移动设备逐步具备接近专业创作工具的工作方式。

这些能力的意义,并不仅仅在于“拍得更好”,而在于让影像系统能够捕捉更完整的环境信息。从空间结构到动态变化,再到声音采集(如“四麦收音系统”对环境声的处理),手机正在形成一个多维感知入口,为AI提供更丰富的现实数据。

李卓的判断是:“‘身临其境’会从形容词变成能力。”当图像不再只是静态画面,而成为可以被理解、被分析甚至被重建的信息载体时,影像也就成为AI进入现实世界的起点。

而在博鳌亚洲论坛这样的高密度信息场景中,这种能力也开始呈现出更现实的意义。对于媒体而言,报道不再只是记录发言与整理观点,还包括对现场环境、人物状态以及细节变化的捕捉。在这一过程中,手机逐渐从记录工具转变为生产工具。在今年博鳌论坛的现场,也出现了很多媒体使用vivo X300 Ultra及其增距镜、兔笼等拓展套件,跑新闻的场景。

以vivo X300 Ultra为代表的影像能力,使记者可以在复杂光线与远距离场景下完成稳定拍摄,并通过高规格视频与音频记录,直接获取可用于制作的内容素材。从会场发言到场外交流,从宏观场景到细节特写,一部手机即可覆盖大部分采集需求。

这种能力的提升,使移动设备在新闻生产流程中的角色进一步前移,也让“第一现场”的信息获取更加完整与高效。

如果说过去两年的AI,已经完成了对数字世界的重构,那么下一步,它必须进入现实。vivo给出的答案,已足够清晰,因为只有当世界被理解,AI才真正有机会改变它。

来源:https://www.163.com/dy/article/KPE661BH0519DDQ2.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

vivo X300 Ultra发布会专用视频套件,由SmallRig斯莫格与vivo联合研发
科技数码
vivo X300 Ultra发布会专用视频套件,由SmallRig斯莫格与vivo联合研发

蓝鲸新闻4月1日电,日前,vivo举办vivo X300 Ultra发布会,现场共设置13个专业拍摄机位,所有机位均统一搭载vivo X300 Ultra手机与专业视频扩展套件。蓝鲸科技记者从产业链

热心网友
04.01
OPPO K15 Pro测评:旗舰级电竞性能,续航体验是亮点
网络安全
OPPO K15 Pro测评:旗舰级电竞性能,续航体验是亮点

家人们,K系列又出新品了。哦等等,不是你们想的那个红米K系列啦,今儿给大家端上来的这个K是OPPO K15 Pro系列正文开始之前,先给大家来一波省流,放一个配置表给大家过一下。(图源:雷科技,Na

热心网友
04.01
iOS17输入法AI纠错升级:语法错别字一键修正
网络安全
iOS17输入法AI纠错升级:语法错别字一键修正

2026年4月2日,苹果正式向开发者推送了iOS 27预览版系统。在这份厚重的更新日志中,最引人注目的并非界面微调,而是iPhone默认输入法迎来的一次“史诗级”进化。这一次,苹果不再挤牙膏,而是直

热心网友
04.01
揭秘iPod touch 4:微信员工首测的初代开发机细节
网络安全
揭秘iPod touch 4:微信员工首测的初代开发机细节

快科技4月1日消息,微信员工 "客村小蒋 "晒出了当年微信开发第一个版本用的测试机——iPod touch 4。他表示: "可能当年的大家也都没有想到,微信可以到今天的样子,影响了我们很多人沟通的方式 "。

热心网友
04.01
OPPO K15 Pro发布:主动散热设计,颜值性能全在线
网络安全
OPPO K15 Pro发布:主动散热设计,颜值性能全在线

PChome 4月1日消息,OPPO K15Pro系列发布,该系列提供中屏与大屏两款设备,OPPO K15Pro和OPPO K15Pro+两款机型标配主动式风扇散热,有着潮流平整的出色设计感,依旧是

热心网友
04.01

最新APP

火柴人传奇
火柴人传奇
动作冒险 04-01
街球艺术
街球艺术
体育竞技 04-01
飞行员模拟
飞行员模拟
休闲益智 04-01
史莱姆农场
史莱姆农场
休闲益智 04-01
绝区零
绝区零
角色扮演 04-01

热门推荐

汽水音乐网页版访问入口在哪-汽水音乐网页版如何获取访问入口
手机教程
汽水音乐网页版访问入口在哪-汽水音乐网页版如何获取访问入口

在数字时代,聆听音乐的全新窗口 在当下的数字生活中,音乐已经成为不可或缺的精神食粮。对于广大音乐爱好者来说,一个优质、稳定的在线音乐平台,是实现随时放松与享受的关键。汽水音乐网页版的推出,正是这样一个值得关注的音乐平台入口。它通过网页端的便捷访问,为用户提供了一种流畅、舒适且高效的全新听歌体验,让好

热心网友
04.01
Find N6搭载汇顶创新方案 带来全面拉满的使用体验
科技数码
Find N6搭载汇顶创新方案 带来全面拉满的使用体验

OPPO Find N6折叠屏旗舰与OPPO Watch X3智能手表震撼发布,汇顶科技核心技术赋能 3月17日,OPPO正式发布年度重磅新品——OPPO Find N6大折叠屏旗舰手机与新一代安卓旗舰智能手表OPPO Watch X3。作为其长期深度技术合作伙伴,汇顶科技以多项前沿创新方案,全面加

热心网友
04.01
《重返未来:1999》3.5绿松石蛇俱乐部版本正式上线!
游戏资讯
《重返未来:1999》3.5绿松石蛇俱乐部版本正式上线!

《重返未来:1999》3 5版本「绿松石蛇俱乐部」更新解析:新角色、心相与福利一览 各位玩家久等了!《重返未来:1999》备受瞩目的3 5版本「绿松石蛇俱乐部」现已正式揭晓更新计划。本次版本更新维护将于3月5日上午6:00正式启动,预计持续至10:00。根据以往游戏维护的经验,实际开服时间可能根据情

热心网友
04.01
比特币的价格被定义为多少美元
web3.0
比特币的价格被定义为多少美元

比特币的价格被定义为多少美元 想用一个固定的美元数字来定义比特币的价格?这恰恰误解了它的本质。比特币的价格,从来不是一个由某个中心化机构或公式敲定的“标价”,而是一个由全球无数参与者通过实时交易、持续博弈形成的动态共识。它不像传统货币,由政府权威背书并规定面值。它的价值根基,源于那被广泛认可的、程序

热心网友
04.01
中旅旅行app昵称修改方法
游戏攻略
中旅旅行app昵称修改方法

中旅旅行APP昵称修改步骤详解 想为你的中旅旅行APP账户设置一个更具个性的ID名称吗?修改昵称的流程实际上非常简单便捷,全程仅需一分钟左右即可完成。接下来,我们将通过三个清晰的操作步骤,手把手教你如何快速更换中旅旅行账号的昵称,轻松打造专属的旅行名片。 第一步:打开应用并进入个人主页 首先,请确保

热心网友
04.01