游乐游手机版
首页/科技数码/文章详情

未来视界揭秘:科技前沿如何重塑人类视觉体验

时间:2025-12-26 18:52
在人类认知与文明进程中,图像始终扮演着重要角色。从史前洞穴壁画到现代数字影像,图像表达与生成方式的演进,深刻反映了人类认识世界与改造世界的深度与广度。在这场演进的长河中,人类在19世纪发明了摄影术,



在人类认知与文明进程中,图像始终扮演着重要角色。从史前洞穴壁画到现代数字影像,图像表达与生成方式的演进,深刻反映了人类认识世界与改造世界的深度与广度。在这场演进的长河中,人类在19世纪发明了摄影术,在100年前发明了电视(Television),二者都深刻影响着文明的传播。而今天,AI正重新定义图像——图像不仅是对现实的投射,也是对世界的思想衍射。图像即世界。这个世界里,像素颗粒是如何存在、如何流淌、如何构建成可见的图景的?让我们拉开“视界”的科技帷幕。

话题主持:新民晚报记者 易蓉


图像未来

图像的数字化,是这场演进长河中的“大事件”。

从最微观的视角来解构数字化图像,科学家发明了“像素”。在学术领域,与“摄取”像素相关的技术称之为“图像处理”,与“创制”像素相关的技术归为“计算机图形学”。也有两者交叉而成新的方向,比如“计算摄像学”。总结来说,计算摄像学是“主动调控硬件去拍,让后续处理更简单”;图像处理是“对已拍的图做加工,让图像更好看/更有用”;计算机图形学是“从无到有造图像,模拟真实或虚拟世界”。

人工智能技术作为通用型的基座技术,无论对“图像处理”还是“计算机图形学”以及“计算摄像学”,都产生了深刻的影响和技术革新甚至是颠覆。特别是2025年,图像AI生成技术(包括文生图、图生图、图生视频等)取得飞速进步,Nano Banana、GPT-Image、Sora、Kling、Wan等AI生图工具的陆续推出并迭代版本。AI进行图像创作,已经涌现非常多的爆火作品,甚至进入平台生产力工具池,帮助普通公众进行创意和创作。

AI生图的第一波热潮起始于2014年的生成式对抗网络(GAN),但存在训练不稳定,输出质量差等问题,并未转化为产品级可实际应用的工具。到2020年首次系统化提出的去噪扩散概率模型(DDPM,简称扩散模型),具有理论基础扎实、训练稳定性好、高质量数据生成等优点,成为当前热潮的底层关键技术驱动力。随着算法和工程持续优化,以及大语言模型(LLM)的加持,该技术已经日趋成熟,正全面走向商业落地应用。

而在规模法则(Scaling law)的驱动下,AI生图技术还在持续进步,正在从单帧图片到连续视频,再到可交互的三维空间,并保持风格、逻辑和物理规律的统一。图像模型正从纯文本的自由创意生成转向对象级甚至像素级的特定任务,即从“多样性”到“可控性”;生图工具不只看懂文字,更能通过多种模态输入、人机多轮对话等方式理解创作者的意图,即从“下命令”到“共创作”;多模态大模型正将“文字—图像—视频—3D”无缝串联,并致力于用统一架构同时处理多种模态的“理解—生成—剪辑—推理”任务,即从“单点强”到“全域优”。

目前AI领域的热词,如空间智能、物理智能、世界模型等都直接或间接地包含了图像(视频)生成这一关键“步骤”。因此,AI生图也是通往AGI(通用人工智能)的关键垫脚石。目前,上海交通大学图像通信与网络工程所正在开展生成式媒体通信、多模态大模型压缩、全真数智人及具身智联体等前沿技术攻关与创新,通过将AI与图像技术、通信技术的深度联姻,探索出具备“真像摄取+仿真计算”“真实场景+虚拟生成”“高效重建+实时驱动”特征的世界模型。

围绕“看见”,显示终端也在图像数字化浪潮中不断更新迭代,如今VR头盔、AR眼镜、MR等新型显示终端也日趋常见,将图像直接投影视网膜,甚至更进一步通过脑机接口在视觉皮层上“投射”图像的技术也已问世。完全可以期待在不远的未来,更多奇妙设备将来到大家眼前。

作为重要未来方向之一,扩展现实(XR)更将带来无限想象力和新鲜体验。它以任意形式混合叠加现实环境和虚拟环境,使来自物理世界“摄取”的具象表达与来自思想世界“创制”的想象表达,经由像素颗粒自然汇集,融合一体。XR内涵丰富,是不断拓展图像技术边界的“理想国”。自由视角观看体育比赛、博物馆和演艺场景中的真3D体验(包括点云、体视以及全息等多种形态)已经进入应用。而神经辐射场(NeRF)、高斯泼溅(GS)等新型XR表征技术,支持通过手机、消费类的AI眼镜等设备进行实时图像的采集以及日常训练素材的积累;在AI的加持下,3D转换技术正在快速落地,已经涌现出Polycam、Remy等手机App,能将日常照片转换为高质量的3D模型,特别适合捕捉精细物体和场景。

未来3—5年,随着内容的丰富和终端的普及,XR将带动空间智能相关的各种生活应用(如室内导航,景区导览,数字化身等)走进寻常百姓家。

作者:上海交通大学图像通信与网络工程所 副所长 宋利

原标题:《科技前沿|未来“视界”》

栏目编辑:陆梓华

来源:https://www.163.com/dy/article/KHNOD6FK055040N3.html
上一篇七彩虹RTX 5060 Ti Mini OC评测:强悍ITX神卡,小巧高性能 下一篇马斯克圣诞推出AI作画功能,全球画师抗议集体删号
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
年国家能源局充换电服务业用电量增速48.8%
科技数码 · 2026-06-29

年国家能源局充换电服务业用电量增速48.8%

2025年全社会用电量达103682亿千瓦时,同比增长5 0%。充换电服务业用电增速高达48 8%,信息传输与软件服务业增速17 0%。第三产业和居民用电对增长贡献率合计占一半。中国成为全球首个年度用电量超10 4万亿千瓦时的国家。

追风者 GLACIER ONE 360 S25 液冷散热器新品上市 联体风扇售价429元
科技数码 · 2026-06-29

追风者 GLACIER ONE 360 S25 液冷散热器新品上市 联体风扇售价429元

追风者冰川360S25液冷散热器售价429元,三联一体风扇便捷安装,冷头小体积纯铜底座噪音18dB,风扇转速300-2000RPM、风量75CFM、静压2 96mmAq,五年质保漏液包赔。

三星Galaxy Watch8用户反馈谷歌后台组件异常
科技数码 · 2026-06-29

三星Galaxy Watch8用户反馈谷歌后台组件异常

三星GalaxyWatch8、Watch5Pro、Watch6及Watch7用户反映,GooglePlayServices后台耗电异常,电量占比最高达99 97%,远超正常水平,严重影响续航。目前故障原因不明,谷歌尚未发布官方声明。

罗永浩批苹果iOS 27创新不足 盼新CEO改进
科技数码 · 2026-06-29

罗永浩批苹果iOS 27创新不足 盼新CEO改进

罗永浩批评苹果iOS27创新不足,称仅有双iPhone同号、音量分离等数十项细节改进,认为库克时代缺乏突破性创新,股市虽好但消费者只能被迫接受挤牙膏式升级。

年国产车出口710万辆,两家车企销量破百万
科技数码 · 2026-06-29

年国产车出口710万辆,两家车企销量破百万

2025年国产汽车出口总量达710万辆,同比增长21%。奇瑞以134万辆居首,比亚迪105万辆次之,上汽乘用车出口占比60%最高,长城出口51万辆。吉利、长安等主流品牌同步增长,小鹏、零跑等新兴品牌海外拓展加速。