游乐游手机版
首页/科技数码/文章详情

未来视界揭秘:科技前沿如何重塑人类视觉体验

时间:2025-12-26 18:52
在人类认知与文明进程中,图像始终扮演着重要角色。从史前洞穴壁画到现代数字影像,图像表达与生成方式的演进,深刻反映了人类认识世界与改造世界的深度与广度。在这场演进的长河中,人类在19世纪发明了摄影术,



在人类认知与文明进程中,图像始终扮演着重要角色。从史前洞穴壁画到现代数字影像,图像表达与生成方式的演进,深刻反映了人类认识世界与改造世界的深度与广度。在这场演进的长河中,人类在19世纪发明了摄影术,在100年前发明了电视(Television),二者都深刻影响着文明的传播。而今天,AI正重新定义图像——图像不仅是对现实的投射,也是对世界的思想衍射。图像即世界。这个世界里,像素颗粒是如何存在、如何流淌、如何构建成可见的图景的?让我们拉开“视界”的科技帷幕。

话题主持:新民晚报记者 易蓉


图像未来

图像的数字化,是这场演进长河中的“大事件”。

从最微观的视角来解构数字化图像,科学家发明了“像素”。在学术领域,与“摄取”像素相关的技术称之为“图像处理”,与“创制”像素相关的技术归为“计算机图形学”。也有两者交叉而成新的方向,比如“计算摄像学”。总结来说,计算摄像学是“主动调控硬件去拍,让后续处理更简单”;图像处理是“对已拍的图做加工,让图像更好看/更有用”;计算机图形学是“从无到有造图像,模拟真实或虚拟世界”。

人工智能技术作为通用型的基座技术,无论对“图像处理”还是“计算机图形学”以及“计算摄像学”,都产生了深刻的影响和技术革新甚至是颠覆。特别是2025年,图像AI生成技术(包括文生图、图生图、图生视频等)取得飞速进步,Nano Banana、GPT-Image、Sora、Kling、Wan等AI生图工具的陆续推出并迭代版本。AI进行图像创作,已经涌现非常多的爆火作品,甚至进入平台生产力工具池,帮助普通公众进行创意和创作。

AI生图的第一波热潮起始于2014年的生成式对抗网络(GAN),但存在训练不稳定,输出质量差等问题,并未转化为产品级可实际应用的工具。到2020年首次系统化提出的去噪扩散概率模型(DDPM,简称扩散模型),具有理论基础扎实、训练稳定性好、高质量数据生成等优点,成为当前热潮的底层关键技术驱动力。随着算法和工程持续优化,以及大语言模型(LLM)的加持,该技术已经日趋成熟,正全面走向商业落地应用。

而在规模法则(Scaling law)的驱动下,AI生图技术还在持续进步,正在从单帧图片到连续视频,再到可交互的三维空间,并保持风格、逻辑和物理规律的统一。图像模型正从纯文本的自由创意生成转向对象级甚至像素级的特定任务,即从“多样性”到“可控性”;生图工具不只看懂文字,更能通过多种模态输入、人机多轮对话等方式理解创作者的意图,即从“下命令”到“共创作”;多模态大模型正将“文字—图像—视频—3D”无缝串联,并致力于用统一架构同时处理多种模态的“理解—生成—剪辑—推理”任务,即从“单点强”到“全域优”。

目前AI领域的热词,如空间智能、物理智能、世界模型等都直接或间接地包含了图像(视频)生成这一关键“步骤”。因此,AI生图也是通往AGI(通用人工智能)的关键垫脚石。目前,上海交通大学图像通信与网络工程所正在开展生成式媒体通信、多模态大模型压缩、全真数智人及具身智联体等前沿技术攻关与创新,通过将AI与图像技术、通信技术的深度联姻,探索出具备“真像摄取+仿真计算”“真实场景+虚拟生成”“高效重建+实时驱动”特征的世界模型。

围绕“看见”,显示终端也在图像数字化浪潮中不断更新迭代,如今VR头盔、AR眼镜、MR等新型显示终端也日趋常见,将图像直接投影视网膜,甚至更进一步通过脑机接口在视觉皮层上“投射”图像的技术也已问世。完全可以期待在不远的未来,更多奇妙设备将来到大家眼前。

作为重要未来方向之一,扩展现实(XR)更将带来无限想象力和新鲜体验。它以任意形式混合叠加现实环境和虚拟环境,使来自物理世界“摄取”的具象表达与来自思想世界“创制”的想象表达,经由像素颗粒自然汇集,融合一体。XR内涵丰富,是不断拓展图像技术边界的“理想国”。自由视角观看体育比赛、博物馆和演艺场景中的真3D体验(包括点云、体视以及全息等多种形态)已经进入应用。而神经辐射场(NeRF)、高斯泼溅(GS)等新型XR表征技术,支持通过手机、消费类的AI眼镜等设备进行实时图像的采集以及日常训练素材的积累;在AI的加持下,3D转换技术正在快速落地,已经涌现出Polycam、Remy等手机App,能将日常照片转换为高质量的3D模型,特别适合捕捉精细物体和场景。

未来3—5年,随着内容的丰富和终端的普及,XR将带动空间智能相关的各种生活应用(如室内导航,景区导览,数字化身等)走进寻常百姓家。

作者:上海交通大学图像通信与网络工程所 副所长 宋利

原标题:《科技前沿|未来“视界”》

栏目编辑:陆梓华

来源:https://www.163.com/dy/article/KHNOD6FK055040N3.html
上一篇七彩虹RTX 5060 Ti Mini OC评测:强悍ITX神卡,小巧高性能 下一篇马斯克圣诞推出AI作画功能,全球画师抗议集体删号
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
宫本茂亲签3DS XL拍卖价破两万美元
科技数码 · 2026-05-29

宫本茂亲签3DS XL拍卖价破两万美元

今天来说一件挺有意思的事:2015年任天堂世界锦标赛冠军约翰·戈德堡,近日将他当年夺冠时赢得的宫本茂亲笔签名版3DS XL掌机放上了拍卖平台。截至2026年5月29日,这台签名掌机的竞拍价已突破两万美元,并且价格还在持续攀升。戈德堡在社交媒体上发布声明表示,经过相当长时间的慎重考虑,他决定将这台对自

七彩虹隐星P16 Pro游戏本新配置仅售7799元
科技数码 · 2026-05-29

七彩虹隐星P16 Pro游戏本新配置仅售7799元

七彩虹近期推出隐星P16Pro游戏本新配置,售价7799元。其搭载酷睿i9-13900HX处理器与RTX5060显卡,配备16英寸2 5K高刷电竞屏及高效散热系统。存储组合为16GB内存与1TB固态硬盘,支持后续扩展。该配置主打高性能性价比,适合预算有限但追求强劲性能的游戏玩家与轻度创作者。

苹果iPhone Hikawa握把支架448元重新上架
科技数码 · 2026-05-29

苹果iPhone Hikawa握把支架448元重新上架

苹果公司重新上架了与艺术家贝利·桧川及PopSockets合作设计的iPhone专用握把支架。该配件采用磁吸设计,兼具握持与支架功能,旨在通过人性化设计降低握持负担,并提供三种配色可选,售价448元。

苹果体育应用扩展至170市场 为2026世界杯引入对阵图
科技数码 · 2026-05-29

苹果体育应用扩展至170市场 为2026世界杯引入对阵图

苹果体育应用新增覆盖90多个国家和地区,全球可用市场总数超过170个。为迎接2026年世界杯,应用加入了完整的赛程对阵图和可视化阵型卡片,方便用户追踪赛事与战术。同时,应用支持实时活动功能,可将比分固定在锁屏或表盘,并新增一键跳转至新闻的入口。目前该应用仍仅限iPhone用户使用。

小米史上最强国产巅峰芯片玄戒O3 6月台积电3nm投产
科技数码 · 2026-05-29

小米史上最强国产巅峰芯片玄戒O3 6月台积电3nm投产

据博主爆料,小米下一代自研玄戒芯片计划于今年6月正式进入量产阶段,此次将采用台积电3nm工艺。初代玄戒O1累计出货量已突破100万颗,量产验证十分扎实。新一代芯片的产能将显著提升,这意味着供货问题基本得到解决。 根据现有曝光信息,这颗迭代芯片极有可能命名为玄戒O3,首发搭载机型预计为小米MIX Fo