未来视界揭秘:科技前沿如何重塑人类视觉体验

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

在人类认知与文明进程中,图像始终扮演着重要角色。从史前洞穴壁画到现代数字影像,图像表达与生成方式的演进,深刻反映了人类认识世界与改造世界的深度与广度。在这场演进的长河中,人类在19世纪发明了摄影术,在100年前发明了电视(Television),二者都深刻影响着文明的传播。而今天,AI正重新定义图像——图像不仅是对现实的投射,也是对世界的思想衍射。图像即世界。这个世界里,像素颗粒是如何存在、如何流淌、如何构建成可见的图景的?让我们拉开“视界”的科技帷幕。
话题主持:新民晚报记者 易蓉

图像未来
图像的数字化,是这场演进长河中的“大事件”。
从最微观的视角来解构数字化图像,科学家发明了“像素”。在学术领域,与“摄取”像素相关的技术称之为“图像处理”,与“创制”像素相关的技术归为“计算机图形学”。也有两者交叉而成新的方向,比如“计算摄像学”。总结来说,计算摄像学是“主动调控硬件去拍,让后续处理更简单”;图像处理是“对已拍的图做加工,让图像更好看/更有用”;计算机图形学是“从无到有造图像,模拟真实或虚拟世界”。
人工智能技术作为通用型的基座技术,无论对“图像处理”还是“计算机图形学”以及“计算摄像学”,都产生了深刻的影响和技术革新甚至是颠覆。特别是2025年,图像AI生成技术(包括文生图、图生图、图生视频等)取得飞速进步,Nano Banana、GPT-Image、Sora、Kling、Wan等AI生图工具的陆续推出并迭代版本。AI进行图像创作,已经涌现非常多的爆火作品,甚至进入平台生产力工具池,帮助普通公众进行创意和创作。
AI生图的第一波热潮起始于2014年的生成式对抗网络(GAN),但存在训练不稳定,输出质量差等问题,并未转化为产品级可实际应用的工具。到2020年首次系统化提出的去噪扩散概率模型(DDPM,简称扩散模型),具有理论基础扎实、训练稳定性好、高质量数据生成等优点,成为当前热潮的底层关键技术驱动力。随着算法和工程持续优化,以及大语言模型(LLM)的加持,该技术已经日趋成熟,正全面走向商业落地应用。
而在规模法则(Scaling law)的驱动下,AI生图技术还在持续进步,正在从单帧图片到连续视频,再到可交互的三维空间,并保持风格、逻辑和物理规律的统一。图像模型正从纯文本的自由创意生成转向对象级甚至像素级的特定任务,即从“多样性”到“可控性”;生图工具不只看懂文字,更能通过多种模态输入、人机多轮对话等方式理解创作者的意图,即从“下命令”到“共创作”;多模态大模型正将“文字—图像—视频—3D”无缝串联,并致力于用统一架构同时处理多种模态的“理解—生成—剪辑—推理”任务,即从“单点强”到“全域优”。
目前AI领域的热词,如空间智能、物理智能、世界模型等都直接或间接地包含了图像(视频)生成这一关键“步骤”。因此,AI生图也是通往AGI(通用人工智能)的关键垫脚石。目前,上海交通大学图像通信与网络工程所正在开展生成式媒体通信、多模态大模型压缩、全真数智人及具身智联体等前沿技术攻关与创新,通过将AI与图像技术、通信技术的深度联姻,探索出具备“真像摄取+仿真计算”“真实场景+虚拟生成”“高效重建+实时驱动”特征的世界模型。
围绕“看见”,显示终端也在图像数字化浪潮中不断更新迭代,如今VR头盔、AR眼镜、MR等新型显示终端也日趋常见,将图像直接投影视网膜,甚至更进一步通过脑机接口在视觉皮层上“投射”图像的技术也已问世。完全可以期待在不远的未来,更多奇妙设备将来到大家眼前。
作为重要未来方向之一,扩展现实(XR)更将带来无限想象力和新鲜体验。它以任意形式混合叠加现实环境和虚拟环境,使来自物理世界“摄取”的具象表达与来自思想世界“创制”的想象表达,经由像素颗粒自然汇集,融合一体。XR内涵丰富,是不断拓展图像技术边界的“理想国”。自由视角观看体育比赛、博物馆和演艺场景中的真3D体验(包括点云、体视以及全息等多种形态)已经进入应用。而神经辐射场(NeRF)、高斯泼溅(GS)等新型XR表征技术,支持通过手机、消费类的AI眼镜等设备进行实时图像的采集以及日常训练素材的积累;在AI的加持下,3D转换技术正在快速落地,已经涌现出Polycam、Remy等手机App,能将日常照片转换为高质量的3D模型,特别适合捕捉精细物体和场景。
未来3—5年,随着内容的丰富和终端的普及,XR将带动空间智能相关的各种生活应用(如室内导航,景区导览,数字化身等)走进寻常百姓家。
作者:上海交通大学图像通信与网络工程所 副所长 宋利
原标题:《科技前沿|未来“视界”》
栏目编辑:陆梓华
相关攻略
田晏林 发自 凹非寺量子位 | 公众号 QbitAI春分之后的北京海淀,暖意至,万物生。人工智能产业的发展更是如火如荼。过去五天里,位于“宇宙中心”五道口的AI原点社区,30多场派对狂欢不停。这是在
新智元报道编辑:犀牛【新智元导读】AIGram 在情人节推出「AI 互动视界」,将社交从传统的点赞评论升级为可触碰、可共创的数字事件。当社交的基本单位从账户变为AI 身份,人与人的连接将不再止于信息
新智元报道编辑:艾伦【新智元导读】极佳视界具身大模型 GigaBrain-0 5M*,以世界模型预测未来状态驱动机器人决策,并实现了持续自我进化,超越π*0 6实现 SOTA!该模型在叠衣、冲咖啡、
IT之家 1 月 5 日消息,杜比实验室与抖音今日宣布达成合作,面向抖音用户开放将杜比视界体。据悉,iPhone 用户现可通过抖音 App 分享和观看杜比视界视频,并可使用抖音内置编辑工具或剪映等其
来源:环球网【环球网科技综合报道】北京,2026年1月5日消息——沉浸式娱乐领域领导者杜比实验室与抖音今日宣布达成合作,将杜比视界体验引入抖音平台,覆盖内容创作、分享及观看全流程。此次合作被视为杜比
热门专题
热门推荐
鲁大师软件管家可安全升级常用软件:一、启动后点击顶部“软件管家”选项卡自动扫描;二、在“可升级软件”列表点击绿色“升级”按钮确认安装;三、勾选多个软件后点“批量升级”按钮并发处理;
3月29日,北京已在全国率先启动智能网联新能源汽车商业保险产品开发应用。新产品基本沿用现有的新能源商业车险体系,按照“总体稳定、部分优化”的原则,主要为消费者和汽车企业关心的特定智驾场景、软硬件损失
预计苹果今年将发布两款新的 iPhone 应用,包括 Apple Business 应用和一款具备类似聊天机器人功能的 Siri 应用。借助 Apple Business 应用,使用全新 Apple
据 Axios 报道,苹果公司已聘请前谷歌副总裁 Lilian Rincon 担任人工智能产品营销副总裁。加入苹果之前, Rincon 曾任谷歌购物产品副总裁。在苹果, Rincon 将负责苹果所有
3月29日消息,谁能料到前段时间奥迪车主与雷军之间的那个打赌,竟然还有后续。这到底是咋回事?事情发生在3月25日,网友@单手开吉利 在雷军的微博评论区晒出了自己去年10月刚提的奥迪车,还当场立下一个





