NVIDIA发布CUDA 13.1:护城河20年来最重要更新
12月7日,英伟达正式推出CUDA 13.1版本,并将其定位为“自2006年CUDA平台诞生以来最大、最全面的一次升级”。
此次更新的核心亮点,在于引入了革命性的CUDA Tile编程模型。这标志着GPU编程范式迈入了一个全新且更抽象的崭新阶段。

传统的GPU编程基于SIMT(单指令多线程)模式,开发者需要关注线程、内存和同步等底层细节。
而CUDA Tile是一种基于tile(瓦片、数据块)的模型。开发者现在可以专注于将数据组织成块,并对这些数据块执行计算。底层的线程调度、内存布局以及硬件资源映射等复杂工作,则将由编译器和运行时自动处理。
为了支持Tile编程,CUDA 13.1引入了虚拟指令集(Tile IR),并配套发布了cuTile工具。该工具允许开发者使用Python来编写基于Tile的GPU内核程序。
这极大地降低了GPU编程的门槛,使得不熟悉传统CUDA C/C++或底层SIMT模型的数据科学家和研究人员,也能编写GPU加速代码。
需要明确的是,Tile编程并非要取代SIMT,而是提供了一个并存的备选路径。开发者可以根据具体应用场景,灵活选择最合适的编程模型。
CUDA 13.1的意义,不仅在于新增功能或优化性能,更在于为构建新一代高层、跨架构的GPU计算库和框架奠定了基础。通过引入Tile IR和高层抽象,英伟达在硬件与软件之间,增加了一个更厚实的中间层。
过去,英伟达的竞争对手(如AMD的ROCm、Intel的OneAPI)主要依赖兼容层来进行CUDA代码翻译。但对于CUDA Tile这种更高抽象层的新模式,单纯的代码翻译已远远不够。
竞争对手必须构建同样智能的编译器来处理Tile IR,这无疑增加了技术对齐的难度,客观上进一步提升了CUDA生态系统的粘性和用户锁定度。

相关攻略
AI研究机构EpochAI发布报告,详细拆解了1GW容量AI数据中心的成本结构。研究发现,在年化总成本约85亿美元中,NVIDIA服务器系统的折旧成本高达50亿美元,占比约60%,成为绝对的成本核心。相比之下,能源等运营开支每年仅约6亿美元,占比有限。报告特别强调,IT设备(主要是GPU)的折旧年
NVIDIA在SIGGRAPH上宣布扩展其微服务库,以加速人形机器人开发。其核心是将生成式AI深度集成至OpenUSD语言体系,推出相关模型与NIM微服务,从而提升数字孪生与机器人工作流效率。公司还开放了机器人技术栈,并联合合作伙伴推动OpenUSD的工业应用,为开发者提供从仿真到部署的端到端平台支持。
RTX 6090 6080 6070显卡规格偷跑:明年才能发 性能再挤一挤 年初CES展会上的消息,想必大家还有印象:备受期待的RTX 50 Super系列被无限期推迟了。现在看来,这个系列大概率是“胎死腹中”了。背后的原因也不难理解:一方面,显存价格涨势凶猛,成本压力不小;另一方面,来自AMD的竞
中国寻求突破NVIDIA CUDA护城河:一种前所未有的新方式 4月8日消息,在寻求突破NVIDIA CUDA生态壁垒的种种尝试中,有一个战略级的变通方案,其思路相当值得深入探讨。 时间拉回到不久前的SEMICON CHINA 2026全球半导体产业战略峰会。会上,中国半导体行业协会副理事长、IC设
高刷未启用?五步排查法帮你搞定 新买了高刷显示器,结果在设置里死活找不到144Hz、165Hz的选项,只能锁定在60Hz?这事儿确实挺让人头疼的。别急,这通常不是硬件坏了,而是系统或驱动没有正确识别显示器的“满血”能力。下面这几个步骤,是解决这类问题的标准操作流程,一步步跟着来,大概率能让你找回丢失
热门专题
热门推荐
为庆祝成立50周年,苹果在全球多地门店举办系列庆祝活动。最盛大的庆典在其总部ApplePark举行,员工齐聚草坪,传奇音乐人保罗·麦卡特尼登台献唱,首席执行官蒂姆·库克也参与其中。这场科技与艺术交融的盛会,既是对过往传奇的致敬,也寓意着新篇章的开启。
苹果公司成立五十周年之际,首席执行官蒂姆·库克发布内部信回顾历程。信中指出,公司从车库中的一台原型机起步,如今全球活跃设备已达25亿台。库克强调,未来需主动创造而非等待,并鼓励员工铭记创新精神,共同把握机遇,开创下一个五十年。
苹果CEO库克在专访中回顾了iPod的诞生历程。该产品以口袋装千首歌的能力革新了音乐消费方式。其爆红要求苹果在三个月内生产约1500万台,这极大考验了供应链。此次极限压力测试为苹果锻造出世界级供应链能力奠定了基础。库克还透露,首台原型机播放的第一首歌是《HeyJude》。
知名投资人段永平家族办公室持仓市值升至约200亿美元。本季度清仓阿里,减持苹果、台积电;重仓AI与电动车赛道,大幅增持英伟达并新建仓特斯拉,拼多多获增持。其首次跨足Web3领域,建仓稳定币发行商Circle,显示对合规区块链基础设施的关注。
Mac内置的“缩放”辅助功能可放大屏幕细节。通过系统设置开启该功能后,可选择画中画或全屏模式。用户可使用修饰键配合触控板手势、快捷键组合、双击Control+Option或鼠标智能缩放等多种方式灵活操作,满足不同场景下的查看需求。





