首页 游戏 软件 资讯 排行榜 专题
首页
web3.0
PyTorch 1.2更新:三大领域库加速AI开发

PyTorch 1.2更新:三大领域库加速AI开发

热心网友
61
转载
2025-12-03

PyTorch 社区迎来重大更新:1.2 版本及三大领域库齐发力

2026虚拟币交易平台推荐:

最近,PyTorch 社区迎来了一系列令人兴奋的更新,包括 PyTorch 1.2、torchvision 0.4、torchaudio 0.3 和 torchtext 0.4。这些新版本都进行了优化和改进,兼容性更强,使用起来也更加方便。PyTorch 官方发布了相关文章介绍了每个工具的更新细节。

PyTorch 1.2:生产应用更进一步

PyTorch 1.2 在生产应用方面向前迈出了一大步,并增加了一个改进的 TorchScript 环境。这些改进使得用户可以更容易地构建生产模型,扩展对导出 ONNX 格式模型的支持功能,并增强对 Transformers 模块的支持。

此外,用户对 TensorBoard 的使用也更便捷,现在只需输入代码 `from torch.utils.tensorboard import SummaryWriter`,即可开始使用。

ONNX EXPORT 改进

PyTorch 1.2 增加了对导出 ONNX Opset 版本 7(v1.2)、8(v1.3)、9(v1.4)和 10(v1.5)的全面支持。同时,还优化了常量折叠(constant folding)的传递,用以支持最新版本的 ONNX Opset 10。

ScriptModule 也有相应的改进,包括:支持多输出、张量工厂表、元组作为输入和输出。此外,用户现在可以设置个性化的标记来导出自定义操作,并在导出期间指定输入的动态大小。

NN.TRANSFORMER

PyTorch 1.2 包含一个标准的 nn.Transformer 模块,该模块完全依赖注意力机制来构建输入和输出之间的全局依赖关系;该模块的各个组件经过精心设计,可以独立使用。

DAPI 库更新:加速领域研究

PyTorch 域的库(如 torchvision、torchtext 和 torchaudio)提供了对常用数据集、模型和转换器的便捷访问,可用于快速创建最先进的基线模型。此外,它们还提供了常见代码抽象集,以减少用户可能不得不重复写入代码的麻烦。

围绕 PyTorch 出现了一个称为 DAP I(Domain API)的专业库生态系统,以简化许多领域中新算法和现有算法的开发过程。PyTorch 1.2 核心版本发布后,官方也发布了三个更新的 DAPI 库,用于支持文本、音频和视觉内容。

TORCHAUDIO 0.3:与 KALDI 兼容,新转换器

Torchaudio 专注于机器理解音频波形。它是一个 ML 库,提供相关的信号处理功能。它利用 PyTorch 的 GPU 为波形提供了许多工具和转换的支持,并使数据加载和标准化更容易、更易读。

Torchaudio 0.3.0 的重点是标准化和复数、转换(重采样)和两个新的函数(phase\_vocoder,ISTFT)、Kaldi 兼容性以及新的教程。

标准化

Torchaudio 的转换接口进行了更新,以便围绕以下词汇和约定进行标准化:假设张量具有通道作为第一维度,时间作为最后维度(适用时);这将使得它与 PyTorch 的大小一致。对于大小的名称,用前缀 n\_(例如「大小(n\_freq,n\_mel)的张量」)命名,而维度名称则不具有该前缀(例如「维度张量(通道,时间)」);并且所有变换和函数的输入现在首先要假定通道。

Kaldi 兼容性

Torchaudio 提供与 Kaldi 兼容的接口,以简化载入并减少用户对 Kaldi 代码的依赖性。现在有一个接口可用于 spectrogram,fbank 和 resample\_waveform。

新教程

官方发布了一个新的教程,演示用户如何使用 torchaudio 进行预处理波形;同时该教程也将介绍加载波形并对其应用一些可用转换的示例。

带有监督学习数据集的 TORCHTEXT 0.4

torchtext 的一个关键重点领域是提供有助于加速 NLP 研究的基本要素。其中包括轻松访问常用数据集和基本预处理流程,用以处理基于原始文本的数据。torchtext 0.4.0 版本包括一些热门的监督学习基线模型,这些模型都带有「one-command」的数据加载项。

新版本涵盖了几个用于监督学习的主流文本分类数据集,包括:AG\_NEWS、SogouNews、DBpedia、YelpReviewPolarity、YelpReviewFull、YahooAnswers、AmazonReviewPolarity、AmazonReviewFull。

支持视频的 TORCHVISION 0.4

视频现在是 torchvision 中的一员,并且 torchvision 可以支持视频的数据加载、数据集、预训练模型和变换。TORCHVISION 0.4 版本包括:用于读/写视频文件(包括音频)的高效 IO 源码,支持任意编码与任意格式;标准视频数据集,与 torch.utils.data.Dataset 和 torch.utils.data.DataLoader 兼容;基于 Kinetics-400 数据集构建的预训练模型,用于视频(包括训练脚本)的动作分类;用于训练用户自身视频模型的参考训练脚本。

torchvision 提供了一些实用程序类型的 API,比如:VideoClips,它通过创建一组视频中所有剪辑的索引,简化了在视频文件列表中枚举所有可能固定大小的剪辑的任务。它还允许用户能够为视频指定固定的帧速率。

来源:https://www.51wangming.com/qukuailian/qkl88150.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

企业如何高效整合多表格数据提升决策效率
AI教程
企业如何高效整合多表格数据提升决策效率

Excel多表数据整合:四种高效方法详解 在日常办公与数据分析中,我们经常需要处理分散在不同表格中的数据。销售业绩、客户资料、财务流水等信息往往各自独立,如何快速、准确地将它们合并为一份完整的视图,是提升工作效率的关键。本文将系统介绍Excel中四种实用的多表数据整合技巧,帮助您轻松应对各类数据合并

热心网友
05.26
养蚕流程图解从孵化到结茧全过程详解
AI资讯
养蚕流程图解从孵化到结茧全过程详解

ignore-error 1 " uploadprocessed= "true "> 1 养蚕全过程概述:从蚕卵到蚕茧的关键步骤 成功养殖家蚕并收获高品质蚕丝,是一个系统化、精细化的管理过程。整个流程环环相扣,涵盖了选种孵化、幼虫饲养、上蔟结茧与采收处理等多个核心阶段。其中,温度与湿度的精准控制、新鲜

热心网友
05.26
空洞骑士丝之歌全红色道具收集攻略与获取方法
游戏攻略
空洞骑士丝之歌全红色道具收集攻略与获取方法

《空洞骑士:丝之歌》中红色护符能显著改变角色能力,影响战斗与探索策略。其获取通常需完成高难度挑战或深度探索,例如击败特定敌人、破解环境谜题、完成隐藏任务或与特殊商人交换。了解这些护符的效果与获取方式,有助于玩家规划成长路线,从容应对游戏中的试炼。

热心网友
05.26
MetaGPT多智能体框架如何用自然语言编程简化开发
AI教程
MetaGPT多智能体框架如何用自然语言编程简化开发

MetaGPT产品介绍 在软件开发领域,效率与门槛一直是两个难以兼顾的痛点。MetaGPT的出现,正是为了解决这个问题。它本质上是一个基于多智能体协作框架的AI平台,目标很明确:让用户用最自然的方式——说话,来驱动复杂的软件构建过程。 那么,它具体是如何运作的?我们可以从几个核心维度来看: 多智能体

热心网友
05.26
游戏产业升级:聚焦产品创新机遇与赋能策略
游戏资讯
游戏产业升级:聚焦产品创新机遇与赋能策略

游戏产业步入高质量发展关键阶段,亟需资源整合与创意孵化平台。2026创新游戏&开发者大会以“创意无限,游启新机”为主题,将于2026年6月11日至12日在杭州举办。大会通过专场分享、项目路演等形式,连接行业从业者与创作者,加速优质创意落地,推动产业协同升级与高质量发展。

热心网友
05.26