游乐游手机版
首页/web3.0/文章详情

PyTorch 1.2更新:三大领域库加速AI开发

时间:2025-12-03 11:24
PyTorch迎来重大更新,1 2版本及三大领域库齐发力。PyTorch 1 2在生产应用方面取得进展,改进TorchScript环境,扩展ONNX格式模型支持,增强Transformers模块支持。DAPI库更新加速领域研究,torchvision、torchtext和torchaudio提供常用

PyTorch 社区迎来重大更新:1.2 版本及三大领域库齐发力

大家都在用的虚拟币交易平台推荐:

最近,PyTorch 社区迎来了一系列令人兴奋的更新,包括 PyTorch 1.2、torchvision 0.4、torchaudio 0.3 和 torchtext 0.4。这些新版本都进行了优化和改进,兼容性更强,使用起来也更加方便。PyTorch 官方发布了相关文章介绍了每个工具的更新细节。

PyTorch 1.2:生产应用更进一步

PyTorch 1.2 在生产应用方面向前迈出了一大步,并增加了一个改进的 TorchScript 环境。这些改进使得用户可以更容易地构建生产模型,扩展对导出 ONNX 格式模型的支持功能,并增强对 Transformers 模块的支持。

此外,用户对 TensorBoard 的使用也更便捷,现在只需输入代码 `from torch.utils.tensorboard import SummaryWriter`,即可开始使用。

ONNX EXPORT 改进

PyTorch 1.2 增加了对导出 ONNX Opset 版本 7(v1.2)、8(v1.3)、9(v1.4)和 10(v1.5)的全面支持。同时,还优化了常量折叠(constant folding)的传递,用以支持最新版本的 ONNX Opset 10。

ScriptModule 也有相应的改进,包括:支持多输出、张量工厂表、元组作为输入和输出。此外,用户现在可以设置个性化的标记来导出自定义操作,并在导出期间指定输入的动态大小。

NN.TRANSFORMER

PyTorch 1.2 包含一个标准的 nn.Transformer 模块,该模块完全依赖注意力机制来构建输入和输出之间的全局依赖关系;该模块的各个组件经过精心设计,可以独立使用。

DAPI 库更新:加速领域研究

PyTorch 域的库(如 torchvision、torchtext 和 torchaudio)提供了对常用数据集、模型和转换器的便捷访问,可用于快速创建最先进的基线模型。此外,它们还提供了常见代码抽象集,以减少用户可能不得不重复写入代码的麻烦。

围绕 PyTorch 出现了一个称为 DAP I(Domain API)的专业库生态系统,以简化许多领域中新算法和现有算法的开发过程。PyTorch 1.2 核心版本发布后,官方也发布了三个更新的 DAPI 库,用于支持文本、音频和视觉内容。

TORCHAUDIO 0.3:与 KALDI 兼容,新转换器

Torchaudio 专注于机器理解音频波形。它是一个 ML 库,提供相关的信号处理功能。它利用 PyTorch 的 GPU 为波形提供了许多工具和转换的支持,并使数据加载和标准化更容易、更易读。

Torchaudio 0.3.0 的重点是标准化和复数、转换(重采样)和两个新的函数(phase\_vocoder,ISTFT)、Kaldi 兼容性以及新的教程。

标准化

Torchaudio 的转换接口进行了更新,以便围绕以下词汇和约定进行标准化:假设张量具有通道作为第一维度,时间作为最后维度(适用时);这将使得它与 PyTorch 的大小一致。对于大小的名称,用前缀 n\_(例如「大小(n\_freq,n\_mel)的张量」)命名,而维度名称则不具有该前缀(例如「维度张量(通道,时间)」);并且所有变换和函数的输入现在首先要假定通道。

Kaldi 兼容性

Torchaudio 提供与 Kaldi 兼容的接口,以简化载入并减少用户对 Kaldi 代码的依赖性。现在有一个接口可用于 spectrogram,fbank 和 resample\_waveform。

新教程

官方发布了一个新的教程,演示用户如何使用 torchaudio 进行预处理波形;同时该教程也将介绍加载波形并对其应用一些可用转换的示例。

带有监督学习数据集的 TORCHTEXT 0.4

torchtext 的一个关键重点领域是提供有助于加速 NLP 研究的基本要素。其中包括轻松访问常用数据集和基本预处理流程,用以处理基于原始文本的数据。torchtext 0.4.0 版本包括一些热门的监督学习基线模型,这些模型都带有「one-command」的数据加载项。

新版本涵盖了几个用于监督学习的主流文本分类数据集,包括:AG\_NEWS、SogouNews、DBpedia、YelpReviewPolarity、YelpReviewFull、YahooAnswers、AmazonReviewPolarity、AmazonReviewFull。

支持视频的 TORCHVISION 0.4

视频现在是 torchvision 中的一员,并且 torchvision 可以支持视频的数据加载、数据集、预训练模型和变换。TORCHVISION 0.4 版本包括:用于读/写视频文件(包括音频)的高效 IO 源码,支持任意编码与任意格式;标准视频数据集,与 torch.utils.data.Dataset 和 torch.utils.data.DataLoader 兼容;基于 Kinetics-400 数据集构建的预训练模型,用于视频(包括训练脚本)的动作分类;用于训练用户自身视频模型的参考训练脚本。

torchvision 提供了一些实用程序类型的 API,比如:VideoClips,它通过创建一组视频中所有剪辑的索引,简化了在视频文件列表中枚举所有可能固定大小的剪辑的任务。它还允许用户能够为视频指定固定的帧速率。

来源:https://www.51wangming.com/qukuailian/qkl88150.html
上一篇CC币是什么?怎么买?未来能涨到多少 下一篇派币外网交易价格分析:市场供求决定一切
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
狗狗币今日价格走势分析 市场波动下的投资机遇与风险应对
web3.0 · 2026-06-25

狗狗币今日价格走势分析 市场波动下的投资机遇与风险应对

狗狗币今日行情深度解析:波动中的机遇与风险应对策略 在瞬息万变的加密货币市场中,狗狗币始终是一个独特且无法忽视的存在。凭借其强大的社区共识与深厚的迷因文化基因,它不仅存活于牛熊周期,更屡次成为市场情绪的风向标。今日,我们将对狗狗币的实时走势进行专业剖析,旨在帮助投资者穿透价格波动的表象,精准识别其中

FSXU币购买教程与投资价值全面介绍
web3.0 · 2026-06-25

FSXU币购买教程与投资价值全面介绍

FSXU币:不止于稳定,一个生态的治理核心 在加密世界的众多项目中,FlashX生态推出的FSXU币(FlashXUltra)显得有点特别。它不仅是基于币安智能链(BSC)BEP-20标准发行的实用型代币,总量恒定200万枚,更被设计为整个生态系统的多功能引擎。从支付结算到质押生息,从游戏内购到实体

TRM报告:伊朗借CoinEx转移38亿美元遭制裁归零
web3.0 · 2026-06-25

TRM报告:伊朗借CoinEx转移38亿美元遭制裁归零

TRMLabs报告显示,自2018年起伊朗实体通过加密货币交易所CoinEx完成超620万笔转账,总额达38 4亿美元。其中Nobitex为主要上游,涉及伊朗伊斯兰革命卫队相关交易。2025年6月美国制裁后,相关资金规模骤降至15万美元以下。

2000元投资狗狗币是明智选择还是高风险投机行为
web3.0 · 2026-06-25

2000元投资狗狗币是明智选择还是高风险投机行为

2000元买入狗狗币:是理性投资还是高风险投机? 近期,“用2000元购买狗狗币”成为社交媒体上的热议话题。在数字货币市场持续吸引眼球的背景下,这笔看似不大的金额,究竟代表了踏入Web3世界的一次谨慎尝试,还是一场纯粹的投机博弈?本文将从多个维度深入剖析,帮助您做出更清醒的判断。 狗狗币的起源与现状

2026年全球十大加密货币交易所排名与安全深度评测
web3.0 · 2026-06-25

2026年全球十大加密货币交易所排名与安全深度评测

2026年数字资产交易平台全景扫描:交易量、安全性与稳定性深度解析 转眼来到2026年,数字资产交易平台早已不再是金融世界的边缘角色,而是构成了全球金融市场不可或缺的一环。随着加密货币日益渗透进主流视野,用户需求水涨船高,各大平台之间的竞争也进入了白热化阶段。今天,我们就来深入盘点一下,这一年里全球