2020年9月25日,北京云栖大会上传来重要消息:阿里云正式将ODLA(Open Deep Learning API)开源,这是业界首个面向深度学习的开放接口标准。早在今年5月的OCP全球峰会上,阿里云就已首次公开这一接口标准,并透露Graphcore等生态伙伴率先完成适配支持。Graphcore专为机器智能从零设计的AI处理器IPU,通过ODLA接口,开发者可直接在IPU上运行AI Matrix中的各类模型,大幅减少底层适配工作量。

张伟丰博士在2020 OCP全球峰会上详细解读ODLA接口标准
ODLA本质上是一套为加速深度学习场景而设计的统一异构硬件编程接口。它定义了深度学习计算任务的规范与执行方式,核心价值在于实现上层应用与底层异构硬件平台的解耦。这一设计使得AI异构计算更加便捷,代码能够做到“一次生成,随时链接,随处执行”——这一理念如今已逐步落地。
“新型应用令人振奋,也意味着我们对数据中心的期望达到了前所未有的高度。我们希望借助更广泛的硬件选择,以更大规模拓展操作类型的范畴。ODLA帮助我们驾驭这种复杂性,充分释放这些卓越新技术的潜力。”Graphcore高级副总裁兼中国区总经理卢涛如此评价。
阿里云开发ODLA的初衷,是为了解决异构计算领域长期存在的核心挑战。该接口标准设计轻量高效,可在异构环境中实现效率最大化。在异构计算场景下,软件框架既要充分挖掘专业芯片的性能潜力,又要让多种处理器在通用平台上协同工作,而每种处理器由于架构和专业知识领域差异,需进行不同程度的优化——例如AI计算中的稀疏性处理。ODLA所提供的抽象级别,恰好能够适配不同芯片架构之间的差异。
基于ODLA的异构AI硬件对接方案
借助ODLA,在Graphcore IPU上进行技术适配和应用部署的工作量大幅减少,效率显著提升。更重要的是,ODLA能够与AI计算框架实现更好的软硬协同,快速运用现有编译优化技术以获得最佳性能。在异构任务中,ODLA充当了系统级通用语言与特定架构优化之间的桥梁——或者说转换器,从而让Graphcore IPU等设备发挥出极致性能。
对数据中心运营商而言,ODLA带来的益处远不止简化新型微处理器技术的集成。它支持通用且高性能的数据中心部署,并为高级应用提供统一的加速框架。而对应用程序开发者来说,ODLA减少了对不同架构重复优化的需求,从而有效控制开发成本和缩短产品上市时间。
ODLA在2020云栖大会上公布的核心特性与优势:
· 透明接口层,零性能损耗。
· 接口抽象统一,实现软硬件解耦:通过面向AI的多粒度算子抽象,定义统一接口,解耦具体软硬件,实现业务平滑迁移;代码可复用,开发和部署效率自然提升。
· 多模态执行方式:支持解释执行、编译执行、载入预编译代码等多种模式,兼容各类硬件的运行模式。
· 全场景AI支持:同时支持推理与训练,适配云端、边缘端、终端全场景AI业务;算子定义广泛,接口丰富(包括设备管理、会话管理、执行管理、事件同步/异步、资源查询、性能监控等)。
· 卓越扩展性,支持AI芯片厂商的独特属性与自定义算子。
张伟丰博士在云栖大会上正式宣布开源ODLA
Graphcore相信,IPU将成为下一代数据中心AI工作负载的核心部件。然而,这一愿景离不开ODLA等框架和工具的支持——只有这些工具才能确保Graphcore的产品与同类最佳技术协同工作。
Graphcore联合创始人兼首席执行官Nigel Toon表示:“ODLA优雅地满足了Graphcore新用户的两大核心需求:一是希望轻松将我们的技术集成到现有数据中心,二是希望确保最终的设置从各个组件到整个系统的每个层级都能获得高度优化。”
