2020年7月8日,Graphcore正式发布了基于IPU的开发者云。这次开放是面向中国的客户、大学、研究机构和个人研究者,而且完全免费。先分享几个关键信息:这个开发者云是中国首款IPU开发者云,部署在金山云上,底层硬件用的是IPU PCIe卡适配完成的浪潮NF5568M5服务器和戴尔DSS8440服务器。对于活跃在AI领域前端的创新者来说,这相当于打通了一条快速通道——不需要自己建机房,也不用走繁复的内部采购流程,直接就能在IPU上运行自己的AI模型。
Graphcore高级副总裁兼中国区总经理卢涛坦言,在和不少创新者交流时,很多人想用IPU来跑自己的算法模型,希望获得更好的结果,但受限于条件很难实现。这次推出免费的开发者云,本地工程支持团队还会和开发者一起制定工程计划,全程提供咨询支持,可以说是把门槛降到了最低。
开发者经常会遇到两个让人头疼的问题。一个是向算力平台提需求时,对方回复说GPU搞不定想要的低时延和高吞吐量;另一个是算法模型在GPU上跑得极其慢,让人忍不住怀疑是不是算法本身出了问题。其实,GPU从一开始就不是为机器学习的计算需求而设计的。Graphcore从零打造的IPU则完全不同——它是一种高度灵活、易于使用的并行处理器,专为算力密集型的机器学习和深度学习任务而生,能在训练和推理模型上实现当前最先进的性能。借助IPU开发者云,创新者可以让算法直达IPU,避开传统硬件的限制陷阱,不用因为硬件的短板而被迫妥协。
具体来说,三类用户可以从中获得不同的支持。商业客户可以在较短的时间内——通常是三周左右——通过IPU极大优化现有模型,看清模型现在和未来的性能提升空间,快速行动,抢占市场先机。大学、研究机构和个人研究者则可以获得更长的免费访问周期,通常是6个月,直到完成研究项目并发表成果。对于那些专注于机器智能新突破、致力于扩大人类潜能的研究者,还能获得优先访问使用权。另外,全球正在从事COVID-19相关研究的机构和个人,可以享受最先使用权。在收到使用请求并完成评估后,Graphcore工程团队会与用户一起制定开发计划和使用周期,全程提供技术咨询和支持。
这次部署还离不开金山云的支持。金山云提供的云物理机服务让Graphcore能够灵活布置多种机型,目前已上线IPU PCIe卡配置完成的浪潮NF5568M5服务器和戴尔DSS8440服务器。如果使用者在本地有测试需求,金山云还能把机器运送到使用者本地配合测试,之后再送回数据中心,这种灵活性在以往并不多见。金山云合伙人刘涛表示,很高兴IPU开发者云入驻金山云,期待更多开发者在上面实现AI模型加速创新。
IPU开发者云适用于先进和复杂的AI模型训练与推理,按场景大致可以分为五类:
1. 自然语言处理类,比如BERT;
2. 高级计算机视觉应用类,以分组卷积为代表,比如ResNeXt、EfficientNet、ResNet;
3. 时序分析类,比如LSTM、RNN、GRU等大量应用于语音、广告推荐、金融算法的模型;
4. 排名与推荐类,比如Deep Autoencoder;
5. 概率模型,比如MCMC等用于算法交易的模型。
除此之外,IPU在稀疏化应用场景的前沿探索上也非常适合。
配合开发者云的上线,Graphcore的创新社区也已全面上线,覆盖微信、知乎、微博以及即将上线的中文创新社区网站。创新者们可以在自己常用的社交平台上直接向Graphcore全球的科学家提问,获取IPU硬件与软件更新的最新资讯,阅读深度技术文章,和其他创新者交流成长。卢涛表示,在中国建立IPU开发者云是Graphcore对中国创新社区的承诺,通过免费使用和源源不断的知识输出,把中国最具有创新能力和求知精神的机器智能创新者们汇聚在一起,共同探索与收获。
Graphcore联合创始人兼CEO Nigel Toon也强调,Graphcore非常专注于中国市场。机器智能方面的许多新突破将非常适合中国的客户和研究机构。通过为AI研究的创新者免费提供云计算中的IPU支持,以及运营在中国的创新社区,能够支持中国最具创新精神的人才去解决世界上最棘手的AI问题。
