中国广州,2020年9月21日——高云半导体发布了GoAI™ 2.0机器学习平台。这个平台的核心逻辑很简单:在高云FPGA上搭建卷积神经网络,然后跑到边缘端的机器学习推理任务。它提供了一套SDK和翻跟斗,而且直接对接TensorFlow和TensorFlow Lite,主要针对GW1NSR4P μSoC FPGA做了专项优化。效果嘛——从微控制器里把计算密集型的活儿卸下来,性能直接提升了80倍。

机器学习圈子的一个明显趋势是:框架、平台、模型和数据集正在走向统一。TensorFlow已经成为嵌入式SoC和微控制器领域的主流选择之一。GoAI™ 2.0的新能力,就是让客户能用上支持高云嵌入式FPGA的TensorFlow,不再需要自己去折腾底层适配。
“GoAI™ 2.0在把机器学习模型部署到边缘嵌入式FPGA这件事上,有几个关键更新,”高云半导体国际营销总监Grant Jennings表示,“比如,你可以用这个平台把MobileNet这类模型部署到我们的GW1NSR4P μSoC FPGA上。这颗芯片特别适合跑TinyML推理——它集成了一个ARM Cortex-M3硬核微控制器,可以直接移植模型并控制GoAI翻跟斗;还有4.6K查找表的FPGA逻辑,用来实例化翻跟斗和连接传感器输入;外加8MB的SRAM做层存储。所有这些都装在一个6x6mm的QFN48封装里,成本很低。我们的SDK能让客户快速、轻松地把TensorFlow部署到FPGA上。”
使用GoAI™ 2.0,你完全不需要碰FPGA的RTL代码,也不需要写微处理器的C/C++程序。SDK会自动生成从ARM Cortex-M处理器驱动翻跟斗的C/C++代码。翻跟斗本身以FPGA IP的形式提供,但同时也包含在预先生成的部分比特流里——这些比特流已经接好了各种传感器输入。翻跟斗的架构设计特别巧妙:处理器在每个模型层只需要更新一个寄存器映射,部署或切换模型时根本不用动RTL。
机器学习的入门曲线不低,但GoAI™ 2.0提供了好几套针对不同传感器输入的参考设计,比如摄像头、麦克风和加速度计。具体来说:有根据输入值预测正弦波输出的数据推理,有从麦克风输入判断“是”或“否”的音频短语检测,还有根据摄像头画面判断是否有人在的人员检测。手势检测也正在开发中——利用加速度计捕捉用户拿着开发板在空气中画出的形状。开发者可以用三种GoAI™嵌入式开发套件之一入手,套件里包含了不同密度的高云FPGA、传感器和必要的外设(比如HDMI输入输出用于视频演示)。
“边缘机器学习推理已经是很多市场的主流需求了,包括消费、工业和医疗,”高云半导体美洲区销售总监Scott Casper说,“GoAI™ 2.0让嵌入式工程师以高性价比的方式把这些高级功能加到产品里。我们提供了参考平台、开发套件和现场支持,工程师上手很容易。”
“在即将开幕的AI EXPO KOREA展会上,我们会展示GoAI™ 2.0平台,”高云半导体亚太区销售总监兼香港总经理谢肇坚补充道,“这次是首次在韩国展出。GoAI™ 2.0为边缘AI市场提供了最具性价比的平台,而且我们的人员检测方案已经被韩国客户选为下一代平台——跟现有方案比,功耗和设计复杂度都大幅降低了。”
高云GoAI™ 2.0解决方案将于2020年10月27日至29日在韩国首尔COEX D馆亮相。
