三张图

在Xilinx官网翻资料时,偶然在“应用→AI推断加速”板块里撞见下面这三张图,瞬间有种“众里寻他千百度,蓦然回首,那人却在灯火阑珊处”的感觉。三张图把FPGA/ACAP这类架构在AI推理中的优势,讲得明明白白,通俗易懂。
第一条:CPU和GPU要想实现高吞吐、高性能,就必须一次灌入足够多的数据——但数据的准备和同步,又会拖累延时。结果呢?高吞吐量和低延时,通常只能二选一。
第二条:FPGA和ACAP的应用覆盖面极广,IT、CT、OT这些领域里已经摸爬滚打了多年,积累的IP和应用相当厚实。如今AI渗透到各行各业,用FPGA做自定义AI翻跟斗,可以快速且紧密地耦合到现有的应用场景中。更关键的是,加速不只局限在AI部分,网络、存储等环节也能一起提速,实现整体效能的跃升。
第三条:人工智能和深度学习的模型迭代飞快,借助Domain Specific Architecture这类平台,新模型的设计和迭代周期可以大大缩短,跑得比以往快得多。
遗珠
无独有偶,在Apple开发者大会的相关报道里,大家热议iPad OS、惊叹Mac的配置和价格时,往往忽略了一则挺重要的信息:Mac Pro除了CPU和GPU,用户还可以选装FPGA加速卡。装上它,视频编辑者能同时处理3路8K视频流或12路4K视频流。不妨开个小脑洞——也许在未来的某一天,每个工作站都会标配一块FPGA加速卡,专门给特定应用做加速。到那时,App Store里会顺便卖卖加速的Overlay吗?
