如今,智能设备早已悄然融入我们生活的方方面面——从语音助手、人脸识别摄像头,到日常使用的个人电脑,无不内置这些功能。不过,它们并非依靠魔法运行,背后需要强大的数据处理能力支撑。部分设备依赖云端数据中心完成计算,另一些则借助人工智能(AI)芯片,在设备本地直接处理任务。
事实上,AI技术已成为美国、中国、欧盟等主要经济体的国家战略,在科技竞争与产业布局中占据越来越重要的地位。从手写识别(如经典的MNIST数据集)、人脸识别(例如 Facebook 的 DeepFace),到语音识别(亚马逊 Alexa、苹果 Siri、微软 Cortana),再到机器人、自动驾驶(如 TartanRacing),乃至下棋的 AlphaGo 和游戏 AI Pac-mAnt,都离不开它的支撑。随着 AI 的深入发展,神经网络模型、机器学习等专业技术逐渐显现——它们依靠经验学习,而非传统编程。机器学习又为深度学习奠定了基础,深度学习通过分层算法,能够更高效地解析数据。

专为训练设计的 AI 芯片,实际上扮演着“网络教师”的角色——就像课堂上教导学生的老师。原始神经网络最初较为“笨拙”,需要海量数据输入才能逐步成长。训练过程极为消耗计算资源,因此我们需要专注于训练的 AI 芯片,它们能够快速且高效地处理数据。芯片性能越强,网络学习速度就越快。
一旦网络训练完成,就需要推理芯片来应对真实世界的数据——比如人脸识别、手势识别、自然语言处理、图像搜索、垃圾邮件过滤等。推理是大多数 AI 系统中用户可直接感知的环节,除非你本身从事训练开发工作。可以把训练想象成编纂一部字典,而推理则是查询单词、理解其用法。两者相互依存,缺一不可。值得注意的是:设计用于训练的芯片也能执行推理任务,但反过来,推理芯片无法进行训练。
云计算与边缘计算
AI 芯片的另一个重要维度在于:它既可部署在云端,也可用于边缘端——当然,这同样涵盖训练与推理两个环节。
云计算的优势在于便捷的可访问性,无需本地部署即可调用各种功能。在这些场景中,设备无需内置芯片来处理推理,从而节省电力和成本。但短板也十分明显:隐私与安全风险——数据存储在云服务器上,可能面临黑客攻击。此外,对于推理任务而言,云端的效率通常不如专用边缘芯片。
处理边缘推理的芯片可以直接安装在设备中,例如人脸识别摄像头。由于所有数据保留在设备本地,芯片往往为特定用途量身定制——比如用于人脸识别的摄像头会搭载擅长处理人脸模型的芯片。不过,在设备上额外增加一块芯片会提升成本和功耗。关键在于利用边缘 AI 芯片在成本与功耗之间取得平衡,确保产品对目标细分市场定价合理,且功耗可控。
下面介绍这些应用与芯片的常见搭配方式:
云端 + 训练
该组合的目标是开发用于推理的 AI 模型。这些模型经过优化后,最终形成特定场景下的 AI 应用。云端训练芯片性能强劲、运行成本较高,设计初衷是尽可能快速地完成训练。训练芯片用于训练 Facebook 的照片识别、谷歌翻译等服务的模型,而云推理芯片则负责处理用户输入的数据,利用这些公司训练好的模型进行推断。其他例子还包括 AI 聊天机器人,以及大型科技公司运营的各类 AI 服务。
边缘 + 推理
在设备上直接利用边缘芯片进行推理,能够彻底消除网络不稳定或延迟问题,同时更好地保护隐私和数据安全。另一个好处是节省带宽——尤其是图像、视频等可视化数据,上传时非常消耗流量,省下的成本十分可观。只要成本与功耗平衡得当,边缘推理甚至可能比云计算更便宜、更高效。
举一个具体例子:耐能的 KL520 和 KL720 芯片,就是为设备端设计的低功耗、低成本芯片。KL520 支持 2D、3D 图像识别,兼容结构光、ToF、双目视觉等多种 3D 传感技术,能够计算不同的神经网络模型,在规格、性能、成本方面均具优势,解决了 3D 模组价格偏高、芯片成本高、功耗大等问题。因此,该芯片被广泛应用于智能门锁、门禁、机器人、无人机、智能家电、智能玩具等物联网设备。类似的产品还有英特尔的 Movidius 和谷歌的 Coral TPU。
代表性应用场景包括:带人脸识别的监控摄像头、用于行人及危险检测(或驾驶行为监测)的车载摄像头,以及语音助手背后的自然语言处理功能。
这些不同类型的芯片,以及它们各自的实现方式、模型和应用场景,构成了未来 AIoT(人工智能物联网)发展的基石。如果再融合 5G 等新兴技术,它们的性能还能进一步提升。无论是在家庭还是工作环境中,AI 正在快速成为我们生活的一部分,而 AI 芯片领域的发展还将更加迅猛——不久的将来,会有更多种类的芯片问世,让我们的工作与生活更加便捷高效。
