移远通信端侧AI大模型重塑人机交互新体验
2025年春节前后,DeepSeek的强势崛起,深刻重塑了全球人工智能产业的竞争版图。它不仅引发了关于技术路径的广泛探讨,更重要的是,它强力催化了“边缘计算+AI”的规模化需求,使得大型语言模型在终端设备上的部署成本与运营复杂度显著降低。从智能搜索到服务机器人,从智能汽车到AI手机,各行各业都在积极探索与这位“现象级”AI模型的融合路径。
在这场产业浪潮中,一个核心问题成为焦点:端侧人工智能的下一阶段将驶向何方?移远通信产品总监王韬在近期一场行业直播中分享了他的洞察:DeepSeek正在引领端侧AI从传统的“被动响应式”交互,向更具前瞻性的“主动认知智能”演进。当然,机遇总是与挑战并存,关于算力瓶颈、算法优化与商业化路径的新思考,也随之成为行业必须面对的新课题。
DeepSeek引领端侧AI迈入“主动智能”新阶段
端侧AI并非一个全新的概念。早期的实践多集中于利用DSP等专用芯片处理基础的语音唤醒或图像优化任务。随着芯片算力的持续提升,行业开始尝试将更复杂的算法模型集成到终端设备中。真正的范式转变大约发生在2021年前后,将百亿级参数AI大模型能力下沉至设备本地的思路开始成为主流,这标志着端侧AI正式进入了追求“认知与决策智能”的高阶发展阶段。
市场增长数据充分印证了这一趋势的巨大潜力。根据头豹研究院的最新报告,2023年中国端侧AI市场规模已突破1900亿元,预计到2028年,市场规模将迅猛增长至超过1.9万亿元,年复合增长率接近60%。

中国端侧 AI 市场规模,图源:头豹研究院
从千亿级市场迈向万亿级规模,未来的增长动力显然不再仅仅依赖硬件性能的升级,而更在于端侧应用与边缘计算、AI大模型三者的深度融合。这种融合正从底层技术架构、上层应用场景和整体产业生态三个维度,全面拓展端侧AI的能力边界与应用价值。
与依赖云端的AI方案相比,端侧AI具备多重显著优势:响应实时性更高、长期推理成本更低,并且从硬件层面确保了用户数据隐私与安全。尤为关键的是,它使得大模型的智能推理能力彻底摆脱了对网络连接的依赖,即便在离线或无网络环境中,智能服务也能持续稳定运行。
然而,将云端庞大的AI模型成功部署到资源受限的终端设备上,始终是一项艰巨的工程挑战。如何在高能效的前提下保持模型的强大性能?又该如何协同推进硬件、软件乃至商业模式的创新?这些都是横亘在产业面前的现实难题。
在DeepSeek出现之前,行业普遍陷入一种困境:端侧设备受限于算力、内存和功耗,难以独立承载参数超过百亿的大模型,复杂任务往往需要云端协同完成。这不可避免地带来了网络延迟,也增加了数据隐私泄露的风险。同时,当时的模型功能较为单一,难以支撑复杂的多模态交互或自主决策任务。
DeepSeek的突破性意义,在于为破解上述难题提供了全新的技术范式。其创新的MoE(混合专家)架构是核心关键。以DeepSeek-V3为例,其每层包含256个路由专家和1个共享专家,但每个Token实际仅激活其中8个专家。这种稀疏激活机制,极大地降低了模型训练与推理的算力消耗。此外,通过高效的模型蒸馏技术,能够将大模型的强大推理能力“迁移”至更轻量化的版本中,有效弥补了小模型在自我博弈与强化学习方面的不足。更具启发性的是,其研究性版本DeepSeek-R1-Zero证明,仅通过强化学习也能训练出具备强大逻辑推理能力的模型。
这一系列技术突破,使得终端设备独立处理复杂认知任务成为可能,真正将智能决策权从云端下放至网络边缘。正如移远通信产品经理王柯所言,DeepSeek诠释了一种“以少胜多”的部署哲学,极大地加速了模型的小型化与高效化进程。如今,一个仅30亿或40亿参数的轻量化模型,其综合性能可能已媲美早期的70亿参数模型。
从硬件产业视角看,这带来的益处是直接而深远的。另一位产品经理罗铮指出,DeepSeek能够以更小的模型体量实现更强的智能表现,这意味着,采用算力更低的芯片、容量更小的存储以及成本更优的硬件方案,就能构建出高性能的端侧AI产品。
目前,端侧AI大模型的主要落地场景已全面覆盖AI PC、AI手机、智能可穿戴设备、智能家居、智能网联汽车以及新零售等领域。而智能机器人,特别是人形机器人,则被业界公认为下一个爆发性增长的蓝海市场。端侧AI部署通过底层架构革新与场景深度适配,正在驱动机器人产业向更高层级的自主化、智能化方向演进。
一方面,本地化部署能极大降低数据上传的通信延迟,实现毫秒级的环境感知、决策规划与动作执行的闭环控制,满足工业场景中对精准抓取、快速避障等高实时性任务的严苛要求。另一方面,端侧大模型能更高效地支持视觉、语音、力觉等多模态数据的实时融合处理,让服务型机器人实现更自然、更拟人化的情感化交互。
正如移远通信产品经理沈锋所总结,DeepSeek这类先进模型带来的最直接影响,就是显著降低了实现同等智能性能的综合成本。这使得许多原本处于观望状态的行业,开始愿意投入资源,积极探索端侧AI的落地应用。
移远通信:提供端侧AI规模化落地的一站式解决方案
面对市场的澎湃需求与严峻挑战,产业需要的不仅是前瞻的理念,更是能够将概念快速转化为成熟产品的工具链与解决方案。正如移远通信多位专家在分享中所强调的,公司正致力于提供一套覆盖智能硬件、算力平台、核心算法与工程服务的完整端侧AI解决方案,助力客户跨越从技术验证到商业成功的“最后一公里”。
全面高效支持主流AI大模型端侧部署
AI大模型是智能体的“智慧大脑”。目前,移远通信的解决方案已实现多种主流AI模型的端侧高效部署,全面支持包括通义千问、DeepSeek在内的国内外领先模型。
以当前备受瞩目的DeepSeek为例,其R1版本专注于强化学习技术路线,并通过知识蒸馏技术衍生出从1.5B到70B参数不等的多个轻量化版本。这些模型体积精巧但性能卓越,成为端侧部署的理想选择。目前,移远通信的高算力AI智能模组SG885G已能够稳定、高效地运行经过针对性优化与微调的DeepSeek-R1蒸馏小模型。
实测性能数据颇具说服力:基于SG885G模组的端侧AI方案,生成Tokens的速度可超过每秒40个。如何理解这个速度?人类正常的对话语速约为每分钟300-400字,折合500-600个Tokens。这意味着,一个能够支持每秒准确输出10个Tokens以上的AI模型,就已具备了商业化应用的基本条件。移远当前的方案性能远超此基准线,并且未来通过持续优化,性能仍有提升空间。
该解决方案的应用场景极为广泛,涵盖智能服务机器人、智能汽车座舱、工业机器视觉、个性化虚拟助手、教育平板、智慧养老监护、全屋智能家居,乃至AI教育玩具和智能可穿戴设备等领域。
王柯透露,当许多厂商仍在研究如何适配DeepSeek模型时,移远通信已在端侧部署方面取得了实质性领先。这背后,体现了技术团队卓越的工程化能力,能够快速完成从方案选型、模型微调优化、端侧集成部署到系统资源调度的全流程工作。
在决定端侧AI体验关键的语音交互环节,移远的大模型解决方案实现了全语音链路的低延迟无缝衔接与高效运行,完整覆盖从语音唤醒、声源定位、语音识别到语音合成播报的主流功能模块,助力客户快速构建基于自然语音的无感化智能交互体验。

覆盖广泛需求的全系列智能模组产品矩阵
边缘计算智能模组是承载端侧AI能力的硬件基石。为满足不同应用场景对算力性能、成本控制和功耗预算的差异化需求,移远通信提供了丰富且完整的智能模组产品矩阵。
SG885G-WF是目前在高端端侧AI应用中的主力型号,它集成高通旗舰级QCS8550芯片平台,综合AI算力高达48 TOPS,并提供了包括多路显示输出、高清摄像头接口、多声道音频以及丰富高速外设接口在内的全面硬件资源。此外,其完整的产品线还包括:
■ 基于高通QCS8250平台的SG865W系列,AI算力为15 TOPS;
■ 基于高通QCM6490平台的SG560D系列,AI算力为12 TOPS;
■ 基于展锐UIS7885平台的SG530C系列,AI算力为8 TOPS;
■ 基于瑞芯微RK3568平台的SG368Z系列,AI算力为1 TOPS。
罗铮介绍,移远通信的智能模组产品能够覆盖从1 TOPS到48 TOPS的广泛算力谱系。并且,公司已在规划算力高达80-100 TOPS甚至更高的下一代产品,以应对客户未来对边缘算力持续增长的需求。
除了核心模组,配套的生态开发板也是加速方案落地与产品开发的重要工具。例如在MWC 2025大会上推出的QuecPi Alpha智能生态开发板,基于高通跃龙QCS6490处理器打造,AI算力达12 TOPS,能够满足众多AIoT应用中对物体检测、图像分析等功能的多样化开发需求。这些硬件开发平台均能灵活支持安卓、Linux和Ubuntu等主流操作系统,极大方便了客户在高端机器人和复杂端侧AI产品上的原型开发与快速迭代。移远提供的“软硬件一体”组合及全方位技术支持,能让客户在不同算力平台间的迁移与产品升级过程变得更加平滑高效。

QuecPi Alpha智能生态开发板
“智能模组 + AI大模型”双轮驱动,重构端侧AI应用体验
技术与产品的最终价值,需要通过具体的应用场景来检验。移远通信“高性能智能模组+前沿AI大模型”的组合策略,正在多个关键领域深度重构端侧AI的应用范式与用户体验。
第一个典型应用是AI服务机器人。基于SG885G-WF高性能智能模组与全栈语音链路架构,服务机器人能够对用户的语音指令、复杂提问或即时求助做出快速响应,精准理解用户意图,并以清晰、自然的合成语音进行反馈,实现真正的“无感”自然交互。特别值得一提的是,得益于SG885G-WF的强大本地算力,这套“大模型+机器人”解决方案在完全离线状态下也能提供完整的AI交互性能,这极大地拓展了其在网络不稳定或注重隐私场景下的应用范围。
这使得智能服务机器人在医疗康养、智能客服、商务接待导览、零售智能导购等领域展现出巨大的应用价值。在落地过程中,移远的技术团队提供从硬件适配、算法优化到整机调试的全流程工程化支持,帮助客户产品快速上市并构建差异化竞争优势。例如在智慧康养领域,合作伙伴德壹机器人基于移远的方案成功推出了“全能王AI具身机器人”,该产品支持8自由度3D视觉导航,深度融合了前沿AI技术与传统中医理疗智慧,重新定义了智能理疗服务的行业标准。
沈锋分析认为,DeepSeek等AI大模型的涌现,为机器人行业注入了强大的“认知智能”,重塑了机器人的“大脑”。当前大多数商用机器人仍以执行基础功能为主,交互与理解能力存在明显短板,而AI大模型的深度融合将有效弥补这一缺陷。未来五年,部署于各类终端的智能机器人数量将呈现指数级增长,这是一个充满潜力的黄金赛道。
第二个典型案例是AI智能无人零售解决方案。在MWC 2025上,移远通信推出了围绕“动态视觉识别+边缘计算”构建的创新零售方案。该方案基于高性能5G AI算力模组SG560D,支持先进的全链路商品识别算法,识别准确率高达99%以上,并具备创新的商品上新管理平台等软硬件一体化服务。除了SG560D搭载的QCM6490平台,该方案还能灵活兼容更多算力平台,以满足不同零售设备厂商的差异化产品竞争需求。
目前,这套AI智能无人零售解决方案已与兴元科技“喵星人”智能售货机等多家行业客户的终端产品完成深度系统集成,并已进入多个商业场景的实地测试与运营阶段。
结语
作为端侧AI生态的关键构建者与推动者,移远通信正通过“智能模组”与“AI大模型”的双引擎驱动策略,深度参与并积极重塑着产业格局。其一站式解决方案深度融合了DeepSeek等前沿AI模型,并凭借SG885G-WF等高性能智能模组,成功突破了端侧AI在算力瓶颈与工程化落地方面的关键障碍。
在服务机器人、智慧零售、汽车电子等多元化场景中,这种“软硬一体”的组合正在构建起“本地实时决策-自然流畅交互-数据隐私安全”的闭环能力。展望未来,随着更高算力模组的持续迭代、场景化算法的不断优化以及生态合作的日益深入,AI大模型的强大能力必将被拓展至更多、更广阔的端侧应用场景之中,真正开启万物智能的新时代。
相关攻略
DeepSeek等AI大模型降低了端侧AI部署门槛,推动其向主动智能演进。凭借实时、低成本及隐私保护优势,端侧AI市场快速增长。移远通信提供涵盖模组与模型的一站式方案,助力解决算力与工程挑战,已应用于机器人、智能零售等领域,实现本地决策与实时交互,持续拓展应用边界。
新唐科技推出基于端侧AIMCUM55M1的智慧门禁方案,利用本地AI算力实现毫秒级图像识别与决策,无需联网即可准确判断人员携带物品并控制门禁,同步提供语音与屏幕反馈。该方案具备高安全、高集成与低功耗特点,有效解决传统门禁人工核查慢、云端延迟及数据泄露等痛点。
2025年,人工智能正以前所未有的深度与广度融入日常生活,大规模部署于各类终端设备。行业分析报告指出,本年度集成端侧大模型的AI智能终端出货量同比增幅超过165%。这不仅是一个增长数字,更标志着产业战略共识的达成:人工智能的核心战场,正从集中式的云端计算,坚定地转向分布式、近用户的边缘侧智能。 在近
微软推出专为本地运行设计的小型语言模型Mu,参数仅3 3亿,集成于Copilot+PC的NPU芯片。它通过自然语言直接控制系统设置,响应快且保护隐私。该模型在特定任务上效率媲美云端大模型,标志设备端AI的重要进展,未来或广泛应用于各类物联网设备。
AI技术正从云端向终端设备延伸。端侧AI利用本地算力运行轻量化模型,能实现更低延迟、更强隐私保护并减轻云端负担。其落地依赖于模型压缩、芯片优化等技术的进步,已在智能手机、自动驾驶、工业视觉等领域广泛应用。产业链上下游协同推动,使端侧AI成为智能化升级的关键力量。
热门专题
热门推荐
制作PPT用什么软件好?2024年五大主流工具深度评测 无论是职场汇报、学术答辩还是项目路演,一份专业且吸引人的PPT演示文稿都至关重要。面对众多制作工具,如何选择最适合自己的那一款?本文将对五款主流的PPT软件进行全方位对比分析,从功能、协作、设计到易用性,助您根据核心需求做出最佳决策,高效打造令
今日A股市场整体走势偏弱,朗玛信息(股票代码300288)股价同步调整,截至收盘下跌3 16%,全天成交额4783 73万元,换手率为1 77%,公司总市值约为35 21亿元。股价的短期波动,引发了投资者对其核心投资逻辑与未来潜在机会的深入探讨。 异动深度解析:AI医疗战略的机遇与挑战 朗玛信息是市
《超级蠕虫大战圣诞老人2》是一款休闲益智游戏,攻略涵盖基本操作、关卡解锁与道具使用。玩家需掌握战斗策略与技能升级,熟悉敌人特性和环境机制。合理运用道具并完成隐藏任务可获取奖励,多人模式注重策略博弈。建议多练习并参与社区交流,同时注意游戏时长以保护视力。
在Kimi里搜索“2026年北京积分落户政策细则”,如果跳出来的总是房产中介的软文、培训机构的广告或者各种自媒体猜测,那说明默认的联网检索没有经过过滤。想要获得干净、权威的结果,必须主动使用结构化的提示词进行限定。 用结构化提示词锁定权威信源 这一步是关键,直接决定了你看到的信息是来自官方发布渠道,
为避免代码丢失,Qoder编辑器需手动开启自动保存功能。全局设置中可开启开关并选择触发条件,如按时间间隔或窗口失去焦点时保存。还可为特定项目单独配置,覆盖全局设置。若功能失效,需检查文件位置是否只读、用户权限是否足够,并避免直接编辑受保护的系统文件。





