首页 游戏 软件 资讯 排行榜 专题
首页
业界动态
思必驰智元精灵G2:工业级交互,如何赋能生产力声控升级

思必驰智元精灵G2:工业级交互,如何赋能生产力声控升级

热心网友
24
转载
2025-12-18

2025年全运会期间,智元机器人面向市场推出了工业级交互式具身作业机器人——智元精灵G2。它在广州交通枢纽承担了乘客引导、问答咨询以及安全巡查等核心任务,同时还具备全场景全向避障与高精度力控操作能力,可广泛应用于汽车零部件制造、物流搬运及导览讲解等多种场景。思必驰为其提供软硬一体化的语音交互解决方案,成为智元精灵G2赋能产业升级的关键支撑。

声姿

声智协同,让产业场景交互更精准

针对地铁站、展馆、博物馆等多样化交互场景,思必驰为智元精灵G2量身打造了行业专属的语音交互方案,实现流畅精准的设备控制与场景响应。用户通过语音即可轻松切换作业模式、调整参数,系统具备强抗干扰与指令定制能力,并支持中英文及多方言实时互译。

在博物馆,G2可根据用户画像动态切换讲解风格,提供深度知识延伸与主动导览服务;在地铁站,它能在嘈杂环境中准确锁定对话人,实现出行指引与安全提醒;在展厅,G2还支持多轮连贯交互与VIP专属服务,实现“边走边讲”的沉浸式导览体验。适配多场景的智元精灵G2,正推动智能交互在实际应用中全面落地。

人形适配阵列,拾音无死角

针对智元精灵G2的类人形态与运动特性,思必驰采用离“散型环四麦克风阵列方案,通过科学排布、定向拾音,确保无论在静止巡检还是移动作业中,均可实现广域高精度语音捕获,做到指令“一说即中”,且不受机身转动影响。

全链路语音,交互一气呵成

端到端的全链路语音交互系统,实现了从唤醒、识别、语义理解到语音反馈的无缝衔接。系统可接收连续的复合指令,摆脱重复唤醒的繁琐,有效提升作业效率,交互过程如同协同办公般自然流畅。

大模型底座,低延迟稳定交互

思必驰通过自研的AISPEECH DFM语言计算大模型,构建了以中楗大模型为技术底座、串联语音交互技术与行业专业模型的“1+N分布式大模型智能体系”。该系统兼顾低延迟与高可靠性,助力G2实现精准语义理解与场景化应答,提供稳定、智能的对话支持。

智慧降噪,动态应对噪声

基于思必驰AI智慧降噪技术,G2可实时感知环境的噪声变化,动态调整降噪策略,有效过滤设备运行声、风扇噪声、人声混杂等多种干扰,确保关键指令在嘈杂环境中依然清晰可辨,拒绝“噪声失聪”。

深度回声消除,抗干扰更强

具备深度学习的回声消除算法,对工业场景中常见的非线性噪声与复杂声学反馈具备更强抑制能力,能有效克服机器人自发声与环境噪声的混合干扰,显著提升高噪声工况下的识别鲁棒性。

360° 声源定位,识别更精准

G2机器人支持360°全向声源定位技术,可准确判断发声人方位与距离,实现“声随人动、定向响应”的沉浸式交互。在多人协同作业场景中,G2能够“听音识位”,精准锁定指令来源,执行更准确、交互更专注。

工业智能化,因“声”而进化

智元精灵G2配备全球首款十字腕力操控臂,全臂集成高精度关节扭矩传感器,结合3自由度腰部设计,可模拟人类弯腰、转腰动作。通过真机强化学习算法,能在一小时内完成内存条插接等精密操作。搭载双电池热插拔技术与自主充电功能,适配95%以上的工厂地面环境。依托智元自研大模型,实现本地AI算力低于10毫秒延迟,达到100%任务完成率。配合思必驰的智能交互技术,从语音模组到场景算法,从单机交互到系统协同,持续推动G2机器人在工业环境中“听得清、听得懂、响应快、执行准”。

声姿

从体育赛事的公共服务,到工业生产的精密作业,再到商用场景的高效服务,智元精灵G2的出现,打破了工业机器人与商用机器人的场景壁垒,重新定义了工业级交互式具身机器人的核心标准,更是“AI+机器人”赋能产业升级的生动实践。

声姿

未来,随着AI大模型与机器人技术的持续迭代,思必驰将继续深耕工业级语音交互领域,与智元等合作伙伴携手,推动更多智能化、场景化的机器人解决方案落地,让“声动”赋能生产力,让智能改变产业与生活。

来源:https://www.ithome.com/0/906/073.htm
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

多平台推广的优势与核心价值解析
业界动态
多平台推广的优势与核心价值解析

在流量日益分散的今天,把鸡蛋放在同一个篮子里,风险不言而喻。多平台推广,早已不是“要不要做”的选择题,而是“如何做好”的生存题。它的核心价值,可以概括为两点:实现“流量风险对冲”,以及构建“品牌触点全覆盖”。通过在不同生态位——无论是搜索、短视频、图文还是电商——建立内容矩阵,企业不仅能有效缓冲单一

热心网友
05.19
DeepSeek知识库搭建教程 从零开始构建企业智能问答系统
业界动态
DeepSeek知识库搭建教程 从零开始构建企业智能问答系统

DeepSeek知识库的核心,是运用RAG(检索增强生成)技术,将DeepSeek强大的大语言模型推理能力,与您的私有文档资源——包括PDF文件、内部代码库、标准操作流程(SOP)等——深度融合。其最终目标是实现基于特定垂直领域数据的精准智能问答,让AI的回答不再是通用泛化,而是具备专业依据、内容详

热心网友
05.19
三大运营商入局AI付费服务 使用门槛低至99元
AI
三大运营商入局AI付费服务 使用门槛低至99元

三大运营商推出Token套餐,将大模型调用量包装为类似流量包的产品,以降低AI使用门槛。中国电信推出个人与企业多档套餐,最低月费9 9元;上海移动推出1元购40万Tokens服务;联通则提供个人与团队版套餐。运营商凭借用户渠道和支付优势,推动算力消费向大众市场普及,可能重塑AI服务消费模式。

热心网友
05.19
本地部署量化模型解决HermesAgent响应慢问题
AI
本地部署量化模型解决HermesAgent响应慢问题

HermesAgent本地运行缓慢常因未量化的大语言模型占用资源过多。可通过AWQ量化模型、llama cpp后端加载GGUF模型、配置vLLM引擎提升并发吞吐、禁用非必要工具降低上下文开销,以及调整SQLite记忆检索阈值等方案优化。这些方法能显著降低延迟,提升响应速度。

热心网友
05.19
AI治理评估工程:破解智能体监管缺失的关键路径
AI
AI治理评估工程:破解智能体监管缺失的关键路径

随着AI智能体能力的持续增强,确保其行为始终符合预设目标与安全边界,已成为行业亟待解决的核心挑战。然而,当前主流的治理方案在防止智能体“失控”或“脱轨”方面,仍面临显著的实践瓶颈。 在之前的探讨中,我们分析了主流治理思路:部署多样化的对抗性验证器,构建一个多层次的安全审查网络。该方案的核心逻辑并非限

热心网友
05.19