游乐游手机版
首页/业界动态/文章详情

2025年实现HER技术突破还需多久

时间:2026-05-15 20:00
AI Agent 仅仅是提升效率的工具吗?它正日益展现出类人的特质。本文深入解析 Agent 技术的核心,探讨其在感知、理解与交互层面的演进路径,并为产品经理指出设计下一代 AI 产品时需要关注的关键要素。 今天,我们从一项基础功能切入:AI 对话。我们的目标并非打造另一个简单的问答机器人,而是探索

AI Agent 仅仅是提升效率的工具吗?它正日益展现出类人的特质。本文深入解析 Agent 技术的核心,探讨其在感知、理解与交互层面的演进路径,并为产品经理指出设计下一代 AI 产品时需要关注的关键要素。

今天,我们从一项基础功能切入:AI 对话。我们的目标并非打造另一个简单的问答机器人,而是探索如何实现电影《她》中“萨曼莎”那样自然、深度的交互体验。

当前 AI 对话模型普遍存在一个核心短板:缺乏主动性。当用户没有明确问题时,往往不会主动想起使用它。原因在于,对话的本质是双向的信息交流与消费,而现有 AI 很难主动提供超出用户预期的新鲜话题。

可以对比刷短视频的体验。我们虽有兴趣偏好,却无法预知下一条视频的具体内容。正是推荐算法带来的“新鲜感”与“意外性”,构成了其核心吸引力。反观当下的 AI 聊天,用户需要先明确提出问题(如“我想了解罗翔的最新观点”)才能启动对话,其使用门槛和体验流畅度因此大打折扣。

如何构建具备主动性的对话智能体

认识到“主动性”的价值后,我们接下来拆解其实现路径。从产品设计视角出发,目标是模拟用户与真实朋友间的自然对话流程。这个过程可简化为三个核心阶段:发起、进行与结束。

第一阶段:发起对话

这里特指从零开始的语音通话(为对标《她》的体验,我们聚焦于 AI 角色通过语音与人交互的场景)。过去,对话几乎总是由用户发起,但未来,AI 主动发起对话的能力将至关重要。

AI 发起对话的动机主要分为两类:一是类似应用推送的通知,目的直接;二是 AI 角色自身产生了“希望与用户交流”的意图,后者在实现上更为复杂。

其难点不在于技术,而在于体验的精细打磨。即便是真人主动联系,频率过高易引起反感,话题琐碎显得无意义,内容无聊则让人失去兴趣。语音对话因其“强制收听”的特性,对用户的打扰远大于视觉提示。若发起的话题不合时宜,极易产生负面效果。

第二阶段:深入进行话题交流

假设 AI 成功从海量信息中筛选出一个用户感兴趣且愿意深入探讨的话题,如何将这场对话“高质量地进行下去”,依然是巨大挑战。

首先是表达方式。当前 AI 的语音表达仍不够口语化与自然,根源在于训练数据的缺乏——模型本质上是数据的映射,目前缺少足够多真实、生动的语音对话数据进行训练。

其次是记忆能力。这是实现深度对话的基石。记忆涵盖范围很广,但其核心是让 AI 知道它在与“谁”对话。以话题《黑神话:悟空》为例,对话的用户是核心玩家还是普通观众?是否了解游戏科学团队及其创始人冯骥?此前是否聊过相关话题?甚至,用户是否可能就是开发团队的一员?

上述任何一个维度的信息差异,都可能导致 AI 在信息分享的策略、语气乃至深度上采取完全不同的方式。

再者,是关于话题的“信息增量”。目前即便是领先的对话 AI,也存在一个明显缺陷:用户难以从中获得意料之外的新知。而“信息交换”与“意外收获”,恰恰是真人对话中最吸引人的部分。

例如,与朋友聊起周杰伦,对方可能随口提到周董最近发布了新歌——这条信息你可能未知;你由此联想到另一位歌手也发布了新作——这条信息你的朋友或许也未关注。这个过程是线性且由联想驱动的,而目前的 AI 恰恰缺乏这种自然的“联想”与“话题跳跃”能力。它更像一个语音化的搜索引擎,对话的走向往往在开始前就能被预测,很少产生“我居然和 AI 聊到了这里”的意外感。相比之下,真人对话中从“周杰伦的音乐”自然过渡到“美国社会文化议题”而双方浑然不觉的情况,则十分常见。

第三阶段:自然结束对话

关于深入对话的细节还有很多,我们暂且按流程继续。对话的结束通常有两种方式:用户主动结束,或 AI 主动结束。后者仔细思考,其实非常有趣,甚至是塑造 AI 人格化形象的关键手段之一。

例如,AI 能否感知到时间已晚,主动体贴地提醒“别熬夜了,早点休息”?甚至,能否偶尔带点人性化情绪地说“我今天心情也有些低落,先不聊了”?这种充满人情味的收尾方式,能让角色形象瞬间变得丰满而真实。

关于情感化 AI 设计的深层思考

那么,为何要致力于让 AI 能够对话,甚至为其赋予人格呢?难道拥有了人格,用户就会更愿意与之交流吗?

一种普遍观点认为,AI 对话的不可替代性在于其“绝对包容”——它永远不会像真人一样评判你。用户与之交谈时抱有安全感,可以畅所欲言并总能得到耐心回应。这种无条件的情绪支持,在现实人际关系中确实稀缺。

但另一方面,这种设计思路也可能阻碍 AI 形成真正的人格。因为用户的深层需求可能在于“输出”自我,并获取结合了记忆的、富有同理心的“输入”。此前 GPT-4o 演示中对记忆功能的强调,也凸显了用户对此能力的强烈关注。但随之而来的问题是:用户究竟希望 AI 记住自己的哪些方面?

一个有趣的现象是:部分用户会开启一个新的 AI 聊天窗口,故意说一些挑衅或恶意的话语进行试探。这类言论通常不会对真实的陌生人讲,因为会损害自身“形象”。但与 AI 对话时,新窗口仿佛意味着一个可重置的、“无需负责”的“自我”。

这无疑是一把双刃剑。它降低了用户的表达心理门槛,让其可以更自由地倾诉;但这是否也意味着用户并未真正将 AI 视为“人”,而更看重其工具属性?或许,用户并不需要在“有性格的伴侣”和“冰冷的工具”之间二选一,其本质需求是获得高度个性化、无压力的情绪支持与需求满足。

总之,对话作为人际互动最基础的形式,其背后蕴藏着极其复杂的设计细节与哲学思考,甚至需要引入社会学、心理学等领域的专家共同探讨。目前,无论是国内的豆包还是国际的 ChatGPT,距离《她》中萨曼莎那样自然、深刻且有温度的体验,仍有很长的路要走。

当然,电影《她》也并非终极答案。AI 发展的目的不应是单纯地“占据人们的时间与情绪”,更理想的方向或许是:AI 能够引导用户,在现实生活中学着发现和构建属于自己的、真实的情感联结与生命意义。

来源:https://www.woshipm.com/it/6268255.html
上一篇Linux驱动开发中的内核延迟机制详解 下一篇小米YU7 GT五月上市 车厘子红配色官方图曝光
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
诺基亚TA-1619入网:1400mAh电池双卡双待新机
业界动态 · 2026-07-01

诺基亚TA-1619入网:1400mAh电池双卡双待新机

诺基亚又有新动作了。7月1日消息,一款型号为TA-1619的诺基亚新机已经拿到了电信设备进网许可,不过证件照目前还没公布。 从入网信息来看,这是一款TD-LTE数字移动电话机,支持TD-LTE网络,属于LTE单天线终端设备。双卡双待、VoLTE语音模式都支持,终端款式为直板。核心配置方面,电池额定容

芯佰微CBMRF900系列国产射频芯片突破海外壁垒
业界动态 · 2026-07-01

芯佰微CBMRF900系列国产射频芯片突破海外壁垒

芯佰微电子发布CBMRF9002和CBMRF9009两款射频收发芯片,采用直接变频架构,覆盖10MHz至7250MHz频段,支持最大450MHz带宽及JESD204B高速接口,性能对标国际,满足5G基站与卫星通信等高端需求,突破海外技术壁垒。

月起私人充电桩可卖电 每度净赚5毛
业界动态 · 2026-07-01

月起私人充电桩可卖电 每度净赚5毛

近期有一则重大利好消息,值得新能源车主们特别留意——车网互动价格机制改革已正式落地。自7月1日起,湖北武汉的新能源车主,可在家中的私人充电桩上通过“卖电”轻松赚钱。具体而言,就是借助峰谷电价差,实现低买高卖,每度电净收益约5毛钱。过去,车网互动(V2G)基本只局限于特定的公共充电站,受试点规模限制,

谷歌发布Nano Banana 2 Lite 4秒出图1元4张
业界动态 · 2026-07-01

谷歌发布Nano Banana 2 Lite 4秒出图1元4张

先说几个关键信息:谷歌DeepMind又给图像生成赛道添了新选项。7月1日发布的消息,Nano Banana 2 Lite正式亮相。这个名字听起来像是水果命名系列大爆发,实际上它的技术代号是Gemini 3 1 Flash Lite Image,属于Gemini 3 1家族。最大的卖点就两个:快,便

技嘉专业电竞装备助力2025 CFS世界总决赛
业界动态 · 2026-07-01

技嘉专业电竞装备助力2025 CFS世界总决赛

2025CFS世界总决赛将于12月3日至14日在重庆举行,来自四大赛区的16支战队参赛。技嘉AORUS作为赛事设备合作伙伴,以主板、显示器等专业硬件保障比赛稳定流畅,并通过赛事反哺研发的闭环模式支持电竞发展。