首页 游戏 软件 资讯 排行榜 专题
首页
科技数码
优化人工智能可信度:让AI更“靠谱”的关键实践

优化人工智能可信度:让AI更“靠谱”的关键实践

热心网友
41
转载
2026-01-26

  新华社新加坡1月26日电  记者手记|如何让人工智能更“靠谱”

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

  新华社记者舒畅

  越来越多人发现,人工智能聊天机器人并不总是可靠。它可能答非所问,抑或前言不搭后语,有时甚至煞有介事地编造根本不存在的消息。在1月下旬于新加坡举行的第40届人工智能促进协会年会上,如何让人工智能更“靠谱”、更“负责”,成为这场国际人工智能学术会议的重要议题之一。

  在研究者眼中,人工智能的缺陷对应着更细分的问题。比如,人工智能的置信度值是否与真实情况匹配等。一个来自意大利的研究团队在本届年会上提醒说,合理计算人工智能的置信度值非常重要。

  在这项名为“盲目自信的陷阱”的研究中,参与者在人工智能协助下完成逻辑推理题。结果显示,当人工智能表现得非常自信时,参与者更容易采纳它的建议——但这些建议很可能是错的;然而,如果人工智能犹豫不决,用户却可能会拒绝正确的建议。

  意大利米兰-比可卡大学的研究成员卡泰丽娜·弗雷戈西说,这两种情况都反映了现实问题:很多人工智能系统的置信度值没有被正确校准,从而向使用者传递了误导性的信号。

  置信度问题并非人工智能可靠与否的唯一体现。另一项来自印度和美国团队的研究,则从“认知疲劳”的角度,观察人工智能如何在不知不觉中变得不可靠。

  美国南卡罗来纳大学人工智能研究所的研究成员里朱·马尔瓦说,随着人类与聊天机器人对话时间越来越长,模型会开始“走神”:偏离原始指令、重复输出内容,甚至以自信的口吻生成不可靠的信息。研究团队将这种现象称为“认知疲劳”,且它并非偶发,而是一种系统性效应。

  “认知疲劳是可以被发现、预测并干预的。”马尔瓦说。团队设计了一个系统,通过追踪注意力衰减等三个关键指标,将人工智能何时开始“疲劳”可视化,并提供多种实时干预手段,如当人工智能开始偏离指令时,这套系统会重新输入原始指令,让对话回到“正确轨道”。

  在大会现场,从单一的聊天机器人,到可以自主完成任务的智能体,再到多个智能体组成的协作网络,研究者们不只关注它们的能力与效率,也反复探讨它们的边界和可控性。

  在不少与会者看来,完全放手让智能体自主完成任务,远没有想象中简单。

  “目前,这些智能体的行动边界非常宽,它们能写代码,可以在计算机上做我们能做的任何事情……所以,我们应该把研发重点转向人类与智能体的协作,建立智能体与人类之间的透明交互,这具有现实紧迫性。”美国微软人工智能前沿实验室主任埃杰·卡马尔说。

  微软首席科学家埃里克·霍维茨认为,当前种种不确定性,与人类尚未完全理解人工智能内部运作机制密切相关。

  在23日的历任主席对谈会上,他说:“今天的人工智能表现令人惊讶。我说‘惊讶’,是因为我们仍无法给出令人满意的科学解释:它们为何如此高效?如何失败?在哪些方面脆弱?对人工智能内部机制和原理的系统性科学探索,现在变得非常紧迫。我们必须打开这个‘黑箱’。”(完)

来源:https://www.163.com/dy/article/KK7HD78405346RC6.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

东方卫视今晚22:30《两说》展望“低空经济+人工智能”的未来发展蓝图
科技数码
东方卫视今晚22:30《两说》展望“低空经济+人工智能”的未来发展蓝图

两说作为战略性新兴产业,低空经济坐拥万亿级赛道的发展空间,备受瞩目。而人工智能技术正从感知、决策、协同、调度到监管,全链条重构其发展逻辑,成为推动低空经济从试点探索迈向规模化商用的核心引擎。在人工智

热心网友
04.01
今晚播出《天作之合》:低空经济与人工智能深度解析 | 两会特辑
科技数码
今晚播出《天作之合》:低空经济与人工智能深度解析 | 两会特辑

两说 Business Insights当前,低空经济以其战略性新兴产业与万亿级赛道的发展空间而备受关注,人工智能技术正从感知、决策、协同、调度、监管全链条重构低空经济发展逻辑,成为低空经济从试点

热心网友
04.01
NeurIPS紧急致歉背后,AI安全风险更值得警惕
科技数码
NeurIPS紧急致歉背后,AI安全风险更值得警惕

【文 观察者网 心智观察所】 最近,NeurIPS——人工智能领域最具影响力的学术会议之一——在2026年征稿规则中新增了一项条款:凡被美国财政部海外资产控制办公室(OFAC)列入制裁名单的机构,

热心网友
03.31
读懂算做闭环+AI赋能科研模式革新3大趋势
科技数码
读懂算做闭环+AI赋能科研模式革新3大趋势

人民网北京3月30日电 (记者赵竹青)当高端科学仪器被AI赋能,会发生什么?3月27日,2026中关村论坛年会AI for Science(人工智能赋能科学研究)青年论坛上发布的我国首套智能双束电镜

热心网友
03.30
海评:中国领跑人工智能等多领域科技发展
科技数码
海评:中国领跑人工智能等多领域科技发展

来源:海外网03:41机器人“灵巧手”能独立穿针引线,亦可弹琴奏乐;智能眼镜将语音转为字幕、总结成提纲,帮助人们实现高效交流;脑机接口、外骨骼突破技术瓶颈,助力残障人士恢复手部运动,甚至举起哑铃

热心网友
03.30

最新APP

火柴人传奇
火柴人传奇
动作冒险 04-01
街球艺术
街球艺术
体育竞技 04-01
飞行员模拟
飞行员模拟
休闲益智 04-01
史莱姆农场
史莱姆农场
休闲益智 04-01
绝区零
绝区零
角色扮演 04-01

热门推荐

生存33天新手阵容推荐生存33天高性价比入门搭配指南
游戏攻略
生存33天新手阵容推荐生存33天高性价比入门搭配指南

末日生存手游推荐:前往九游开启你的废土冒险之旅 近年来,末日生存题材手游以其独特的沉浸感与生存挑战,持续吸引着大量玩家。在废墟世界中探索资源、应对危机、重建秩序的核心玩法,带来了紧张而富有成就感的游戏体验。如果你正在寻找一款高品质的末日生存手游,九游平台无疑是理想的起点。这里汇集了多款深受好评的末日

热心网友
04.06
纪念碑谷3第二关通关攻略纪念碑谷3第二关详细步骤与解谜技巧
游戏攻略
纪念碑谷3第二关通关攻略纪念碑谷3第二关详细步骤与解谜技巧

《纪念碑谷3》第二关“小镇”超详细图文攻略 《纪念碑谷》系列凭借其独特的视觉艺术与空间谜题设计广受赞誉。最新发布的《纪念碑谷3》在第二章节“小镇”中,将这一美学风格与机关逻辑提升到了新的层次。本章节不仅延续了标志性的极简主义美学,其空间层次感与交互严谨性也更具挑战性。本攻略将为你完整解析《纪念碑谷3

热心网友
04.06
生存33天沙漠之王精通沙漠之王的33天极限生存打法与实战技巧
游戏攻略
生存33天沙漠之王精通沙漠之王的33天极限生存打法与实战技巧

《生存33天》:“沙漠之王”高效通关攻略 在热门生存手游《生存33天》中,玩家面临的挑战远不止于无尽的丧尸潮。游戏深度结合了生存资源管理与高难度首领战策略,其中“沙漠之王”堪称游戏中期最具考验的BOSS。它不仅是实力分水岭,击败后更能获得稀有材料、限定头衔及海量经验金币,大幅推动队伍成长。本文将深入

热心网友
04.06
生存33天四只手Boss通关攻略生存33天高难度四手怪打法详解
游戏攻略
生存33天四只手Boss通关攻略生存33天高难度四手怪打法详解

《生存33天》“四只手”首领完全通关攻略 你是否在“四只手”首领关卡止步不前?不必焦虑,这个Boss在《生存33天》中素有“新秀杀手”之称。初次遭遇时,其独特的机制与高额伤害往往让玩家措手不及,不少冒险者在此耗费了数日时光。然而,只要掌握了它的核心规律,你就会发现这个敌人不过是外强中干。以下这份详尽

热心网友
04.06
剑与远征启程赫普角色介绍剑与远征启程赫普强度分析与技能解析
游戏攻略
剑与远征启程赫普角色介绍剑与远征启程赫普强度分析与技能解析

《剑与远征:启程》前排坦克英雄赫普深度解析:双形态切换机制与实战搭配指南 在《剑与远征:启程》这款策略放置手游中,组建一支攻守兼备的队伍至关重要,而前排坦克英雄的选择往往是决定胜败的关键。今天,我们将聚焦于蛮血部族的一位特色英雄——赫普。作为一名超稀有品质的坦克,赫普不仅具备坚实的防御力,更凭借独特

热心网友
04.06