首页 游戏 软件 资讯 排行榜 专题
首页
AI
对话IJCAI大会主席张成奇 大模型克服幻觉后为何不够靓丽

对话IJCAI大会主席张成奇 大模型克服幻觉后为何不够靓丽

热心网友
80
转载
2026-05-16

作者丨王悦 张进

编辑丨陈彩娴

八月的济州岛,海风温热,而第33届国际人工智能联合会议(IJCAI)的现场,气氛比天气还要火热。为期一周的大会,吸引了全球近3000名研究者与从业者齐聚一堂,论文提交量较去年增长了23.8%。不出所料,计算机视觉、机器学习与大模型,依然是讨论最集中的焦点。

本届大会有一个值得关注的里程碑:张成奇教授作为IJCAI首位华人大会主席,主持了这场学术盛宴。他也是继杨强教授、周志华教授之后,第三位进入IJCAI理事会的华人学者。

说起与IJCAI的渊源,张成奇的故事要追溯到2011年。当时,正是凭借他的积极推动,澳大利亚墨尔本才成功获得了IJCAI 2017的主办权。而本届大会的赞助金额也创下历史新高,超过70万美元,这背后同样离不开他的努力。

当然,张成奇本人的学术履历,在人工智能领域也堪称重量级。1982年,他在中国人工智能研究的摇篮之一——吉林大学攻读硕士,投身专家系统研究。1992年,他历时九年的研究成果,发表于国际顶级期刊《Artificial Intelligence Journal》,成为大陆华人在该刊发表的首篇论文。深耕AI与数据挖掘四十余年,他发表了300多篇学术论文,谷歌学术引用超过33000次,H指数达70,并曾荣获新南威尔士州科学与工程奖等荣誉。

在济州岛的大会现场,我们与这位新任大会主席进行了一场对话。他分享了首次担此重任的体会,解读了本届IJCAI的新变化,并坦诚地聊了聊对当前AI热潮,尤其是大模型发展的观察与思考。

一、IJCAI更严格了,但被接收的大部分都是好文章

问:今年各国参会者的比例大致如何?

张成奇:中国参会者大约占了总人数的三分之一。东道主效应非常明显,这次韩国本地参会人数,比在其它地方举办时多了起码20倍,能占到五分之一左右。回想2017年在澳大利亚举办时,有500多位当地学者参与(约四分之一),这次澳洲来的就只有70人左右了。会议选址,确实能极大地促进本地AI社区的交流与发展。

问:我们注意到,今年IJCAI的很多赞助商都来自中国。

张成奇:是的。从2017年开始,主要的赞助商就多来自国内。今年参展的企业包括信也科技、百度、滴滴、华&为、美图、OPPO、vivo、京东、贝式计算等。IJCAI从2017年起专门设立了“赞助事务官”一职,最初由我负责,去年起由于涵接手,我从旁协助。企业赞助的资金,每年能资助大量学生,金额达数十万美元。这形成了一个良性循环:受资助的学生更愿意向会议投稿,会议的影响力也随之增长。

问:组织如此大规模的国际顶会,遇到过很大的挑战吗?

张成奇:整体推进还算顺利。过去三十年来,我先后在澳大利亚人工智能年会、亚太人工智能年会、亚太数据挖掘大会、国际数据挖掘大会(KDD, ICDM)等会议中多次担任大会主席,积累了不少经验,处理起来算是驾轻就熟。

问:您担任过这么多国际顶会的主席,尤其是作为华人主席,有什么特别的感受?

张成奇:能够担任顶级会议主席的人本就很少,其中的华人更是凤毛麟角。这一系列经历下来,最大的收获是让组织工作更有条理了。另外,IJCAI作为一个综合性会议,与CVPR、ICML这类专注单一领域的垂直会议不同。它的特点是涵盖的AI子领域更广、更丰富,文章接收的范围也相对宽一些,但要想办出极高的专精名气,挑战也更大。

张成奇与学者在IJCAI现场交流

二、应用大模型要注意“领域的错误敏感度”

问:您如何看待当前的大模型热潮?

张成奇:大模型本质是生成式模型。它的最大优点,是生成效果“靓丽”,思维发散,显得很聪明,近似于人。但最大的缺点,就是存在“幻觉”,而且这个问题几乎无法根除。某种意义上,如果彻底克服了幻觉,它可能就不再是现在这样“聪明”的生成式模型了。人的聪明在于解决问题,但计算38的平方,人肯定算不过计算机。在传统有标准答案的领域,计算机不会出错,大模型反而会。这就是它鲜明的优缺点。

问:那么,我们应该如何理性地利用大模型?

张成奇:关键在于区分不同领域对错误的“敏感度”。我举三个例子:

第一,核电站维修。这里容不得丝毫差错,哪怕是0.01%的错误概率也不行,属于错误敏感度极低的领域。

第二,写诗作画。这里可以天马行空,没有绝对的对错,属于错误敏感度极高的领域。

第三,股票交易。这里没有100%的胜率,只要长期赚钱概率超过50%即可接受,属于错误敏感度中性的领域。

所以,大模型聪明、发散,但不保证全对。我们不能因为它有幻觉就全盘否定。对于中性或高敏感度的领域,比如创意、金融分析,它完全可以用。99.9%的人都是使用者,无法决定模型是否有幻觉,但我们可以判断自己所在领域对错误的容忍度,思考如何扬长避短,让技术与场景更好地适配。

问:在您看来,目前哪些领域最适合大范围应用大模型?

张成奇:导游行业是个好例子。规划路线时,多绕几分钟通常问题不大,只要安全有保障即可,容忍度很高。从这个切入点开发垂直模型值得尝试。

再比如智能养老,这里有两个刚需:健康与饮食。健康管理需要精准控制用药;饮食管理则需要为糖尿病患者、体寒者等提供个性化食谱。大模型在实现这种千人千面的智能服务上大有可为。

此外,情感陪伴、社交匹配(基于兴趣圈层)、运动管理(为老人定制步行方案)等场景,生成式模型都能提供丝滑的体验。开发通用大模型可以暂时不过多考虑领域问题,但如果要做垂直领域模型,选对赛道至关重要

问:大模型下一步的发展趋势会是什么?

张成奇:一方面,是减少算力消耗、提升效率;另一方面,是应用领域不断拓宽。这些都是渐进式的改进。未来能否有突破性进展,还要看底层架构有没有像GPT那样的革命性变革出现。目前,在通用领域,大模型可能比99%的人都“聪明”,但在专业深度上,它仍难以超越真正的专家。

除了技术专家在研究如何解决幻觉、提升效率,还有一个视角同样重要:站在普通用户的角度,思考如何将现有模型的能力发挥到极致,让技术更普惠。这需要更多“从上往下”的思维,从现象中抽象出本质,再落地到具体应用中。

问:具身智能今年也很热,您认为这是泡沫吗?

张成奇:人的智能大致可分为感知、认知、行为三层。深度学习解决了感知,GPT在很大程度上推进了认知,而行为智能(如机器人控制)的突破一直较小。现在要做的,正是将这三层智能融合起来。早期AI不好用,就是因为感知不过关。现在感知、认知都有了长足进步,虽然还没到终点,但已经能实现很多工作了。家庭机器人还需时日,正是因为其行为执行仍面临挑战。有了GPT的加持,具身智能的能力会上一个大台阶,这个台阶够我们消化五年、十年了。所以,这个方向一定会得到长足发展,因为单一的感知或认知智能,拿出来都很难直接应用。

问:您如何看待智能体(Agent)的复兴?

张成奇:Agent本身就是一个研究方向,曾经火过,也沉寂过,现在热度又回来了。根本原因在于,过去它对环境的感知和判断能力太弱,而现在这部分能力已经大幅提升。剩下的,就是如何更好地进行协调与决策了。

来源:https://www.leiphone.com/category/ai/N1D88fWTKuVTZm8o.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

问界M9保值率80.4%夺冠 2026年4月纯电车型保值榜
业界动态
问界M9保值率80.4%夺冠 2026年4月纯电车型保值榜

近日,中国汽车流通协会联合精真估发布了《2026年4月纯电动车型一年车龄保值率排行榜》。这份数据对于正在选购新能源车的消费者具有重要参考价值,能帮助大家更清晰地了解当前热门电动车的残值表现。 该榜单统计的是车龄满一年的纯电动车型。位居榜首的是问界M9,其一年保值率高达80 4%。这一夺冠成绩含金量十

热心网友
05.16
追觅Aurora Lux系列手机发布 29款奢华设计全解析
业界动态
追觅Aurora Lux系列手机发布 29款奢华设计全解析

科技行业近期迎来一场备受瞩目的创新盛宴。以智能清洁机器人闻名的追觅科技(Dreame),在旧金山隆重举办了“Dreame Next 2026”未来愿景发布会。活动不仅前瞻性地展示了涵盖智能手机、智能穿戴乃至概念电动车的全系列产品,更邀请到苹果联合创始人史蒂夫·沃兹尼亚克亲临助阵。这场为期四天的盛会,

热心网友
05.16
SpaceX最快下周披露招股书 6月初启动全球路演计划
AI
SpaceX最快下周披露招股书 6月初启动全球路演计划

SpaceX最快下周披露招股书,6月初启动全球路演,估值或达1 75万亿美元,募资规模有望创纪录。公司以垂直整合与成本控制为核心优势,布局商业航天、AI基础设施与卫星互联网,其“太空数据中心”构想融合太空太阳能与AI算力,开辟新赛道。此次IPO或引发科技板块资金结构性变动,标志资本正加速拥抱太空与AI融。

热心网友
05.16
NVIDIA扩展机器人微服务库加速人形机器人发展
AI
NVIDIA扩展机器人微服务库加速人形机器人发展

NVIDIA在SIGGRAPH上宣布扩展其微服务库,以加速人形机器人开发。其核心是将生成式AI深度集成至OpenUSD语言体系,推出相关模型与NIM微服务,从而提升数字孪生与机器人工作流效率。公司还开放了机器人技术栈,并联合合作伙伴推动OpenUSD的工业应用,为开发者提供从仿真到部署的端到端平台支持。

热心网友
05.16
OKX交易所安全性如何?资金风险与监管深度解析
web3.0
OKX交易所安全性如何?资金风险与监管深度解析

OKX作为全球领先的数字资产交易平台,其风险主要来源于市场波动、技术安全与合规环境。平台通过多重安全机制、资产储备证明和严格的合规流程来管理风险。用户需理解加密货币的高波动性本质,并采取自主保管资产、启用安全功能等策略,以在参与Web3生态时更好地保护自身权益。

热心网友
05.16