首页 游戏 软件 资讯 排行榜 专题
首页
科技数码
阿里Table-as-Search:用表格解决复杂信息搜索难题

阿里Table-as-Search:用表格解决复杂信息搜索难题

热心网友
41
转载
2026-02-10


免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

这项由阿里巴巴国际数字商务团队主导的研究发表于2026年2月,论文编号为arXiv:2602.06724v1,为长期复杂信息搜索任务提供了一个全新的解决思路。该研究团队包括来自阿里巴巴国际的多位研究人员,他们提出了一个名为"Table-as-Search"(TaS)的创新框架,将原本混乱无序的信息搜索过程转变为像填写表格一样条理分明的任务。

当你需要搜索大量复杂信息时,是否经常遇到这样的困扰:搜索进行到一半就迷失了方向,忘记了之前找到了什么,还需要找什么?或者在海量搜索结果中完全迷失,无法有效整理和利用获得的信息?阿里巴巴的研究团队注意到,现有的AI信息搜索系统在处理复杂、长期的搜索任务时经常"迷路",就像一个人在大型购物中心里转来转去,最终忘记了自己要买什么。

传统的信息搜索系统采用类似"思考-行动"的方式工作,就像一个人边走边想,把所有的搜索历史和结果都记在脑子里。当搜索任务简单时,这种方式还算有效。但是当面临复杂的多步骤搜索任务时,系统就会因为信息过载而出现问题,经常出现"丢三落四"的情况,这在学术界被称为"迷失在中间"现象。

研究团队提出的TaS框架就像是给搜索过程提供了一个清晰的表格模板。每当用户提出复杂的搜索需求时,系统首先会创建一个结构化的表格,其中行代表需要找到的候选对象,列代表需要验证的条件或需要收集的信息。这样,搜索过程就变成了填写表格的过程:已经找到的信息填入相应的格子,空着的格子就代表还需要继续搜索的内容。

这种方法的巧妙之处在于它将复杂的搜索状态管理问题转化为直观的表格操作。就像你在整理购物清单时,会在买到的物品后面打勾,还没买到的保持空白。通过这种方式,系统始终清楚地知道当前的进展状况,不会因为信息过多而混乱。

TaS框架能够统一处理三种不同类型的信息搜索任务。第一种是深度搜索,就像寻找一个符合多个严格条件的特定目标,比如找到一个既在出生省份上大学,又在20岁左右为电视剧唱主题歌,还在22岁左右发行首张专辑的歌手。第二种是广度搜索,需要收集大量对象的基本信息,比如搜集2005年到2015年所有TED奖获得者的详细资料。第三种是深广结合搜索,这是最具挑战性的任务,既需要大范围寻找符合条件的目标,又需要深入挖掘每个目标的详细信息,比如找到30家在西班牙市场销售阿迪达斯运动鞋、价格有竞争力且有成熟B2C运营经验的商家,并获取他们的联系方式。

在技术实现上,TaS采用多智能体协作的方式工作。系统中有一个主要规划者负责整体协调,就像项目经理一样制定搜索策略和分配任务。还有多个执行智能体负责具体的搜索操作,就像不同的专员分别负责不同方面的信息收集。所有搜索到的信息都存储在一个外部数据库中,这样可以避免系统因为信息过多而"撑爆"。

研究团队设计了一个三阶段的工作流程。首先是表格初始化阶段,系统根据用户查询创建合适的表格结构。然后是动态协调阶段,系统会在两种模式之间切换:当需要寻找更多候选对象时,启动"行扩展"模式,派遣多个搜索智能体并行寻找新的候选者;当候选对象足够但信息不完整时,启动"单元格填充"模式,针对每个候选对象补充缺失的信息。最后是答案综合阶段,系统整理表格中的信息生成最终回答。

为了验证TaS框架的有效性,研究团队进行了大规模实验测试。他们使用了多个不同类型的测试基准,包括需要多步推理的深度搜索任务、需要大规模信息聚合的广度搜索任务,以及他们专门构建的复合型深广搜索任务。特别值得一提的是,由于目前缺乏高质量的深广结合搜索测试集,研究团队专门创建了一个包含20个复杂商务开发场景的测试基准,这些场景都来自真实的商业需求。

实验结果显示,TaS框架在各种测试中都表现出了显著的优势。在深度搜索任务中,使用成本较低的Gemini-2.5-Flash模型的TaS系统,竟然超越了使用更强大模型的传统多智能体系统,准确率从38.4%提升到52.4%。这说明问题的关键不在于模型的推理能力,而在于如何有效管理复杂的搜索状态。

在广度搜索任务中,TaS系统同样表现出色。使用Claude-Sonnet-4模型时,TaS的成功率达到3.5%,与使用更强"思考"版本模型的传统系统相当。更重要的是,TaS在提高搜索覆盖率的同时还保持了较高的精确度,打破了传统系统中精确度和覆盖率相互制约的困境。

在最具挑战性的深广结合搜索任务中,TaS系统更是展现出了决定性的优势。与商用系统Gemini DeepResearch相比,TaS在候选对象发现准确率上提升了4.7%,在信息收集精确度上提升了5.1%。这证明了结构化规划相比专有黑盒系统的明显优势。

研究团队还深入分析了TaS框架的多个优势特性。在鲁棒性方面,随着搜索任务复杂度的增加,TaS相对于传统方法的优势越来越明显。在简单任务中,TaS的优势可能只有14.3%,但在最复杂的任务中,优势可以扩大到17.9%。这说明TaS特别适合处理高复杂度的搜索任务。

在效率方面,TaS的优势并不来自于简单的增加搜索量,而是来自于更精确有效的搜索策略。实验显示,TaS系统在使用相同甚至更少搜索次数的情况下,能够获得比传统系统更好的结果。这就像一个有经验的购物者能够用更少的时间买到更多需要的东西。

TaS框架还表现出了优秀的可扩展性。研究发现,给TaS分配更多计算资源时,它能够更有效地利用这些资源获得性能提升。在测试时扩展实验中,TaS的性能提升幅度比传统方法更大。

框架的灵活性也是一个重要优势。研究团队发现,TaS的执行层(子智能体)可以很容易地被更小、更专业的模型替代,而不会损失太多性能。这意味着在实际应用中可以大大降低计算成本。同时,TaS可以无缝集成现有的专业搜索智能体,让它们发挥更大的作用。

通过具体案例分析,研究团队展示了TaS如何解决传统方法的两个主要问题。第一个是过早收敛问题,传统系统经常找到部分匹配的结果后就停止搜索,而TaS通过表格结构强制系统验证所有条件。第二个是搜索不充分问题,在需要大量信息收集的任务中,传统系统经常遗漏信息或留下空白,而TaS通过明确的表格结构确保信息收集的完整性。

研究团队也诚实地指出了TaS框架的一些局限性。首先,这个框架主要针对信息搜索任务优化,对于不需要搜索的一般性任务可能会增加不必要的复杂性。其次,TaS的性能在很大程度上依赖于主规划智能体的能力,如果规划智能体的能力不足,整个系统的性能就会受到影响。此外,目前的深广结合搜索评估还需要人工验证,这在一定程度上限制了大规模测试的可行性。

尽管存在这些限制,TaS框架仍然为复杂信息搜索任务提供了一个突破性的解决方案。它不仅解决了传统方法在处理复杂长期搜索任务时的根本性问题,还展现了在多种应用场景中的广泛潜力。对于需要进行复杂信息收集和分析的商业应用、学术研究和日常信息搜索,TaS都提供了一个更可靠、更高效的解决方案。

这项研究的意义远不止于技术创新本身。它重新定义了我们对复杂信息搜索任务的理解方式,从混乱的文本生成转向结构化的信息管理。这种思维方式的转变可能会影响未来搜索系统的设计理念,让人工智能在处理复杂任务时变得更加可靠和高效。随着信息量的爆炸式增长,像TaS这样能够有效管理复杂搜索状态的框架将变得越来越重要,为构建更智能、更实用的信息搜索系统铺平道路。

Q&A

Q1:Table-as-Search框架是什么?

A:Table-as-Search是阿里巴巴国际团队开发的信息搜索框架,它将复杂的搜索任务转化为填写表格的过程。系统创建结构化表格,行代表候选对象,列代表需要验证的条件或收集的信息,通过填写表格来管理搜索进度,避免传统方法容易迷失方向的问题。

Q2:TaS框架比传统搜索方法好在哪里?

A:TaS的主要优势在于结构化的状态管理。传统方法容易在复杂搜索中"迷路",而TaS通过表格清晰追踪搜索进度。实验显示,TaS能让成本较低的模型超越更强大的传统系统,在复杂任务中优势更加明显,同时在提高覆盖率的同时保持高精确度。

Q3:TaS框架能处理哪些类型的搜索任务?

A:TaS可以统一处理三种搜索任务:深度搜索(寻找符合多个严格条件的特定目标)、广度搜索(收集大量对象的基本信息)、深广结合搜索(既要大范围寻找又要深入收集详细信息)。特别擅长处理复杂的商务开发、学术研究等需要多步骤信息收集的场景。

来源:https://www.163.com/dy/article/KLE395A10511DTVV.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

中关村论坛2026年会:通用智能人“通通”3.0全球首发
科技数码
中关村论坛2026年会:通用智能人“通通”3.0全球首发

3月29日,2026中关村论坛年会通用人工智能论坛召开,会上发布了一系列原创成果:全球首个通用智能人 "通通 "3 0升级亮相,具身智能、机器人核心引擎 "通脑 "入选2026中关村论坛年会重大成果,通育A

热心网友
03.29
中关村论坛前瞻:揭秘下一个“龙虾”,离人非常近
科技数码
中关村论坛前瞻:揭秘下一个“龙虾”,离人非常近

  中新经纬3月29日电 (周奕航 谢婧雯)“我每天很忙,希望有人帮我把每天我关注的离散的热点资讯、行业动态等汇总好,在固定时间段主动推送给我,这就是我需要的体验,提升了我的效率,我愿意为这样的AI

热心网友
03.29
48小时AI论文冲刺SCI?智体驾驭者正成为科研新范式
科技数码
48小时AI论文冲刺SCI?智体驾驭者正成为科研新范式

全球开发者先锋大会(GDPS 2026)上举办的48小时科研论文突击赛,吸引了全球开发者、科研人员和学术界的高度关注。参赛者需要在48小时内,借助智能体完成从选题构思、文献分析、科学计算到论文撰写的

热心网友
03.29
蚂蚁阿福肝病智能体上线,助力国家AI应用试点基地建设
科技数码
蚂蚁阿福肝病智能体上线,助力国家AI应用试点基地建设

3月28日,国家人工智能应用中试基地(医疗领域)阶段性成果总结发布会在复旦大学附属中山医院举行。作为依托基地进行中试推广的优质成果之一,复旦大学附属中山医院、中国科学院院士樊嘉团队与蚂蚁健康深度合作

热心网友
03.29
周鸿祎中关村论道:智能体重塑产业格局,6大方向驱动变革
业界动态
周鸿祎中关村论道:智能体重塑产业格局,6大方向驱动变革

在日前举办的2026中关村论坛年会全球独角兽企业大会上,360集团创始人周鸿祎发表主题演讲,围绕以“龙虾”(OpenClaw)为代表的新一代智能体技术,系统阐述了人工智能加速演进所带来的产业变

热心网友
03.29

最新APP

恶魔秘境
恶魔秘境
角色扮演 03-29
猫和老鼠华为
猫和老鼠华为
休闲益智 03-29
暗黑之地
暗黑之地
角色扮演 03-28
你比我猜
你比我猜
休闲益智 03-26
锦绣商铺
锦绣商铺
模拟经营 03-26

热门推荐

鲁大师软件管家使用教程:一键升级常用电脑软件
电脑教程
鲁大师软件管家使用教程:一键升级常用电脑软件

鲁大师软件管家可安全升级常用软件:一、启动后点击顶部“软件管家”选项卡自动扫描;二、在“可升级软件”列表点击绿色“升级”按钮确认安装;三、勾选多个软件后点“批量升级”按钮并发处理;

热心网友
03.29
北京推进智能网联新能源车险,支持L2-L4级别统一适配
科技数码
北京推进智能网联新能源车险,支持L2-L4级别统一适配

3月29日,北京已在全国率先启动智能网联新能源汽车商业保险产品开发应用。新产品基本沿用现有的新能源商业车险体系,按照“总体稳定、部分优化”的原则,主要为消费者和汽车企业关心的特定智驾场景、软硬件损失

热心网友
03.29
苹果今年将发布两款新iPhone应用,包含聊天机器人
科技数码
苹果今年将发布两款新iPhone应用,包含聊天机器人

预计苹果今年将发布两款新的 iPhone 应用,包括 Apple Business 应用和一款具备类似聊天机器人功能的 Siri 应用。借助 Apple Business 应用,使用全新 Apple

热心网友
03.29
苹果聘请前谷歌副总裁分管AI产品营销
科技数码
苹果聘请前谷歌副总裁分管AI产品营销

据 Axios 报道,苹果公司已聘请前谷歌副总裁 Lilian Rincon 担任人工智能产品营销副总裁。加入苹果之前, Rincon 曾任谷歌购物产品副总裁。在苹果, Rincon 将负责苹果所有

热心网友
03.29
雷军销售心法:一句话卖出一辆车,金牌销售的秘诀
科技数码
雷军销售心法:一句话卖出一辆车,金牌销售的秘诀

3月29日消息,谁能料到前段时间奥迪车主与雷军之间的那个打赌,竟然还有后续。这到底是咋回事?事情发生在3月25日,网友@单手开吉利 在雷军的微博评论区晒出了自己去年10月刚提的奥迪车,还当场立下一个

热心网友
03.29