游乐游手机版
首页/科技数码/文章详情

阿里云与Elastic合作推出AI搜索新范式提升企业生产力

时间:2026-05-14 22:16
大模型技术推动企业搜索向智能体交互演进。阿里云与Elastic提出Agent原生搜索架构,将搜索系统重构为智能体的记忆与技能库,支持JSON等格式返回。通过混合检索2 0、逻辑冷热数据分离及自研FalconSeek引擎,实现千亿级数据毫秒响应与成本降低。未来将深化知识记忆湖、Serverless架构及行业定制,助力企业智能化转型。

在大模型技术广泛应用的背景下,企业搜索领域正悄然经历一场深刻的范式变革。传统的“关键词匹配”模式,正加速向“智能体交互式搜索”演进。对于企业而言,核心挑战在于:如何在保障系统稳定与成本可控的前提下,平滑实现智能化升级?这已成为企业数字化转型进程中无法回避的关键课题。

近期,一场以“解锁搜索AI之力”为主题的技术峰会在北京成功举办。此次由Elastic主办、阿里云深度参与的大会,汇聚了近四百名行业专家与从业者。会上,阿里云的多位技术负责人分享了前沿洞察与落地实践,议题核心聚焦于Agent原生架构、向量混合检索、云端降本增效等关键方向,为业界清晰勾勒出Search AI(AI搜索)的可行路径。

一、 产品进阶:定义 Agent 时代的搜索新范式——从“人找信息”到“知识记忆湖”

阿里云智能集团计算平台事业部AI搜索负责人邢少敏在演讲中提出了一个鲜明观点:随着大模型应用进入“驾驭工程”阶段,搜索的核心价值已发生根本性迁移。过去,其核心使命是服务于人类查找信息;如今,它正转变为服务于智能体(Agent)高效获取上下文,成为Agent上下文工程与记忆管理的核心基础设施。

这意味着,搜索系统本身需要被重新设计与构建。

首先,是体验的重构,迈向Agent原生。传统搜索引擎的图形界面与结果列表,是为人类浏览设计的。而面向未来的智能搜索,需要为Agent的“阅读”与“理解”而优化。阿里云Elasticsearch正在进行这种深度重构:原生支持Agent的创建、编排与调用,使搜索结果能以JSON、Markdown等更利于AI解析的格式返回,从而让智能体高效读取并执行任务,同时节省宝贵的Token消耗。更进一步,其数据处理能力也实现了“Agent化”,用户可用自然语言描述多模态数据处理需求,由内置Agent转化为离线任务执行,完成后自动构建索引。

更关键的一步在于“技能化”。阿里云将Elasticsearch的实例创建、集群运维、健康诊断、数据查询等全生命周期能力,抽象为一套通用的“Skills”(技能集)。这使得无论是内部的“悟空”、“QoderWork”等平台,还是外部的开源Agent如OpenClaw,都能通过这套标准化接口直接调用。Elasticsearch由此演变为连接数据世界的统一网关,极大降低了智能体使用复杂数据服务的门槛。

其次,是定位的升华,构建“知识记忆湖”。邢少敏提出,未来的阿里云Elasticsearch应演进为Agent的长期记忆、技能与知识库的存储引擎。通过Agentic Search(智能体搜索)架构,它不仅能存储交互日志和用户偏好,更能持续沉淀企业知识,形成一种“越用越懂”的有机记忆机制。这不仅能有效减少对大模型的重复调用及Token消耗,提升任务成功率,更能依托全模态数据湖仓架构,打破企业内部的信息孤岛。

阿里云携手 Elastic 定义 Agent 时代搜索新范式,解锁 Search AI 核心生产力 -

最后,这一切都离不开高性能底座的坚实支撑。底层自研的FalconSeek引擎,将向量查询性能提升了50%至300%。结合GPU加速与BBQ量化技术,确保即使在千亿级数据规模下,依然能为Agent提供毫秒级的上下文检索响应。

二、 最佳实践:千亿级 AI 搜索的效能突破与架构演进

蓝图虽好,但大规模落地AI搜索,效果瓶颈与高昂成本是两大现实挑战。阿里云智能集团计算平台事业部AI搜索产品负责人汤祯捷分享了来自客户实践的三大核心突破。

第一个突破,是混合检索的“2.0升级”。传统向量检索在遇到强过滤条件时,易出现“召回为空”的困境。阿里云推出的智能混合检索2.0,主打“原生一体化融合”。它不再是两个独立引擎的简单拼接,而是在统一框架内实现多路召回与RRF(Reciprocal Rank Fusion)融合。其“边检索边过滤”的能力,直接在KNN近邻搜索过程中应用过滤器,彻底解决了上述工程痛点。再加上基于语义感知的动态权重调整,无需手动调参即可实现高质量的结果融合,显著提升了长尾知识的召回准确率。

阿里云携手 Elastic 定义 Agent 时代搜索新范式,解锁 Search AI 核心生产力 -

第二个突破,在于极致的成本效能优化。面对千亿级数据,算力需求呈指数级增长。阿里云的策略是“逻辑冷热索引分离”。简言之,只为10%高频访问的“热数据”构建高性能HNSW索引,而对90%的“冷数据”采用低开销存储方案。这一举措使单节点内存需求暴降70%,计算规格直接减半。通过Ingest Pipeline实现智能流量路由,数据能根据更新频率、访问热度自动标记为热或冷。再配合存储介质降级和存算分离架构,整体拥有成本(TCO)降低了40%到70%。

第三个突破,是范式从“搜索”到“执行”的转移。汤祯捷指出,AI搜索正在从被动的“信息获取”工具,转向主动的“智能体自主执行”平台。借助阿里云ES的基础底座,结合Search Agent核心能力与Agentic RAG引擎,可以搭建起全新的AI智能体产品。它支持多模态检索与结构化索引,为企业构建可度量、可调度的多Agent协作体系,实现深度研究、联网搜索、知识库问答乃至自主执行等复杂任务。更重要的是,Agentic RAG引擎实现了检索与索引的闭环优化:检索结果的质量反馈用于优化索引策略,而索引的更新又反过来提升检索效果。

阿里云携手 Elastic 定义 Agent 时代搜索新范式,解锁 Search AI 核心生产力 -

三、 技术深潜:破解 AI 搜索“效果与成本”双重难题的最佳实践

如何将上述突破落到实处?阿里云智能集团计算平台事业部AI搜索高级技术专家吴作栋,从技术细节层面给出了系统性解决方案。

阿里云携手 Elastic 定义 Agent 时代搜索新范式,解锁 Search AI 核心生产力 -

在成本效益方面,BBQ量化技术与存算分离架构是杀手锏。针对百亿级向量场景,BBQ量化通过非对称量化将数据压缩到极致。实测效果显著:处理100亿向量所需的存储节点从225台锐减至11台,资源节约高达95%。再结合OpenStore存算分离,整体总拥有成本(TCO)降低超过40%。

在性能提升方面,自研的FalconSeek引擎功不可没。这款基于C++ Native构建的云原生引擎,彻底消除了JVM GC带来的性能抖动,使得DSL聚合查询加速了6.8倍,带过滤的向量查询吞吐量提升了3到5倍。同时,通过Retrievers声明式检索框架,可以一键编排BM25、kNN等多路召回与RRF融合排序,兼顾了关键词的精确匹配和语义的深度理解。

对于企业的落地路径,吴作栋建议采用三步走策略:快速搭建(BM25+kNN+RRF)→ 效果优化(接入高质量Embedding/Rerank模型+BBQ量化)→ 极致性能(切换FalconSeek引擎+存算分离架构)。这套方案已通过实战检验,成功支撑了金山文档的千亿级语义搜索和某头部大模型公司的大规模C端实时检索场景。

四、 生态协同:构建 Agent Native 的开放搜索底座

本次大会不仅是技术的展示,更是生态的聚合。阿里云与Elastic的深度协同,正从三个维度共同构建面向Agent时代的开放搜索生态系统。

其一,是首发ES Skills,赋予Agent原生执行力。阿里云Elasticsearch正式发布了ES Skills功能,将实例管理、集群诊断、索引操作等核心能力封装成标准化工具集。这意味着,各种主流AI Agent现在可以通过自然语言直接发现并调用这些技能,实现从“被动检索”到“主动执行”的跨越。

其二,是云原生架构增强,实现极致弹性与合规。在全面兼容Elastic最新特性(如向量搜索、机器学习节点)的同时,阿里云增强了OpenStore存算分离架构与Serverless能力,支持按需付费和秒级扩缩容,更好地满足云原生时代的弹性需求。

其三,是全链路可观测,降低运维复杂度。通过集成CloudLens for ES,实现了从底层基础设施(CPU、内存、磁盘)到上层应用(慢查询、健康事件、向量检索延迟)的全链路监控。结合智能告警与根因分析,帮助运维团队从“被动救火”转向“主动预防”,切实保障AI搜索业务的高可用性。

五、 未来演进:从 RAG 到 Agentic Search,重塑企业知识资产

从“提示词工程”到“上下文工程”,再到如今长时间运行的“驾驭工程”,AI技术的演进脉络清晰可见。阿里云Elasticsearch的战略重心,也随之从单纯的“搜索引擎”转向“Agent的智能记忆与AI搜索基础设施”。未来,其投入将深化于三个方向:

第一,AI搜索的终极形态:打造“知识记忆湖”。未来的搜索系统将演变为企业专属的、包含智能记忆库的Agent智能体。它能自动从交互中沉淀记忆,形成统一的“知识记忆湖”,让Agent越用越聪明,具备个性化与连续性的服务能力。同时,基于阿里云OpenLake打造的全场景联邦搜索(Lake Search),将进一步打通数据壁垒。

第二,效能的持续突破。Serverless与存算分离架构将更进一步,屏蔽所有底层资源细节,实现真正的按需计费与极致弹性。GPU加速将深化应用于向量索引构建、重排序及推理环节,结合BBQ量化,在千亿级规模下坚守毫秒级响应与极致成本。

第三,行业的深耕与融合。针对金融、电商、媒体等不同行业的特性,推出预置最佳实践的专属搜索实例。同时,推动搜索、推荐与问答能力的“搜推问一体”融合,构建支持多模态检索与复杂工作流编排的一体化平台,助力企业从“数字化”迈向真正的“智能化”。

可以预见,通过提供稳定、高效、智能且成本可控的AI搜索基础设施,阿里云致力于成为企业构建下一代AI Agent应用最坚实的底座,在这场AI浪潮中,助力客户实现业务的可持续增长与智能化转型。

来源:https://www.php.cn/faq/2464579.html?uid=1242473
上一篇Meta首席AI官汪滔谈行业冲突:直言不喜大佬频繁争斗氛围 下一篇ROG夜神5090超频三破世界纪录 3DMark得分首破5万
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
OpenClaw手机App上线,结果翻车了
科技数码 · 2026-07-01

OpenClaw手机App上线,结果翻车了

OpenClaw 官方宣布,已正式推出 iOS 和 Android 原生移动 App,用户如今可以在手机上使用这款主打“能真正帮你做事”的个人 AI 助手。官方在 X 上给出的定位也很直接:把 Agent 放进口袋里,让用户可以在移动端处理频道消息、任务和回复。从功能上看,OpenClaw 移动端并

优必选CEO周剑:家庭机器人生态核心投入过半精力
科技数码 · 2026-07-01

优必选CEO周剑:家庭机器人生态核心投入过半精力

先说几个核心判断:优必选正在布局一盘长远战略。创始人兼CEO周剑在近期一场媒体沟通会上,直接亮出了公司未来的发展路线——工业、商用、家庭陪伴机器人三条业务主赛道并行推进,现阶段每条线各占约一半精力。一边是已经能够稳定创造收入的工业场景,另一边则是他眼中“最具想象力与未来空间”的家庭陪伴领域。工业人形

CPO/NPO/OIO开启封装级光连接价值空间,技术路线尚未收敛
科技数码 · 2026-07-01

CPO/NPO/OIO开启封装级光连接价值空间,技术路线尚未收敛

6月30日,申银万国在光连接系列研报中重点指出,MPO光连接器领域的投资机会值得高度关注。通俗来说,随着AI算力集群持续扩张,光互联升级带来的连锁效应——数据中心光纤通道数量、前面板端口密度、机柜内光纤管理复杂度——均在同步攀升。光连接器的角色早已超越传统的低价值标准件,如今它直接决定着链路插损、可

龙岗AR实景剧本游内测体验短板有效破解之道
科技数码 · 2026-07-01

龙岗AR实景剧本游内测体验短板有效破解之道

在今年龙岗区第二届人工智能与机器人发展大会上,区级部门一次性推出了7个AI“龙搭子”。其中,名为“龙导游”的成果成为文商旅融合领域的核心亮点。据南都N视频记者了解,依托“龙导游”打造的全区全域AR实景剧本游“龙岗大陆”,已在今年五一假期发布了内测版本。经过一个月市场验证后,该项目正式启动面向全社会的

南下资金6月30日净买入中芯国际与建滔积层板
科技数码 · 2026-07-01

南下资金6月30日净买入中芯国际与建滔积层板

6月30日,南下资金持续大举买入港股,单日净流入金额高达58 95亿港元。接下来,我们直接盘点哪些个股获得资金青睐、哪些遭到减持: 净买入方面,中芯国际领跑全场,单日吸金19 33亿港元;建滔积层板紧随其后,净买入10 59亿港元;腾讯控股获得7 65亿港元净流入;智谱(02513 HK)也有6 5