【2025云栖大会】阿里云AI搜索年度发布:开启Agent时代,重构搜索新范式

简介: 2025云栖大会阿里云AI搜索专场上,发布了年度AI搜索技术与产品升级成果,推出Agentic Search架构创新与云原生引擎技术突破,实现从“信息匹配”到“智能问题解决”的跨越,支持多模态检索、百亿向量处理,助力企业降本增效,推动搜索迈向主动服务新时代。

演讲主题:AI搜索年度发布——Agentic Search创新、云原生搜索引擎进化、AI搜索产品融合升级

年初大模型技术的爆发式发展,使得传统用户搜索场景被颠覆,据某权威研究机构数据显示,超58%的美国用户使用 Google 时不再点击搜索结果,传统搜索流量逐渐转向AI驱动工具,这一转变背后将重构用户搜索的交互逻辑、数据形态与技术架构。

9月26日杭州举行的云栖大会AI搜索专场上,阿里云智能集团计算平台事业部AI搜索负责人——邢少敏与产品负责人——汤祯捷重磅发布年度AI搜索技术与产品升级成果。阿里云搜索技术通过Agentic Search 架构创新、云原生引擎底层技术变革,从传统“信息匹配”迈向“智能问题解决”的全新时代,成为信息交互的核心范式,助力金山办公在文档协作领域低成本实现百亿向量检索能力,货拉拉在物流调度的洪峰压力下保持核心业务极低延迟,实现了客户业务性能突破与成本优化的双赢。

(上图可用作封面图,不放入文章,此话删除)


一、AI搜索:颠覆传统,重塑信息交互范式

如今,三大核心趋势正在重塑搜索边界:

  1. 用户交互升级:用户需求从“找到链接”转向“解决问题”,搜索普惠化加速;
  2. 数据模态进化:文本、图像、视频、代码等多模态混合搜索成为刚需;
  3. 主动智能跃迁:以大模型为核心、Agent 为引擎的协同架构,实现跨工具、跨数据源的深度推理。

阿里云AI搜索通过技术架构与产品生态的全面革新,正推动搜索从“检索工具”升维为“智能 AI 助手”。


二、Agentic Search:AI搜索迈入自主协作时代

演讲中邢少敏详细阐释了阿里云AI搜索的核心突破——Agentic Search 架构创新。该架构通过多 Agent 协同、多模态数据处理与任务自主规划,构建了从“问题提出”到“方案自主生成”的智能闭环。

其技术优势体现在:

  • 多模态数据处理:支持文档、图像、代码、视频等内容的解析、实体抽取与向量化,覆盖向量引擎、数据库、知识图谱等多引擎协同;
  • 自主任务规划:依托 Qwen3 大模型与短期/长期记忆能力,主 Agent 可动态调用 Code Agent、Browser Agent 等工具,实现复杂问答与多跳推理;
  • 权威测试领先:在 OpenAI 的 BrowseComp 、红杉中国Xbench-DeepSearch以及Deep Research  Bench评测集中,Agentic Search 评测指标均超越 Gemini、OpenAI 等国际主流方案,排名第一。

此外,阿里云构建了覆盖文档解析、多模态向量化、NL2SQL、重排序的全链路 AI 搜索专属大模型体系,并开放 Qwen3、DeepSeek 等大模型,为企业提供定制化智能搜索基座。


三、云原生引擎突破:性能倍增,成本优化

为支撑 AI 搜索的高并发与复杂计算需求,阿里云发布面向多场景检索的云原生引擎技术升级,实现性能与成本的双重突破:

Elasticsearch 高性能检索引擎:通过 CPU 批次执行、消除流水线阻塞和SIMD/向量化计算等优化、以及存算分离架构,复杂查询性能最高可提升6倍,存储成本降低50%,支持文本、日志、向量、时序等混合检索场景;

向量检索进化:向量检索 GPU 加速,基于 GPU 卡的索引构建性能提升13倍,资源成本下降5倍;结合 BBQ 量化技术,内存占用降低95%,节省20倍机器资源;基于DiskANN技术,低成本支持百亿规模向量检索;

全模态数据治理:从文档、数据库到湖仓的多源数据,通过文档结构抽取、实体关系建模,实现非结构化数据到向量数据、知识图谱的转化,为多模态搜索提供实时索引能力。


四、产品矩阵融合升级:AI搜索产品的'一横三纵'

Agentic Search 创新,再到基于云原生引擎突破向量引擎全面升级AI搜索全模态数据治理等技术能力深耕,在此次年度产品发布中,汤祯捷从产品角度分享了三个主题-融合,加速,开箱即用, 将诸多核心领先 AI 搜索能力融合于在 AI 搜索多产品内的落地规划。打造业内领先的面向 Agentic Search 新时代的'一横三纵'的 AI 搜索产品矩阵。

  1. AI搜索开放平台 - 面向人和 Agent 的 Agentic Search 基础设施。平台方式支撑多个 AI 搜索产品的 AI 原子能力。此为'一横'。
  • 提供多模态解析、视频解析、向量化等全链路AI搜索服务,支持API调用与按量计费。
  • 全链路搜索开发基础能力,覆盖模型微调-模型部署-编排。
  • 搜索链路效果测评:内置 Qwen3 大模型与测评工具,助力企业快速构建 Agentic Search等应用。

  1. 检索分析服务Elasticsearch - 开源企业级AI搜索平台。此为'一纵'。Elasticsearch 企业版在多类查询场景下的性能提升效果显著,其中文本检索方面,Terms/DateHist 聚合提升 2.59 倍、Query+Sort 查询提升 3 倍、MultiTerms 聚合提升 6.83 倍;向量检索方面,普通向量查询提升 1.7 倍、带过滤条件的向量查询提升 4 倍,全面体现了云原生架构对检索效率的显著增强。
  1. 场景增强:支持全文、语义、日志、向量、时序分析等多场景检索分析能力。
  2. 引擎加速:NativeES 引擎支持检索性能提升2倍至6倍;检索存算分离降本50%;向量检索内存优化20倍。
  3. 发布“企业专属 Agent 知识库”,提供一键 Agentic Search 解决方案,帮助用户构建安全独享的专属知识库。
  4. Elasticsearch Serverless 版实现秒级弹性伸缩,保障安全与稳定性。
  1. 智能检索服务OpenSearch - 深度接入AI原生能力的自研AI Native搜索服务此为'二纵'。
  1. LLM智能问答版,集成 DeepSearch/DeepResearch Agent,其 AI+ 专业搜索能力效果领先,支持“答案直出”。
  2. 行业算法版 为电商,互联网等行业领域提供高精度定制AI检索能力,全面对接AI搜索平台。
  3. 向量检索版,支持多模态数据湖,向量引擎多算法加强(GPU 加速/ RabitQ 量化/ DiskANN 算法),文搜视频/文搜图。
  1. 现在起,OpenSearch 不仅是自研搜索服务,更是 AI 原生多模态数据湖搜索。
  2. 向量检索服务Milvus版 - AI向量检索的利器。此为'三纵'。
  • 全托管服务兼容开源 Milvus,新增秒级弹性伸缩、数据分层存储功能;

内核性能提升100%,支持百亿级数据湖检索,集成 Milvus Agent 实现智能化交互。


五、客户实践:AI搜索从工具到智能助手,助力用户实现业务增长

阿里云AI搜索技术落地成效已在头部客户场景中率先验证:

金山办公通过 ES 内核级优化实现百亿级文档秒级响应,攻克高并发检索瓶颈,并构建冷热数据自动流转的"无感运维"体系;

货拉拉依托 ES 重构智能调度系统,成功支撑300+业务应用并发访问的千万级 QPS 洪峰压力,核心业务响应延迟稳定在10ms RT,运维效率提升50%。

两大案例揭示了阿里云 AI 搜索技术演进的新逻辑:当技术架构深度适配业务特征,搜索系统正在从"支撑业务"进化为"驱动增长"的核心引擎。

“AI 搜索不仅是在信息获取领域的技术升级,更是用户检索分析体验的跃迁。”

阿里云 AI 搜索通过 Agentic 架构的智能化、云原生引擎的高性能与产品生态的开放融合与加速,正推动搜索从“被动响应”走向“主动服务”。未来,随着大模型、Agent 与云原生技术的深度协同,AI 搜索将进化为每个人的贴身智能助手,引领人类进入信息无界、交互自然的新纪元。

了解更多:

【阿里云 AI 搜索开放平台 官网】:https://www.aliyun.com/activity/bigdata/opensearch/platform

【阿里云 智能开放搜索OpenSearch 官网】:https://www.aliyun.com/product/opensearch

【阿里云 检索分析服务Elacticsearch 官网】:https://www.aliyun.com/product/bigdata/elasticsearch

【阿里云 Elacticsearch Serverless 官网】:https://www.aliyun.com/product/es/es-serverless

【阿里云 向量检索服务 Milvus 版 官网】:https://www.aliyun.com/product/milvus

相关文章
|
22天前
|
人工智能 自然语言处理 算法
【2025云栖大会】AI 搜索智能探索:揭秘如何让搜索“有大脑”
2025云栖大会上,阿里云高级技术专家徐光伟在云栖大会揭秘 Agentic Search 技术,涵盖低维向量模型、多模态检索、NL2SQL及DeepSearch/Research智能体系统。未来,“AI搜索已从‘信息匹配’迈向‘智能决策’,阿里云将持续通过技术创新与产品化能力,为企业构建下一代智能信息获取系统。”
226 9
|
22天前
|
机器学习/深度学习 人工智能 Serverless
吉利汽车携手阿里云函数计算,打造新一代 AI 座舱推理引擎
当前吉利汽车研究院人工智能团队承担了吉利汽车座舱 AI 智能化的方案建设,在和阿里云的合作中,基于星睿智算中心 2.0 的 23.5EFLOPS 强大算力,构建 AI 混合云架构,面向百万级用户的实时推理计算引入阿里云函数计算的 Serverless GPU 算力集群,共同为智能座舱的交互和娱乐功能提供大模型推理业务服务,涵盖的场景如针对模糊指令的复杂意图解析、文生图、情感 TTS 等。
|
23天前
|
云安全 人工智能 安全
Dify平台集成阿里云AI安全护栏,构建AI Runtime安全防线
阿里云 AI 安全护栏加入Dify平台,打造可信赖的 AI
|
23天前
|
机器学习/深度学习 人工智能 算法
阿里云视频云以 360° 实时回放技术支撑 NBA 2025 中国赛 —— AI 开启“智能观赛”新体验
NBA中国与阿里云达成合作,首发360°实时回放技术,融合AI视觉引擎,实现多视角、低延时、沉浸式观赛新体验,重新定义体育赛事观看方式。
209 0
阿里云视频云以 360° 实时回放技术支撑 NBA 2025 中国赛 —— AI 开启“智能观赛”新体验
|
23天前
|
人工智能 缓存 运维
【智造】AI应用实战:6个agent搞定复杂指令和工具膨胀
本文介绍联调造数场景下的AI应用演进:从单Agent模式到多Agent协同的架构升级。针对复杂指令执行不准、响应慢等问题,通过意图识别、工具引擎、推理执行等多Agent分工协作,结合工程化手段提升准确性与效率,并分享了关键设计思路与实践心得。
330 20
【智造】AI应用实战:6个agent搞定复杂指令和工具膨胀
|
23天前
|
存储 人工智能 OLAP
AI Agent越用越笨?阿里云AnalyticDB「AI上下文工程」一招破解!
AI上下文工程是优化大模型交互的系统化框架,通过管理指令、记忆、知识库等上下文要素,解决信息缺失、长度溢出与上下文失效等问题。依托AnalyticDB等技术,实现上下文的采集、存储、组装与调度,提升AI Agent的准确性与协同效率,助力企业构建高效、稳定的智能应用。
|
25天前
|
人工智能 vr&ar UED
获奖公布|第十九届"挑战杯"竞赛2025年度中国青年科技创新"揭榜挂帅"擂台赛阿里云“AI技术助力乡村振兴”专题赛拟授奖名单公示
获奖公布|第十九届"挑战杯"竞赛2025年度中国青年科技创新"揭榜挂帅"擂台赛阿里云“AI技术助力乡村振兴”专题赛拟授奖名单公示
|
25天前
|
人工智能 算法 搜索推荐
AI 搜索时代选 GEO 外援?十家服务商,企业看过来
随着AI普及,GEO(生成式引擎优化)成为品牌获客新赛道。本文推荐10家优质GEO服务商,涵盖内容优化、流量提升、合规风控等方向,助力企业提升在DeepSeek、豆包等AI模型中的曝光与推荐,实现智能时代的精准增长。
|
25天前
|
存储 人工智能 OLAP
AI Agent越用越笨?阿里云AnalyticDB「AI上下文工程」一招破解!
AI 上下文工程是管理大模型输入信息的系统化框架,解决提示工程中的幻觉、上下文溢出与信息冲突等问题。通过上下文的采集、存储、加工与调度,提升AI推理准确性与交互体验。AnalyticDB PostgreSQL 版提供增强 RAG、长记忆、Supabase 等能力,助力企业构建高效、稳定的 AI 应用。
|
25天前
|
存储 人工智能 安全
云栖大会|AI驱动的智能数据湖仓,高性能实时分析与深度洞察
2025云栖大会“AI驱动的智能数据湖仓”专场,汇聚夺畅、聚水潭、零跑汽车等企业及阿里云瑶池团队,分享AI时代下数据管理到分析的全链路实践,涵盖智能计算、弹性架构、多模态处理与数据安全,共探Data+AI融合新范式。

热门文章

最新文章

下一篇