首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >腾讯云数据分析智能体:全球第三,国内第一!

腾讯云数据分析智能体:全球第三,国内第一!

作者头像
小腾资讯君
发布于 2025-07-04 17:49:04
发布于 2025-07-04 17:49:04
29200
代码可运行
举报
运行总次数:0
代码可运行

「 魔镜啊魔镜,谁是这个世界上最美丽的女人?」

皇后并不知道,自以为非常简单的问题,魔镜有多累。如果用数据来回答,可能需要这样复杂的指令:

代码语言:javascript
代码运行次数:0
运行
复制
SELECT name FROM people WHERE beauty_score = (SELECT MAX(beauty_score) FROM people) AND gender = 'female';

看,把自然语言变成精准的数据库查询(SQL),本身就充满挑战。腾讯云却将它做到了全球顶尖水平——

权威自然语言转SQL(NL2SQL)国际评测平台BIRD-Bench公布最新结果:腾讯云自研的数据分析智能体TCDataAgent斩获全球第三、国内第一! 刷新国内在该领域的最佳成绩,超越众多国际科技巨头。

图片
图片

先来看看这份榜单的含金量——

BIRD-Bench被誉为「NL2SQL全球最难榜单」。它不仅要求系统将自然语言问题(如「找出未通过质检的订单」)准确翻译成SQL语句,还要确保生成的SQL在超大、超真实、藏着各种「脏数据」的企业级数据库里,又快又准地跑出来。

测评用的样本,涵盖了金融、医疗、体育等37个真实行业场景,总数据量达到33GB,考题多达1万+条,非常考验产品的理解、推理和数据细节把控等能力。

就是在这样严苛的条件下,腾讯云TCDataAgent依然取得了75.74分的高分。

传统方法容易在复杂结构或语义模糊时「猜错」用户意图,TCDataAgent则在三大方向取得突破——

● 错误自动识别与修正:引入「数据库约束验证机制」,能够像「质检员」一样自动发现并修复SQL语句中的结构性或语义性错误。比如,连接错误、多余的条件等。

● 「理解」数据库内容:让模型紧密「结合」数据库的真实内容来生成和优化SQL,极大提升了意图理解和结果的可信度;

● 高质量训练筛选:通过后训练(post-training)技术,优先筛选并复用效果最优的SQL样本进行训练迭代,让每一次筛选出来的有效SQL都能可持续发展,提升模型整体学习的效率和稳定性。

这项技术创新成果,也被数据库领域顶尖国际会议VLDB接收发表。论文中的实验显示,TCDataAgent的核心模块可以集成到其他同类系统中,能将查询执行准确率最高提升18.3%。

我们希望,通过Data+AI融合,让用户通过自然语言就能轻松进行复杂的数据查询、报表生成和趋势分析,让「人人都是数据科学家」变得不再遥远。

本文系转载,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文系转载,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档