AI在线 AI在线

让RAG真正读懂“言外之意”!新框架引入词汇多样性,刷新多项基准SOTA

RAG准确率提升10.6%,多项基准拿下新SOTA! ACL 2025最新研究提出Lexical Diversity-aware RAG (DRAG) 框架,首次系统性地将词汇多样性引入RAG的检索与生成过程,提供了一个轻量、通用且易扩展的解决方案。 在多项基准任务中,该方法带来了显著性能提升,尤其在HotpotQA上刷新了当前最优结果。
9/27/2025 1:17:41 PM
一水

业界首个高质量原生3D组件生成模型来了!来自腾讯混元团队

业界首个高质量原生3D组件生成模型来了! 来自腾讯混元3D团队。 现有的3D生成算法通常会生成一体化的3D模型,而下游应用通常需要语义可分解的3D形状,即3D物体的每一个组件需要单独地生成出来。
9/27/2025 1:10:36 PM
一水

大模型“精细化”对齐,真实性提升25.8%刷新SOTA!token级精准编辑,无需训练即插即用

提升大模型对齐能力新方法,在TruthfulQA任务上真实性指标提升25.8%,刷新当前最优性能! 方法名为Token-Aware Editing (TAE),是一种token感知的推理时表征编辑方法。 该方法首次系统性地从token层面解决了传统表征编辑技术的问题,无需训练、即插即用,可广泛应用于对话系统、内容审核、偏见mitigation等场景。
9/27/2025 12:58:47 PM
衡宇

首个开源实现100%可复现的稳定RL训练框架来了!2次结果完全重合

开源框架实现100%可复现的稳定RL训练! 下图是基于Qwen3-8B进行的重复实验。 两次运行,一条曲线,实现了结果的完美重合,为需要高精度复现的实验场景提供了可靠保障。
9/27/2025 11:30:07 AM
衡宇

用同一组提示词,横向测评30+热门AI绘画平台(下)

前言. 常见的 AI 生图模型大概有以下这些:黑森林的 flux kontext、flux krea、flux dev、flux pro、flux krea、flux1.1,谷歌的 imagen-4、nano-banana,OpenAI 的 Gpt-4o,以及国内的 Dreamina3.1、Qwen3、Wan2.2、星流,还有就是老牌的 Midjourney、Ideogram、即梦、豆包、可灵、海螺等其他平台。 当有设计需求,无论是要出主图还是找创意灵感时,我习惯根据具体使用场景,把提示词放到对应的平台上尝试。
9/27/2025 7:38:24 AM
AI设计师Lena

京东AI「结果」:深度应用已成当下,万亿生态瞄准未来

谁最懂场景,谁赢得未来。 9 月 25 日,北京,深秋的气息逐渐浓烈,即便太阳高悬,空气中还是流露出些许凉意,而在中关村国际创新中心,一墙之隔的里面,却是喧哗而热闹。 人形机器人前一刻还在台上与碳基生物酷酷斗舞,下一秒便转头向观众说「hi」;数字人歌手与人类歌手隔着屏幕互动,吟唱着同一首歌;可爱的玩偶不再沉默,变身「话痨」与大家聊起了天;让打工人挠破了脑袋想创意的营销海报,现在直接「秒级」生成;不管是人还是动物,甚至一个动漫角色,只需要上传一张图就直接拥有一个数字分身……这是「2025 京东全球科技探索者大会 (JDD 大会)」的现场,也是京东大模型品牌升级后的首次 JDD,而这些都是京东 AI 应用最为沉浸、直观的展示。
9/26/2025 7:35:00 PM
机器之心

Agentic Coding表现创新高,全新KAT系列模型上榜SWE-Bench

近期,快手 Kwaipilot 团队推出了 KAT 系列两款突破性 Agentic Coding 大模型:开源 32B 参数模型 KAT-Dev-32B 与闭源旗舰模型  KAT-Coder。 这两款模型在 Code Intelligence 领域分别体现出轻量级的超强表现和极致性能。 其中,在 SWE-Bench Verified 上,KAT-Dev-32B 展现出强劲性能并取得了 62.4% 的解决率,在所有不同规模的开源模型中排名第 5。
9/26/2025 7:28:00 PM
机器之心

IEEE TPAMI 2025 | 北京大学提出分布驱动的终身学习范式,用结构建模解决灾难性遗忘

近日,北京大学王选计算机研究所周嘉欢助理教授与彭宇新教授合作在人工智能重要国际期刊 IEEE TPAMI 发布一项最新的研究成果:DKP (Distribution-aware Knowledge Aligning and Prototyping for Non-exemplar Lifelong Person Re-Identification)。 该工作针对终身学习中的灾难性遗忘问题,提出分布建模引导的知识对齐与原型建模框架,不仅有效增强了对历史知识的记忆能力,也提升了模型的跨域学习能力。 本文的第一作者为北京大学北京大学王选计算机研究所助理教授周嘉欢,通讯作者为北京大学王选计算机研究所教授彭宇新。
9/26/2025 6:55:00 PM
机器之心

​谷歌 DeepMind 推出全新机器人 AI 模型 可实现洗衣物分类

谷歌旗下的 DeepMind 近日发布了一款新型机器人人工智能模型,该模型具有出色的洗衣物分类能力。 这一技术进步标志着通用机器在推理能力方面的显著提升,旨在使机器人在日常生活中变得更加实用。 在家庭生活中,洗衣物的分类是一项耗时的任务。
9/26/2025 6:17:10 PM
AI在线

美国与马斯克的 xAI 达成协议,显示与特朗普的关系改善

近期,美国政府与埃隆・马斯克创办的人工智能公司 xAI 达成了一项重要协议,这一举动被视为特朗普与政府之间关系逐渐回暖的标志。 协议的达成恰逢特朗普与马斯克在纪念查理・基尔克的活动上会面,这使得此次交易备受关注。 马斯克作为科技界的领军人物,其公司 xAI 致力于开发先进的人工智能技术。
9/26/2025 6:17:10 PM
AI在线

剪映创作者交流会:全面引入AI能力,打造一站式创作工具

日前,剪映举办 2025 创作者交流大会,以「All in AI,All in One,创作,无限新可能」为主题,全面介绍了剪映各项 AI 能力,并与创作者共同探讨 AI 如何重塑创作流程、降低创作门槛。 剪映产品负责人表示,剪映的终极目标是成为每一位创作者的「全能伙伴」,从前端灵感到后期输出,实现无缝闭环。 她强调:「AI 时代,创作不应被技术门槛束缚,而应回归灵感与情感的表达。
9/26/2025 5:39:00 PM
机器之心

理想i6正式发布:统一价24.98万元,续航720公里

9 月 26 日,理想汽车正式发布新形态五座 SUV—— 理想 i6。 新车全国统一零售价 24.98 万元,并将于 9 月 27 日起正式开启交付。 “年轻,就应该去拥有和创造最好的产品。
9/26/2025 5:06:00 PM
新闻助手

华为第一「境」CEO官宣:广汽神车操盘手

与华为轮值董事长和广汽董事长合影,他站C位。 他是谁? 华为第一「境」启境CEO刘嘉铭,近日以上述隆重的方式走向台前。
9/26/2025 5:02:14 PM
一凡

创智&交大发现AI能动性新规律, 78样本胜GPT5实现软件+科研自动化

AI 能动性的时代要求系统不仅能思考,更要能干活:包括协同编程(人机协作开发)和自动化科学研究。 LIMI 仅用 78 个样本就超越 GPT-5 达 14.1%,并发现了能动性效率原则: AI 能动性不仅来源于数据丰富性,更来自于战略性构建。 本文来自于上海创智学院和上海交大刘鹏飞老师团队,团队专注于构建最前沿 AI 系统。
9/26/2025 4:53:00 PM
机器之心

学三年动画被AI秒杀,OpenAI要拍电影,好莱坞不敢买账

OpenAI要「干趴」好莱坞。 这是网友学了三年动画做出来的《泰坦尼克号》,不知道大家是啥想法,反正我看完就精神分裂了。       视频来自学了三年的动画,毕业只能去电子厂打螺丝的 B 站 up 主 MAX - 小仙女一边是李云龙附体:开炮,开炮!
9/26/2025 4:42:00 PM
机器之心

北汽自主电驱技术取得重大突破,海纳川电机单转子挑战超高转速成功

近日,北汽集团旗下核心零部件平台海纳川公司自主研发的电动汽车用驱动电机单转子挑战成功55000转/分钟超高转速,获得权威机构认证,该转子的转速达到当前行业领先水平,这代表着北汽集团的自主电驱技术实现重大突破,核心零部件自主创新能力再度跃迁。 同时,海纳川电机项目也是北京市首个汽车用电机项目,北汽集团持续为首都科技创新中心建设贡献力量,为京津冀新能源汽车产业高质量发展与新质生产力发展注入新的产业链价值。 电机的转速是衡量新能源汽车动力系统性能的关键指标之一。
9/26/2025 4:25:57 PM
西风

马斯克新模型背后算法来自英伟达???

Jay 发自 凹非寺量子位 | 公众号 QbitAIGrok-4-fast最近在降本增效上的表现堪称一骑绝尘,连有「路由器」傍身的GPT5都给干趴下了。 面对如此惊艳的推理效率,很多人第一反应就是:堆卡式的算力scaling又一次大显神威了。 实际上,Grok的背后确实有英伟达的影子。
9/26/2025 4:21:32 PM
Jay

Project Imaging-X发布:1000+开放医学影像数据集全景式综述

作者丨项目团队编辑丨ScienceAI过去几年,通用领域的基础模型(Foundation Models)在大规模、异质、高质量数据的推动下快速演进。 在医学影像场景中,基础模型同样被寄予厚望:期望以一次预训练,支持多模态(CT/MR/PET/内镜等)、多任务(分割/检测/配准/追踪等)与多解剖部位的统一处理,成为从研究到临床的“通用基础”。 然而,医学影像数据的获取与敏感高度依赖医学专业知识,并受到伦理与隐私的严格约束,现有的公开数据长期呈现“小而散、偏科严重”的格局:与通用视觉领域的数据集相比,目前公开的医学影像数据集的规模普遍较小,通常只有数千张图像,与通用领域的数据集个数级数量相比。
9/26/2025 4:13:00 PM
ScienceAI