一周AI最火论文 | 移动端的3D实时CNN正在成为现实,加速框架细节起底

简介: 一周AI最火论文 | 移动端的3D实时CNN正在成为现实,加速框架细节起底

本周关键词:推荐系统、3D建模、BERT

本周最佳学术研究

新一代推荐系统实验工具

如果你关注推荐系统,那么python版的LensKit推荐系统引擎库(LKPY)可能会引起你的兴趣。这是一个开源工具包,可用于构建、研究及学习推荐系统。

2010年LensKit 的Java版本首次发布,目前该工具已经应用于各种研究的发表、小规模生产部署以及线上(MOOC)和线下(传统教室)教育中。

在本文中,美国博伊西州立大学的研究人员提出了LensKit for Python项目,将原始工具重新构建为灵活易用的Python插件,用于推荐系统研发。

Python版的LensKit(LKPY)使研究人员和学生能够利用强大且不断发展的PyData和Python科学生态圈(包括scikit-learn,TensorFlow和PyTorch),构建健壮、灵活且可重复的实验系统。

原文:
https://arxiv.org/pdf/1809.03125v3.pdf

Python的度量学习算法

Metric-learn是一个开源Python库,包含几种流行的有监督和弱监督度量学习算法的高效Python实现。

作为scikit-learn-contrib的一部分,metric-learn提供了一个与scikit-learn兼容的统一接口,可以很方便地与其他机器学习库进行交叉验证、模型选择和串联。Metric-learn遵从MIT许可,并已在PyPi上进行了全面测试。

github链接:
https://github.com/scikit-learn-contrib/metric-learn

原文:
https://arxiv.org/pdf/1908.04710v2.pdf

3D卷积神经网络的移动端加速框架

目前,许多移动终端都配备了强大的高端移动CPU和GPU,这使得它们逐步成为深度学习的重要平台。

本文介绍了RT3D,一种用于3D CNN(卷积神经网络)的移动端加速框架,它由两个新型且适用于移动设备的结构化稀疏方案(Vanilla和KGS)和最佳修剪算法组成,并且有一个编译器辅助的代码生成框架将对网络的修剪转化为性能的提升。

评测结果显示,RT3D击败了两个最先进的加速框架,加速高达29.1倍。这是RT3D首次在150 毫秒内预测16个视频帧,即通过纯软件解决方案在现成的移动设备上实现3D CNN的实时预测。

原文:
https://arxiv.org/abs/2007.09835v1

用于结构化3D建模的大型逼真数据集

研究人员创建了一个大型的Structured3D综合数据集,其中提供了21835个房间地面详细真实的3D结构批注,和超过196k的2D渲染。

他们引入了统一的“原始+关系”的表示方法,这使他们能够有效地捕获各种各样的半全局或全局的3D结构,及其相互关系。该数据集可用于训练深层网络以进行房间布局预测,并在公共基准上证明其性能得到改善,此数据集也可能有益于图像合成。

研究人员认为这项工作是构建智能机器重要且令人振奋的一步,该机器可以实现人类水平的整体3D场景理解。

他们将继续为数据集添加更多场景和对象的3D结构注释,并探索使用数据集的新方法,以推进用于结构化3D建模和理解的技术。

项目网站:
https://structured3d-dataset.org/

原文:
https://arxiv.org/pdf/1908.00222v3.pdf

使用BERT的会话系统生成产品标题

一组研究人员研究了在标签有限的情况下,为大型电子商务目录里的产品生成简明,语法正确的语音标题的问题。

在本文中,他们提出了一种使用BERT从输入Web标题生成简短、自然、口头化的标题序列到序列方法。即使在数据极其有限的情况下,他们仍通过指标和人工评估了4种不同的基准。

他们在现实世界的行业数据集上进行了广泛的实验,并对模型输出进行了人工评估,结果表明,BERT汇总优于可比较的基准模型。

基于丰富的用户元数据,来生成不同用户细分的个性化标题,并将Web数据与可能依赖于产品的其他产品属性结合在一起,是扩展此工作的一些方向。

原文:
https://arxiv.org/abs/2007.11768

其他爆款论文

用于R和Python的高维数据分析的稀疏学习库:毕加索项目:
https://arxiv.org/abs/2006.15261v1

自动单眼3D狗重建的端到端方法:谁把狗拒之门外?
https://arxiv.org/pdf/2007.11110v1.pdf

一种新的训练程序,可以减少3D检测任务所需的3D标签工作量:
https://arxiv.org/pdf/2004.02693v2.pdf

从单个2D偏振图像估计穿衣的人体形状的问题:
https://arxiv.org/pdf/2007.09268v1.pdf

学习资源

深度学习:
https://lme.tf.fau.de/teaching/free-deep-learning-resources/

65个最好的深度学习课程:
https://www.classcentral.com/subject/deep-learning

AI大事件

亚马逊为Alexa开发者推出了一系列新功能:
https://www.zdnet.com/article/amazons-new-tools-for-alexa-developers-hints-at-whats-next-for-the-voice-assistant/

人工智能降低了用户体验,但这一定是坏事吗?
https://www.zdnet.com/article/artificial-intelligence-drives-new-user-experiences/

相关文章
|
2月前
|
人工智能 物联网 调度
边缘大型AI模型:协作部署与物联网应用——论文阅读
论文《边缘大型AI模型:协作部署与物联网应用》系统探讨了将大模型(LAM)部署于边缘网络以赋能物联网的前沿框架。针对传统云端部署高延迟、隐私差的问题,提出“边缘LAM”新范式,通过联邦微调、专家混合与思维链推理等技术,实现低延迟、高隐私的分布式智能。
759 6
边缘大型AI模型:协作部署与物联网应用——论文阅读
|
3月前
|
人工智能 Java 开发者
阿里出手!Java 开发者狂喜!开源 AI Agent 框架 JManus 来了,初次见面就心动~
JManus是阿里开源的Java版OpenManus,基于Spring AI Alibaba框架,助力Java开发者便捷应用AI技术。支持多Agent框架、网页配置、MCP协议及PLAN-ACT模式,可集成多模型,适配阿里云百炼平台与本地ollama。提供Docker与源码部署方式,具备无限上下文处理能力,适用于复杂AI场景。当前仍在完善模型配置等功能,欢迎参与开源共建。
1747 58
阿里出手!Java 开发者狂喜!开源 AI Agent 框架 JManus 来了,初次见面就心动~
|
3月前
|
机器学习/深度学习 人工智能 资源调度
智能家居环境中的AI决策解释:实现以人为中心的可解释性——论文阅读
本文探讨智能家居中AI决策的可解释性,提出以人为中心的XAI框架。通过SHAP、DeepLIFT等技术提升模型透明度,结合用户认知与需求,构建三层解释体系,增强信任与交互效能。
324 19
智能家居环境中的AI决策解释:实现以人为中心的可解释性——论文阅读
|
3月前
|
人工智能 运维 Java
Flink Agents:基于Apache Flink的事件驱动AI智能体框架
本文基于Apache Flink PMC成员宋辛童在Community Over Code Asia 2025的演讲,深入解析Flink Agents项目的技术背景、架构设计与应用场景。该项目聚焦事件驱动型AI智能体,结合Flink的实时处理能力,推动AI在工业场景中的工程化落地,涵盖智能运维、直播分析等典型应用,展现其在AI发展第四层次——智能体AI中的重要意义。
1367 27
Flink Agents:基于Apache Flink的事件驱动AI智能体框架
|
3月前
|
人工智能 数据可视化 数据处理
AI智能体框架怎么选?7个主流工具详细对比解析
大语言模型需借助AI智能体实现“理解”到“行动”的跨越。本文解析主流智能体框架,从RelevanceAI、smolagents到LangGraph,涵盖技术门槛、任务复杂度、社区生态等选型关键因素,助你根据项目需求选择最合适的开发工具,构建高效、可扩展的智能系统。
970 3
AI智能体框架怎么选?7个主流工具详细对比解析
|
3月前
|
机器学习/深度学习 人工智能 自然语言处理
AI Compass前沿速览:IndexTTS2–B站、HuMo、Stand-In视觉生成框架、Youtu-GraphRAG、MobileLLM-R1–Meta、PP-OCRv5
AI Compass前沿速览:IndexTTS2–B站、HuMo、Stand-In视觉生成框架、Youtu-GraphRAG、MobileLLM-R1–Meta、PP-OCRv5
352 10
AI Compass前沿速览:IndexTTS2–B站、HuMo、Stand-In视觉生成框架、Youtu-GraphRAG、MobileLLM-R1–Meta、PP-OCRv5
|
2月前
|
人工智能 JavaScript 前端开发
GenSX (不一样的AI应用框架)架构学习指南
GenSX 是一个基于 TypeScript 的函数式 AI 工作流框架,以“函数组合替代图编排”为核心理念。它通过纯函数组件、自动追踪与断点恢复等特性,让开发者用自然代码构建可追溯、易测试的 LLM 应用。支持多模型集成与插件化扩展,兼具灵活性与工程化优势。
281 6
|
3月前
|
机器学习/深度学习 资源调度 算法框架/工具
AI-ANNE: 将神经网络迁移到微控制器的深度探索——论文阅读
AI-ANNE框架探索将深度学习模型迁移至微控制器的可行路径,基于MicroPython在Raspberry Pi Pico上实现神经网络核心组件,支持本地化推理,推动TinyML在边缘设备中的应用。
266 10
|
3月前
|
机器学习/深度学习 人工智能 自然语言处理
​​超越CNN与RNN:为什么Transformer是AI发展的必然选择?​
本文深入解析Transformer及其在AI领域的三大突破:自然语言处理、视觉识别(ViT)与图像生成(DiT)。以“注意力即一切”为核心,揭示其如何成为AI时代的通用架构。
498 2
|
3月前
|
人工智能 算法 开发者
2025年高教社杯E题——AI 辅助智能体测全国大学生数学建模(思路、代码、论文)
2025年高教社杯E题——AI 辅助智能体测全国大学生数学建模(思路、代码、论文)
490 1

热门文章

最新文章

下一篇