你好，我是AI助理，可以解答问题、推荐解决方案等

开发者社区云计算文章正文

建立Hugging Face模型调用环境

2024-11-06 539

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

老皮皮不会弹舌

简介： 本文介绍了如何在环境中导入transformers库，并从Hugging Face网站下载模型。如果使用镜像网站，需获取access token。部分模型需申请仓库权限，建议使用国外信息填写。有GPU的用户需先配置CUDA和pytorch-gpu。

1. 需要在环境中导入transformers库。

2. 需要到Hugging Face网站下载模型。（TODO为下载保存的本地地址）

3. 网站下载模型时采用镜像网站的话，需要到Hugging Face原网站上获取access token。跳转链接见hf- mirror首页最下方。

截屏2024-11-06 13.19.38.png

4. 个别模型需要申请仓库权限。节点地址、姓名、国家、联系方式都需要使用国外的才可以通过。建议设置如下。

5. 有GPU可以使用的，需要先配置CUDA和pytorch-gpu。

文章标签：

来源：

开发者社区 > 云计算 > 文章 > 正文

老皮皮不会弹舌

目录

相关文章

一个处女座的程序猿

|

算法数据库计算机视觉

Dataset之COCO数据集：COCO数据集的简介、下载、使用方法之详细攻略

Dataset之COCO数据集：COCO数据集的简介、下载、使用方法之详细攻略

一个处女座的程序猿

38175 1 1

|

虚拟化

故障案例-ESXI6.7 EP13 紫屏分析

一台ESXI6.7 EP13 紫屏分析过程

2770 0 0

|

7月前

|

人工智能自然语言处理运维

让AI读懂K线图！ChatTS-14B：字节开源的时间序列理解和推理大模型，自然语言提问秒解趋势密码！

ChatTS-14B是字节跳动开源的时间序列专用大模型，基于Qwen2.5-14B微调优化，通过合成数据对齐技术显著提升分析能力，支持自然语言交互完成预测推理等复杂任务。

1400 1 1

让AI读懂K线图！ChatTS-14B：字节开源的时间序列理解和推理大模型，自然语言提问秒解趋势密码！

|

9月前

|

机器学习/深度学习并行计算 API

Qwen2.5-1M: 支持100万Tokens上下文的开源Qwen模型

两个月前，Qwen团队升级了 Qwen2.5-Turbo，使其支持最多一百万个Tokens的上下文长度。今天，Qwen正式推出开源的 Qwen2.5-1M 模型及其对应的推理框架支持。

1786 28 29

汀丶人工智能

|

存储 Linux 开发工具

告别Hugging Face模型下载难题：掌握高效下载策略，畅享无缝开发体验

【8月更文挑战第2天】告别Hugging Face模型下载难题：掌握高效下载策略，畅享无缝开发体验

汀丶人工智能

2996 64 68

告别Hugging Face模型下载难题：掌握高效下载策略，畅享无缝开发体验

|

数据采集自然语言处理 PyTorch

动手实践：使用Hugging Face Transformers库构建文本分类模型

【10月更文挑战第29天】作为一名自然语言处理（NLP）爱好者，我一直对如何利用最先进的技术解决实际问题充满兴趣。Hugging Face 的 Transformers 库无疑是目前最流行的 NLP 工具之一，它提供了大量的预训练模型和便捷的接口，使得构建和训练文本分类模型变得更加简单高效。本文将通过具体的实例教程，指导读者如何使用 Hugging Face 的 Transformers 库快速构建和训练一个文本分类模型，包括环境搭建、数据预处理、模型选择与训练等步骤。

757 0 0

不要葱姜蒜

|

11月前

|

搜索推荐物联网 PyTorch

Qwen2.5-7B-Instruct Lora 微调

本教程介绍如何基于Transformers和PEFT框架对Qwen2.5-7B-Instruct模型进行LoRA微调。

不要葱姜蒜

11658 34 43

Qwen2.5-7B-Instruct Lora 微调

周周的奇妙编程

|

人工智能 Linux Docker

一文详解几种常见本地大模型个人知识库工具部署、微调及对比选型（1）

近年来，大模型在AI领域崭露头角，成为技术创新的重要驱动力。从AlphaGo的胜利到GPT系列的推出，大模型展现出了强大的语言生成、理解和多任务处理能力，预示着智能化转型的新阶段。然而，要将大模型的潜力转化为实际生产力，需要克服理论到实践的鸿沟，实现从实验室到现实世界的落地应用。阿里云去年在云栖大会上发布了一系列基于通义大模型的创新应用，标志着大模型技术开始走向大规模商业化和产业化。这些应用展示了大模型在交通、电力、金融、政务、教育等多个行业的广阔应用前景，并揭示了构建具有行业特色的“行业大模型”这一趋势，大模型知识库概念随之诞生。

周周的奇妙编程

156029 30 84

|

12月前

|

存储人工智能自然语言处理

人工智能----RAG Workflow工作流详解

【11月更文挑战第20天】随着人工智能技术的飞速发展，自然语言处理（NLP）领域也迎来了革命性的变革。其中，检索增强生成（Retrieval-Augmented Generation，简称RAG）技术作为一种结合了信息检索与生成模型的技术，在提高生成式模型的准确性和实用性方面展现出了巨大潜力。本文将深入探讨RAG Workflow工作流的历史、背景、功能点、优缺点及其底层原理，并通过Java代码演示其主要功能点。

1201 6 6

老皮皮不会弹舌

|

12月前

|

存储 Java 程序员

深入理解ThreadLocal及其弱引用

深入理解ThreadLocal及其弱引用

老皮皮不会弹舌

154 0 0

热门文章

最新文章

中文大模型体验测评系列（一）

七招教你处理非平衡数据——避免得到一个“假”模型

python web service开发

《Cadence 16.6电路设计与仿真从入门到精通》——1.4 Cadence SPB 16.6的启动　

百度网盘搜索引擎

想在Daydream View上看成人内容，GameLink为你准备好一切

真正实现性能可预期的ECS实例（突发性能实例t5）

一文讲透 RocketMQ 消费者是如何负载均衡的

Silverlight版本的LoadMask

jQuery 常用技巧

springboot自动装配的基本原理

星野“崽崽”大规模下架整改：AI陪伴行业的警示与拐点

Python 3.14 实用技巧：10个让代码更清晰的小改进

如何驯服AI编程

Kali Linux 加入 Windows 域：完整的域渗透测试环境搭建指南

使用 Ansible 自动化部署 Snort3 入侵检测系统：从零到生产环境（RedHat）

我是谁？我从哪来？我要到哪去？——聊聊数据血缘分析的“前世今生”

兄弟别手工点云服务器了：聊聊 IaC 的人间真实与落地指南

别再给我推明星八卦了！——大数据视角下，个性化新闻推荐的“人间真实”优化指南

Vue 3 emit 参数数量不匹配问题深度解析与最佳实践

相关电子书

低代码开发师（初级）实战教程

冬季实战营第三期：MySQL数据库进阶实战

阿里巴巴DevOps 最佳实践手册