NexaAI, 一行命令运行魔搭社区模型，首次在设备上运行 Qwen2-Audio-阿里云开发者社区

NexaAI, 一行命令运行魔搭社区模型，首次在设备上运行 Qwen2-Audio

2024-12-09 873

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： Qwen2-Audio是一个 70亿参数量 SOTA 多模态模型，可处理音频和文本输入。

音频语言模型正在获得显著的关注，但边缘部署选项仍然非常有限。虽然 llama.cpp 和 Ollama 支持文本和视觉模型，但它们目前不支持音频模型。

Qwen2-Audio是一个 70亿参数量 SOTA 多模态模型，可处理音频和文本输入。它无需 ASR 模块即可实现语音交互，提供音频分析功能，并支持超过8种语言和方言，例如中文、英语、粤语、法语、意大利语、西班牙语、德语和日语。

魔搭社区和Nexa SDK合作，一键运行魔搭社区GGUF模型，包括本次发布的Qwen2-Audio的GGUF格式。

Github repo：

NexaAI 魔搭模型repo：

01.Nexa SDK：一句话运行魔搭社区模型

使用魔搭社区免费CPU算力使用Nexa一键运行魔搭社区GGUF模型。

首先，安装Nexa SDK

pip install nexaai

一句话运行魔搭社区模型

nexa run -ms Qwen/Qwen2.5-3B-Instruct-GGUF

在魔搭社区的免费Notebook算力上运行Qwen-Audio-7B-GGUF

curl -fsSL https://public-storage.nexa4ai.com/install.sh | sh

然后，运行Qwen2-Audio模型

nexa run qwen2audio

或者运行的同时支持Streamlit 本地WebUI

nexa run qwen2audio -st

也可以直接在ModelScope上运行Qwen-Audio-7B-GGUF

nexa run -ms NexaAIDev/Qwen2-Audio-7B-GGUF

将音频文件存储在终端中（或在 Linux 上输入文件路径）。将文本提示以及语音文件地址直接输入模型。

💻 默认的 q4_K_M 版本需要 4.2GB 的 RAM。

下图列出了在您的设备上运行 Qwen2-Audio 需要多少 RAM