查看 “
” 全部搜索结果
AI 助理
你好,我是AI助理,可以解答问题、推荐解决方案等
开发者社区
个人
开发者社区
个人
首页
计算机视觉
自然语言处理
语音
多模态
科学计算
魔搭社区官网
探索云世界
热门
百炼大模型
Modelscope模型即服务
弹性计算
通义灵码
云原生
数据库
云效DevOps
龙蜥操作系统
云计算
弹性计算
无影
存储
网络
倚天
云原生
容器
serverless
中间件
微服务
可观测
消息队列
数据库
关系型数据库
NoSQL数据库
数据仓库
数据管理工具
PolarDB开源
向量数据库
大数据
大数据计算
实时数仓Hologres
实时计算Flink
E-MapReduce
DataWorks
Elasticsearch
机器学习平台PAI
智能搜索推荐
数据可视化DataV
人工智能
机器学习平台PAI
视觉智能开放平台
智能语音交互
自然语言处理
多模态模型
pythonsdk
通用模型
开发与运维
云效DevOps
钉钉宜搭
镜像站
开发者社区
>
ModelScope模型即服务
>
语音
语音
关注
包括语音识别、语音合成、语音唤醒、声学设计及信号处理、声纹识别、音频事件检测等多个领域
0
今日
322
内容
0
活动
300
关注
来自:
ModelScope模型即服务
最新
文章
视频
问答
推荐
h5cei4nf5lz3y
|
24天前
|
问答
如何做一款高准确率去判断中文语音是否为同一人说的软件
74 浏览
0 回答
0 感兴趣
游客u47je7pgqayge
|
6月前
|
问答
Funasr GPU2.0.0部署推理,RTF达不到0.0008,连0.0076都达不到。
178 浏览
0 回答
0 感兴趣
蚝油菜花
|
7月前
|
博文
覆盖16省方言的老人语音数据集!SeniorTalk:智源研究院开源全球首个超高龄老年人中文语音数据集
826 浏览
5 点赞
6感兴趣
蚝油菜花
|
7月前
|
博文
AI终于能听懂宝宝说话了!ChildMandarin:智源研究院开源的低幼儿童中文语音数据集,覆盖22省方言
773 浏览
20 点赞
21感兴趣
蚝油菜花
|
7月前
|
博文
Dolphin:40语种+22方言!清华联合海天瑞声推出的语音识别大模型,识别精度超Whisper两代
3497 浏览
50 点赞
51感兴趣
蚝油菜花
|
7月前
|
博文
Text to Bark:让狗狗听懂人话!全球首个AI"狗语"生成器,137种狗狗口音任君挑选
1234 浏览
15 点赞
16感兴趣
游客u47je7pgqayge
|
7月前
|
问答
funasr 微调没有效果?微调数据量是多少,如何调整batch_size
225 浏览
0 回答
0 感兴趣
蚝油菜花
|
8月前
|
博文
PaddleSpeech:百度飞桨开源语音处理神器,识别合成翻译全搞定
692 浏览
18 点赞
18感兴趣
蚝油菜花
|
8月前
|
博文
EmotiVoice:网易开源AI语音合成黑科技,2000+音色情感可控
868 浏览
43 点赞
44感兴趣
蚝油菜花
|
8月前
|
博文
Oliva:语音RAG革命!开源多智能体秒解复杂搜索,实时对讲颠覆传统
420 浏览
4 点赞
4感兴趣
蚝油菜花
|
8月前
|
博文
MoshiVis:语音视觉实时交互开源!7B模型秒懂图像,无障碍革命来袭
370 浏览
28 点赞
28感兴趣
蚝油菜花
|
8月前
|
博文
Soundwave:语音对齐黑科技!开源模型秒解翻译问答,听懂情绪波动
440 浏览
13 点赞
13感兴趣
蚝油菜花
|
8月前
|
博文
GPT-4o-mini-transcribe:OpenAI 推出实时语音秒转文本模型!高性价比每分钟0.003美元
412 浏览
2 点赞
2感兴趣
蚝油菜花
|
8月前
|
博文
GPT-4o-Transcribe:OpenAI 推出高性能语音转文本模型!错误率暴降90%+方言通杀,Whisper当场退役
402 浏览
2 点赞
2感兴趣
蚝油菜花
|
8月前
|
博文
GPT-4o mini TTS:OpenAI 推出轻量级文本转语音模型!情感操控+白菜价冲击配音圈
433 浏览
2 点赞
2感兴趣
蚝油菜花
|
8月前
|
博文
URO-Bench:端到端语音对话模型评测黑马!多语言/多轮/副语言全维度一键开测
558 浏览
1 点赞
1感兴趣
蚝油菜花
|
8月前
|
博文
WhisperChain:开源 AI 实时语音转文字工具!自动消噪优化文本,效率翻倍
2223 浏览
2 点赞
7感兴趣
蚝油菜花
|
8月前
|
博文
Baichuan-Audio:端到端音频大模型,实时双语对话+语音生成
992 浏览
3 点赞
3感兴趣
蚝油菜花
|
9月前
|
博文
OSUM:告别ASR单一功能,西工大开源的语音大模型会「读心」!识别+情感分析+年龄预测等8大任务1个模型全搞定
818 浏览
8 点赞
8感兴趣
蚝油菜花
|
9月前
|
博文
Step-Audio:开源语音交互新标杆!这个国产AI能说方言会rap,1个模型搞定ASR+TTS+角色扮演
1181 浏览
91 点赞
92感兴趣
蚝油菜花
|
9月前
|
博文
Zonos:油管博主集体转粉!开源TTS神器Zonos爆火:克隆你的声音说5国语言,还能调喜怒哀乐
538 浏览
18 点赞
21感兴趣
蚝油菜花
|
9月前
|
博文
TIGER:清华突破性模型让AI「听觉」进化:参数量暴降94%,菜市场都能分离清晰人声
752 浏览
6 点赞
7感兴趣
蚝油菜花
|
9月前
|
博文
Hibiki:实时语音翻译模型打破语言交流障碍!支持将语音实时翻译成其他语言的语音或文本
932 浏览
18 点赞
19感兴趣
蚝油菜花
|
9月前
|
博文
FireRedASR:精准识别普通话、方言和歌曲歌词!小红书开源工业级自动语音识别模型
2808 浏览
17 点赞
17感兴趣
蚝油菜花
|
9月前
|
博文
SpeechGPT 2.0:复旦大学开源端到端 AI 实时语音交互模型,实现 200ms 以内延迟的实时交互
1974 浏览
21 点赞
22感兴趣
蚝油菜花
|
10月前
|
博文
百聆:集成Deepseek API及语音技术的开源AI语音对话助手,实时交互延迟低至800ms
3031 浏览
5 点赞
6感兴趣
蚝油菜花
|
10月前
|
博文
Kokoro-TTS:超轻量级文本转语音模型,支持生成多种语言和多种语音风格
1484 浏览
5 点赞
5感兴趣
蚝油菜花
|
10月前
|
博文
Weebo:支持多语言和实时语音交流的开源 AI 聊天机器人,回复具备语调、情感的语音
868 浏览
17 点赞
17感兴趣
蚝油菜花
|
10月前
|
博文
三行代码实现实时语音转文本,支持自动断句和语音唤醒,用 RealtimeSTT 轻松创建高效语音 AI 助手
2236 浏览
18 点赞
19感兴趣
蚝油菜花
|
10月前
|
博文
TangoFlux:高速生成高质量音频,仅用3.7秒生成长达30秒的音频,支持文本到音频转换
280 浏览
6 点赞
6感兴趣
蚝油菜花
|
11月前
|
博文
3D-Speaker:阿里通义开源的多模态说话人识别项目,支持说话人识别、语种识别、多模态识别、说话人重叠检测和日志记录
2382 浏览
18 点赞
18感兴趣
蚝油菜花
|
11月前
|
博文
Freestyler:微软联合西工大和香港大学推出说唱音乐生成模型,支持控制生成的音色、风格和节奏等
381 浏览
16 点赞
16感兴趣
蚝油菜花
|
11月前
|
博文
CosyVoice 2.0:阿里开源升级版语音生成大模型,支持多语言和跨语言语音合成,提升发音和音色等的准确性
7267 浏览
22 点赞
26感兴趣
蚝油菜花
|
11月前
|
博文
ChatTTSPlus:开源文本转语音工具,支持语音克隆,是 ChatTTS 的扩展版本
768 浏览
5 点赞
5感兴趣
蚝油菜花
|
11月前
|
博文
Clone-voice:开源的声音克隆工具,支持文本转语音或改变声音风格,支持16种语言
1937 浏览
9 点赞
11感兴趣
蚝油菜花
|
11月前
|
博文
ClearerVoice-Studio:阿里通义开源的语音处理框架,提供语音增强、分离和说话人提取等功能
2021 浏览
3 点赞
3感兴趣
蚝油菜花
|
11月前
|
博文
Fish Speech 1.5:Fish Audio 推出的零样本语音合成模型,支持13种语言
1027 浏览
3 点赞
4感兴趣
游客sjgoxolfnpuvo
|
11月前
|
问答
模型:语音合成-中文-多情感领域-16k-多发音人 语速调节
184 浏览
1 回答
0 感兴趣
蚝油菜花
|
11月前
|
博文
Voice-Pro:开源AI音频处理工具,集成转录、翻译、TTS等一站式服务
847 浏览
10 点赞
10感兴趣
游客sjgoxolfnpuvo
|
问答
iic/speech_sambert-hifigan_tts_zh-cn_16k模型实时合成
369 浏览
1 回答
0 感兴趣
邢兵xingbing
|
问答
wekws训练自定义数据集的误唤醒较高。
547 浏览
1 回答
0 感兴趣
1575484699945370
|
博文
kws_util 下载不了
300 浏览
1 点赞
1感兴趣
游客houy3eurbzy4a
|
问答
基于ModelScope进行推理,
180 浏览
0 回答
0 感兴趣
ljc1
|
博文
使用开源的模型(像speech_sambert-hifigan_tts_zhida_zh-cn_16k)进行语音合成任务的推理时,推理速度太慢了,500字大约需要1分钟,为什么会这么慢
835 浏览
2 点赞
3感兴趣
游客taeheo5yiccxi
|
问答
请问iic/speech_sambert-hifigan_tts_zh-cn_16k模型如何离线部署
339 浏览
1 回答
1 感兴趣
YKKKsss
|
问答
目前有没有什么对于识别英语、俄语、韩语有较高准确率的语音模型
291 浏览
0 回答
0 感兴趣
禅舞不二Z
|
问答
智能语音合成后,JAVA SDK的demo中是直接生成了wav音频文件,怎么样让他生成完成后直接播放
217 浏览
0 回答
0 感兴趣
游客yposhrygvdecq
|
问答
使用0.3.0版本的ttsfrd, coredump
399 浏览
0 回答
0 感兴趣
jjrwo5hrjucj4
|
问答
关于自定义语音唤醒
320 浏览
0 回答
0 感兴趣
1432226210479870
|
问答
在Windows平台上关于 ModelScorpe Audio 安装涉及 kwsbp 的问题
1038 浏览
2 回答
0 感兴趣
1
2
3
4
...
7
你好!
登录掌握更多精彩内容
账号登录
我的内容
我的收藏
活跃用户
游客tj3qpeis4xvem
马Jack
给您推荐最划算最便宜的阿里云产品 https://www.aliyun.com/activity?userCode=m4a0ywsh
游客zbyde6evs4owe
青否数字人源码
数字人直播源码独立部署,数字人直播防封专业版,交互数字人源码独立部署,了解咨询V+ zhibo175 ,领取数字人相关资料!
1504110813821446
相关产品
智能语音交互
文档详情
产品详情
我要发布
文章
问答