阿里云开源AI配音CosyVoice语音克隆文字转语音部署和使用教程

应该是开源界音色最稳定的语音合成和克隆模型了，支持预训练音色合成、自然语言控制、3秒极速复刻和跨语种复刻。

官方部署方式比较复杂，错误较多，我这里进行了整理和优化，支持GPU和CPU，方便大家使用。

CosyVoice 开源仓库: https://github.com/FunAudioLLM/CosyVoice

使用方法

均支持 GPU 和 CPU

第一次启动过程可能会有点长，需要从魔搭下载3个模型

Windows 一键启动包

百度网盘: https://pan.baidu.com/s/1UTuRKPQ9nuQk69qxQzdL4A?pwd=j2ei 提取码: j2ei

下载后使用 7z 解压。没有 7z 的话，可以在这里下载：https://7-zip.org/download.html

双击双击启动.bat 启动服务

启动后，访问 http://127.0.0.1:50000/

注意：文件夹中不能有中文、特殊字符和空格，否则可能会启动失败

Docker部署

确保已经安装了Docker软件，没有的话，从官网下载安装 https://www.docker.com/products/docker-desktop/

复制以下代码到终端运行即可

CPU 版本

curl -fsSL https://harryai.cc/cosyvoice/docker-compose.yml -o docker-compose.yml

docker-compose up

GPU 版本

curl -fsSL https://harryai.cc/cosyvoice/docker-compose-gpu.yml -o docker-compose.yml

docker-compose up

docker 启动后，访问 http://127.0.0.1:50000/

全部评论(0)

推荐阅读

实时对话数字人系统源码
实时对话数字人系统源码开发语言介绍：开发语言：php、redis、vue等【100%全开源】用途：Ai客服、Ai医生、Ai老师、Ai律师、Ai亲人...一、ai对话数智人使用教程【多角色切换方法】：横屏2段竖屏2段mp4格式视频，一段不说话【20-30秒左右】，一段说话【50-60秒左右】。竖屏尺寸1080×1920。横屏尺寸1920×1080尺寸。上传至云端获取云存储地址填写在下图处即可切换角色。后台形象管理——>添加形象
数字人
编辑：酷虎软件
时间：2024-11-18 10:30
阅读：211

ai写作助手哪个好用？百度一下：酷虎Ai写作
ai写作助手哪个好用？百度一下：酷虎Ai写作一个优秀的AI写作助手应该具备以下功能：1.语言理解能力：能够准确理解用户的需求和输入的文本内容。2.丰富的知识储备：涵盖多个领域的知识，以便为用户提供准确、全面的信息。3.创意生成能力：帮助用户激发创意，提供新颖的写作思路和观点。4.语法和拼写检查：能够检测并纠正文本中的语法错误和拼写错误。5.文风调整功能：可以根据用户的需求和写作场景，调整文章的风格，如正式、幽默、简洁等。6
人工智能
来源：AI写作
编辑：酷虎软件
时间：2024-10-14 09:00
阅读：188

影优尽优如何获取激活码
影优尽优邀请码：33388800绿幕直播影优尽优是一种创新的直播方式，它结合了绿幕技术和直播功能，为用户提供了更加丰富、灵活的直播体验。以下是对绿幕直播影优尽优的详细介绍：
直播知识
来源：AI数字人
编辑：酷虎软件
时间：2024-09-17 16:14
阅读：358