AI语音克隆与合成平台

基于开源GPT-SoVITS开发，提供专业的语音克隆和合成服务，让您的应用拥有自然、流畅的AI语音。

立即注册查看文档

邀请好友注册活动

注册即可获得10元余额，同时邀请的好友也将获得10元奖励，邀请人数无上限！

产品特点

为什么选择菜包音频

专业的语音服务，助力您的业务发展

快速部署

提供简单易用的API接口，支持多种编程语言，10分钟即可完成接入。无需复杂配置，即可享受专业语音服务。

高质量克隆

采用先进的GPT-SoVITS技术，3-10分钟即可完成声音克隆。克隆后的声音自然流畅，富有情感，保留说话者特征。

稳定可靠

多节点分布式架构，合成服务和克隆服务分开部署。支持动态扩缩容，确保服务高可用性。

成本优势

克隆功能完全免费，合成服务按字计费。无最低消费要求，灵活的计费方式助您降低成本。

技术支持

提供详细的API文档和示例代码。专业的技术团队7*24小时在线，为您解决接入使用过程中的问题。

持续创新

紧跟AI技术发展，持续优化模型效果。定期更新API功能，为您提供更好的语音服务体验。

价格方案

简单透明的价格体系

无需复杂计算，按需付费。新用户注册即送10元体验金，邀请好友最高可得100元奖励。

克隆音色

免费

无限制使用克隆功能

3-10分钟完成克隆
支持中英文声音
情感表现更强
基础技术支持

开始使用

语音合成

1元 /10000字

按实际使用量计费

快速合成响应
支持批量合成
7x24小时技术支持
API调用示例
无最低消费

立即开始

私有部署

定制

适合特殊需求场景

独立服务器部署
数据私有化存储
定制化开发
专属技术支持
可选源码授权

联系我们

常见问题

如何计费？

克隆音色功能完全免费。语音合成采用按字计费模式，每10000字收费1元，例如：合成5000字将收取0.5元费用。

是否有免费额度？

新用户注册即可获得10元体验金，可用于体验所有功能。同时通过邀请好友注册，每邀请一人可获得10元奖励，最高可得100元。

如何进行私有部署？

如果您有私有化部署需求，请联系我们的客服。我们将根据您的具体需求提供定制化解决方案和报价。

支持哪些付款方式？

我们支持微信在线支付。私有部署用户可以提供对公转账服务，具体可联系客服咨询。

技术说明

关于模型选择与特性的重要说明

关于吞字现象的说明

由于GPT-SoVITS的自回归推理特性，必然会存在吞字问题。目前市面上两大最强的开源声音克隆模型对比：

GPT-SoVITS

情感表现更强
合成速度更快
克隆时间短(3-10分钟)
存在少量吞字问题

BERT-VITS

稳定性更强
训练语料要求长
克隆时间长(数小时)
情感表现较弱

综合各方面因素考虑，菜包音频选择了GPT-SoVITS作为底层模型。如果遇到吞字问题，请重新提交合成任务。

开源计划

菜包音频是基于GPT-SoVITS改造的一个产品，实现了多节点合成推理和克隆，并且支持热增减节点。我们承诺在代码整理完成后将进行完整开源，敬请期待。

主要特性

多节点合成推理架构
支持热增减节点
基于GPT-SoVITS改造优化

快速开始

只需几个简单步骤，即可开始使用

1

注册账号

创建您的菜包音频账号

2

获取API密钥

在控制台获取您的API密钥

3

上传音频

上传语音素材进行克隆

4

开始使用

调用API进行语音合成

核心团队

专业的团队，为您提供优质的服务

产品负责人

Leo

负责产品规划与设计

技术负责人

大华

负责系统架构与开发

模型负责人

way

负责AI模型优化与训练