AI语音克隆与合成平台

基于开源GPT-SoVITS开发,提供专业的语音克隆和合成服务,让您的应用拥有自然、流畅的AI语音。

最新活动

邀请好友注册活动

注册即可获得10元余额,同时邀请的好友也将获得10元奖励,邀请人数无上限!

产品特点

为什么选择菜包音频

专业的语音服务,助力您的业务发展

快速部署

提供简单易用的API接口,支持多种编程语言,10分钟即可完成接入。无需复杂配置,即可享受专业语音服务。

高质量克隆

采用先进的GPT-SoVITS技术,3-10分钟即可完成声音克隆。克隆后的声音自然流畅,富有情感,保留说话者特征。

稳定可靠

多节点分布式架构,合成服务和克隆服务分开部署。支持动态扩缩容,确保服务高可用性。

成本优势

克隆功能完全免费,合成服务按字计费。无最低消费要求,灵活的计费方式助您降低成本。

技术支持

提供详细的API文档和示例代码。专业的技术团队7*24小时在线,为您解决接入使用过程中的问题。

持续创新

紧跟AI技术发展,持续优化模型效果。定期更新API功能,为您提供更好的语音服务体验。

价格方案

简单透明的价格体系

无需复杂计算,按需付费。新用户注册即送10元体验金,邀请好友最高可得100元奖励。

克隆音色

免费

无限制使用克隆功能

  • 3-10分钟完成克隆
  • 支持中英文声音
  • 情感表现更强
  • 基础技术支持
开始使用
推荐

语音合成

1元 /10000字

按实际使用量计费

  • 快速合成响应
  • 支持批量合成
  • 7x24小时技术支持
  • API调用示例
  • 无最低消费
立即开始

私有部署

定制

适合特殊需求场景

  • 独立服务器部署
  • 数据私有化存储
  • 定制化开发
  • 专属技术支持
  • 可选源码授权
联系我们

常见问题

如何计费?

克隆音色功能完全免费。语音合成采用按字计费模式,每10000字收费1元,例如:合成5000字将收取0.5元费用。

是否有免费额度?

新用户注册即可获得10元体验金,可用于体验所有功能。同时通过邀请好友注册,每邀请一人可获得10元奖励,最高可得100元。

如何进行私有部署?

如果您有私有化部署需求,请联系我们的客服。我们将根据您的具体需求提供定制化解决方案和报价。

支持哪些付款方式?

我们支持微信在线支付。私有部署用户可以提供对公转账服务,具体可联系客服咨询。

技术说明

关于模型选择与特性的重要说明

关于吞字现象的说明

由于GPT-SoVITS的自回归推理特性,必然会存在吞字问题。目前市面上两大最强的开源声音克隆模型对比:

GPT-SoVITS

  • 情感表现更强
  • 合成速度更快
  • 克隆时间短(3-10分钟)
  • 存在少量吞字问题

BERT-VITS

  • 稳定性更强
  • 训练语料要求长
  • 克隆时间长(数小时)
  • 情感表现较弱

综合各方面因素考虑,菜包音频选择了GPT-SoVITS作为底层模型。如果遇到吞字问题,请重新提交合成任务。

开源计划

菜包音频是基于GPT-SoVITS改造的一个产品,实现了多节点合成推理和克隆,并且支持热增减节点。我们承诺在代码整理完成后将进行完整开源,敬请期待。

主要特性

  • 多节点合成推理架构
  • 支持热增减节点
  • 基于GPT-SoVITS改造优化

快速开始

只需几个简单步骤,即可开始使用

1

注册账号

创建您的菜包音频账号

2

获取API密钥

在控制台获取您的API密钥

3

上传音频

上传语音素材进行克隆

4

开始使用

调用API进行语音合成

核心团队

专业的团队,为您提供优质的服务

Leo
产品负责人

Leo

负责产品规划与设计

大华
技术负责人

大华

负责系统架构与开发

way
模型负责人

way

负责AI模型优化与训练