注册即可获得10元余额,同时邀请的好友也将获得10元奖励,邀请人数无上限!
专业的语音服务,助力您的业务发展
提供简单易用的API接口,支持多种编程语言,10分钟即可完成接入。无需复杂配置,即可享受专业语音服务。
采用先进的GPT-SoVITS技术,3-10分钟即可完成声音克隆。克隆后的声音自然流畅,富有情感,保留说话者特征。
多节点分布式架构,合成服务和克隆服务分开部署。支持动态扩缩容,确保服务高可用性。
克隆功能完全免费,合成服务按字计费。无最低消费要求,灵活的计费方式助您降低成本。
提供详细的API文档和示例代码。专业的技术团队7*24小时在线,为您解决接入使用过程中的问题。
紧跟AI技术发展,持续优化模型效果。定期更新API功能,为您提供更好的语音服务体验。
无需复杂计算,按需付费。新用户注册即送10元体验金,邀请好友最高可得100元奖励。
免费
无限制使用克隆功能
定制
适合特殊需求场景
克隆音色功能完全免费。语音合成采用按字计费模式,每10000字收费1元,例如:合成5000字将收取0.5元费用。
新用户注册即可获得10元体验金,可用于体验所有功能。同时通过邀请好友注册,每邀请一人可获得10元奖励,最高可得100元。
如果您有私有化部署需求,请联系我们的客服。我们将根据您的具体需求提供定制化解决方案和报价。
我们支持微信在线支付。私有部署用户可以提供对公转账服务,具体可联系客服咨询。
关于模型选择与特性的重要说明
由于GPT-SoVITS的自回归推理特性,必然会存在吞字问题。目前市面上两大最强的开源声音克隆模型对比:
综合各方面因素考虑,菜包音频选择了GPT-SoVITS作为底层模型。如果遇到吞字问题,请重新提交合成任务。
菜包音频是基于GPT-SoVITS改造的一个产品,实现了多节点合成推理和克隆,并且支持热增减节点。我们承诺在代码整理完成后将进行完整开源,敬请期待。
只需几个简单步骤,即可开始使用
创建您的菜包音频账号
在控制台获取您的API密钥
上传语音素材进行克隆
调用API进行语音合成
专业的团队,为您提供优质的服务
负责产品规划与设计
负责系统架构与开发
负责AI模型优化与训练