MockingBird|声音克隆

本文介绍了MockingBird声音克隆,这是一款高效的音频处理工具,能够为电影配音和音效制作提供真实的声音模拟效果。通过对MockingBird的详细了解,可以更好的利用它来实现音频处理的需求。

声音克隆

什么是MockingBird

MockingBird在英文翻译中为:嘲鸫(美洲鸣禽,能模仿别种鸟的鸣叫);

顾名思义,该项目的主要功能就是可以模仿别人的声音。

MockingBird主要特点

  • 支持中文:支持普通话并使用多种中文数据集进行测试:aidatatang_200zh, magicdata, aishell3, biaobei, MozillaCommonVoice, data_aishell 等
  • Windows + Linux:可在 Windows 操作系统和 linux 操作系统中运行(苹果系统M1版也有社区成功运行案例)
  • 简单部署:仅需下载或新训练合成器(synthesizer)就有良好效果,复用预训练的编码器/声码器,或实时的HiFi-GAN作为vocoder
  • 网络服务:可伺服你的训练结果,供远程调用。

Github地址

https://github.com/babysor/MockingBird

MockingBird数据集制作注意事项

  1. 尽量只有一个人声。
  2. 背景音乐尽量少。
  3. 人声的语调尽量平和。
  4. 人声尽量不要有口头语,并且说话内容大多是长句。
  5. 如果有多个发音人,要分别放在train目录下的不同子文件夹内。
  6. 尽量不要有汉字以外的字符,数字和英文尽量替换成同样读音的中文字符。
  7. 可以用拼音代替文字,制作数据集和运行软件时都可以使用这种方法。
    例如:数据集→shu4 ju4 ji2|七海→qi1 hai3|轻音对应的数字为5。
  8. 如初背景音乐的软件效果也比较有限,如果可以的话还是有先用纯语音。

部署教程

方式描述
MockingBird|便携版v1.1.7 – openAI免安装便携版本,解压即可使用,对亲手非常友好。
待完善手动配置搭建,推荐有电脑基础且爱折腾的用户使用。

此文章由OpenAI开源维基百科原创发布,如若转载请注明出处:https://openai.wiki/mockingbird.html

(0)
上一篇 2022-12-12 11:51
下一篇 2022-12-12 16:33

相关推荐

  • Voice Changer|实时变音-WSL

    VC Client是一款用于实时音频转换的客户端软件,利用各种音频转换人工智能进行AI音频转换。支持的音频转换人工智能模型包括MMVC|So-Vits-SVC|RVC|DDSP-SVC等项目。

    2023-07-08
    001.6K
  • VITS-fast-fine-tuning|声音克隆

    VITS-fast-fine-tuning会指导你如何将自定义角色,加入预训练的VITS模型中,在1小时内的微调使模型具备包含任意两个角色之间进行声线转换以及声色声线进行中日英三语文本到语音合成。

    2023-08-15
    011.9K
  • So Vits Svc|人声模拟

    So Vits Svc是一个用来模拟人声的开源项目,可以将您训练好的声音模型,用于生成类似微软云希、抖音文字转语音等效果。对于电脑的硬件要求并不高,但是需要较为繁琐的准备工作,还有大量的声音素材。

    2023-03-24
    0359.8K
  • Voice Changer|实时变音

    VC Client是一款用于实时音频转换的客户端软件,利用各种音频转换人工智能进行AI音频转换。支持的音频转换人工智能模型包括MMVC|So-Vits-SVC|RVC|DDSP-SVC等项目。

    2023-07-07
    013.8K
  • MockingBird|便携版v1.1.7

    支持中文:支持普通话并使用多种中文数据集进行测试,Windows + Linux:可在 Windows 操作系统和 linux 操作系统中运行(苹果系统M1版也有社区成功运行案例)。

    2022-12-13
    084.8K

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

评论列表(1条)

微信