0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

借助深度学习算法实现5秒内克隆你的声音

Android编程精选 ? 来源:开源前线整理 ? 作者:开源前线整理 ? 2021-09-29 11:45 ? 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

大家应该都知道声音克隆技术,通俗的来说就是借助深度学习算法,可以完全模拟某个人的声音,而且由机器合成的语音连情绪都能够完美表达出来,基本可以以假乱真,只要不见面,你根本就察觉不出来向你发出声音的知识一个机器。

语音克隆最大的创新之一是减少创建语音所需的原始数据量。过去,该系统需要数十甚至数百小时的音频。但是,今天猿妹要和大家分享的这个工具5秒钟就可以克隆成功,这个工具名叫——MockingBird。

MockingBird已经登上Github热榜,收获3.5K的Star,累计分支 303(Github地址:https://github.com/babysor/MockingBird)

MockingBird具有如下特性:

支持普通话并使用多种中文数据集进行测试

适用于 pytorch,已在 1.9.0 版本(最新于 2021 年 8 月)中测试,GPU Tesla T4 和 GTX 2060

支持 Windows + Linux

仅使用新训练的合成器(synthesizer)就有良好效果,复用预训练的编码器/声码器

MockingBird如何使用

MockingBird的安装要求如下:

首先,MockingBird需要Python 3.7 或更高版本

安装 PyTorch

安装 ffmpeg。

运行pip install -r requirements.txt 来安装剩余的必要包。

安装 webrtcvad 用 pip install webrtcvad-wheels。

接着,你需要使用数据集训练合成器:

下载 数据集并解压:确保您可以访问 train 文件夹中的所有音频文件(如.wav)

使用音频和梅尔频谱图进行预处理:python synthesizer_preprocess_audio.py 《datasets_root》 可以传入参数 --dataset {dataset} 支持 adatatang_200zh, magicdata, aishell3

预处理嵌入:python synthesizer_preprocess_embeds.py 《datasets_root》/SV2TTS/synthesizer

训练合成器:python synthesizer_train.py mandarin 《datasets_root》/SV2TTS/synthesizer

当你在训练文件夹 synthesizer/saved_models/ 中看到注意线显示和损失满足您的需要时,请转到下一步。

使用预先训练好的合成器,如果没有设备或者不想慢慢调试,可以使用网友贡献的模型。

训练声码器

预处理数据: python vocoder_preprocess.py 《datasets_root》

训练声码器: python vocoder_train.py mandarin 《datasets_root》

启动工具箱

然后你可以尝试使用工具箱:python demo_toolbox.py -d 《datasets_root》

责任编辑:haq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 开源
    +关注

    关注

    3

    文章

    3779

    浏览量

    44124
  • 克隆
    +关注

    关注

    0

    文章

    22

    浏览量

    7949
  • 深度学习
    +关注

    关注

    73

    文章

    5569

    浏览量

    123087

原文标题:5秒内克隆你的声音,并生成任何内容,这个工具细思极恐...还特么的开源~

文章出处:【微信号:AndroidPush,微信公众号:Android编程精选】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    思必驰声音复刻算法获得深度合成服务算法备案

    近日,国家互联网信息办公室正式发布第十二批深度合成服务算法备案信息,思必驰声音复刻算法通过此次备案。该算法能够高精度复刻人类
    的头像 发表于 07-31 17:42 ?419次阅读

    思必驰7月份大事件回顾

    近日,思必驰声音复刻算法通过国家互联网信息办公室第十二批深度合成服务算法备案。该算法能够高精度复刻人类
    的头像 发表于 07-28 17:52 ?328次阅读

    正点原子 AI BOX0 智能伴侣,1.54寸高清屏+长效续航,语音畅聊,情景对话,知识科普,多色可选,随身携带!

    ! ③ 声音克隆黑科技:录制声音,定制专属家人的声音,异地也能温暖相伴! 全场景覆盖的神器 ① 学习加速器:孩子作业辅导、英语对话练习、百科
    发表于 04-24 16:11

    SDK如何控制DLP4500在一秒内投影60张图片?

    如何利用SDK进行二次开发,实现的功能为,控制DLP4500在一秒内投影60张图片,相机(灰点)同步拍摄。请问可以提供一下参考程序代码吗?
    发表于 02-25 07:58

    BP神经网络与深度学习的关系

    ),是一种多层前馈神经网络,它通过反向传播算法进行训练。BP神经网络由输入层、一个或多个隐藏层和输出层组成,通过逐层递减的方式调整网络权重,目的是最小化网络的输出误差。 二、深度学习的定义与发展
    的头像 发表于 02-12 15:15 ?986次阅读

    NPU与机器学习算法的关系

    在人工智能领域,机器学习算法实现智能系统的核心。随着数据量的激增和算法复杂度的提升,对计算资源的需求也在不断增长。NPU作为一种专门为深度
    的头像 发表于 11-15 09:19 ?1418次阅读

    NPU在深度学习中的应用

    设计的硬件加速器,它在深度学习中的应用日益广泛。 1. NPU的基本概念 NPU是一种专门针对深度学习算法优化的处理器,它与传统的CPU和G
    的头像 发表于 11-14 15:17 ?2163次阅读

    Pytorch深度学习训练的方法

    掌握这 17 种方法,用最省力的方式,加速的 Pytorch 深度学习训练。
    的头像 发表于 10-28 14:05 ?731次阅读
    Pytorch<b class='flag-5'>深度</b><b class='flag-5'>学习</b>训练的方法

    GPU深度学习应用案例

    GPU在深度学习中的应用广泛且重要,以下是一些GPU深度学习应用案例: 一、图像识别 图像识别是深度学习
    的头像 发表于 10-27 11:13 ?1600次阅读

    FPGA加速深度学习模型的案例

    :DE5Net_Conv_Accelerator 应用场景 :面向深度学习的开源项目,实现了AlexNet的第一层卷积运算加速。 技术特点 : 采用了Verilog语言进行编程,与P
    的头像 发表于 10-25 09:22 ?1343次阅读

    AI大模型与深度学习的关系

    人类的学习过程,实现对复杂数据的学习和识别。AI大模型则是指模型的参数数量巨大,需要庞大的计算资源来进行训练和推理。深度学习
    的头像 发表于 10-23 15:25 ?3067次阅读

    用TPA3112设计的一个音频功放电路,上电1-3后就没有声音输出了,怎么解决?

    用TPA3112设计的一个音频功放电路 输入采用差分的,后来把1个输入接地,变成了单端的了 问题很奇怪 接信号发生器,上电后,1-3秒内有音频输出,能够听到声音 然后就没有声音了 FAULT输出低 折腾了很久,望高手指点一二
    发表于 10-12 07:17

    FPGA做深度学习能走多远?

    。FPGA的优势就是可编程可配置,逻辑资源多,功耗低,而且赛灵思等都在极力推广。不知道用FPGA做深度学习未来会怎样发展,能走多远,怎么看。 A:FPGA 在深度
    发表于 09-27 20:53

    深度识别算法包括哪些内容

    :CNN是深度学习中处理图像和视频等具有网格结构数据的主要算法。它通过卷积层、池化层和全连接层等组件,实现对图像特征的自动提取和识别。 应用领域 :CNN在图像识别、目标检测、视频分
    的头像 发表于 09-10 15:28 ?902次阅读

    基于大数据与深度学习的穿戴式运动心率算法

    性能的关键手段。然而,在复杂多变的运动环境中,准确测量心率数据对于传统算法而言具有较大的技术瓶顶。本文将探讨如何运用大数据和深度学习技术来开发创新的穿戴式运动心率算
    的头像 发表于 09-10 08:03 ?694次阅读
    基于大数据与<b class='flag-5'>深度</b><b class='flag-5'>学习</b>的穿戴式运动心率<b class='flag-5'>算法</b>