Real Time Voice Cloning是一个开源的实时语音克隆工具。只要上传分析说话者几秒钟的原始音频,通过深度学习,就能模仿该说话者的声音进行文本的语音阅读。基于Transfer Learning from Speaker Verification to Multispeaker Text-To-Speech Synthesis (SV2TTS)搭建,SV2TTS 是一个三步深度学习构架,允许把几秒钟的语音数字化分析后,再以文字到语音的训练模型生成新的声音。 Real Time Voice Cloning遵守MIT开源协议。

[repo owner=”CorentinJ” name=”Real-Time-Voice-Cloning”]