資源簡介
Real-Time Voice Cloning 是“Transfer Learning from Speaker Verification to Multispeaker Text-To-Speech Synthesis(SV2TTS)”論文的實現,這是一個三階深度學習框架,允許從幾秒鐘的音頻中創建一個數字化的語音,并使用它來調節訓練的“文本轉語音”模型,以推廣到新的聲音。
代碼片段和文件信息
評論
共有 條評論