十年網(wǎng)站開發(fā)經(jīng)驗 + 多家企業(yè)客戶 + 靠譜的建站團隊
量身定制 + 運營維護+專業(yè)推廣+無憂售后,網(wǎng)站問題一站解決
基于RTVC-7 Voice Cloning Model 的Tuned-GE2E-SayEN-EarSpeech 搭建怎樣的,相信很多沒有經(jīng)驗的人對此束手無策,為此本文總結(jié)了問題出現(xiàn)的原因和解決方法,通過這篇文章希望你能解決這個問題。
創(chuàng)新互聯(lián)公司長期為上1000+客戶提供的網(wǎng)站建設(shè)服務(wù),團隊從業(yè)經(jīng)驗10年,關(guān)注不同地域、不同群體,并針對不同對象提供差異化的產(chǎn)品和服務(wù);打造開放共贏平臺,與合作伙伴共同營造健康的互聯(lián)網(wǎng)生態(tài)環(huán)境。為溫江企業(yè)提供專業(yè)的成都網(wǎng)站制作、網(wǎng)站建設(shè)、外貿(mào)網(wǎng)站建設(shè),溫江網(wǎng)站改版等技術(shù)服務(wù)。擁有10年豐富建站經(jīng)驗和眾多成功案例,為您定制開發(fā)。
和 https://blog.csdn.net/u013625492/article/details/114433738 中 GE2E 的版本幾乎一致
區(qū)別就是文本是 英文, 使用 VCTK 等英文數(shù)據(jù)集訓練
https://github.com/ruclion/Tuned-GE2E-SayEN-EarSpeech
之前訓練 AutoVC 用過
處理數(shù)據(jù)的邏輯從: /ceph/home/hujk17/Tuned-GE2E-SayEN-EarSpeech/FaPig_extract_GE2E_VCTK_nosli.py 開始
保留了 train, val, unseen. 訓練的時候只使用 train
在 2.1. 中也一并提取了, 使用 GE2E
在 2.1. 中也一并提取了, 使用 實驗室的 mel.嘿嘿(●ˇ?ˇ●), 終于方便啦
symbols 不用動, 本身就保留了英文的標點
需要改下 train.txt 的路徑
以 Kiss 為模型名字, 邏輯從 Kiss_train.py 開始
直接用 本來的小 Batch 訓練, batch_size = 12
256 的 Embedding 仍然后面接了一個 FC, 和中文的一致
中文的叫 FaPig, 英文叫 Kiss, 邏輯從 Kiss_train.py 開始
from synthesizer.FaPig_train import train 和 from synthesizer.Kiss_train import train 其實完全一致, 只是為了統(tǒng)一格式, 拷貝了一份
看完上述內(nèi)容,你們掌握基于RTVC-7 Voice Cloning Model 的Tuned-GE2E-SayEN-EarSpeech 搭建怎樣的的方法了嗎?如果還想學到更多技能或想了解更多相關(guān)內(nèi)容,歡迎關(guān)注創(chuàng)新互聯(lián)行業(yè)資訊頻道,感謝各位的閱讀!