PTT評價

Re: [問卦] 五音不全的人,用AI唱歌怎那麼好聽?

看板Gossiping標題Re: [問卦] 五音不全的人,用AI唱歌怎那麼好聽?作者
bachelorwhc
(積積陰陰德)
時間推噓 1 推:1 噓:0 →:0

※ 引述《kikiki37 (441)》之銘言:
: 網路上有位胖胖身材的人
: 平常唱歌都五音不全,高音也飆不太上去,還常破音
: 但有人用他的聲音,給AI翻唱,竟然變很好聽,聲音也確實本人
: 有沒有五音不全的人,用AI唱歌怎那麼好聽?
: ---
: https://i.imgur.com/FU3HbAh.jpg


這邊解釋一下AI怎麼學習發音

當然細節很多 這邊就只講大方向


AI在訓練時 你會準備一組答案 而AI會去猜

當AI猜得越準 你就能說這個AI的準度越高

當然 AI的神經很有可能是把整組答案背下來

所以我們要透過各種方式確保AI不是只能回答這組考題(術語叫過適)




語音在訓練初期 其實最麻煩的就是收集資料

前面我們提過 要怎麼樣將人說的話 變成答案

比方說: 說「尷尬」這兩個字

我們會將文本內容轉換成IPA拼音 還必須對上說話者的語速、節奏、語氣

但尷尬有人會念「ㄍㄢㄍㄚˋ」或「ㄐ|ㄢㄐ|ㄝˋ」

所以文本上的預處理 往往是頭痛的一塊

還有需要用其他模型來推敲聲音檔的語氣變化加入參數

使AI不單是能夠發音 還必須要配合指定的情緒發音




https://github.com/jaywalnut310/vits

不過現在VITS已經算落伍了 據說VALL-E X更屌

可是我沒時間追了QQ

--

※ PTT 留言評論
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 118.160.0.46 (臺灣)
PTT 網址

BlueBird5566 10/05 23:18激凸了

※ 編輯: bachelorwhc (118.160.0.46 臺灣), 10/05/2023 23:19:05