Re: [閒聊] 中國有配音員的聲音被偷走了
※ 引述《Mayfly (Baccano)》之銘言:
: 老實說我最近也偶爾會在B站上聽一些AI代唱
: 就是讓ACG人物的AI語音唱某些樂曲,比方說草神唱大悲咒什麼的
: 對岸最近有個梗,什麼薩菲羅斯男人中的男人
: 就是用AI編曲演唱歌頌薩菲羅斯什麼的
: 還有個遊戲直播主,他之前發了個影片鑑賞那些用他的聲音為免洗遊戲打的廣告
: 只能說,當初大概也很少人預測到,最先被AI打成手工業者的,竟然是創意產業和流行設計
: 或許也是側面表現了現代人類的精神生活有多空泛吧……
準確來說是替代了部分創意、流行的生產步驟,AI只是降低製造的門檻。
不然像...
薩菲羅斯男人中的男人、歐金金是奶茶...
不管誰來都不會覺得這玩意是AI想出來的
=============================================================
配音領域的話,對岸常用的3個開源項目
Bert-VITS2、GPT-SoVITS、Fish-speech
至於唱歌方面的我沒太研究,不過據我所知唱歌AI目前還是比較粗糙的
Bert-VITS2
去年就有了,開源版預訓練模型無法用來推理
必須使用者自己收集素材,然後自己煉丹。
GPT-SoVITS
還是要自己去煉丹,原始項目沒法直接推理,
不過他的LLM參數量太小,常常出現幻覺。
Fish-speech
原理跟第上面的差不多,
不過重製了聲碼器,然後把LLM的參數量堆到1B,
初步解決比較常見的多音字發音問題。
比較雞賊的是,這玩意有做小樣本推理功能,
只要提供一個參考音頻,就能還原個7788,
不過要達到最佳效果還是要自己重煉聲碼器。
我這幾個月都拿這些聽書,體驗下來....
目前在自己有煉丹能力的情況下,音色跟韻律可以做到非常出色的還原。
但配音還需要情感演繹之類的功能,這點目前的TTS技術,
不管是商用項目還是開源項目,都遠遠達不到預期。
想要達到感情也很匹配的程度,需要大量人工進行微調,
如果是這樣的話,成本還是請真人配音比較便宜。
目前這技術,可以拿來整活、做二創、自己練著玩之外,
現階段要拿來直接給遊戲、動畫、配音,目前差距還很大。
除非你用人工干預一句一句精調。
記得yt上有個日本搞得很鬧的AI 安倍就是用BV2生成的
--
我覺得用AI做音樂比做配音簡單多ㄌ
畢竟音樂本身的和弦都很簡單 甚至大部分都是用
機器在微調ㄉ
所以AI隨便都可以出一首妳聽不出差別的音樂
但聲優很難 去聽YT就知道AI和真人聲還是差太多ㄌ
語音的話,目前能做到長音頻30秒幾乎聽不出與真人的區別, 但聽個3~5分鐘就能明顯察覺問題了,情感表達上現在還很糙。
唱歌的話Suno AI吧
邦邦也把香澄跟友希那的聲音拿來做AI唱歌了
歐金金是奶茶那是抖音擦邊自媒體搞的吧,跟AI沒關係
83
Re: [討論] 郭台銘剛說AI可以幫素還真配音?四年前的文章現在重新再看一次, 目前科技應該是可以做到還原黃大的真人原聲了。 最近的AI孫燕姿相信大家都知道, 只要餵AI一定歌手的高度樣本學習數量,就可以唱出不輸真人的聲音34
[討論] 中研院繁中LLM被爆直接拿對岸的來套!中央研究院詞庫小組(CKIP) 中研院資訊所、語言所於民國75年合作成立 前天釋出可以商用的繁中大型語言模型(LLM) CKIP-Llama-2-7b 以商用開源模型 Llama-2-7b 以及 Atom-7b 為基礎X
Re: [爆卦] 中央研究院詞庫小組大型語言模型對於LLM只有這一點認知程度的話,最好不要就這樣出來帶風向會比較好,不然先去 跟陽明交大校長先去旁邊先學習一下什麼叫做LLM,不同LLM之間又有什麼差異。 第一個錯誤的認知是認為LLM就應該要提供正確的答案,事實上LLM是一個機率模型, 它所做的事情是基於模型的權重預測下一個token(詞塊)最高的機率是那個,它不是資 料庫,所以你不能因為它答的一個答案不是你所想的就是說這個模型如何如何。4
[情報] 星際大戰黑武士將繼續以AI配音經典角色永將流傳:《星際大戰》黑武士將繼續以 AI配音 AI 語音技術日新月異,只要資料數量夠、參數設定正確,要用 AI 模擬真人語音已經不 是難事,現在迪士尼想好好利用這項技術,為經典角色繼續賦予新生命,首先就是《星際 大戰》中最為人熟知的角色「黑武士」達斯維達。 達斯維達以它獨特的呼吸氣音以及冷酷語調著稱,根據外媒報導,在烏克蘭新創公司X
Re: [問卦] 中研院自己做的大型語言模型怎麼了?這語言模型基礎是建構於Llama 2,meta提供的開源模型 另外Atom 7b則是中文社群跟一間中國公司在Llama 2之上訓練成中文使用者適合的模型, 也是開源且開放商用 技術上也不用解釋太多,反正開源模型他本來就不會像GPT或百度的文心一言那樣限制某 些爭議性回答3
Re: [討論] 中研院繁中LLM被爆直接拿對岸的來套身為LLM猴子,大多同意DrTech的看法,只是台智雲這塊有點不一樣。 其實台智雲有幾乎一半台灣杉2號的機器可以用, 也克服很多開源軟體無法解決的問題;例如硬體是V100不是A100, 又要能夠做3D model parallelism,又要同時能跑LoRA,RLHF, 在100Gbps網路中維持GPU使用率滿載等等。在meta llama出來之前,3
Re: [問卦] ChatGpt為什麼開始變笨了?正好半夜看到這篇無聊來回一下 GPT4能力下降大概5月多開始就有人注意到了 但你要怎麼定義能力衰退這件事而且量化他? 於是七月就有一篇論文在討論這件事1
Re: [新聞] 台版ChatGPT雛型曝光 國科會用4個月秀TAI版 : 的生成式AI模型,耗時4個月今(14日)宣布第一階段成果,目前已投入70億個參數量 , : 針對繁體中文訓練,實測已達自動摘要、翻譯文本、寫信與寫文章,都有不錯表現,並 首- 請容我搬運一篇對岸知乎的文章, 這是一篇非常長的文章,其中大部分片段與本文無直接關聯,而且是2023/02寫的. 我只搬運本串相關的記憶體的部分,還有尾部的結論.且未修飾原文用字 詳細的有興趣請直接去原網址看吧. ChatGPT背後的經濟賬
爆
Re: [塵白] 2.3劇情出包 超絕炎上中86
[索尼] 總裁:PS5 Pro目標是鐵杆使用者83
[閒聊] 無限期休刊的知名作品?83
[問題] 只會投90英里速球的投手大概什麼等級51
[閒聊] 索尼CEO表示 會從星鳴的經歷中吸取教訓48
[妮姬]反擊部隊與二週年的漫畫43
Re: [塵白] 2.3劇情出包 超絕炎上中42
Re: [劍心] 安慈是不是根本就不懂雙重之極限?35
[閒聊] 你願意花多少錢買顯卡打遊戲?33
Re: [情報] 帕魯專利侵權訴訟報告32
[妮姬]疑似聖誕角色?爆
[閒聊] 玩偶遊戲 官方Line貼圖28
[閒聊] 在死之前可以做什麼中二動作77
[教育] 闇龍紀元智障守護者約售出50萬套28
[妮姬] 畫一個很過份的圖26
[閒聊] 盜賊為啥被稱為盜賊45
[情報] 遊戲王假鈔泰國流行中26
[閒聊] 死神 藍染聲優 速水獎訪談25
[閒聊] 現實中如果真的沒有兩顆蛋蛋會怎麼樣?22
[少前] 少女前線2:追放 開發者訪談30
[繪圖] 活俠傳 溫夫人 夫人!我...我...我喜23
[閒聊] 如果頭文字D的背景在台灣23
[閒聊] 說到三個ㄌㄌ 會想到?23
[閒聊] 如果今天ubi出女的謙信會大賣嗎?34
[閒聊] keroro為什麼轉國民番失敗21
Re: [閒聊] 家長問:你怎麼都買前凸後翹的女生模型20
[討論] 最近有哪些新連載不錯的嗎? 求推薦19
[情報] 烙印勇士 377 & 37818
[奶子] 看奶子對身體一點幫助都沒有爆
[情報] 帕魯專利侵權訴訟報告