Re: [討論] 大家能接受有聲書用AI生成的聲音嗎?
※ 引述《MrTaxes (謝謝提醒)》之銘言:
: 最近看了一本寂天出版的英文讀本
: 它的閱讀錄音檔有放在官網上
: 我聽了其中一段 發現聲音...有一種合成的感覺~
: 不太確定是否是AI生成的人聲
: 是否有這個可能呢?
英文的話,現在AI合成很普遍啊,像是Google Play Books就可以
導入EPUB電子書,設定人聲後製作成有聲書輸出,目前支援英、
法、德、西葡等歐語。
https://i.imgur.com/WcOAi8v.jpg
我有試試能不能說中文,結果還真能唸出來,就像老外講中文。
https://i.imgur.com/6ewlXwZ.jpg
然後Apple Books則是有”Apple Books Digital Narration”服務,目
前僅限英文,唸起來就真的很自然。
我去年也有幫老貓的單車導覽書,用微軟Azure AI語音合成來製
做成語音導覽電子書小冊,方便邊騎邊聽導覽:
不過中文合成語音真的就是還差不少,Amazon和微軟的服務相較
之下微軟Azure比較自然,但是遇到破音字就扭不過來,還會原因
不明念錯。所以還是要重新聽過一遍,然後用SSML等來修正讀音
。所以就算合成語音成熟,有聲書還是需要編輯校對。
我倒是在想,要是中文語音合成能成熟到如上面的英文與歐語一樣
時,這樣製作出來的有聲書,成本頓時變低很多,那麼售價還該和
現在一樣嗎?
如果有聲書價格和電子書差不多,那麼為什麼不開放電子書的TTS
功能就好呢?
然後,說句實在話,中國在語音合成技術上投入的資本與心力真的
超過台灣很多,無論騰訊和科大訊飛的合成引擎都很強,到底台灣
是用還不用呢?
後面都是開放問題,我也沒有答案。
--
AI/語音合成一牽涉到對岸資安就很傷感情....
以前聽故事書錄音,講故事的人變換角色時也會變換語氣...
這個應該是AI還做不到的趣味效果..
生成式AI語音資料庫樣本夠多其實不是大問題樣本數取得
才是頭痛傷腦筋的問題...
等沒有政治問題的時候就沒問題
直接買對岸出的Boox就好啦,文字轉聲音的功能相當不錯
微信的AI是中文裡我聽過最自然的,可惜是中國腔...appl
e的siri台灣腔雖然還不錯,但不能唸完整本書qq
對岸現在蠻多講解介紹娛樂影視作品的影片有使用MS的語
音庫。我自己是覺得聽起來沒有很重的腔調。如果以同樣
方式處理的話倒是不會排除有聲書
在「輔助使用」→「語音內容」打開「朗讀螢幕」。下面
聲音選Siri,在Apple Books裡兩指下拉就可唸整本了。
16
Re: [討論] 唐鳳分享如何成為蘋果電腦公司顧問的過程可以不要忽略這段嗎? Speech Group Member, Apple Research Labs, 1996/06-1997/08 另外還有 2000-2006 在 Cepstral 擔任 CEO " Cepstral 是語音合成技術和服務的提供商。它由卡內基美隆大學 的頂尖科學家於 2000 年 6 月創立,其中包括計算機科學家 Kevin Lenzo8
[問卦] 語音AI什麼時候開始變得那麼自然的以前合成語音都是機械腔調 好像自從注意看那個男人開始 有點分不清真人和ai語音的差別惹 關鍵的技術突破是什麼時間點呢 --5
Re: [閒聊] AI會讓Pixiv的繪師生態圈瓦解嗎?我覺得你想多了,看看V家吧,你現在可以用軟體模仿真人唱歌,有些調得還滿自然的。 甚至你不想用軟體音也沒關係,像花譜還有跟一個語音合成軟體合作,叫甚麼我有點忘記了 ,但反正就是你能用花譜的聲音編出人聲部分。 早就有人聲合成的軟體可以用了,初音早就開演唱會N次了,但人類的歌手也沒失業,人類 歌手的新手也沒瓦解。4
[問卦] 初音是最初代的vtuber嗎這兩年都在流行各種 vtuber AI語音 但是說到最初代的作品,其實是初音吧,雖然說只是用軟體去合成人聲 還不到自主學習的程度 稱不上是AI 2007年就利用人的聲音做電子合成,也很符合vtuber的形象 如果加上AI,初音說不定能夠更進化2
[閒聊] Vtuber 絆愛衍生語音軟體「KIZUNA」發售Vtuber 絆愛衍生語音軟體「KIZUNA」發售日公開,TV 動畫企劃進行中 日本 Kizuna AI 株式會社在 6 月 30 日慶祝旗下所屬 Vtuber 絆愛(キズナアイ)誕生 六周年活動上宣布,CeVIO AI 聲音合成軟體「KIZUNA」將在 8 月 8 日進行 24 小時限 定販售,並公開 KIZUNA 翻唱的「Kizuna AI to AI」MV。- 剛剛在 Hugging face 挖到這個鬼東西 還有94個Like 合成結果沒有到非常自然 不過還行,有及格
1
[閒聊] 現在語音合成這麼厲害了嗎 馬娘B站連結 語音合成模仿白目麥昆 用語音合成讓大和赤驥的溫泉旅行劇情配上聲音- 因為有個App叫剪映 裡面串了微軟Azure的語音合成API 能幫助營銷號快速把文案轉成影片 那些跟風的電影講解為了快速出片 文案根本寫到有套路了