PTT評價

Re: [閒聊] AI翻譯484比機翻順?

看板C_Chat標題Re: [閒聊] AI翻譯484比機翻順?作者
tsubasawolfy
(悠久の翼)
時間推噓 6 推:6 噓:0 →:6

: 大意就是顧及語言和文化的差異無法直譯
: 它就直接用另一個語言寫新故事
: 總之AI是會以可讀性為優先 自己再創作或加油添醋的
: 跟機翻那種逐字逐句對照可以方便校閱或學習單字是完全兩種概念

這比較像ChatGPT的翻譯跟上一世代的機器翻譯的世代差異

chatgpt使用的是兩種語言之間的機率相似度去重組,換言之你可以把它看作

它知道兩種語言的...本質? 然後透過本質去轉換後輸出。

直接用這個影片內的圖解釋

https://youtu.be/hph9OeKjg3w?si=rIi1yUkjZfgM_W4j

這部影片是在講能不能用ChatGPT能不能讓我們跟鯨魚對話

裡面有提到上一世代的機器翻譯(已經用了機器學習的翻譯機)

https://i.imgur.com/LNph0hM.png


兩種語言的翻譯需要一個編碼器跟解碼器

左邊的編碼器先把This dog is black轉換成對應向量(數值)
https://i.imgur.com/pJVUfyX.png


然後再把這些數值經過法語的解碼器轉換成相對應的法語 (逐字逐句翻)

https://i.imgur.com/M2wNu3Y.png

https://i.imgur.com/aJNMJ0c.png

但是這種方法需要你已經了解另一個語言後,才能做出相對應的解碼器

就像羅塞塔石碑那樣,別人已經幫你刻好相對應的語言轉換在上面

如果要拿來翻譯鯨語是不可能的,所以它們才想用ChatGPT的方式

chatgpt一樣是各語言都拆解編碼轉換成數值,依照出現頻率跟相對應機率做出文字雲
https://i.imgur.com/Fs5WjjN.png

https://i.imgur.com/2JgWkBj.png

然後把這些文字雲疊在一起,找出兩種語言高度重疊區域,再進行A語言轉換成B語言

當然轉換輸出的語言也要根據該語言的遊戲規則(對GPT來說是排列組合不同)去輸出

https://i.imgur.com/pByVDWZ.png

https://i.imgur.com/o38Zib7.png

我覺得這種找出語言之間高度相似處轉換,就有點像找出那句話的本質??

例如 桌上有一顆蘋果 代表你說的就是桌子上有一顆蘋果在那邊的這個情境or事實

然後把這個事實用不同語言描述一次,而不是傳統的點對點的逐句機器翻譯

但是這種方式就是需要大量的語言文字去搞出那個 文字銀河系 (不是雲等級)


回到那個影片

所以想要用這種方式去翻譯抹香鯨鯨語是有可能,多虧冷戰已經收集了很多年的海底聲音

但是但是這是各種鯨魚的資料,還要先過濾出各種鯨魚的叫聲才有可能建立

抹香鯨自己的鯨語銀河系去翻譯成人類語言


--

※ PTT 留言評論
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.47.86.152 (臺灣)
PTT 網址

LawLawDer07/29 20:03好屌…

Wardyal07/29 20:05你鯨魚語言的Dataset沒正確的Label怎麼訓練

Wardyal07/29 20:05所以靠出現機率就能得出意思嗎

reader271407/29 20:06好像也有要把dna編碼當作語言去翻譯的研究

labbat07/29 20:13無label就unsupervised唄

smart0eddie07/29 20:18人跟鯨魚的認知會一樣嗎

cloki07/29 20:36就不管認知一不一樣直接用實際存在的頻率數據去練吧

cloki07/29 20:38先把那些東西分群然後再進一步訓練去提高準確率

longlongint07/29 21:17可以做出能跟鯨魚對話的AI 但人還是不懂

longlongint07/29 21:17只好把小孩送進去一起從小學鯨魚雨

smart0eddie07/29 21:28認知不一樣你兩群就不一樣啊

zonpoulin07/30 05:58釣出超屌應用了 不知道能否反推簡單人語跟鯨魚溝通?