PTT評價

Re: [問題] 簡體字沒有"遊"嗎?

看板C_Chat標題Re: [問題] 簡體字沒有"遊"嗎?作者
dbwu
(dbwu)
時間推噓 7 推:7 噓:0 →:17

※ 引述《purewind》之銘言
: ※ 引述《sai0224sai (塞啦)》之銘言
: : 看中國那邊都在用游戲、手游
: : 沒看過遊這個字出現
: : 是真的沒有"遊"還是單純跟臺灣的"因該"一樣變成年輕人分不清的地方?
: 說到簡轉繁,我搞不懂機器翻譯為什麼永遠搞不定常用的繁體字
: 舉例:
: 遊戲→游戲、什麼→什么、豆干→豆幹
: 一個→壹個、一隻→一只
: 不該翻的亂翻,該翻的又不翻
: 現在AI文字處理不是在吹可以辨識情緒、寫詩、寫新聞
: 結果這麼簡單的簡轉繁反而做不到= =
: 不過好處是跳板仔一下子就露餡了: p
: ----
: Sent from BePTT on my Google Pixel 4a (5G)

因為簡體為求簡易,簡體會用大量同樣的字代換繁體
例如你舉例的游泳、遊戲,在繁體的編碼中是兩個不一樣的編碼

但在簡體裡是「游泳、游戏」,字都是「游」,編碼都是一樣的

你繁轉簡很簡單,反正導出的結果是唯一的
但簡轉繁,機器哪裡知道你要的繁體編碼是「游」的還是「遊」的?
比較智障的機器就會得出你舉的例子(但聰明一點的也只是預設字庫多一點點而已)
所以要精確簡轉繁,要嘛建立字庫彙集使用習慣
要嘛用AI自主學習,來輔助建立字庫

比如說「裡面」和人名「里昂」
簡體是「里面」和人名「里昂」

字庫裡就先設定好,繁化時遇到這種情況,一個要轉成「裡」,一個要轉成「里」




另外以前也有聽說過反向處理,轉換時去尋找簡體還沒被轉成簡體前的繁體編碼
來精確的還原正確的繁體字
不過我不懂程式,不知道這到底是傳說還是實際可用
----
Sent from BePTT

--

※ PTT 留言評論
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 122.116.33.134 (臺灣)
PTT 網址

Molestia09/06 21:56字庫設定好 會變成鋼彈八成

Molestia09/06 21:57https://i.imgur.com/BuwsEOc.jpg 鋼彈五成

ChHChen09/06 21:58字庫設定好有時候也會有過度翻譯,像那個王國計程車兵

chister09/06 22:01楊文里面向南方 會變成楊文裡面向南方

這就很像調教注音輸入法 你到底是想要遇到「面向」時優先呢 還是遇到「裡面」時優先呢 這個字庫真的無法解決,唯有依靠AI學習

smart0eddie09/06 22:01...的士

googlexxxx09/06 22:03精準翻譯一定要人工,翻譯不只單純字體切換還要做到語

googlexxxx09/06 22:03意跟表達,後者還會有創作的部分。所以翻譯通常屬於原

googlexxxx09/06 22:03創,AI最高只能做到意思或字體轉換要詞達義目前的技術

googlexxxx09/06 22:03做不到。(目前的最好方式回歸英文再翻出來,不過我覺

googlexxxx09/06 22:03得這個有時會把狀況弄的更糟糕)

我說的這些僅止於「精準繁化」 尤其像備份對岸小說時,如果還要把用字遣詞和語句邏輯都轉成台灣的 那不是累死了xDD 不是單就用語習慣轉換的話,繁化姬表現的還不錯 不過說實話,真的會有人想要拿簡體去「翻譯」嗎?

spfy09/06 22:07反向那個除非原本就有刻意作保留 不然應該是辦不到

我也覺得是這樣,編碼轉換過都不見了 到底是要怎麼精準還原…不過如果有方法留下可能就可以了 但如果原本就是簡體,就算這個方法可行也無能為力

※ 編輯: dbwu (122.116.33.134 臺灣), 09/06/2021 22:15:16

Vulpix09/06 22:24簡體的東西寧可看原文,反正都練習過了。

googlexxxx09/06 22:25其實還蠻多簡體(翻譯)的,只是用在的地方可能不是文

googlexxxx09/06 22:25章。通常用在程式跟人機介面,因為要簡單易懂邏輯合理

googlexxxx09/06 22:25。台灣也有用日文的英文的都有,不過這類的翻譯通常是

googlexxxx09/06 22:25工程師去寫的

Vulpix09/06 22:25花那個力氣去繁化就是麻煩。而且看了反而頭痛。

googlexxxx09/06 22:26看那種取向,尤其是教育取向不可能給台灣的小孩子閱讀

googlexxxx09/06 22:26簡體邏輯的

googlexxxx09/06 22:28另外像技術文獻,台灣用詞一定要精準所以也不可能用對

googlexxxx09/06 22:28岸用語

YomiIsayama09/07 09:05太極無按兩下

YomiIsayama09/07 09:06鋼彈五成

YomiIsayama09/07 09:07好奇簡繁轉換除了翻遊戲文本的以外都什麼人在用