PTT評價

Re: [閒聊] 起點網站部分文字無法轉繁體

看板CFantasy標題Re: [閒聊] 起點網站部分文字無法轉繁體作者
gusion
()
時間推噓 2 推:2 噓:0 →:0

最近做了一個chrome extension,把起點自定義的編碼轉換回去。
雖然基本功能已經有了,但其他功能還很簡陋
暫時還不打算上架,有興趣的可以先下載試用看看。

連結如下↓
https://github.com/lyroazo/qidian-proofreader/archive/v0.1.1.zip

安裝方式:
1. 下載擴充功能壓縮檔並解壓縮
2. 打開chrome擴充功能頁面,或者連到chrome://extensions/
3. 打開開發人員模式
4. 點選載入未封裝項目
5. 選取解壓縮的資料夾

辨識時間大約是載入完內文後約18~19秒鐘
辨識完會有訊息視窗跳出來
有時候辨識會有問題,可以重新整理換一個編碼組合
另外我有做快取功能,遇到以前辨識過的組合,就不用重新辨識,會快一點

由於我對javascript不是很熟,所以開發比較慢
也歡迎大家fork回去自己魔改

最後附上原始碼連結
https://github.com/lyroazo/qidian-proofreader/tree/master

--------
2020/12/01 更新
1. 連結更新成0.1.1版
2. 辨識時間由6~7秒變成18~19秒

因為原本起點防盜版的文字編碼只有使用58000~58122
但今天發現使用的文字編碼變成58000~58334
所以增加辨識的文字數,時間就變久了@@


※ 引述《linzero (【林】)》之銘言:
: : 有問題的會變成這樣
: : https://imgur.com/AOI8K6K
: : 推 BenShiuan : https://i.imgur.com/dmI1ooe.jpg 看起來不像正常 10/31 14:41

: 顯示 伴隨着
: 字碼 伴隨#58016
: 58016轉16進位是E2A0
: Unicode碼裡E000~EFFF是私人造字區
: 也就是大家遵守的規範裡沒定義
: 這區是讓人自己私下定的
: 這區的字如何顯示是看個別系統而定
: 比方把 冏rz 擠成一個字的寬度字形圖像
: 定義成E001
: 這樣字碼是E001(#57345)就會顯示成 冏rz
: 但在別的系統就不是
: 可能無法顯示(不支持這字碼定義)
: 或者顯示別的(比如別系統定義成 ^_< )
: 應該是起點拿去定義中文字用
: 而起點網站系統有對應字
: 在起點系統上可以被正常顯示
: 而換個系統會有問題
: (所以有些盜版網站會有顯示 #....或看來像是亂碼 的情況吧)
: 簡轉繁的機制
: 是把UNICODE碼裡的簡體字轉成UNICODE碼對應的繁體字
: 而這區自訂區的字,簡繁轉換機制無法處理
: 仍然用該字碼(像E2A0)
: 而這字碼是靠起點系統顯示的
: 所以簡繁轉換用自己的字形
: 起點自訂的字用自己訂的字形
: 且這自訂字形看來對應的是簡體
: 才造成兩者簡繁、字形不同的情況吧
: 不過 着 這個字UNICODE碼裡也有
: 不知起點為何要另外定義

--

※ PTT 留言評論
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 111.184.12.7 (臺灣)
PTT 網址

BenShiuan 11/30 06:55

※ 編輯: gusion (111.184.12.7 臺灣), 12/01/2020 23:41:38

serene0414 12/14 19:14感謝~