PTT評價

Re: [爆卦] 林俊言疑似變造公文

看板Gossiping標題Re: [爆卦] 林俊言疑似變造公文作者
wild2012
(噹噹噹噹噹)
時間推噓 推:2 噓:2 →:3

我曾經用OCR掃描過上萬份文件
有直接用Py程式外掛掃描,也有用過號稱OCR最強的abbyy的軟體
甚至是對岸的PDF中文辨識系系統

我認為 基本上 這份文件沒有問題

一開始是圖檔的PDF,經過掃描之後 圖檔上傳保存
之後圖檔再用文字辨識掃描一次

把裡面的字辨識出來,才能把他加進 裁判書搜尋系統
這樣你才能用關鍵字找判決書
也就是大家找到的那些整整齊齊 每一個字都可以複製的網路判決書

而在OCR的過程中
他會盡力把每個文字物件都辨識出來,不管是字、圖形、符號、污漬都會掃出來
經過訓練後,可以只掃描重點 或把印章裡面的字都另外框選出來

那個印章,大家可以看到除了日期會不同,其他都是一樣的
也就是說,該辨識軟體經過訓練 會特別掃秒日期的部分
所以你才會看到 日期怪怪的樣子

因為軟體辨識出來後 會重製成它認識的樣子!!!
比如說 歪七扭八的簽名 會重製成新細明體

也就是說極大可能 你拿的是 辨識出來後的結果檔案,而不是原始圖檔
把公文的原始圖檔拿到網路上給人竄改嗎???原始圖檔應該是會另外存放的

--

※ PTT 留言評論
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 61.231.182.116 (臺灣)
PTT 網址

terryone11 08/13 06:12以後偽造文書就用你這當藉口

terryone11 08/13 06:13我的軟體訓練 會特別掃描XX部分

講這種話表示 你沒用過OCR

ttyycc 08/13 06:16找找其他的公文比對一下就知道了

cerberi 08/13 06:17

cerberi 08/13 06:18問題不在那個章 在其他地方啦

那些都是OCR辨識重製的問題

zhalao 08/13 06:18連usb證據都直接開啟的會這麼專業?

我只聽到硬碟法庭上直接點開,沒聽到USB直接開啟

cisyong 08/13 06:26怎會用這個軟體??

OCR水很深的

※ 編輯: wild2012 (61.231.182.116 臺灣), 08/13/2025 06:26:47