PTT評價

Re: [新聞] 搶太妍門票僅須4秒!警破獲首宗AI搶票黃牛 逮30歲台大畢

看板Gossiping標題Re: [新聞] 搶太妍門票僅須4秒!警破獲首宗AI搶票黃牛 逮30歲台大畢作者
sxy67230
(charlesgg)
時間推噓 9 推:10 噓:1 →:10

阿肥外商碼農阿肥啦!

其實就是使用langchain加上類GPT 3.5-4(當前很多開源的,一張4090就可以運行起來),透過模型輔助加上langchain可以直接接上Google等搜索引擎或特定網站解鎖語言模型讀取最新資訊的能力,這樣就可以規避掉官方要識別人類(粉絲?)的特殊問題。

然後圖片驗證識別這個目前就被玩爛開源Acc都可以到99%以上了,基本上你想用CNN或swin transformer來做效果都非常好。

至於自動爬蟲程式,阿肥最近也再跟公司的爬蟲同事一起研究有打算搜集一些人類點擊速度跟滑動速度的資訊讓模型學習一些策略做反防爬蟲,這個我印象中也是有幾篇論文在研究只是不多,主要是搜集人類瀏覽軌跡的資料比較困難,而且要搜集這東西要做也只能暗著做。

差不多4醬

--

※ PTT 留言評論
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 49.216.90.41 (臺灣)
PTT 網址

SRNOB 09/08 07:49可是他五年前就開始了耶

五年前圖片驗證技術就很成熟了,中間也可能優化他的爬蟲程式啊

snider 09/08 07:49問題是賣黃牛有罪....

※ 編輯: sxy67230 (49.216.90.41 臺灣), 09/08/2023 07:51:36

Eunha9903 09/08 07:50那如果用程式自己搶會有罪嗎

SRNOB 09/08 07:51不是你搞這個能賺嗎 拿去弄量化模型不是比

SRNOB 09/08 07:51較好?

SRNOB 09/08 07:51量化交易

搶票這個我不知道,不過反防爬蟲公司一直有這個需求啊,反反防爬蟲也是一個剛需。

※ 編輯: sxy67230 (49.216.90.41 臺灣), 09/08/2023 07:55:11

xm3u4vmp6 09/08 07:56反爬蟲又能兼顧使用者體驗搞 爆賺吧

SRNOB 09/08 07:58這個窪地網站最擅長了 各種奇葩反爬蟲

xm3u4vmp6 09/08 07:59不過我猜都會搞到使用者不爽

SRNOB 09/08 08:00以前google打一大串文字最不爽 現在好多了

zombiechen 09/08 08:02Selenium 就行了。為什麼要用到AI?

主要是Selenium的點擊模式很好識別啊,就算是你設定一個亂數隨機也很好抓,抓到就直 接band掉ip,又不是每個人都有幾萬組IP可以使用的。

※ 編輯: sxy67230 (49.216.90.41 臺灣), 09/08/2023 08:08:11

reihane 09/08 08:07好奇圖形驗證碼需求單純用CNN現成package

reihane 09/08 08:07能不能做到 還是需要自己蒐集圖形資料貼

reihane 09/08 08:07標籤train

可以直接用市面開源框架的OCR模型,連gpu 不用可以直接用cpu推理不用1秒就有結果, 實測直接拿他們官網提供的模型跟常見的圖形驗證就有9成命中率了,我推測他們也是有 拿那些數據加上大量其他的圖片文件去練蠱,所以效果連微調都不用。

cka 09/08 08:13自己搶沒問題 加價賣有罪

※ 編輯: sxy67230 (49.216.90.41 臺灣), 09/08/2023 08:17:06

amge1524 09/08 08:23自己搶一樣有罪,文創法10-1

reihane 09/08 08:36了解 感謝大大解答!

Rexspinner 09/08 09:15好奇javascript腳本的點擊模式也很好

Rexspinner 09/08 09:15抓嗎?搭配chrome的擴充功能也能做出i

Rexspinner 09/08 09:15sTrusted = true的click,應該不好抓

Rexspinner 09/08 09:15嗎?