Re: [新聞] 搶太妍門票僅須4秒!警破獲首宗AI搶票黃牛 逮30歲台大畢
阿肥外商碼農阿肥啦!
其實就是使用langchain加上類GPT 3.5-4(當前很多開源的,一張4090就可以運行起來),透過模型輔助加上langchain可以直接接上Google等搜索引擎或特定網站解鎖語言模型讀取最新資訊的能力,這樣就可以規避掉官方要識別人類(粉絲?)的特殊問題。
然後圖片驗證識別這個目前就被玩爛開源Acc都可以到99%以上了,基本上你想用CNN或swin transformer來做效果都非常好。
至於自動爬蟲程式,阿肥最近也再跟公司的爬蟲同事一起研究有打算搜集一些人類點擊速度跟滑動速度的資訊讓模型學習一些策略做反防爬蟲,這個我印象中也是有幾篇論文在研究只是不多,主要是搜集人類瀏覽軌跡的資料比較困難,而且要搜集這東西要做也只能暗著做。
差不多4醬
--
可是他五年前就開始了耶
五年前圖片驗證技術就很成熟了,中間也可能優化他的爬蟲程式啊
問題是賣黃牛有罪....
那如果用程式自己搶會有罪嗎
不是你搞這個能賺嗎 拿去弄量化模型不是比
較好?
量化交易
搶票這個我不知道,不過反防爬蟲公司一直有這個需求啊,反反防爬蟲也是一個剛需。
※ 編輯: sxy67230 (49.216.90.41 臺灣), 09/08/2023 07:55:11反爬蟲又能兼顧使用者體驗搞 爆賺吧
這個窪地網站最擅長了 各種奇葩反爬蟲
不過我猜都會搞到使用者不爽
以前google打一大串文字最不爽 現在好多了
Selenium 就行了。為什麼要用到AI?
主要是Selenium的點擊模式很好識別啊,就算是你設定一個亂數隨機也很好抓,抓到就直 接band掉ip,又不是每個人都有幾萬組IP可以使用的。
※ 編輯: sxy67230 (49.216.90.41 臺灣), 09/08/2023 08:08:11好奇圖形驗證碼需求單純用CNN現成package
能不能做到 還是需要自己蒐集圖形資料貼
標籤train
可以直接用市面開源框架的OCR模型,連gpu 不用可以直接用cpu推理不用1秒就有結果, 實測直接拿他們官網提供的模型跟常見的圖形驗證就有9成命中率了,我推測他們也是有 拿那些數據加上大量其他的圖片文件去練蠱,所以效果連微調都不用。
自己搶沒問題 加價賣有罪
自己搶一樣有罪,文創法10-1
了解 感謝大大解答!
好奇javascript腳本的點擊模式也很好
抓嗎?搭配chrome的擴充功能也能做出i
sTrusted = true的click,應該不好抓
嗎?
爆
Re: [問題] 繪師有權力禁止別人學習畫風?兩邊都有學一點,試著回一下: 「繪師能不能禁止AI學習他的畫風?」 其實這個問題預設條件就錯了,現行的AI其實追根究柢到最後都是統計技術, 那種「會自己思考」的AI還不存在,可能也還要很久才會出現。 現在所謂的AI技術幾乎都是指深度學習、類神經網路等技術,X
Re: [請益] 每日FBX之亂到此結束?低調回覆這篇, 小弟之前做投資網站時有寫爬蟲去抓每日FBX官網的報價, 然後有發現網站 雖然寫要看每日報價必須登入會員, 可是其實他技術上根本沒有阻擋, 就算沒有會員的 cookie, 打下面這個API就能拿到近一年的每日報價了... 拿到的json檔案想方便觀看可以用下面的網站解析json:30
Re: [新聞] USAF預計明年7月施行人類對AI演習為何對台灣來說最簡單也最有效的AI軍事武器:自動機槍塔 沒有人想要開發呢 現有的開源軟體框架已經很成熟,也有已經訓練好的物體偵測模型(yolo) 只要把通用模型針對特定目標做遷移式學習就可以強化特殊領域辨識率 訓練用圖像資料靠海陸弟兄幫忙模擬一下 (班長:徵求資料標注公差10名) 整個套件硬體成本其實很低,樹莓派+intel神經棒或nvidia jeston應該可以做到15
Re: [閒聊] 用AI圖在ci-en被開創作者帳號被婊的心得突然想到 還有人說模型訓練的時候 用的圖沒經過繪師同意 這樣bad 那chatgpt訓練使用的資料也都有經過同意嗎7
Re: [閒聊] 沒人樂見AI繪圖技術的誕生嗎?大家都從藝術創作創意與著作權的方式去探討。 其實對於AI演算法而言,一切都是數據,Garbage in garbage out. 好的數據集才能產出好的訓練結果,大數據甚至可以量變產生質變。 產生出革命性的新技術來賺大錢。 類似這種蒐集網路公開數據然後分析產出有價值的衍生數據的爭議很早就有了。3
[請益] 國內外公開書籍資料的網站?因為最近有大量的ISBN書籍資料網站需要查詢(就是書名,圖片,價錢) 加上自己也有做過相關的爬蟲資料 但是爬一些商業網站,像是ebay 或是 Amazon 博客來.... 都已經做到高度的防護,我的爬蟲技術也已經無法跟上 想問一下各位大大,因為我只是想查詢書籍的資料2
Re: [請益] 大家爬蟲都爬什麼好玩?其實很多能寫啊 像我最常用的是寫各種js腳本 前年寫了一支腳本搶小米折價券 原理只是一直用js click()按鈕而已 花不到10分鐘為我帶來五千塊的收益2
[討論] 小玉 若用明星訓練的AI做A片 還會被關嗎?現在主流認為 用網路爬蟲去抓未授權的影像回來訓練 AI 模型 再由 AI 模型生成的資料是可以合法賣錢的 (例如 Midjourney, chatGPT, Dall.E2) 這樣說 小玉 若用明星訓練的AI做A片 還會被關嗎? #他只是生不逢時 --- 如提, 最近用了vba爬蟲與vba整理訊息+line bot 結合 產生了自己的股市最新新聞~即時的喔 比如說加權指數 道瓊 盤後資訊 最好用的應該是即時新聞資訊,
- 我認為要先釐清楚一點,要做AI的模型並非只能透過Python, 大家都用Python原因在於AI套件都已經由國外的大神做好了, 甚至有些套件都事先訓練好資料,提供weight檔案,可以直接使用應用在某些專案, 若只是要用這些AI套件,使用Python非常方便 Python的優點:
爆
Re: [新聞] 釋出3,753億元 財政部:嚴重衝擊中央財政爆
[問卦] 醫生太棒了吧==爆
[問卦] 鏡週刊遭threads愛台網友出征爆
[問卦] 抽獎又作弊?爆
[爆卦] 麥當勞重北一S50前員工遭性侵自殺爆
Re: [新聞] 建中校友宴竟吃「香鮑佐蘿莉」!他痛批:64
[問卦] 認真文 聽說明天保證會起訴了!63
[問卦] 小火鍋霸主是???爆
[問卦] Threads:我們是什麼很賤的人嗎?還要上街55
[問卦] 晨晨:蹦闆很囂張,我要替我爸報仇57
[問卦] 為什麼一定要出國考察爆
Re: [問卦] 長大後發現父母原來是89/O麻會怎樣?50
[問卦] 有什麼工作是簡單 穩定 還能偷閒的?52
[問卦] 志祺77要跟誰打拳上流量才會高爆
[問卦] 耶誕城那麼狂的嗎?44
[問卦] 人生的意義到底是什麼42
[問卦] 住家裡但有工作,算啃老嗎= =...?33
[問卦] 這麵+飯要430元?☺65
[問卦] 值得買的樂高組合☺20
Re: [問卦] 罷免連署需要身分證 你真的OK??27
[問卦] 30歲拿不出五萬塊算很可悲嗎==?30
[問卦] 讀莊敬高職一律當作8+9可以嗎26
[問卦] 玉里是什麼樣的地方?27
[問卦] 認真文 為什麼輝達員工不想去南部25
[問卦] 沖繩屌打墾丁?!哪邊好吃好玩推88
[問卦] 以前學過的科目哪一個最廢?45
[問卦] 安卓市場只剩三星手機能打了?21
[問卦] 統神吵到鄰居態度才是正確的吧?21
[問卦] 樓上漏電會讓浴室燈閃爍嗎?40
[問卦] 三惡法講的快亡國但怎麼燒不起來?