Re: [新聞] 搶太妍門票僅須4秒!警破獲首宗AI搶票黃牛 逮30歲台大畢
阿肥外商碼農阿肥啦!
其實就是使用langchain加上類GPT 3.5-4(當前很多開源的,一張4090就可以運行起來),透過模型輔助加上langchain可以直接接上Google等搜索引擎或特定網站解鎖語言模型讀取最新資訊的能力,這樣就可以規避掉官方要識別人類(粉絲?)的特殊問題。
然後圖片驗證識別這個目前就被玩爛開源Acc都可以到99%以上了,基本上你想用CNN或swin transformer來做效果都非常好。
至於自動爬蟲程式,阿肥最近也再跟公司的爬蟲同事一起研究有打算搜集一些人類點擊速度跟滑動速度的資訊讓模型學習一些策略做反防爬蟲,這個我印象中也是有幾篇論文在研究只是不多,主要是搜集人類瀏覽軌跡的資料比較困難,而且要搜集這東西要做也只能暗著做。
差不多4醬
--
可是他五年前就開始了耶
五年前圖片驗證技術就很成熟了,中間也可能優化他的爬蟲程式啊
問題是賣黃牛有罪....
那如果用程式自己搶會有罪嗎
不是你搞這個能賺嗎 拿去弄量化模型不是比
較好?
量化交易
搶票這個我不知道,不過反防爬蟲公司一直有這個需求啊,反反防爬蟲也是一個剛需。
※ 編輯: sxy67230 (49.216.90.41 臺灣), 09/08/2023 07:55:11反爬蟲又能兼顧使用者體驗搞 爆賺吧
這個窪地網站最擅長了 各種奇葩反爬蟲
不過我猜都會搞到使用者不爽
以前google打一大串文字最不爽 現在好多了
Selenium 就行了。為什麼要用到AI?
主要是Selenium的點擊模式很好識別啊,就算是你設定一個亂數隨機也很好抓,抓到就直 接band掉ip,又不是每個人都有幾萬組IP可以使用的。
※ 編輯: sxy67230 (49.216.90.41 臺灣), 09/08/2023 08:08:11好奇圖形驗證碼需求單純用CNN現成package
能不能做到 還是需要自己蒐集圖形資料貼
標籤train
可以直接用市面開源框架的OCR模型,連gpu 不用可以直接用cpu推理不用1秒就有結果, 實測直接拿他們官網提供的模型跟常見的圖形驗證就有9成命中率了,我推測他們也是有 拿那些數據加上大量其他的圖片文件去練蠱,所以效果連微調都不用。
自己搶沒問題 加價賣有罪
自己搶一樣有罪,文創法10-1
了解 感謝大大解答!
好奇javascript腳本的點擊模式也很好
抓嗎?搭配chrome的擴充功能也能做出i
sTrusted = true的click,應該不好抓
嗎?
爆
Re: [問題] 繪師有權力禁止別人學習畫風?兩邊都有學一點,試著回一下: 「繪師能不能禁止AI學習他的畫風?」 其實這個問題預設條件就錯了,現行的AI其實追根究柢到最後都是統計技術, 那種「會自己思考」的AI還不存在,可能也還要很久才會出現。 現在所謂的AI技術幾乎都是指深度學習、類神經網路等技術,X
Re: [請益] 每日FBX之亂到此結束?低調回覆這篇, 小弟之前做投資網站時有寫爬蟲去抓每日FBX官網的報價, 然後有發現網站 雖然寫要看每日報價必須登入會員, 可是其實他技術上根本沒有阻擋, 就算沒有會員的 cookie, 打下面這個API就能拿到近一年的每日報價了... 拿到的json檔案想方便觀看可以用下面的網站解析json:30
Re: [新聞] USAF預計明年7月施行人類對AI演習為何對台灣來說最簡單也最有效的AI軍事武器:自動機槍塔 沒有人想要開發呢 現有的開源軟體框架已經很成熟,也有已經訓練好的物體偵測模型(yolo) 只要把通用模型針對特定目標做遷移式學習就可以強化特殊領域辨識率 訓練用圖像資料靠海陸弟兄幫忙模擬一下 (班長:徵求資料標注公差10名) 整個套件硬體成本其實很低,樹莓派+intel神經棒或nvidia jeston應該可以做到15
Re: [閒聊] 用AI圖在ci-en被開創作者帳號被婊的心得突然想到 還有人說模型訓練的時候 用的圖沒經過繪師同意 這樣bad 那chatgpt訓練使用的資料也都有經過同意嗎7
Re: [閒聊] 沒人樂見AI繪圖技術的誕生嗎?大家都從藝術創作創意與著作權的方式去探討。 其實對於AI演算法而言,一切都是數據,Garbage in garbage out. 好的數據集才能產出好的訓練結果,大數據甚至可以量變產生質變。 產生出革命性的新技術來賺大錢。 類似這種蒐集網路公開數據然後分析產出有價值的衍生數據的爭議很早就有了。3
[請益] 國內外公開書籍資料的網站?因為最近有大量的ISBN書籍資料網站需要查詢(就是書名,圖片,價錢) 加上自己也有做過相關的爬蟲資料 但是爬一些商業網站,像是ebay 或是 Amazon 博客來.... 都已經做到高度的防護,我的爬蟲技術也已經無法跟上 想問一下各位大大,因為我只是想查詢書籍的資料2
Re: [請益] 大家爬蟲都爬什麼好玩?其實很多能寫啊 像我最常用的是寫各種js腳本 前年寫了一支腳本搶小米折價券 原理只是一直用js click()按鈕而已 花不到10分鐘為我帶來五千塊的收益2
[討論] 小玉 若用明星訓練的AI做A片 還會被關嗎?現在主流認為 用網路爬蟲去抓未授權的影像回來訓練 AI 模型 再由 AI 模型生成的資料是可以合法賣錢的 (例如 Midjourney, chatGPT, Dall.E2) 這樣說 小玉 若用明星訓練的AI做A片 還會被關嗎? #他只是生不逢時 --- 如提, 最近用了vba爬蟲與vba整理訊息+line bot 結合 產生了自己的股市最新新聞~即時的喔 比如說加權指數 道瓊 盤後資訊 最好用的應該是即時新聞資訊,
- 我認為要先釐清楚一點,要做AI的模型並非只能透過Python, 大家都用Python原因在於AI套件都已經由國外的大神做好了, 甚至有些套件都事先訓練好資料,提供weight檔案,可以直接使用應用在某些專案, 若只是要用這些AI套件,使用Python非常方便 Python的優點:
爆
[問卦] 靠!所以台灣人在天安門被抓是假的?爆
[問卦] 台灣價值徹底崩壞的八卦爆
Re: [新聞] 逼死職員內幕!被許銘春一手拔擢 謝宜容爆
[問卦] 誒遺書不是給家屬的?檢調憑啥扣留?爆
[問卦] 抽獎、空污、綠鬣蜥、霸凌,還有什麼?爆
[問卦] 有人在辦公室上吊 命案現場不用封鎖?80
[爆卦] 何佩珊:謝宜容並沒有直接霸凌死者爆
[問卦] 希特勒搞屠殺也是立意良善嗎?87
[問卦] 從11職等降為10職等 就是嚴懲喔O_o77
[問卦] 公務員花12年升到簡任很厲害嗎爆
Re: [新聞] 同仁寧願降調也要離開 綠民代指謝有綠色67
Re: [新聞] 「我當然敢辦她」!勞長何佩珊承諾本周63
[問卦] 謝宜容的小孩現在在想什麼?83
Re: [新聞] 同仁寧願降調也要離開 綠民代指謝有綠色43
[問卦] 一句話講出8+9的口頭禪41
[問卦] 調離主管職位是什麼意思呢?!21
[問卦] 工作能逼死人? 大可以離職就好33
Re: [新聞] 調查稱謝宜容「目的良善」引眾怒 勞長31
[問卦] 遺書也要被國防布了嗎?32
[爆卦] 立法院防治職場霸凌專報猛烈質詢勞動部長33
[問卦] 淘寶雙11下單收到貨了ㄇO_o28
[問卦] 這次已經確定八又翻了對吧27
[問卦] 最幹的四個字幹話29
[爆卦] 昨天支那足球迷用雷射筆干擾日本隊23
[問卦] 華航怎麼不改名叫台航?28
[問卦] 瞻仰遺容時要注意什麼☹71
[問卦] 那些為洪仲丘上街頭的人都去哪了?26
[問卦] 教各位避免被霸凌的辦法22
[問卦] 演都不想演 連戰犯都沒有 等風頭過20
[問卦] 30歲存款多少,才算及格= =...?