請益Request爬蟲
最近接到一個專案要爬購物網站存mySQL
爬分類裡面各產品資訊+內頁詳細資訊
目前已經使用selenium+multithreading寫完
可惜速度不夠快
所以正改用request改寫
但發現不管用什麼方法(session、cookie、payload)都沒辦法取得首頁的商品資訊
已經把網路上能看的解決方式都看過一遍還是無解
另外也試過network的event(貌似是api?
把相關資訊post上去爆出ConnectionError: ('Connection aborted.'
所有能試解法都試過還是無法
有沒有精通的高手幫看一下還有甚麼辦法呢
-----
Sent from JPTT on my iPhone
--
標題分類跟縮網址都不會嗎...
非親非故又問的不清不楚,願意幫忙的人可能不多:(
你瀏覽器看得到用爬蟲至少能抓個幾次(後續可能被擋)
不要放棄
直接回到完成的版本,然後複製多份同時跑,每支爬的範圍
指定一下
先縮網址再說
dynamic websites?
印象中好像如果是spa爬蟲抓不到(?)
如果你是女生 幫的人可能會多一點
只能給你關鍵字 用wireshark或fiddler看request的raw
data 想辨法模擬出一個一模一樣的request
這是get的raw data https://imgur.com/EViD6Ld
我網路亂抓的圖 我比較常用fiddler 你可以找個順手的
你很不想問問題?
問chatGPT
你給的這個網址,超級市場分類商品,點進去就timeout了
不好意思第一次在本版發文
感謝各位指教
selenium 笑死 怎麼可能快
建議先去搞懂request的運作方式,不然以後也是一個頁面
問一次
這兩本書我沒讀過 不過看目錄應該有你要的東西
看反爬蟲那個章節就好
selenium不夠快你不會多開幾台?
你在那邊破解反爬蟲的成本絕對夠你多開好幾台
多開幾台治標不治本 又浪費效能 學好request才是正解
謝謝各位意見,小弟再回去多研究request
你要先了解request和Selenium兩個爬出來的網頁差異還
有運作原理
網路上能看的解決方式都看過一遍???你可以看兩遍
連縮網址都不會你回去報資測會比較快
凶
有些反爬蟲技術就不是requests學好就能解決的
弱弱問一下,用爬蟲進行商業行為(外包),這樣不違法
嗎…?
51
[閒聊] EVGA官網爬蟲程式下載連結: 使用方法: 安裝 Node.js () 開啟cmd後cd到專案內26
Re: [問題] 會提醒你穿外套帶雨傘的捷徑這幾天自己寫了一個早晨siri播報+通知的捷徑(連結在最下面), 可以播報目前時間、今日行事曆、目前地區(行政區)的天氣資訊、溫度&降雨機率的小叮 嚀, 播完之後會再顯示一則通知:8
[發問] 道館分佈地圖請教一下,最近要去高雄,想訂道館旁的飯店。 已經爬過關鍵字,也看過精華區, 但還是沒有找到需要的資訊。 網路上我也查了一下,查到的資訊都很舊, 網站連結都是失效或沒有高雄的資訊。6
[越獄] iOS12以下的越獄目前Cydia Impactor已經不能使用 只能用AltStore來代替 但altstore只支援iOS12以上 還建議最好是12.2以上 那請問11.4還有其他代替方案可以越獄嗎? 我爬了很多資料4
[問題] 請問富士的相機怎麼查快門數如題,網路上查到的方式幾乎都試過了, 還是沒辦法查,有查到富士的exif不會紀錄快門次數資訊,所以沒有辦法查 從機身直接看快門次數的選單,早期機型好像也沒有 想請問有版友知道怎麼查嗎?謝謝 --3
[問題] ipad mini4無法鎖定螢幕如題 我有一台買超久的ipad mini4 版本是ios14.8.1 半年未使用但持續有充電 最近要給小孩做簡易線上測驗