PTT評價

請益Request爬蟲

看板Soft_Job標題請益Request爬蟲作者
andy22543
(andy22543)
時間推噓 6 推:9 噓:3 →:26

最近接到一個專案要爬購物網站存mySQL
爬分類裡面各產品資訊+內頁詳細資訊
目前已經使用selenium+multithreading寫完
可惜速度不夠快
所以正改用request改寫
但發現不管用什麼方法(session、cookie、payload)都沒辦法取得首頁的商品資訊
已經把網路上能看的解決方式都看過一遍還是無解

另外也試過network的event(貌似是api?
把相關資訊post上去爆出ConnectionError: ('Connection aborted.'
所有能試解法都試過還是無法
有沒有精通的高手幫看一下還有甚麼辦法呢


附上連結
https://www.hktvmall.com/hktv/zh/%E8%B6%85%E7%B4%9A%E5%B7%BF%E5%A0%B4/%E8%B6%85%E7%B4%9A%E5%B8%82%E5%A0%B4/%E5%86%B7%E5%87%8D-%E6%80%A5%E5%87%8D%E9%A3%9F%E5%93%81/main/search?page=0&q=%3Arelevance%3Astreet%3Amain%3Acategory%3AAA11110000000

-----
Sent from JPTT on my iPhone

--

※ PTT 留言評論
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 220.137.8.129 (臺灣)
PTT 網址

keel9013501/19 20:13標題分類跟縮網址都不會嗎...

Hsins01/19 20:23非親非故又問的不清不楚,願意幫忙的人可能不多:(

MoonCode01/19 20:40你瀏覽器看得到用爬蟲至少能抓個幾次(後續可能被擋)

MoonCode01/19 20:40不要放棄

alihue01/19 22:01直接回到完成的版本,然後複製多份同時跑,每支爬的範圍

alihue01/19 22:01指定一下

victor2181301/19 22:40先縮網址再說

chuchutaro01/20 00:03dynamic websites?

wayne566894401/20 00:25印象中好像如果是spa爬蟲抓不到(?)

vi00024601/20 00:33如果你是女生 幫的人可能會多一點

vi00024601/20 00:34只能給你關鍵字 用wireshark或fiddler看request的raw

vi00024601/20 00:34data 想辨法模擬出一個一模一樣的request

vi00024601/20 00:38這是get的raw data https://imgur.com/EViD6Ld

vi00024601/20 00:39我網路亂抓的圖 我比較常用fiddler 你可以找個順手的

becca94501/20 01:03你很不想問問題?

Murasaki011001/20 01:19問chatGPT

kanahela01/20 07:38你給的這個網址,超級市場分類商品,點進去就timeout了

andy2254301/20 09:17不好意思第一次在本版發文

andy2254301/20 09:17感謝各位指教

surimodo01/20 10:07selenium 笑死 怎麼可能快

HybridSC01/20 15:44建議先去搞懂request的運作方式,不然以後也是一個頁面

HybridSC01/20 15:44問一次

vi00024601/20 16:41這兩本書我沒讀過 不過看目錄應該有你要的東西

vi00024601/20 16:42看反爬蟲那個章節就好

brucetu01/20 20:29selenium不夠快你不會多開幾台?

brucetu01/20 20:30你在那邊破解反爬蟲的成本絕對夠你多開好幾台

vi00024601/21 00:34多開幾台治標不治本 又浪費效能 學好request才是正解

andy2254301/21 11:04謝謝各位意見,小弟再回去多研究request

ReverieKai01/21 17:48你要先了解request和Selenium兩個爬出來的網頁差異還

ReverieKai01/21 17:48有運作原理

secretfly01/22 01:00網路上能看的解決方式都看過一遍???你可以看兩遍

B098869808801/22 12:30連縮網址都不會你回去報資測會比較快

MoonCode01/22 19:19

john031201/22 19:57有些反爬蟲技術就不是requests學好就能解決的

Belieeve01/23 06:30弱弱問一下,用爬蟲進行商業行為(外包),這樣不違法

Belieeve01/23 06:30嗎…?