[請益] 備份網站的技術?
花了很多P幣,跟時間再研究google跟備份網站
備份網站不是用多線程爬蟲技術嗎?
但是好像發現了,沒有這麼簡單
好像每個版,測試過,被備份的方式不同....
說簡單,但也不簡單
這類網站所依賴的技術,其實滿簡單的
但是PTT只要發文權限跟方式不改,永遠都一定會被備份
發文的那個瞬間,因為很多地方不能改變,只能發文後再改
所以,第一次的文章標題,還有發文者一定會被紀錄
本文可以修改,所以必須等第二次才能解決
想問一下,PTT備份網站,像是PTTWEB 所仰賴的技術.....
謝謝!
損失好多P幣跟時間,血淚,才得到這種結論.....
人腦真的比不上電腦QQ
--
……有人看得懂這篇嗎?
伸手文啊
為什麼會損失p幣
看標題進來因為是DB backup或snapshot結果是爬蟲...我快
跟不上時代了..
看不懂想要幹麻
看不懂在說什麼
我也跟不上你的腦
請先閱讀「提問的智慧」,謝謝。
先定義你要備份的內容是甚麼。
是原本的內容一模一樣?還是只爬文章文字內容?
看標題我以為你是要問快照之類的
原 po 應該是想問備份 PTT 裡面所有發推文紀錄的網站
ctrl+S…?
我覺得PTT備份文章的網站真的好厲害喔!全都可以記錄
偷取別人網站內容叫備份¿¿¿
這就是工程師和客戶之間的思維差異
只要格式固定,都可以被解析
我程度太差看不懂 QQ
爬蟲作業自己寫欸 本來每個網站爬蟲都不一樣
都要修改
明明是中文,我確聽不懂
要用眼看
看不懂的都沒有成為PM的資質
客戶說的備份 要跟工程師說逆向工程才聽得懂
ptt有個allpost版吧
為什麼要對自己的網站做逆向工程
沒有什麼是複製貼上解決不了的
2012做到現在發文發問還像完全不懂程式的外行著實厲害
對不起我還真的看不懂
這個表達能力不愧是工程師
我看得懂,有人可以撿我去當PM嗎?QQ
看不懂想問什麼+1
我看得懂中文看不懂這篇文
Ctrl+A+C+P
偷別人網站內容 然後做出相似的東西放出來 他想知道
那些網站怎麼辦到的
沒講解決要解決什麼,一百遍都猜不透吧
看得懂 還好我有看完新上的通靈王
好吧~ 我直說1.是用甚麼技術做出的網站? 2.如何防止一發文就被備份 3.可以從備份網站刪文嗎?
公開網站要怎麼防止備份 你要他們刪文不然寫信去問看看R
寫了3封,沒人鳥~
只有一開始就不存在的東西不會被備份
反向思考 你可以發加密文
去跟 ptt 站方要求禁止來自這些網站的爬蟲
應該說請求才對
公開網站可以防爬蟲的話,那一開始你就發加密網站就好
砍站
我連這網站的技術都不知道~ 要怎麼砍?
※ 編輯: yobook (101.137.139.78 臺灣), 10/10/2021 10:20:25公開網站 網站也不是你擁有的話 你單純發文沒辦法防吧
哪篇啊? 我架個網站備份那篇,你想刪聯絡我一定刪
我看唯一的問題應是:如何發文不留痕跡?
不要上網
駭進去砍啊 不然就走法律途徑
如果你是說刪除,那叫特權,工程師不能任意刪除的。公
司主管授權維運工程師,政府公權力要求私人企業
問netflix怎麼防止用直播截取卡把魷魚遊戲錄下來
阿你文章就發出來了
1. 直接爬BBS、爬PTT網頁版、爬別人的爬蟲
2. 如何防止? 1. 發在有讀取權限的版 2. 不要發文
3. 檯面上方法有許多,檯面下方法不好說
砍東西就是駭客行為啊,資訊資產保留的有一定的規範,
不是你要砍就砍
你可以用GDPR去要求刪除
支離破碎的發言
這篇是三小....
啊不就爬蟲
之前試過在文章開頭加個HTML註解,有些備份網站就抓不
到內文
嘗試更改你的內文阿,或是故意加一些語法讓爬蟲程式錯
亂認不出來
爬蟲只能抓固定Pattern的東西吧
怎麼這麼多會通靈的人,真是太厲害了
程式碼,資料庫 系統環境安裝啊
資料庫比較麻煩 動態客戶資料要利用閒置時間備份。否則
資料會漏的
13
[討論] PTT網頁版好恐怖啊~~~~~簡體字說明 不接受刪文請求 不接受刪文請求7
[問卦] 真的沒辦法停止PTT的網路爬蟲?PTT很多備份網站 多道真的有點誇張,很多鄉民都有貼了 但是 真的不能停止requuests的發送嗎? 或是就算備份,也不讓google搜尋搜到的方法?7
[問卦] 在ptt發的文章加上台獨字眼防爬蟲備份現在爬蟲網站盛行 Ptt的文章 只要一發佈 就會被大量備份 你刪文也刪不掉這些備份下來的痕跡 但這些爬蟲網站 好像就說都是中國那邊的 主要都是要產出到內容農場之類的7
[問題] pttweb是PTT的官方網站嗎?最近發現一個網站,裡面全部是PTT的文章 想問一下,因為之前已經刪掉的文章,竟然還在裡面出現? 而且這個網站是號稱官方的備份網站? 很好奇,這個網站是PTT官方的網頁板?1
[請益] 備份網站可以拿來做資料庫實驗嗎?因為寫了很多的e-mail 拜託備份網站刪文 但是一年多來,都沒有結果 想問一下,既然這種沒有經過作者同意的備份網站 處於非法狀態,而且主機端又在海外 那乾脆自己研究,然後查詢其主機端5
[問卦] 所以說 ptt的發文到底怎麼刪乾淨大家都知道 現在一堆爬蟲網站 即時性地在備份ptt 只要一發文 沒多久就能在各種xxptt pttxx之類的網站翻到 你刪文還沒用4
Re: [問卦] 軍武版認為該版遭中共監看一定會監看 很多年以前中國就有一個網站 UCPTT 到現在都還活得好好的 隨時備份PTT站上的所有文章 基本上只要發文就會被 UCPTT 備份了 軍武板討論軍事情報 必然會被監看3
[問卦] 驚!Ptt發文、留言備份484掛了?最近去看一下Ptt網頁板 就去查發文留言的網站 沒想到最近好像掛了 最新紀錄只有到2天前 一般發個半小一小就會被備份了X
[問題] 備份網站的技術?花了很多P幣,跟時間再研究google跟備份網站 備份網站不是用多線程爬蟲技術嗎? 但是好像發現了,沒有這麼簡單 好像每個版,測試過,被備份的方式不同.... 說簡單,但也不簡單