[軟體] pyGNovelDL
如果版主覺得這篇文章不妥的話,請通知我刪除,謝謝
最近試著寫python的UI程式,弄了好久總算寫出一個可
以用的介面, 有興趣的版友可以看看
用途: 使用爬蟲抓取網頁的文字後,存成txt或其它格式。
程式本身可產生純文字txt和青空文庫txt,
配合AozoraEpub3可將青空文庫txt轉成epub
配合kindlegen可將epub轉成mobi
配合kepubify可將epub轉成kepub
python的原始碼在此
https://github.com/tsaiminghan/pyGNovelDL
透過pyinstaller打包好的exe
包含其它轉檔程式(java, AozoraEpub3.jar ...)放在extra資料夾內
https://drive.google.com/drive/folders/1l_4FPAIohVKPRZAuTI6ye-T3pKjIIIZ6?usp=sharing
縮址:
https://tinyurl.com/y4jvawnh
使用方法
(設定)
1. 點擊window.exe,開啟程式(最小化時會縮到右下角)
https://imgur.com/a/3quqMIO
2. 選取設定頁,點擊...按鍵,確認執行檔位置正確
https://imgur.com/a/JY6NDMI
(下載)
3. 貼上小說網址,選擇開始分析
https://imgur.com/a/id6F9pX
4. 分析完成後,會新增一筆任務,選擇開始下載
https://imgur.com/a/1sNx7Xf
5. 下載完成後,開啟資料夾可以看到產出的檔案
https://imgur.com/a/htlh7ms
6. commandline.exe可以使用命令的方法下載, 與
windows.exe兩者獨立無關
--
ps:上面的圖我是隨便找一本章節數少的書抓圖,
書我沒看過。
--
正版網頁…也能爬?
這樣是不是不用擔心變正版受害者XD
只能爬非vip的文字
先推一個
不錯喔 現在真的要做正版備份了 不然成為正版受害者
正版如果把JAVA關掉可不可以爬?
起點就只能爬非vip的部分, 跟有沒有java無關 另外vip的部分應該是圖片吧(我沒試過),所以也沒辦法抓到文字
這種其實有點吃網站流量資源,有的網站會對這種方式
有應對方法,像是一段時間內鎖IP之類的限制
另外起點VIP現在不是圖片了
不是圖片 vip也能爬嗎?
不行,就算vip不是圖片,那還要先處理登入才有辦法爬 我沒處理登入的部分
※ 編輯: tsaiminghan (220.136.107.98 臺灣), 10/24/2020 22:46:57所以正版還是只能爬不需登入的
登入cookie沒做吧,那還是只能爬免費網站
71
[iAPP] 多多閱讀內購免費軟體名稱:多多閱讀 軟體分類:txt閱讀器 軟體連結:49
[分享] 自己實作的 Youtube MV 惡意留言自動檢舉# 再更 目前有更新版本 想解決帳號被擋下來無法登入的問題, 開發時有順利解決 但不知道是不是因為我變開發邊測試太多次了 到最後有些帳號又被擋 下來 再麻煩大家測試看看了~ 目前登入帳號的部分使用者需要在自動開啟的網頁上自行登入,就不用在介面上輸入了~30
Fw: [閒聊] 反作弊程式會導致艾爾登法環遊戲卡頓作者: zhtw (Select None) 看板: C_Chat 標題: [法環] 反作弊程式會導致艾爾登法環遊戲卡頓 時間: Fri Feb 25 14:25:28 2022 DC 看到有人討論,艾爾登法環的反作弊程式 EAC 會導致遊戲過程卡頓 解決方法只有關閉 EAC 之後直接開啟遊戲程式13
Re: [閒聊] 自己做的vlive統整下載清單TWICE vlive網址清單(截至2022/11/01): 下載程式yt-dlp下載處: 合併程式ffmpeg下載處: 批次下載命令1: 批次下載命令2:6
[問題] Kobo Libra H2O匯入書籍請益版上各位大家好! 前幾日趁父親節pchome特價,購入Kobo Libra H2O, 但光是一個txt檔的匯入就快把小的給勸退了(掩面) 因閱讀的多為txt檔的小說(簡繁皆有),所以收機子後後設定完就開始了上傳作業,步驟 如下:5
[問題] Kindle 繁體中文字體選擇各位好, 小弟最近入手了一台 Kindle Paperwhite 4 (KPW4) 然後就開啟了四處找便宜書再轉檔處理進 KPW4, 但其中在 Kobo 買的原子習慣原本就是直排的書籍,格式看起來也蠻舒服的 想要試著維持直排放入 KPW4 中,爬過版上不少文章,3
[閒聊] 刺蝟貓下載方式(非常麻煩)推 AddictoBear : 很多盜版都是製作成圖片,然後拿來賣錢這樣,刺蝟貓 03/01 22:47 → AddictoBear : 沒有,據從盜版大佬了解是說,有做過公關,像是廢爐 03/01 22:47 → AddictoBear : 都有,但廢爐有在抓,而且有很多種方式去ban專門做 03/012
Re: [問題] Kindle更新後字型問題: 文中敘述推測... 檔案是否為 txt 格式? 用電子閱讀器不建議匯入txt檔容易當機 閱讀 txt 檔可用1
Re: [問題] Kobo Libra H2O匯入書籍請益猜測是 Calibre 尚未支援 Kobo 8月10號更新的新資料庫 建議解決方案 用 ConvertZZ 將 txt 檔案先簡轉繁 中文純文字檔我習慣用漢書編輯修改,然後用好讀製書程式1
Re: [問題] Kobo Libra H2O匯入書籍請益目前自己也會用kobo閱讀器看來源是txt的小說 (為了看小説家になろうXD) 通常過程是 1.確認txt的編碼以UTF-8為主 -需要轉換就轉存或用Convertz