Re: [閒聊] 因為用了浮水印 追蹤少了1000人
※ 引述《mizuarashi (米茲阿拉西)》之銘言:
: 推特上有個日本繪師最近也用了浮水印,但用了之後追蹤直接少了1000多人。
: https://i.imgur.com/knrf5g0.jpeg
雖然知道這位畫師應該是想玩梗和酸馬斯克,但是這方法建議別用。
不能說完全無效,但是可以說微乎其微。
AI對於圖片中的異物,也就是浮水印、簽名、商標等等有很高的辨識力,
若是再加上提詞區分的話,浮水印基本上是擺好看的。
我就直接用這案例,做個簡單的實驗當栗子。
我模仿這位畫師,用素材網站隨便抓來的貓貓圖蓋在圖片上做一個風格Lora模型訓練集,底圖則是我測試時用同一個模型產生,風格類似的AI廢圖,大概長這樣:
模擬一下實際使用情況,
訓練的底模用Illustrious XL,然後再用noobAI來生圖。
先測試一下沒套風格模型,
也沒有任何品質提詞(Masterpiece等等)和負面提詞生圖的結果。
https://iili.io/2AGBD7a.png
然後我們套上用貓貓圖訓練的風格Lora模型後,用相同的提詞跑第一張。
https://iili.io/2AGC4vs.png
欸,貓貓出來了。你看,很有用吧這招。
等等,相同參數我們再跑個幾張。
https://iili.io/2AGx9hx.png
貓貓沒有每張圖都出現,實際上是跑了30張圖出現了8張貓貓圖。
約1/3。
https://iili.io/2AGIBWv.png
1/3看起來已經很高了吧?是不是達到汙染的目的了?
那我們加上品質提詞試試看,就用我平常用的這組。
正面是
masterpiece,best quality,high quality, good quality very aesthetic,absurdres,
負面是
(bad quality,low quality,worst quality:1.4),bad anatomy,signature,watermark,
backlighting,shaded face,
產生的結果長這樣:
https://iili.io/2AGAmp1.png
https://iili.io/2AGYP9V.png
還是有浮貓印,但是已經降低到30張只剩兩張了。
而且如果有觀察降躁細節的話,有時還可以看到貓貓被AI逐漸分解成背景的過程。
最後一步,在訓練打標時有兩個敏感度特別高的提詞,分別是cat和too many。
我們把它丟到負面提詞去做區隔。
只要以簡單以提詞處理區隔,
這30張乍看之下被浮貓印蓋得七零八落的圖片也能被訓練成一個正常的風格Lora模型。
有用,但就只有那麼一點點。
這個Lora就只是不太能生成和貓有關的圖片而已。
或許浮貓印還可以再強化,
例如分布隨機化、加入狗狗鳥鳥龜龜兔兔等等,應該能讓AI更混淆。
但扣除怒噴馬斯克,引導粉絲去bluesky的宣示意味之外,
真的有必要花時間做這些事嗎?
好像沒有。
第一點。
馬斯克就算用X上的資料訓練AI,那這些浮貓印圖片也只會是數億張圖片中的少少幾張,在沒有特別針對學習(應該沒有那麼閒)的情況,
不管有貓沒貓都不會在成品有任何肉眼可辨認的影響。
(而且我不相信只靠X就能搞出能用的模型,大概最終還是得去找類似LAION的資料庫 ==)
第二點。
不是只有X在爬資料訓練模型,他肯告訴你還算好的。
沒有公開資料來源,連訓練方都不知道自己到底拿了啥在訓練的大模型比比皆是。
以上這還是用爬蟲當前提。
假設有人想訓練這位畫師的畫風模型Lora,那可能連爬蟲都不用,
直接去bluesky拿圖就好。
第三點,也是最重要的一點。
ACG畫風的AI模型的直接資料來源不是推特或其他社交平台,
甚至有時候連Pixiv或deviantart等等投稿網站都不是。
事實上,自從NovelAI用爬蟲爬了某個盜圖網站訓練出第一款普及的ACG畫風模型以來,
那個盜圖網站就一直是所有大型ACG風格模型的主要學習對象。
現今被稱為「咒語」的標籤式提詞其實就是源自該網站對於圖片的詳細分類標籤。
甚至,由於該網站有清楚的標示角色、作品、畫師等資訊,
所以現今模型經過學習後也可以單純靠輸入上述資訊的提詞來生成標籤標註的圖片。
至於盜圖網站的圖片哪來的?
很單純,就只是使用者從各處的網站右鍵另存檔案再上傳,然後再人工打上分類標籤。
該網站也很清楚的將AI圖從圖庫中區隔開來,
所以一直被視為「清潔」又有效的訓練資料來源。
所以只要圖片有上傳到網路上,就有可能被人上傳到該網站上,
然後再被AI模型所學習。
那該怎麼辦?浮水印又沒啥用,難道畫師就沒有反制的方法嗎?
也不能說沒有,其實可以只上傳在訓練時會被剃除的圖片來防爬蟲。
因為大模型不可能像我搞Lora一樣手搓調整訓練集,
所以勢必得用自動縮放調整圖片大小和比例。
這其中就有一些圖片被認為無益或是會污染資料而被剃除。
以能模仿畫師畫風的開源模型Illustrious-XL來講,
他們公開的paper其實有講了有三類圖片會從訓練集中被剃除。
1.太小的圖片,未滿768*768。
2.太大的圖片,超過4000萬像素。
3.比例太極端的圖片,超過1:10。
簡單來講,太小AI可能不要,太大AI可能也不要,太長太寬AI也不要。
在我的認知無誤的前提下,
與其上浮水印,不如單純不要公開大小為768*768以上的圖片就好。
由於AI訓練的解析度一直在拉高,已經從最早的512*512一路飆到有人在搞2048*2048,
因此避免上傳大圖理論上可以防一些爬蟲。
或者上傳版面尺寸比例超過1:10的圖片,主要視覺部分不變,
其他版面拉空的部分看要塞貓貓還是狗狗,這樣目前應該也能防一些爬蟲。
當然,以上這都是防爬蟲不防人手。
講白點,就像看到好圖右鍵一樣。
真的像盜圖網站那樣用人力蒐集資料,或是爬蟲飢不擇食的話那是不能防的。
只是上述的圖片處理方法理論上可以勸退,或污染某些比較隨興的Lora製作者的成果。
--
(と・てノ) 翼龍欸
--
專業推
長知識 :O
翼龍欸
好奇問 有的繪師不是用浮水印 而是用一種像是汽油彩虹
的紋路去破壞圖片 這樣有用嗎
他所有的圖都用的話應該有用。 但是現今的狀況是他以前圖可能已經被爬過了或者被人收集起來放在別處,所以我猜沒用。
※ 編輯: Satoman (1.163.176.215 臺灣), 11/15/2024 23:10:45可以試見子這張嗎
印象很早就有人說過類似的內容
@@
專業推
推實驗
但沒持續關注AI繪圖的人可能會漏掉
浮水印確實很好處理
我比較好奇盜圖網站是指有些古老繪師
甚至Pixiv,Twitter帳號都已消失都還
找得到一些圖的那些Y,K,D,S開頭網站嗎?
另外有沒有可能就算上傳小圖
但爬資料的人用例如Waifu2x這種程式
先算出較大的圖再丟去做訓練?
訓練大模型不可能,因為圖片數量都是百萬起跳。 搞Lora有時候是會沒錯,但那又回到你公開了就不可能防人手的問題。
紋路那個是說glaze吧 那個有人專門寫小程式把它去除
這些手段主要都是防自動的 人手多的是方法繞
推
推板主 長知識了
專業推,尤其是後半段真的很現實…這不是轉到藍天就
能解決的
那acg人物的圖用人物當浮水印是不是就無敵了(?
AI對人物識別力更強,它會很清楚的知道這個畫面裡有兩個不相干的人。 應該會比貓貓還沒用。
推專業文
推
借題問,blue sky 除了r18設定開關之外還有什麼嗎?用了
一兩天我卻什麼露點圖都挖不太到…以前推特裏帳追一兩個
之後就越來越多能挖…下R18 tag出來的是滿滿的bl,有點
難用…
大師
漲知識 但感覺現在這種生成式AI趨勢 對創作者來說好吃
虧 然後AI監管法規進度又很慢
專業推推
厲害繪師的圖不可能小於768*768吧
就算只放預覽另外連結P網還是會被抓去練@@
畫完後手動縮到768以下不是那麼困難的事 就細節會糊掉
翼龍欸
你只要看過那個盜圖網站 就知道無論轉到什麼平台都是
一樣的 只是心裡上舒服點而已
29
[AI] 如何訓練LoRA? 猴子都學得會的手把手教學!先附上預覽圖,幼妲貼貼: 網頁好讀版: 前言都是一些廢話,如果只是想知道如何訓練LoRA,可以直接往下跳至分隔線。22
Re: [情報] 推特將強制所有圖文無償用於AI訓練其實我很想跟各位繪師說一下 不要認為換到其他平台就沒事情 除非你們朋友就是管這些社群平台後端的大主管 不然你也不知道對方後端怎麼設計的 除了telegram這種奇特設計以外16
Re: [討論] AI跟二創哪個侵權多?不是喔, 這概念完全不對 現在的著作權法, 會告訴你, 怎樣的行為算侵權, 好比沒有經過授權的重製, 散布, 公開播送等等 那拿AI圖片去訓練神經網路模型, 並沒有任何法定「侵權」行為, 除非修法, 加上一條「機器學習」。9
Re: [閒聊] 所以AI應用到繪圖領域,爭議怎麼這麼大棋譜沒有版權,圖畫有 AI生圖的版權糾紛很難處理 而且這次stable diffusion其中的waifu模型,或是NovelAI 都使用了圖庫danbooru 包含大量非正式授權圖片,網站本身已有人幫圖片上標籤省去超大量人力10
Re: [問題] AI為什麼不去吃動畫就好?我自己整的比較大的 馬娘 怕痛 不當哥哥了 養老8
[閒聊] 來聊聊AI輔助作畫的願景首先novel-ai過份了 手腳的問題解決了 馬賽克問題解決了 四肢亂跑的問題解決了 多人的問題也解決了 下面第三張極度nsfw注意 (全裸無露點)5
[閒聊] 反魔法屏障 NO-AI 浮水印工具簡介: 部分AI繪圖工具會讓生成的圖片加上一個隱形的浮水印,避免被AI模型二次訓練, 過去有人提議用這個辨識是否是AI生成的圖,但破解方法太多了。 (也不是所有AI軟體都會加上,甚至能關掉這樣的功能,也還是防堵不了描AI圖之類的)4
Re: [閒聊] AI模型破壞器Nightshade 正式推出這邊要說明一下,所謂的喂AI指得是在訓練模式下,阿肥稍微看了paper主要是透過微小 的相素變化產生的被下毒的圖片影響基石模型中正常圖片的高維空間分佈,所以就可以讓 生成模型你跟他說要產生哈士奇圖他給你緬因貓,因為模型產生的高維空間分佈已經被下 毒的圖破壞了。 不過這只限於訓練階段,一但fixed住的模型就影響有限,論文的假設就是以後所有的創3
[轉錄]AI必定成為設計/行銷/繪圖/美編業的標配轉錄自FB生活中的城市 建議可以看FB 有各步驟參考教學圖 例:修動漫圖片的兔耳2
Re: [討論] AI跟二創哪個侵權多?著作權法不保障畫風 所以如果未來技術發達到一定程度 製作底模的人或許可以聘用 很會「模仿畫風的人」 跟 「很會到處拍照的人」
爆
[蔚藍] 不可能!絕對不可能!爆
[Vtub] 結城さくな 刀劍神域柏青哥爆
[Vtub] Holo三期杯 各場勝負預測71
Re: [絕區] 這絕區零是不是想騙我入坑!62
[問題] 可以變成長期興趣、沈浸其中的遊戲爆
[閒聊] 壞事做盡的40%政府支持率超高:少女前線45
[俄語] 蛋雕為什麼在巴哈這麼多人看?爆
[閒聊] 兩個網友NGA互噴20小時,意外救了親人59
[閒聊] 動畫瘋 2024年度人氣動畫排名37
[蔚藍] 秘密のミッドナイトパーティー(雷34
Re: [鳴潮] 黎那汐塔冒險前瞻-收集與挑戰70
[閒聊] 一年一度的巴尼紀念日 (12/24~25)33
[Vtub] 儒烏風亭螺鈿 100萬訂閱達成47
Re: [閒聊] 咒術最終卷 額外加頁30
[蔚藍] 乃愛換裝就已經無法安於現狀了 (雷)26
[情報] BanG Dream! Ave Mujica68
[閒聊] alp 聖獸之王合同本27
[鳴潮] 內鬼-翱翔的時間限制26
Re: [閒聊] 美國:怎麼設計都很醜...只能交給那國家了25
[蔚藍] 眼鏡 蛋雕 (活動雷)31
[Vtub] 小箱or個人Vtuber 1224 DD串25
[閒聊] 緊身衣是要多緊才能看到肚臍?22
[閒聊] 聖誕節「性愛的六小時」是怎麼來的?24
[LL] 是口味不同還是看錯部 星團第二季不錯啊?24
[鳴潮] 官方聖誕賀圖來了23
[死神] 沒看懂哈斯沃德的能力22
Re: [鳴潮] 黎那汐塔冒險前瞻-收集與挑戰17
[閒聊] 家道中落的大小姐變成我的女僕21
[討論] 溫水被佳樹抓到在玩黑白妹 會怎麼樣88
Re: [閒聊] 壞事做盡的40%政府支持率超高