Re: [閒聊] AI畫圖是不是大數據拼圖?
我嘗試來簡單圖解一下 AI生成圖的概念
因為 1. 想要簡單解釋 2. 我不是本科生
請板上各位高手不吝指教 不過別太嚴格
見圖一
首先,我想要從向量空間開始講起
假設你有一張圖 只有兩個像素 1 x 2
那你可以把第一個像素當成 x 第二個當成 y
這圖就是一個(x,y)向量 (見下圖)
假如有 3個像素 1 x 3 就是(x,y,z)三維向量
同理,
nx x ny 像素的圖 就是一個nx x ny 維度的向量
https://i.imgur.com/5QxQiV2.jpg
見圖二
理解這個想法後
我們把圖像的高維空間畫成二維方便表示
以ACG圖為例
那被人類接受的ACG圖就是一個高維空間中的分佈
簡單理解就是一個範圍內的圖,會被視為可接受的ACG圖
在那個範圍外的空間包含相片 雜訊 古典藝術 支離破碎的圖
生成模型的目的,就是從範圍內的樣本(下圖紅點)建立一個模型
這個模型學習到這個範圍,而模型可以生成也只會生成在範圍內的點
https://i.imgur.com/NfUyIAg.jpg
這裡有兩點值得注意
1. 模型並沒有儲存紅色樣本點的資訊,而是學到讓點落在那個範圍內的方法
2. 雖然理想上是要學習被人類接受的ACG圖的範圍,但是能學到的範圍受到樣本的限制例如:未來會出現的畫風照道理說也在範圍內,但是沒有樣本,理論上學不到
又或者你的樣本內沒有一張圖出現耳機,模型就生不出戴耳機的妹子
基本上這機器學習的概念和人類有像,就是看很多存在的圖理解什麼算ACG圖
怎樣畫才是合格的ACG圖
但是
1.模型缺乏人類的先驗知識,例如我們知道耳機長怎樣,即使沒看過耳機的ACG圖
2.缺乏人類的創造力,因為人所能接受的ACG圖範圍一定比現在大得多,
缺乏人類的經驗知識或本能,以現在的做法機器無法拓展新的創作範圍
接下來簡單講一下,我所理解的主流生成模型
1. 生成對抗網路
這是兩個模型 一個機器評鑑家 和一個機器創作者
機器評鑑家不斷的學習分辨真正的人類創造 和 機器創作者造出的膺品
機器創作者則是不斷學著越畫越像人 騙過評鑑家
一個模型學習界定範圍
另一個學習讓生成的點在範圍內
2. Diffusion model (見圖三)
這個東西就是現在主流的這些動漫圖生成器的原理
這東西比較不直觀 數學也很複雜
簡單來說,
在訓練這模型時,先讓原本那些樣本點隨機擴散
最後變成一個高斯分佈 (ACG圖退化成雜訊)
同時紀錄擴散過程
之後再訓練一個模型學習逆擴散,把高斯分佈還原回ACG圖範圍
之後你高斯分佈取一點(丟一張雜訊給模型)
模型就會自動把你的圖推回去那範圍(變成ACG圖了)
https://i.imgur.com/zdnQPmj.jpg
這樣大致解釋一下,你覺得是拼貼嗎
-----
Sent from JPTT on my iPad
--
哭啊 打到一半就有人解釋了 我在幹嘛…
沒事 有手繪解說給你推QQ
訓練學到的convolution filter 會像是小塊pattern
根據activation 強度會在輸出圖上出現相應的pattern
一層一層疊起來
硬要凹是拼貼也沒說錯
圖文並茂 很棒啊
你講那麼多文組哪懂,看起來像就說拼貼阿
沒關係,你講的比較簡單好懂一點
透過運算把圖拆解 然後透過運算把圖產出來 算拼貼嗎
手繪的 你的分數更高啦
你的圖說蠻清楚的耶
我那篇只是複製貼上啦ww
推推 你的說明也很棒
文組繼續說拼貼抄襲
寫得很清楚
其實我覺得這篇沒有比上一篇好懂 不過推用心
我只是想有人解釋就懶得解釋了
手繪贏了
我懂ㄌ 謝了
有沒有專門用來解釋AI的AI
你的圖很清楚
這問題就在把東西推到不同維度去做拼貼叫不叫拼貼
數學我頭好痛= =
推解說
很好奇擴散手法的發想w 無奈數學不夠好
圖解w
他沒有儲存原始資料能算拼貼嗎?
說到這個, 假如有人亂玩過GAN就知道 train壞的GAN會認為生成在範圍內的最好方法就是 直接生成樣本點XD
Diffusion的概念就是拓樸啊。感覺應該要建立距離概念,那
就應該是賦距的拓樸。有一點類似這樣:給全世界所有人都打
上一個等級,數字越接近零的才是你的朋友。數字很大的那些
可能因為社經或物理上距離你遙遠而數字太大。
他把"圖轉成雜訊又把雜訊還原成圖"的參數記下
把那個參數用在全新的雜訊圖上就是拼貼的時機
問題是人類也是阿 哪個繪師的身體各部位畫法 不是看其他人的圖學來的 不同點是人類有其他知識經驗 電腦只有偽隨機數 和 比人類多更多的閱覽描圖量
而且那種瞎雞巴大的模型隨便train一下就overfitting了
如果這樣還硬要說是拼貼的話,那人在構思圖案的動作在
他們的思考邏輯上也是拼貼了
人的作畫又難以一概而論了,很多人在動筆畫畫的當下
腦裡是沒有畫面的,只有想畫的題材,看到自己畫出的
線條或顏色之後才有接下來的想法,至少跟AI的過程完
全不同
沒說人類不是拼貼,人類就是站在巨人的肩膀上
就如你所說,人類有其他經驗,可以在圖畫上混合
不管啦像素級的拼貼還是拼貼啦都是抄襲啦抄像素也
是抄襲啦不管啦幹
人可以做到 其他事物混圖,但是AI只有 圖混圖
達文西學人體畫法是自己去解剖學來的 哪邊學其他人圖
實際上就是 目前的AI拆解半天 還是只有拆解別人的圖
人類就可以把現實實景混上前輩的畫法
但AI只有 前輩的畫法混前輩的畫法
現在問題就是 AI從A畫家得到的A算式 B畫家得到的B算式
這些算式能說是AI自產的嗎
人類混太多前輩的畫法 混到不能分辨時一樣是侵權啦
誰說的 那是novelai只用圖片 一堆其他的照片之類的都丟進去
丟一堆進去 學的方法跟學到的概念也沒變啊
真的那你訓練AI時多加幾張自己拍的照片進去 這樣就不算拼圖
了嗎
倒頭來是哲學問題嘛
那只是拼圖能拼的材料變多
看起來就是在從樣本分析出來的模型範圍內,慢慢把符
合條件的像素填進去,我玩拼圖也是這樣玩的。
除非你是盲人畫師,不然只要有眼睛看的到在那些人的邏
輯眼中就是抄襲了。
在電腦上架個攝影機 影響直通模型追加訓練 這還不夠仿人類
嗎
人類不也是揉合前輩和個人經驗來創造
我記得很像有漫畫家說過類似人只畫的出看過的東西這種話
別再跟人類一樣了 人類還有自我感知跟想像的功能 ==
ai:我也會加噪點阿==
你給AI看再多 不給他看雷太的畫 不給他看妖精 他是無法
憑空創造出一個噪點跟公式畫出源賴光或長耳朵妖精
電腦有隨機數!
那就只是AI看得還不夠多阿
但人類可以 而今天這個看雷太畫產的公式 雷太有著作權嗎
目前的隨機數要用人為操控去調整給權重阿 離產圖還遠的
人類沒看過也畫不出雷太畫風啊 你想說啥
不是看不夠多的問題 你給他看再多三次元都產不出長耳朵
你回去看看你的隨機噪點是怎麼被轉成圖片的
你人類沒看過人沒看過比較長的耳朵就畫的出妖精?
你大概忘了有一大部份被人類嫌棄淘汰的AI圖都是AI自己
算出來的,這些圖卻不被歸類為AI自己想像的
確實 看得夠多的話就能降低和特定畫家相似的可能性
就變成抓不到
我知道AI會算出人為淘汰的圖阿 所以你還是要用人為去調
教成人類想要的東西 這過程是有價值的沒錯
不是吧,印象派你還可以說是畫家近視太深,看起來都
糊糊的,但野獸派、立體派的畫風在被創造出來以前要
我就覺得這是哲學問題 才以問句做結 模型再強也會被這樣質
去哪裡看來學?水墨畫、浮世繪中許多線條的型態跟透
視法也不是人眼能捕捉到的形象
疑
這問題被推到這地步,跟完美強AI是在模仿人類還是真有意識
根本一樣
有個有趣的事情大家可以想想 danbooru2021 dataset 接
近5TB 而diffusion model則只有4GB
今天問題是餵他吃A畫家的圖得到A畫家公式 用A畫家當tag
一直在不斷告知AI該怎麼畫的過程,難道就不是教嗎?
就會套上這公式去算 那這公式能說不是吃A畫家圖來的嗎
什麼是學會 就是很哲學的東西了
對啊 就像有人可以靠背考高分 有人靠理解原理跟邏輯
因為AI沒有自我意識能夠定義出風格,不管是被人為選
中和淘汰的,對它來說都是符合條件的圖
人類的學會很哲學 但AI的學會還是一串串的公式代碼
告知AI這件事,準確說是調整機器達到預期的目標
novelai不能用繪師當關鍵字就是了
所以才把硬教人類學習的行為,形容成機器人
例如考試機器人
人們在模仿賽璐璐畫風的同時,不也是以此為目標嗎?
還有對繪畫的認知跟對AI數學概念 實際運作的認知也很
影響這個問題的結論
我覺得ai不是不能產生風格 而是審美的是人
它的風格你可能只會覺得這個ai練壞了
感謝講解,diffusion 原來是這個意思
把賽璐璐畫風當作圍棋來看待,人類能走過的棋,AI肯定
也會走過來甚至超越,現在還只是AlphaGO,等到變成Alp
haZero那樣,那就沒有任何繪師能超越AI的畫風了,因為
它能無中生有產出比目前畫風更引人注目的畫風
當然 難的是產生人可以接受的新風格
現在問題就是 產生對於AI來說早就不難了 但AI沒辦法靠自
己明白畫的是不是人要的東西
還是跟強化學習不同
圍棋有規則有明確可定義的目標,可是產圖要懂的是人心
推
目前最大的區別是人類的審美觀其實已經鎖定AI畫圖的局
限性,所以在怎麼強化也還是AlphaGO等級,要跳到Alpha
Zero然後人類還能接受的畫風還有一段路要走
一個目標是贏,另一個的目標是討好人類的審美觀
畫的很厲害很複雜沒有畫師能辦到,人類不喜歡也沒有用
今天如果把一些被淘汰奇形怪狀的圖撿起來說你看這些
都是AI畫的,可能會很新奇沒錯,但實際上卻也是經過
人為主觀判斷挑選後出來的圖,你以為的AI風格其實還
是人為定義的。讓不同的人來選結果可能都不會一樣
我可以說繪師不會完全被取代,但不該因此排擠AI,就像
你不會因為照相機會取代畫肖像畫的人就不用相機一樣
相機的誕生在兩百年前也是顛覆當時的美術,但事實上兩
邊都能夠共存到現在
人畫不出沒看過的東西?那那些奇幻故事的各種種族是怎
麼來的?
ai靠一串串公式跟代碼,人類也一樣啊用語言文字教
你公式教你怎麼做
公式的部分自不必說,代碼就只是機器語言,溝通用
的東西而已
但是有個差距 你腦內的東西是你的這在法律跟道德上沒問
相機的衝擊,促使人類的繪畫創作脫離了早期注重光影
寫實比例的刻畫,朝向新的方向去發展,這說明了人類
的審美觀並不是固定的,除非AI有意識,能為自己的風
格定義出標準,不然終究還是只能作為工具,依附在人
類的喜好之下
題 但AI的公式代碼如果是靠別人的圖來的 請問這些東西能
算是AI擁有者擁有的嗎
人類最主要的差異就是自我意識吧,就算學習也是自我
去思考見解取捨吸收融合之後依照自己的想法去畫出想
畫的東西,用手畫出腦內的想法或創意,就是這樣才有
很多現實不存在的奇幻生物之類的被創作出來
那樣的話有問題的也是那些拿盜圖來餵的人,不是AI
現實不存在的奇幻生物的概念也是從現實動物而來的啊
人類的思想仍然無法超脫自身所生存的世界概念,所謂
的創意仍然是從生命經驗而來。而為了特定目的訓練的
AI都餵同類型的圖,自然也只能製造出範圍內的圖,甚
至超出範圍會被人類判定為不合格
NovelAI如果是盜圖,那應該譴責他們,但AI是無辜的,
不能一竿子打翻一船AI,其他拿公開無版權圖案練習的AI
不該因此被推上處刑台
有問題一直都是盜圖的人,如果是自己畫圖餵給AI,哪
有問題
人類懂得把現實被認知到的概念用思想去融合或以此為
底魔改成一種新的本身就是在用自我意識去創造了啊
為什麼一直有人譴責NovelAi用盜版網站資料 但是卻沒見過
幾個人去譴責danbooru本身啊 它才是萬惡根源不是ㄇ
因為嘴danbooru高機率像上面那篇被曬www
ai也很會融阿 安價串不就融出一堆鬼東西
那像之前有人發文眼睛長奶子的難道就不算創造嗎?
我覺得前提是觀看者知道作者是人類或AI,才因此產生
出觀感差異
問題就在人類創意由來的生命經驗不光來自外在形象的
臨摹而已
推 好多熟悉的名詞,但我沒學好都看無
那是它經過思考理解之後想像得出的東西嗎?
樓上上說的能否舉例呢?有點抽象不太理解你的意思
對,我覺得重點在「作者的思考與理解」,人類繪師的
價值就在於.....他是人類。
因為我們是群居動物,天生有交流的需求,所以能夠理
解繪師思想的畫作比起AI隨機產圖還要有價值
(不過價值可能因人而異就是了)
並不是「因為是人類才能畫的出這樣的圖」,而是「因
為是人類畫出這樣的圖才有意義」
依照圖本身的用途不同,有些不需要作者這層意義的就
會被AI取代
現在的AI算圖的局限在於你的取材樣本終究來自於分析
其他人已經創作出的圖像作品,但是人類的創作靈感有
時候不單單來自於眼睛所見到的事物,夢境、記憶、感
情、經驗,甚至味覺嗅覺等等都能成為題材養分,透過
人的主觀意識形塑成作品,甚至在不同的精神情緒狀態
也會有不一樣的結果。
專業推
當然用AI學習運算可以在視覺結果上無限的接近,但我
認為過程還是有不小的差異
所以簡單說就是AI先看一幅畫怎麽被揉成垃圾
再嘗試把另一坨垃圾攤開變成一幅畫
寫得挺好&有插圖 推
42
最近回去念書了,念的programme名字有AI,應該可以發個言ㄅ 新科技需要熱衷的族群做推廣,有推廣才有funding,我才有薪水qq 不過這些族群不一定對科技有正確的認識 這幾天看到一些不精確又容易誤導的解釋真的會中風 想說做點簡單的科普(科普很難我知道qq)6
很久以前有人發現圖像可以拆解成直線 圓圈等等很小的基本圖樣來表示 用這些基本圖樣可以組成各式各樣的圖37
首Po大家最近討論的AI畫圖 我本來以為真的是AI汲取各種關鍵字 然後用算的方式算出圖陣 看大家玩下來 比較像是AI去全球所有的圖畫數據庫裡面71
只要是深度學習AI,原理都是把圖轉換成矩陣,通過神經網路作back propogation學習特 徵,在整個模型的運算過程中只有矩陣,不存在任何圖像拼接的過程 你認為圖很像,是因為那個tag底下的圖大多有類似特徵,模型通過矩陣學習到這個特徵 當然,也有一些generator的算法是會拿部分來源當輸出,不通過矩陣運算的,怎麼選也 是讓模型自己學,類似概念可以參考pointer network或residual network之類的算法8
首先當然是算的 如果要從全球資料庫找圖再拼圖 那硬碟空間跟運算時間都會非常驚人 從實際面來看很難做到像現在5秒就出一張圖 再來是目前很紅的Novel AI 目前畫風統一程度確實不像一般Stable Difussion17
不是,兩個意思完全不同。 用簡單點的說明方式解釋大數據拼圖和AI畫圖的話。 大數據拼圖就像是有隻以光速的猴子在數十億張圖中找出符合tag要求的圖片,再以各個部 位做切割調整後貼上。 AI就像是個技術高超的繪師,擁有無限壽命還有加速世界的加速能力外掛,另外還有多工處22
我很久以前連waifu diffusion都還沒出來就發過了 複製貼上自己的文章算抄襲嗎 -------------------- 造成這波圖像生成革命的推手21
所以AI是在訓練如何灑鹽,依精準比例灑出一片圖 在大量鹽巴堆裡還原的過程總會產生誤差就是AI的隨機性吧~ 就像是把羅夏的墨跡圖拿給佛洛伊德看:3
這個加噪降噪的過程可以用數學方程表達 比如說雷太獵奇奶的概念 人類的理解就是巨乳、氣球 diffusion的理解則是一堆數學式 同樣的概念,不同的表達方式
爆
[問卦] 如果CDC圖改成這樣會不會比較清楚現在本土疫情嚴重 台灣又這麼小 在高雄染疫都有可能跑到台北造成疫情 一個桃園破口就害鄰近的台北新北新竹一起坐牢 所以大家最關心的當然就是哪些地方確診最多 至少可以避開那個地方不要去 以免造成群聚爆
[閒聊] 迪士尼官方H圖K島看到的,快笑死 @KaiserNeko 有趣的事實: 有一次我在獸控同人大會問了傑夫=古迪(美國神龍傑克的作者)這個問題:46
[瑟瑟] 看色圖不求人Part2 AI生成色圖全教學古拉鎮樓 (從Discord搬運 非本人生成) Part 1 在這 不重要 過時了 這篇將包含所有你生成色圖需要的資訊 1. 使用者界面 Stable Diffusion Webui37
[瑟瑟] 瑟瑟不求人Part3 AI畫馬娘色圖可以嗎?上圖34
[閒聊] 驚!看色圖不求人 AI是否也能畫色圖?雖然下了很農場的標題 但這一篇認真的研究論文 大家或許以為AI跟色圖很遙遠 但事實真的是這樣嗎 在一年前可能沒有錯 但經過最近的突飛猛進 故事已經進入了新的轉捩點30
[創作] 訓練了一個根據草稿畫一個固定角色的模型前言:這並不是那個現在幾乎每天都有新話題的AI根據關鍵字自動繪圖。 一來那種研究已經有很多人做了,我手上的資源也不可能把它做好。 二來我對AI無法通靈的問題也不是很滿意。我還是寧願主動給予較明確的資訊。 我的目標是給予一張低解析度的黑白草稿圖片(非黑即白,沒有中間灰階值), 輸出一張較高解析度,且與特定主題相符的彩色圖片。15
[閒聊] DDPM: 從隨機微分方程到AI圖片生成週末閒著來聊聊最近很紅的AI生成動畫圖片 不廢話先上圖
爆
[閒聊] TOYZ被判刑4年2月定讞+驅逐出境爆
[閒聊] 統神Toyz糾纏一輩子實況生涯 就這結局?爆
[閒聊] FX戰士作者:日本沉沒爆
[閒聊] hololive Meet at Taipei 今天12:00搶票57
[閒聊] 統神跟椅子最後誰比較慘61
[24春] 極速星舞 04 什麼大便54
Re: [閒聊] 統神的頻道全被ban了.....47
[閒聊] 金亨泰:公司DNA...可能是屁股?開玩笑的35
[討論] 小道消息:劍星24小時內應輕鬆破百萬33
[閒聊] 我差點忘記妮姬是個......32
[妮姬] 應該當烏魯克的子民還是王國的子民?31
[閒聊] 羅傑開台玩遊戲王有搞頭嗎31
[Vtub] Nerissa原創曲Say My Name首播29
[閒聊] NS主機銷量有機會超過PS2嗎?23
[閒聊] 簡單分析統粉錯亂的邏輯和疑惑26
[龍珠] 人造人篇是不是就很適合當結局呀28
[閒聊] 鐵道 看板娘大戰開打了嗎?27
[蔚藍] 愛莉 很可愛27
[閒聊] 去監獄看toyz帶什麼會客菜好?25
[楓谷] 活動獎勵設定錯誤 將制裁玩家25
[討論] fallout影集是吃書還是加設定25
[閒聊] 原作、動畫畫風差異很大的作品?25
[迷宮飯] 沒辦法理解修洛的人多嗎?(動畫雷)23
[閒聊] 約兒組織殺害的人都是壞人嗎?24
[閒聊] 當年種命劇情要怎麼救?46
[閒聊] 遊戲人生ZERO 動畫瘋上啦!23
[妮姬] 茵迪維莉亞算不算遜砲萌啊22
[閒聊] 神劍闖江湖新版動畫不紅問題在哪裡?22
[討論] 該怎麼處置對自己有好感的反派女幹部21
Re: [Vtub] まゆる/茉綽/麻油 TanZ紀念LIVE-來賓