PTT評價

Re: [問卦] 所以AI繪圖的原理是啥?

看板Gossiping標題Re: [問卦] 所以AI繪圖的原理是啥?作者
sxy67230
(charlesgg)
時間推噓 4 推:4 噓:0 →:2

※ 引述《lpbrother (LP哥(LP = Love & Peace))》之銘言:
: 剛問了 chatGPT 關於AI繪圖的原理
: 結果 chatGPT 講了一堆什麼生成對抗網絡(GAN)
: 還是什麼卷積神經網絡(CNN)一堆專有名詞
: 寫了一大堆,有看沒有懂
: 因為我是文組 3C白吃
: 因為我本來以為AI繪圖是收集各種不同的圖像重新拼貼,
: 例如收集A的眼睛,B的鼻子之類的
: 結果 chatGPT 講得更複雜
: 有沒有人能夠更簡單的解釋AI繪圖的原理?
: 有沒有八卦?

阿肥外商碼農阿肥啦!剛下班看到回覆一下,

用文組都可以理解的方式,當前主流的圖像生成模型為擴散模型(Diffusion Model),你可以直觀理解他就是一個拆解/組裝的過程。

這邊舉一個例子,假設你今天買了一個拼圖、積木或鋼彈模型好了。我們手上沒有說明書,只有成品,那你想學習組裝你會怎麼做?就蠻簡單的,其實就是我拆解一塊模型的小部件,看看他跟原來鋼彈模型之間的關聯,然後再拆一塊零件看他跟上一步被拆掉後的鋼彈模型之間的關聯,接下來就是一直分解直到全都變成小零件,然後我再根據我記下來的零件之間的關聯重新組裝到我全部都會組裝為止,到此就是學習的過程。接下來,我又買了一個新的鋼彈模型,這次沒有說明書也沒有成品鋼彈,那我就憑著我之前學習拆解的過程來組裝,最後就完成了屬於我的鋼彈作品,就是這麼簡單,所有人類大師本來都是這樣學習的。

然後這背後涉及很多機率論跟熱力學就好比較複雜一點,我們對於世界已經有初步認識就是這世界本來就是混沌而且有機率的,人類大腦其實有一個世界框架是對於物與物之間的分佈關聯,這就是我們常說的相關性,像像太陽升起總是伴隨雞鳴,於是古人就建立了雞鳴跟太陽的參考座標係,而跟時間(準確一點是訊息熵)有產生關聯,於是我們就發現了因果。

根據這樣的觀點,那我們世界的一切都是有機率分佈的,所以生成模型的目標就是找到一個分佈能學習讓AI找到某個參考作標之間的概率分佈,像是樹幹的鄰近分佈可能有樹葉,這樣映射到高維空間上就可以做到非常複雜的生成,像是生成畢加索風格。

一切都是機率跟信息熵,所以就可以透過採樣來逼近某種我們期望的分佈,那AI就可以產生擁有畢加索風格的蒙納莉莎,只是過往我們是要他一步採樣,如今採用diffusion model是一步步還原分解這樣我們發現可以更加穩定。


--

※ PTT 留言評論
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 101.10.6.129 (臺灣)
PTT 網址

yao19891229 05/29 18:45嗯嗯 沒錯 我也這麼認為

ZhouGongJin 05/29 18:48好的,但文組大概只能接受小精靈

donation12 05/29 18:48你寫一段程式碼示範一下

SRNOB 05/29 18:52(畢加索:1.3),(蒙納莉莎:1.3),(LOLI:1.1),,

nextpage 05/29 19:01我開頭都是NSFW沒在跟你543

deolinwind 05/29 19:27所以擴散模型變成克總也是自然現象了