Re: [問卦] word embedding是什麼神奇的東西??
你有聽說過文字接龍吧?
那你想過電腦是怎麼跟你玩文字接龍的嗎? chatgpt就是一種經過練習的文字接龍。
embedding 字詞嵌入 這個東西 我們先說說他在做啥
但是略過 演算法的過程。
假設你有一句話
"我是專業的五樓 " 模型如何知道你在想什麼呢?
他第一件事情,就是先把你說的話轉成它可以理解的資訊
所以他會透過經由 transfermer 那篇有名論文的機制 這個講起來很複雜
但是過程其實就是 類似人腦識別字詞,記住關聯這樣的過程
經過演算之後它會根據 演算法關注的不同點
回傳給你整組 array 結構的 浮點數,詞向量
這個向量就是他根據演算法計算完以後,模型分析完
它跟模型已經知道的一些標註的字詞表的關係, 這個出來的向量如何被決定是
模型一次次訓練的結果,當然你也有參數,跟餵資料實標籤的時機可以調整。
實際上,他在做的事情,假設上面這句話的把它分為四個維度去處理好了
可是從情緒推估,可能是從模型被餵養的資料的概率去決定說等等可能有什麼
就這樣一種維度,去負責一種推論演算,就會產生
"我是專業的五樓":[0.4,0.8,0.7,0.8]這樣的資料,嵌入到這邊就差不多了。
下一步就是進行聯想,跟比對
上面做完以後模型會對這串資料裡面的數值
去做向量計算,點積,或是用餘弦定理去算說這個多維座標點跟啥最接近
就是模型覺得這句話,相近,相似,相關的句子,當然實際情況隨便一個可能都有
一千多個甚至更多維度,模型裡面的參數則更多 70億都是一個很普通的數字。
你可以把模型想像一台大機器,有七十億以上控制閥,或是一個大函式
有七十多億參數,如何互相影響基本上未知,然後她會根據上面那個過程去回應你這樣。
簡單來說就是把人類文字翻譯成模型可以看懂的過程。
--
WHY SO SERIOUS???
--
※ PTT 留言評論
73
Re: [請益] NVDA跟AMD怎麼突然崩了週末有點時間 之前寫的老黃故事 這幾年AI模型突飛猛進的一個關鍵點就是 泛化的能力 簡言之 2018以前 AI模型 都是透過數據 去學習資料上的標註資料 來做人類事先規範好的目的 而機器透過這些標注數據 去達到人類要求的事情 當模型遇到一個沒看過的數據 或者場景變得不同 模型就會失效 甚至無法處理55
Re: [問卦] 中研院自己做的大型語言模型怎麼了?阿肥外商碼農阿肥啦! 昨天晚上都在跟獵人直播來不及趕上大型翻車現場,這邊中午看hugging face hub還 可以進去,但現在已經進不去了。 這邊阿肥就直接說,基本上現在所有中文開源語言模型除了少數像chatGLM這種中國比較 早期做的自己完全從零訓練的語言模型外,大家都是從meta 的llama魔改的,差別在於預56
Re: [閒聊] AI畫圖是不是大數據拼圖?我嘗試來簡單圖解一下 AI生成圖的概念 因為 1. 想要簡單解釋 2. 我不是本科生 請板上各位高手不吝指教 不過別太嚴格 見圖一 首先,我想要從向量空間開始講起42
Re: [閒聊] AI畫圖是不是大數據拼圖?最近回去念書了,念的programme名字有AI,應該可以發個言ㄅ 新科技需要熱衷的族群做推廣,有推廣才有funding,我才有薪水qq 不過這些族群不一定對科技有正確的認識 這幾天看到一些不精確又容易誤導的解釋真的會中風 想說做點簡單的科普(科普很難我知道qq)28
Re: [問卦] Chatgpt的技術到底是獨創還是早就有了?你拆成兩個字來看 chat gpt 其實類似的演算法 〓.〓 你有沒有用google鍵盤X
Re: [爆卦] 中央研究院詞庫小組大型語言模型對於LLM只有這一點認知程度的話,最好不要就這樣出來帶風向會比較好,不然先去 跟陽明交大校長先去旁邊先學習一下什麼叫做LLM,不同LLM之間又有什麼差異。 第一個錯誤的認知是認為LLM就應該要提供正確的答案,事實上LLM是一個機率模型, 它所做的事情是基於模型的權重預測下一個token(詞塊)最高的機率是那個,它不是資 料庫,所以你不能因為它答的一個答案不是你所想的就是說這個模型如何如何。10
Re: [Ai繪] 要如何把女孩弄進廂型車內角色會佔滿整個畫面很明顯是模型的問題 要生出想要的圖像 就需要對應的模型 大致過程是 1.先用合適的模型生好構圖8
[問卦] 沒人發現AI的出現 我們已經離永生不遠嗎?是這樣的 魯哥今天看了一期影片講GPT 其中說到GPT所生成的每一個字 是像玩接龍的方式由資料庫的所有文字檔 經過大語言模型預測 & 人類反饋強化來獲得 例如:2
Re: [閒聊] Neuro真的有辦法做到理解圖像嗎大型語言模型本質上是文字接龍 你說的話會通過tokenizer切成很多token後餵給模型 讓他預測下一個機率最高的字 當input是圖像時 你需要用一個資訊壓縮模型 把圖也壓成一串token 接下來做的事情就一樣了 把這串濃縮feature token餵給模型 搭配你說的其他話 來預測下一個字 重複到出現一個完整的回答為止- 本篇論文一樣由google的研究發表,包含以下幾點特點 1. 相較於graphcast直接對數據擬合,此模型同時採用物理核心與神經網路,預測過程受 ODE等物理條件限制,並採用類似數值模式的時間積分型式。
爆
[問卦] 台達要告人了耶?爆
Re: [爆卦] 苗博雅爆財劃法讓連江縣一年領98億爆
[爆卦] 苗博雅爆財劃法讓連江縣一年領98億爆
[問卦] 拳上要虧爆了嗎?爆
[問卦] 下一步就是宣布戒嚴了吧爆
[問卦]三立記者魏汶萱FB遭瘋狂霸凌爆
[問卦] threads 大批愛台網友焦慮痛哭爆
[問卦] 台灣零負評的Youtuber有誰?75
[問卦] 網路畫師這樣咒人,素質?75
[問卦] 只有我覺得說以後不救災了 很情勒嗎33
Re: [新聞] 釋出3,753億元 財政部:嚴重衝擊中央財政爆
[問卦] Threads:為什麼台灣網紅都不表態98
Re: [爆卦] 苗博雅爆財劃法讓連江縣一年領98億49
[問卦] 台北為什麼可以建設的那麼好???56
[問卦] Threads上說會亡國的要移民去哪?46
Re: [爆卦] 苗博雅爆財劃法讓連江縣一年領98億45
[問卦] 下次強颱 大地震真的不救災 會怎麼樣43
[問卦] 30歲,有人月薪只有2-3萬的嗎==?37
[問卦] 認真問 什麼人看到地方財源增加會跳腳?爆
[爆卦] 青鳥:財劃法通過Tpass、租屋、大學幼兒42
[爆卦] 台大醫學生闖實驗室偷看考卷!36
[問卦] 女記者也被罰太重了吧,是有犯啥天條嗎?爆
[問卦] 青鳥:沒有TPASS你真的可以?30
Re: [爆卦] 苗博雅爆財劃法讓連江縣一年領98億28
Re: [爆卦] 苗博雅爆財劃法讓連江縣一年領98億29
[問卦] 女記者是不是惹到不該惹的人?83
[問卦] 湯圓 被桂冠 獨霸 ??28
[問卦]外國人來台灣拍YouTube 是財富密碼嗎28
[問卦] 小破車懶得烤漆,怎樣補救最便宜有效爆
[問卦] threads再度開始抵制食物