PTT評價

[問卦] 聯考數學95聽不懂LLM原理正常嗎

看板Gossiping標題[問卦] 聯考數學95聽不懂LLM原理正常嗎作者
Supasizeit
(Shitpost King)
時間推噓19 推:19 噓:0 →:17

阿北當年聯考數學95

可是沒有念資工

今天心血來潮

嘗試理解LLM transformer 原理

可是講到token就聽不懂了

然後又變成embedding

弄一弄變成weights

怎麼突然就變成attention block

這不是大學生每個都懂的東西嗎

我是不是失智了

--

※ PTT 留言評論
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 203.204.195.174 (臺灣)

※ 文章網址:
https://www.ptt.cc/Gossiping/E.bBf1xyBeFeCI

haha98 09/08 20:30這個現在小學生就懂了 很多科展都做這個

我兒子說他不會 還被我罵一頓

zuiko 09/08 20:30正常

goodland 09/08 20:30去看李宏毅老師的課

我看吳恩達 難怪看不懂

paul26277 09/08 20:30不同科系不懂正常

資管的也不懂正常嗎

angst 09/08 20:31連token都聽不懂就從nlp開始看ㄅ

Tokenizer strategy 不理解 好多做法

qwerapple 09/08 20:31聯考....不是你聽不懂 是因為你老了

StarTouching 09/08 20:31你可以直接請AI教你

AI不是都胡說八道 他看得懂all you need is attention嗎

Mei5566 09/08 20:32超easy

tm731531 09/08 20:34聯考考的是算數 跟數學無關

lastphil 09/08 20:34聯考又沒有多少數學矩陣

好像也是 只有二維 跟辦家家酒一樣

※ 編輯: Supasizeit (203.204.195.174 臺灣), 09/08/2025 20:37:57

Tenging 09/08 20:42別人國高中就在學的東西

chrischiu 09/08 20:42有ai不用親自理解這個

oldntu 09/08 20:46叫LLM教你LLM

stanly3092 09/08 20:51我都看LLP

taylor0607 09/08 20:58他可以把他的架構想成很多模組 每個

taylor0607 09/08 20:58模組是為了解決舊方法做不到的問題才

taylor0607 09/08 20:59設計的 像是embedding是為了把token

taylor0607 09/08 20:59(文字)變詞向量Attention是讓模型

taylor0607 09/08 20:59從多個角度來學習等等

jhjhs33504 09/08 21:03矩陣運算本來就高效 只是要有辦法轉換

DarkerDuck 09/08 21:05你在見山不是山的階段很OK

DarkerDuck 09/08 21:06一堆聽一下見山是山會呼叫API就以為

DarkerDuck 09/08 21:06自己懂了

DarkerDuck 09/08 21:06不就文字接龍,有啥難的

saiboos 09/08 21:07高中科展就有的東西

abc9bitedi 09/08 21:10還有什麼causal padding 馬的一頭霧

abc9bitedi 09/08 21:10

gowaa 09/08 21:30聯考又沒考這個 有些人高中就只會那些

jhjhs33504 09/08 21:33把語料重組訓練答題較高分部分存起來

gk1329 09/08 21:33實際去寫寫看就懂惹

e34l892 09/08 21:34台大資管哄

jhjhs33504 09/08 21:34當經驗 跟組魔方的手順一樣再問就快了

jhjhs33504 09/08 21:37還是很難解的話 那就算是架構問題了

Aucy 09/08 22:02先把DNN RNN Seq2seq 看懂 應該會了解Transf

Aucy 09/08 22:02ormer

b93510015 09/09 08:20Lala move