PTT評價

Re: [新聞] 專訪杜奕瑾:DeepSeek被炒作過頭

看板Gossiping標題Re: [新聞] 專訪杜奕瑾:DeepSeek被炒作過頭作者
sxy67230
(charlesgg)
時間推噓 8 推:8 噓:0 →:16

※ 引述 《Yirgacheffe》 之銘言:
: 3.完整新聞標題: 專訪杜奕瑾:DeepSeek被炒作過頭
: 4.完整新聞內文: https://www.youtube.com/watch?v=5bgeHE3rI8M

阿肥外商碼農阿肥啦!

這幾天都在休假陪老婆本來懶得說什麼,但這咖就沒什麼料,還覺得自己是專家。

Deepseek R1真正的貢獻就是在方法論上證明讓大語言模型直接走真正的RL去鼓勵模型生成思考鏈的格式以及讓模型去想更久就會出現語言模型的啊哈時刻(AHA moment),而且是無論模型的大小只要強化學習給模型指導規則讓AI模型持續接受指導跟環境學習模型就會在某個時間點突然頓悟。

過去半年不管是學界或是業界其實都被OpenAI的o1閉源(連方法論都閉源)嘗試了不少需要消耗大量人工的方法,其實就是TTT那套PRM(過程獎勵模型)需要大量人工去撰寫人類思考過程的標註數據,這東西業界學界也沒幾個團隊弄得出來,畢竟人類思考過程每個人都不一樣。同樣是1+1可以用很多種過程方法找到2的答案。而Deepseek R1直接開源方法論告訴你讓AI自己頓悟就好了,這跟當年的Alpha Zero讓AI自己左右互搏有異曲同工之妙,就某些人眼瞎覺得貢獻很小。

當前UC Berkeley 還有史丹佛李飛飛的團隊都成功復現DeepSeek r1的成果,李飛飛團隊還證明了只要1000個文檔16張H100 26分鐘就可以讓32B的千問模型出現啊哈時刻。

只能說眼界狹隘的人看什麼都蠻可撥的。

--

※ PTT 留言評論
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 101.12.27.162 (臺灣)
PTT 網址

mycity16 02/06 19:11講那麼多還不是被一些國家禁用

jarry1007 02/06 19:12不能問六四的ai應該禁掉

mycity16 02/06 19:12看來眼界最高的都在八卦版

vzerov 02/06 19:13你不用就能阻止對方變強嗎 笑死

mycity16 02/06 19:13義大利、美國、澳洲、日本都眼界狹隘

mycity16 02/06 19:14就你看的最遠XD

StylishTrade 02/06 19:15AI頓悟了是不是有意識了???

StylishTrade 02/06 19:16而且比較笨的AI多想幾次就懂了

finalzerd 02/06 19:16被禁用是國安問題,倒不是DS很爛就是了

StylishTrade 02/06 19:16代表三個臭皮匠也能勝過諸葛亮?

StylishTrade 02/06 19:17看來算力根本不重要

ZhouGongJin 02/06 19:17就被黨餵食到沒有辨識的能力,只好說

ZhouGongJin 02/06 19:17對手被誇大是廢物。畢竟拿了黨這麼多

ZhouGongJin 02/06 19:17錢是不能客觀地說中國的東西好。

IDfor2010 02/06 19:29今天就有老外在講DS的啊哈時刻 DS從學

nadleeh 02/06 19:29所以那些禁用的能用chatgpt 嗎

IDfor2010 02/06 19:29習中自我進化了

ffdreamer 02/06 19:32天才IT大臣: 我成功讓它回答64問題。

Ceferino 02/06 19:36s1跟r1基本上還是不同,budget forcing

Ceferino 02/06 19:36是個非常有用的方法

IDfor2010 02/06 19:37https://reurl.cc/M6mDVv

mangle 02/06 19:40https://i.imgur.com/ZUZWr4L.jpeg

Shepard 02/06 23:43醒醒吧,沒料但開公司拿標案 ,$成就99%

Shepard 02/06 23:43碼農望塵莫及,人要往$看啊