Re: [新聞] 專訪杜奕瑾：DeepSeek被炒作過頭

sxy67230 發表於 2025/2/6 下午7:10:57

看板Gossiping標題Re: [新聞] 專訪杜奕瑾：DeepSeek被炒作過頭作者

(charlesgg)時間Feb 6 19:10:57 2025推噓 8 推:8 噓:0 →:16

※ 引述《Yirgacheffe》之銘言：
: 3.完整新聞標題: 專訪杜奕瑾：DeepSeek被炒作過頭
: 4.完整新聞內文: https://www.youtube.com/watch?v=5bgeHE3rI8M

阿肥外商碼農阿肥啦！

這幾天都在休假陪老婆本來懶得說什麼，但這咖就沒什麼料，還覺得自己是專家。

Deepseek R1真正的貢獻就是在方法論上證明讓大語言模型直接走真正的RL去鼓勵模型生成思考鏈的格式以及讓模型去想更久就會出現語言模型的啊哈時刻（AHA moment)，而且是無論模型的大小只要強化學習給模型指導規則讓AI模型持續接受指導跟環境學習模型就會在某個時間點突然頓悟。

過去半年不管是學界或是業界其實都被OpenAI的o1閉源（連方法論都閉源）嘗試了不少需要消耗大量人工的方法，其實就是TTT那套PRM(過程獎勵模型）需要大量人工去撰寫人類思考過程的標註數據，這東西業界學界也沒幾個團隊弄得出來，畢竟人類思考過程每個人都不一樣。同樣是1+1可以用很多種過程方法找到2的答案。而Deepseek R1直接開源方法論告訴你讓AI自己頓悟就好了，這跟當年的Alpha Zero讓AI自己左右互搏有異曲同工之妙，就某些人眼瞎覺得貢獻很小。

當前UC Berkeley 還有史丹佛李飛飛的團隊都成功復現DeepSeek r1的成果，李飛飛團隊還證明了只要1000個文檔16張H100 26分鐘就可以讓32B的千問模型出現啊哈時刻。

只能說眼界狹隘的人看什麼都蠻可撥的。

※ PTT 留言評論

※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 101.12.27.162 (臺灣)

※ PTT 網址

→

mycity16 02/06 19:11講那麼多還不是被一些國家禁用

→

jarry1007 02/06 19:12不能問六四的ai應該禁掉

→

mycity16 02/06 19:12看來眼界最高的都在八卦版

→