PTT評價

Re: [新聞] 新模型 R2 延後主因!DeepSeek 嘗試華為晶片失敗,還是

看板Gossiping標題Re: [新聞] 新模型 R2 延後主因!DeepSeek 嘗試華為晶片失敗,還是作者
s213092921
(麥靠貝)
時間推噓 9 推:9 噓:0 →:4

Deepseek從今年2月就遷到華為升騰晶片了

然後用華為升騰晶片訓練,今年5月28日發佈R1模型的強化版

https://www.ettoday.net/news/20250529/2968935.htm

https://www.wantgoo.com/news/1227793

成績有目共睹


現在突然靠不知名人士發佈小作文說華為升騰不可靠

也是很搞笑的


中國科大訊飛的星火AI模型也是100%完全使用華為升騰晶片訓練

排名也是中國國內AI第一梯隊

那你覺得Deepseek玩不過科大訊飛嗎?


至於Deepseek R2大模型延遲發佈,目前知道是因為更換底層架構

很多訓練的東西對不上,所以需要時間調整

照過往規律應該是先發佈V4的底層模型,然後再發佈R2的定律模型

https://hao.cnyes.com/post/184614

這篇論文是DS未來會套用在R2的先行暴雷劇透



DS不是商業化經營,不用像Close AI把GPT4.6包裝成GPT5強行上市揠苗助長



--
Gossiping 綜合 ◎[八卦] 本板沒有特定立場
PTT八卦板自創立以來,一直秉持著公正、中立的立場,
以一個自由且不受限制之資訊交流平台而自居,
從而廣受國內外人士好評愛戴。
是故,由眾多使用者推舉出任之板主,
自然需承襲八卦板的一貫作風:只問對錯,不問立場。

--

※ PTT 留言評論
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 117.56.237.199 (臺灣)
PTT 網址

Informatik 08/15 12:59給那些只想臭對岸的說那麼多 誰聽得懂

panda816 08/15 12:59最後一段XD

hermanwing 08/15 13:01低調

wsdykssj 08/15 13:07那篇看起來NSA吊爆了

meta41110 08/15 13:16凸( ゚д゚)凸不是阿爛鳥不是說都沒人

meta41110 08/15 13:16

asiaking5566 08/15 13:19GPT5反向升級真的繃不住

squeakywheel 08/15 13:37反正會臭中國的就那幾個帳號 看久太

squeakywheel 08/15 13:37熟悉了

bitcch 08/15 14:12closedAI:謝謝你們的研究 我們會好好使用

GiPaPa 08/15 15:13DS連自己國內的競業模型都輸 真的沒救

meta41110 08/15 19:24凸( ゚д゚)凸台灣的嘴砲AI更可悲吧都

meta41110 08/15 19:24空談最會