PTT評價

Re: [問卦] deepseek超低成本計算是真的嗎?

看板Gossiping標題Re: [問卦] deepseek超低成本計算是真的嗎?作者
sharkpops
(T-Rex)
時間推噓 7 推:7 噓:0 →:4

論文有公布
現在就看各家機構要不要去做重複性的驗證
然後使用MOE的稀疏模型,成本一定很低 這無庸置疑
在專業領域一定表現的會比較好,
(單一任務:寫程式、問數學等等)
但泛用型的就可能沒麼理想,
或許最後會發展出泛用型與專業型兩種。

不過也有新創的地方,例如他是訓練是靠自我學習自我解決問題,
這點蠻厲害的。

先不用去糾結有沒有言論審查,這肯定有,
我之前傳一些股票的券商報告,
都被用違反政策給阻止了。 這是比較可惜的。

5萬張H100的事情 目前只是傳聞
幻方絕對不敢講
而且這五萬張放在哪裡也令人覺得有趣

畢竟之前美國的管制禁令把新加坡列為Tier2
而新加坡竟然沒有唉唉叫...
感覺有貓膩啊



※ 引述《koei5566 (光榮56)》之銘言:
: deepseek賣點就是不堆算力
: 改進算法用少量算力做出很大的成果
: 不過有人說是唬爛的
: 財經網美說deepseek偷偷用了五萬顆H100
: 光這成本就幾千萬美金了
: 又偷偷用了中東那邊的算力
: 不可能像deepseek說的那樣只用了550萬鎂就開發出來
: 但是deepseek又開源支持本地運算
: 有張8GB顯卡
: 把deepseek環境架一架
: 斷網跑一下就知道算法是真是假
: 那請問哪邊的說法是真的?
: 有沒有八卦??

--
標題 [新聞] 每天愛愛3次 她在半年內狂瘦50公斤 看板 Gossiping 時間 Mon Oct 12 16:26:25 2015

kitune: 好胃口10/12 16:26
cake10414: 肥宅表示: 10/12 16:26
all0pha765: 難怪三樓那麼痴肥 因為沒做愛 10/12 16:27
all0pha765: 幹你老師10/12 16:27

--

※ PTT 留言評論
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 106.104.69.82 (臺灣)
PTT 網址

yoyodiy 01/27 15:04我靠用chatGPT 進出股票賺快一倍了 這行?

jerrey 01/27 15:07礦場一堆。看yt介紹很可怕

yamhome 01/27 15:07別太早戳破中國假新聞,粉紅會不開心

yoshilin 01/27 15:07發表這麼久,mega應該內部有測過了

tetani 01/27 15:10以色列也是tire2 很神奇

l11111111 01/27 15:12先前V3版就已經引起歐美注意在分析了

l11111111 01/27 15:12所以這次R1版那些巨頭才這麼快有反應

andy810306 01/27 15:205萬張是全公司,實際只用2048張H800

andy810306 01/27 15:20訓練,相當於1500張H100而已

vbhero 01/27 15:36其實背後都是真人回答,這樣滿意了吧!

lipstick 01/27 15:53一定是濾鏡過的大叔回答