Re: [問卦] deepseek超低成本計算是真的嗎?
論文有公布
現在就看各家機構要不要去做重複性的驗證
然後使用MOE的稀疏模型,成本一定很低 這無庸置疑
在專業領域一定表現的會比較好,
(單一任務:寫程式、問數學等等)
但泛用型的就可能沒麼理想,
或許最後會發展出泛用型與專業型兩種。
不過也有新創的地方,例如他是訓練是靠自我學習自我解決問題,
這點蠻厲害的。
先不用去糾結有沒有言論審查,這肯定有,
我之前傳一些股票的券商報告,
都被用違反政策給阻止了。 這是比較可惜的。
5萬張H100的事情 目前只是傳聞
幻方絕對不敢講
而且這五萬張放在哪裡也令人覺得有趣
畢竟之前美國的管制禁令把新加坡列為Tier2
而新加坡竟然沒有唉唉叫...
感覺有貓膩啊
※ 引述《koei5566 (光榮56)》之銘言:
: deepseek賣點就是不堆算力
: 改進算法用少量算力做出很大的成果
: 不過有人說是唬爛的
: 財經網美說deepseek偷偷用了五萬顆H100
: 光這成本就幾千萬美金了
: 又偷偷用了中東那邊的算力
: 不可能像deepseek說的那樣只用了550萬鎂就開發出來
: 但是deepseek又開源支持本地運算
: 有張8GB顯卡
: 把deepseek環境架一架
: 斷網跑一下就知道算法是真是假
: 那請問哪邊的說法是真的?
: 有沒有八卦??
--
標題 [新聞] 每天愛愛3次 她在半年內狂瘦50公斤 看板 Gossiping 時間 Mon Oct 12 16:26:25 2015
--
我靠用chatGPT 進出股票賺快一倍了 這行?
礦場一堆。看yt介紹很可怕
別太早戳破中國假新聞,粉紅會不開心
發表這麼久,mega應該內部有測過了
以色列也是tire2 很神奇
先前V3版就已經引起歐美注意在分析了
所以這次R1版那些巨頭才這麼快有反應
5萬張是全公司,實際只用2048張H800
訓練,相當於1500張H100而已
其實背後都是真人回答,這樣滿意了吧!
一定是濾鏡過的大叔回答
爆
Re: [新聞] Meta陷入恐慌?內部爆料:在瘋狂分析複製DeepSeek,高預teamblind 匿名的可能有人不信 與其聽匿名、鄉民互吹/貶 不如來聽聽 Meta 現任 CEO Mark Zuckerberg 本人對於 Deepseek AI 模型的看法 2025/01/11 Mark Zuckerberg 接受美國知名喜劇演員 Joe Rogan 專訪 截至今日有 840 萬人看過這個影片![Re: [新聞] Meta陷入恐慌?內部爆料:在瘋狂分析複製DeepSeek,高預 Re: [新聞] Meta陷入恐慌?內部爆料:在瘋狂分析複製DeepSeek,高預](https://i.imgur.com/HlQlJzkb.png)
8
Re: [閒聊] 在台灣,特斯拉的先進安全輔助還有優勢嗎想簡單閒聊一下關於特斯拉的科技部分.... 本身工作是寫code相關,加上有涉及到AI的相關領域....老實說我覺得特斯拉的輔助駕駛和FSD是真的蠻厲害的。 當大部分傳統車廠都還在依賴雷達等sensor來實現輔助駕駛,特斯拉早早就投入純視覺的發展,是真的很大膽也很令人驚艷。 先簡單說說我認為純視覺的優勢: 1. 極低的成本,![Re: [閒聊] 在台灣,特斯拉的先進安全輔助還有優勢嗎 Re: [閒聊] 在台灣,特斯拉的先進安全輔助還有優勢嗎](https://i.imgur.com/8u6fqdBb.jpg)
6
[爆卦] 尷尬 支那大模型Deepseek v3自稱chatgpt支那AI公司DeepSeek三天前推出DeepSeek-V3 該公司公布的性能可匹敵GPT-4o以及Claude-3.5-Sonnet DeepSeek-V3用2個月訓練2048個GPU只花588萬美元 遠低於GPT-4o約1億美元 粉紅五毛藉此嘲諷美帝封鎖高階晶片也無法阻止支那AI![[爆卦] 尷尬 支那大模型Deepseek v3自稱chatgpt [爆卦] 尷尬 支那大模型Deepseek v3自稱chatgpt](https://i.imgur.com/Zo1PKXwb.jpg)
6
Re: [請益] Deepseek v3 對台積電有影響嗎我覺得評比指標什麼都是後話 使用體驗太差 你看看這樣怎麼稱霸世界呢? 你的進線參數與資料量就比別人少了,![Re: [請益] Deepseek v3 對台積電有影響嗎 Re: [請益] Deepseek v3 對台積電有影響嗎](https://i.meee.com.tw/CafPIov.png)
4
Re: [問卦] deepseek強在哪裡不用講太多學術性的東西 有人用 DeepSeek R1的 1.5B版本在手機上運作 一個在數學問題上比GPT-4o 和 Claude 3.5還要強的迷你小模型可以在手機上 運作,你認為這屌不屌3
Re: [心得] 百聞不如一見的人工智慧學校首先,那種比較像進階的電腦補習班。如果研究機器學習,深度學 習,那個分支太多,實在不是一個短短的補習就可以搞定。比如我 自己專注在電腦視覺跟AOI,所以我看的paper也就跟其相關,其他 的我也只能放棄。 再者,這基本上就是教你怎樣用現有框架去完成老闆交付的任務,3
[問卦] 我們現在離泛用型AI還有多遠?以前的的AI都是單一用途AI 只能處理單一程式 泛用型AI就是指和人一樣 能直接理解人類語言 能針對人類的直接語言指令做各種工作 而且AI還能對工作自我精進 幾乎就像人類一樣 有了ChatGPT 後離理想的泛用型AI還有多遠?3
Re: [請益] Deepseek v3 對台積電有影響嗎的確會讓人好奇DeepSeek-V3的訓練方式, 但成本降低如此之多,另外一個思考點,是不是除了科技巨頭外, 更多公司願意投入資本支出來建立自己的模型? 而且隨著技術發展,模型建立的成本一定會快速下降。 DeepSeek-V3比較的 Claude.ai/Qwen2.5/LLaMA3.1![Re: [請益] Deepseek v3 對台積電有影響嗎 Re: [請益] Deepseek v3 對台積電有影響嗎](https://i.imgur.com/ZGzxwgNb.jpg)
Re: [問卦] 研究說AI模型已經能自我進化了耶微軟的這方法就跟Alphago的訓練方式一樣,但這僅限於單一學科數學做強化學習,而且這 類型問題一定要有標準答案才能這樣玩,藝術寫作之類的就沒辦法這樣搞,OpenAI的O1就是 大模型用這方法,希望能把推理效應帶到不同領域的資料,但現階段看來非STEM類型的還要 用別種方案當verifier 才能做強化學習 其實最早在2023/10就已經有驗證這方案是成功可行的,當時叫QStar![Re: [問卦] 研究說AI模型已經能自我進化了耶 Re: [問卦] 研究說AI模型已經能自我進化了耶](https://img.youtube.com/vi/jByDZdRxiSs/mqdefault.jpg)
爆
[問卦] 現在的HR都愛問一些奇怪問題嗎![[問卦] 現在的HR都愛問一些奇怪問題嗎 [問卦] 現在的HR都愛問一些奇怪問題嗎](https://i.urusai.cc/QtYfe.png)
爆
[問卦] 11/4離職 11/26出包,公司叫離職的負責?![[問卦] 11/4離職 11/26出包,公司叫離職的負責? [問卦] 11/4離職 11/26出包,公司叫離職的負責?](https://img.youtube.com/vi/uGOWqxN_avw/mqdefault.jpg)
爆
Re: [問卦] 11/4離職 11/26出包,公司叫離職的負責?![Re: [問卦] 11/4離職 11/26出包,公司叫離職的負責? Re: [問卦] 11/4離職 11/26出包,公司叫離職的負責?](https://i.imgur.com/AN84rLmb.jpeg)
爆
[問卦] 去銀行一次提領一百![[問卦] 去銀行一次提領一百 [問卦] 去銀行一次提領一百](https://i.imgur.com/eiBR27jb.jpeg)
92
[問卦] 真的有記者去含檢察官的屌換情報?85
[問卦] 脆女:第一胎沒300萬 別生小孩了!![[問卦] 脆女:第一胎沒300萬 別生小孩了! [問卦] 脆女:第一胎沒300萬 別生小孩了!](https://i.mopix.cc/NRU3Hs.jpg)
爆
Re: [新聞] 不只一人受害!賴瑞隆兒涉「校園霸凌3同79
[問卦] 美財長貝森特:美是中國盟友也是台灣盟友![[問卦] 美財長貝森特:美是中國盟友也是台灣盟友 [問卦] 美財長貝森特:美是中國盟友也是台灣盟友](https://i.imgur.com/W29EoF5b.png)
80
[問卦] 吳郭魚片寫台灣鯛魚片484詐騙?![[問卦] 吳郭魚片寫台灣鯛魚片484詐騙? [問卦] 吳郭魚片寫台灣鯛魚片484詐騙?](https://img.youtube.com/vi/dtuSqd-TcxU/mqdefault.jpg)
77
[問卦] 霸凌同學 有好聽說法嗎67
[問卦] 現在可以在總統府前罵總統嗎57
[問卦] 台女脆文:瑞幸咖啡穩死的!![[問卦] 台女脆文:瑞幸咖啡穩死的! [問卦] 台女脆文:瑞幸咖啡穩死的!](https://i.mopix.cc/NRU3Hs.jpg)
31
[問卦] 全聯鯛魚搞到要國賠了![[問卦] 全聯鯛魚搞到要國賠了 [問卦] 全聯鯛魚搞到要國賠了](https://i.imgur.com/flM1A6bb.png)
44
[問卦] 8歲就嗆要打死人,長大能做什麼?![[問卦] 8歲就嗆要打死人,長大能做什麼? [問卦] 8歲就嗆要打死人,長大能做什麼?](https://i.imgur.com/eVKUCT4b.jpeg)
39
[問卦] 燒臘便當這樣多少合理?![[問卦] 燒臘便當這樣多少合理? [問卦] 燒臘便當這樣多少合理?](https://i.imgur.com/FLuRAsfb.jpeg)
41
[問卦] 八歲就開扁同學以後能成大事嗎31
Re: [新聞] 誤驗「全聯毒鯛魚排」出包 29歲離職女助![Re: [新聞] 誤驗「全聯毒鯛魚排」出包 29歲離職女助 Re: [新聞] 誤驗「全聯毒鯛魚排」出包 29歲離職女助](https://attach.setn.com/newsimages/2025/12/02/5367966-PH.jpg)
35
[問卦] 為何08年大家22k時沒人躺平 現在卻一堆?![[問卦] 為何08年大家22k時沒人躺平 現在卻一堆? [問卦] 為何08年大家22k時沒人躺平 現在卻一堆?](https://i.mopix.cc/P0cKXZ.jpg)
爆
[問卦] 台禁小紅書上微博熱搜還被中國網友群嘲![[問卦] 台禁小紅書上微博熱搜還被中國網友群嘲 [問卦] 台禁小紅書上微博熱搜還被中國網友群嘲](https://files.catbox.moe/f0njq9.png)
36
[問卦] 經過鯛魚事件後 你還相信檢驗數據嗎?![[問卦] 經過鯛魚事件後 你還相信檢驗數據嗎? [問卦] 經過鯛魚事件後 你還相信檢驗數據嗎?](https://i.mopix.cc/wyBvTF.jpg)
爆
[問卦] 只有我覺得台灣這幾年越來越像對岸?![[問卦] 只有我覺得台灣這幾年越來越像對岸? [問卦] 只有我覺得台灣這幾年越來越像對岸?](https://i.imgur.com/mHqBx4fb.jpeg)
64
[問卦] 台灣人有想過有天自己也要翻牆嗎?![[問卦] 台灣人有想過有天自己也要翻牆嗎? [問卦] 台灣人有想過有天自己也要翻牆嗎?](https://i.imgur.com/uwN6ddib.jpeg)
36
[問卦] 驚!9年來 年輕人自殺成長三倍 代表什麼![[問卦] 驚!9年來 年輕人自殺成長三倍 代表什麼 [問卦] 驚!9年來 年輕人自殺成長三倍 代表什麼](https://i.imgur.com/I9muINnb.jpeg)
33
[問卦] 德川家絕嗣!少子化太嚴重了吧?![[問卦] 德川家絕嗣!少子化太嚴重了吧? [問卦] 德川家絕嗣!少子化太嚴重了吧?](https://img.youtube.com/vi/NXxFbNDWjK4/mqdefault.jpg)
30
[問卦] Telegram才更該禁吧爆
[問卦] 禁小紅書用意到底是什麼?![[問卦] 禁小紅書用意到底是什麼? [問卦] 禁小紅書用意到底是什麼?](https://i.mopix.cc/ShazEx.jpg)
49
[問卦] 蝙蝠俠幹嘛不把小丑做掉![[問卦] 蝙蝠俠幹嘛不把小丑做掉 [問卦] 蝙蝠俠幹嘛不把小丑做掉](https://img.youtube.com/vi/cm3Chp2u7HY/mqdefault.jpg)
30
[問卦] 檢驗結果為什麼是助理扛?![[問卦] 檢驗結果為什麼是助理扛? [問卦] 檢驗結果為什麼是助理扛?](https://img.youtube.com/vi/ftuuVwvhvKM/mqdefault.jpg)
25
[問卦] 沒事就吹,出事就推 會想到誰25
[問卦] 王子甩掉粿粿的機率多高
![[問卦] deepseek超低成本計算是真的嗎? [問卦] deepseek超低成本計算是真的嗎?](https://i.imgur.com/U7JYqIkb.jpeg)