[問卦] DeepSeek對行業市場的衝擊很大吧!
https://x.com/QQ_Timmy/status/1885334159914393989?mx=2
艦長J快訊 重要的突破要多寫一次
2025/1/31
總之,這幾天是一次很燒腦的過年假期,感覺比平常還要認真研讀資料
。甚至大年初一晚上還有大陸券商辦專家論壇..... 這個市場實在太捲。
當然,花了這些精神做功課,就是要研究一下開年後的投資動作,究竟是新春大特賣趕快撿便宜、還是苗頭不太對腳底要抹油?很遺憾的,這幾天研究下來,個人目前對硬體的看法越來越偏向後者,但相關的AI應用卻可能加速發展。
DS的論文重點以及它在演算法上的突破,網路上已經有很多人分享,我就不再贅述;直接講幾個觀察到的重點吧~
1. 還記得Apple為了推銷Apple Intelligence,將iPhone 全面升級到8GB以上嗎?這僅僅是為了跑一個3B 參數的小模型而已。 現在,有人成功用一張 Nvidia RTX 6000 (48GB
VRAM) 就可以跑動 DS 671bn 參數的大模型,而且這個模型還開源可以直接下載。
這代表什麼意思?以後企業或個人要佈建AI,可能買一台具有高階顯卡的電腦就做的到。 不用每個月花200USD訂閱OpenAI、不用CSP租賃昂貴的AI server & 網路..... 在地端佈署AI 變得簡單&便宜許多。這兩天已經有看到朋友的公司開始研究把AI模型的佈建轉為在地端執行的可能性。
2 各大廠紛紛投入:短短幾天,可以看到微軟、AWS、NVIDIA 都開始提供DS R1 模型的服務。由於對硬體的要求的確不高,百萬token 輸出的價格只要2.19美元(作為對比:
OpenAI的輸出價格爲60美元/百萬Token),價差接近30倍。
NVIDIA 官方也有描述:在單個NVIDIA HGX H200系統上,完整版DeepSeek-R1 671B的處理速度可達3,872 Token/秒。僅需一個系統就可以完整運作DS R1 大模型。就算企業依然需要利用雲端來佈建AI,需要的系統&價格也比之前簡化許多。
3 NV關鍵優勢不再? 這兩年來,我們持續提到NV產品在大模型與高運算力方面的優勢,包括記憶體的使用、NVlink多卡串聯、Scale-up/out 的領先等等;在探討下一代Rubin或更後面的產品,討論的是一個機櫃做到NVL 144/288 、如何處理這麼大功耗的產品、系統架構該如何演進等等;重點不僅僅是“教主產品做的比別人好”,而是“不用教主的產品
就根本無法訓練&使用這些大的模型”。
忽然間,這個必要性被打了一個大問號。
進而延伸的問題:HBM、CoWoS等等原本為了在空間體積功耗等等限制下塞進最多算力的技術,是不是仍然必要?還是有許多便宜的替代品可以用?
BTW,很多人喜歡把政治問題扯進來。對我來說,探討DS本身到底用了多少卡有意義嗎?沒有,重點是現在實際佈署R1的硬體需求就是極低;其次,它有沒有抄OpenAI? 應該有吧~ 不過OpenAI 的 GPTBoT 在網路上不顧版權的到處亂抓資料也不是一兩天的事情了~
抓完還不開源勒。對投資而言,研究整個市場結構的變化,比這些枝微末節的小事重要多了。
投資總有風險,本人過去績效不做未來獲利之保證。最近詐騙猖獗,本人不收會員、不用追蹤、不騙流量、不需粉絲、更不必按讚分享開啟小鈴鐺。快訊僅供好友交流之用,如果你與我看法不同,你肯定是對的千萬不要被我影響。
===
當一堆人在炒DS抄襲 盜用 其實也用了五萬顆H100沒什麼了不起的時候
全球玩家已經有人試著把DS離線安裝在手機上測試
發現這東西真的可以大幅減少對硬體的需求
而且最可怕的是這東西還開放原始碼給大家使用
有人下載了671B到自己個人電腦建模
而這對市場整個行業的發展方向其實是很大的衝擊吧
有沒有這種開源給全球玩家去玩的八卦??
--
其實受到衝擊的可能是人力資源的影
響
典型又在瞎掰了 點英文網頁RTX6000跑的
是R1-70B q4 和完整模型完全不同東西
chatgpt也有reason按鈕了 坐等降價
新聞說 DS 已經在華為 GPU 上可以跑了
新聞說 DS 已經在華為 GPU 上可以跑了
新聞說 DS 已經在華為 GPU 上可以跑了
未來根本不需要 NV GPU 了
謝謝辛苦發認真文
671B到電腦的容量到底是多少?200g有沒
有?
爆
[心得] DeepSeek對AI產業鏈影響懶人包最這幾天股板跟 X 上的AI金融圈吵的火爆 DeepSeek 對全球 AI 技術發展影響 吵的火爆示意圖 金融人士擔憂影響![[心得] DeepSeek對AI產業鏈影響懶人包 [心得] DeepSeek對AI產業鏈影響懶人包](https://i.imgur.com/WiusWatb.jpg)
45
Re: R: [請益] 為什麼中國越來越強?給一些覺得中國很爛的人看看市場現在在擔心些什麼 艦長J快訊 重要的突破要多寫一次 2025/1/31 總之,這幾天是一次很燒腦的過年假期,感覺比平常還要認真研讀資料,甚至大年初一晚 上還有大陸券商辦專家論壇..... 這個市場實在太捲。![Re: R: [請益] 為什麼中國越來越強? Re: R: [請益] 為什麼中國越來越強?](https://i.imgur.com/OBKfmclb.jpeg)
47
[討論] Deepseek就之前吹過頭了呀 XD來看看DEEPSEEK之前怎麼吹的 「DeepSeek R1的問世,宣告AI訓練與推理成本大幅縮減,在不到600萬美元的極低投入成本 和2048塊性能遠低於H100與Blackwell的H800芯片條件下,DeepSeek團隊打造出性能堪比Ope nAI o1的開源AI模型,相比之下Anthropic與OpenAI訓練成本高達10億美元。該模型每百萬 個token的查詢成本僅爲0.14美元,而OpenAI的成本爲7.50美元,成本降幅高達驚人的98%。![[討論] Deepseek就之前吹過頭了呀 XD [討論] Deepseek就之前吹過頭了呀 XD](https://i.imgur.com/94BvQMzb.jpg)
20
Re: [問卦] 為什麼deepseek會影響台積電 不懂?DeepSeek厲害的地方不是他便宜,不是他厲害,最重要的地方是他開源。 他的原始碼開源,權重開源(資料沒有開源),而且開放商業授權,他的 原始碼是MIT授權,權重則是基於OpenRail的特殊開源架構,也就是只有 一些特別場合他沒有授權,例如製造有害軟體,製造毒品等等 簡單來說你現在馬上就可以在你的電腦,你的公司使用了,你只要用很普20
Re: [新聞] OpenAI:已掌握DeepSeek盜用模型證據Deepseek主打就是蒸餾法,就是高效的AI抄襲工具 哥爾D系柯 不只要抄,還要開源 開起來大抄襲時代 人人有600萬就能參加慈善AI抄襲大賽![Re: [新聞] OpenAI:已掌握DeepSeek盜用模型證據 Re: [新聞] OpenAI:已掌握DeepSeek盜用模型證據](https://i.imgur.com/7jQICgpb.jpg)
12
Re: [討論] 其實Deepseek真的很厲害了DeepSeek可以下載到自己電腦跑、ChatGPT不行, 這在商業使用的場景上就有蠻大的差異 昨天很多人在傳說用(線上版)的DeepSeek會把資料傳給中國,這當然是對的, 但過去一兩年我們幫客戶評估AI專案時, 在串GPT-API上常常會碰到我們或我們的客戶其實也不想把資料傳給OpenAI,4
Re: [新聞] DeepSeek爆紅引AI「股瘟」!ASML歐股開盤算力愈強,模型愈強~ 就算deepseek 真的不用高階晶片就能訓練出說不弱於openAI o1 的模型, 那未來新的模型在有高階晶片的加持下, AI 不是會發展的更快、更難以想像嗎? AI 發展的更快,商用、消費用的領域愈多,對半導體的需求愈大,3
Re: [問卦] deepseek 到底是不是抄的 風向好亂Deepseek AI的訓練過程確實有用到蒸餾技術 蒸餾技術,就是在前人製造AI(例如chatgpt)的基礎上, 拿別人AI的回答當作訓練自己AI的材料 這種作法雖然有點像抄襲他人AI的能力,但在學術界已經是行之有年的做法 各國很多頂尖實驗室都用過這種方法訓練自己的AI
Re: [新聞] OpenAI:已掌握DeepSeek盜用模型證據我先講我非AI專業 但這件事情基本就是鬼扯 甚麼叫做利用O1蒸餾出R1 你要用API抓多少資訊量跟TOKEN才做得出來 然後這件事情OPENAI還會不知道?2
Re: [討論] 盜用模型是什意思?Deepseek根本不在乎本身軟體怎麼樣啊 都開源了 所以DS以後怎樣都無所謂 重點是 他帶來了AI訓練的新模型和想法 真正受影響的就目前還賠錢的OpenAi 還有大股東meta 輝達和台積其實影響不大 不管怎樣訓練