[討論] 關於deepseek的思考
1. Deepseek背後的幻方囤積大量H100有大量算力
2. Deepseek做的是”蒸餾” 把效率提高
生產模型依然要用大量算力 只是後續使用的效能非常好
3. 因為已經開源 所以歐美大廠可以迅速循同樣路徑處理
統合以上推論出以下結論:
1. 歐美各廠在提高效率的同時 還會繼續增加算力累積護城河
2. 幻方偷買顯卡已經浮上檯面 美國政府會處理
3. 已經激起美國的警覺心
X上有種說法是這是Sputnik moment
P.S. Sputnik moment簡而言之就是
美蘇太空競賽 蘇聯領先時 造成美國的恐懼進而團結
股票點:半導體我個人認為被錯殺
只是是不是底部我不敢說
也許再殺個10%我會買tsm or nvda
政黑點:舔共仔吃屎
--
※ PTT 留言評論
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 111.71.7.16 (臺灣)
※ PTT 網址
推
太空競賽2.0
推
有一項很重要 不利共產黨的資訊 通通變
→
不見 言論審查機制 獨步全球
推
這個後面就是會變成小米那樣變成低售
→
價低技術的產品
推
你知道放假前TSM溢價快20%嗎?
→
@stlinman tsm一直都溢價 幅度看市場
→
情緒
78
[心得] DeepSeek將是刺破本輪泡沫的那根釘子從DeepSeek騰空出世,在到今天Nvidia (以下簡稱NV) 等一票AI概念股的下殺,這輪的科技 股估值修正才正剛開始,誰能引爆華爾街炒作了整整一年的AI神話泡泡?或許DeepSeek就會 是刺破本輪AI泡沫的那根釘子。 記得2021 Nvidia顯卡被炒作的神話嗎?那時候以太幣漲到一顆4500,NV的RTX3060顯卡從24 99美元被炒作到6000美元以上,後來的故事大家都知道了,隨著2022那輪幣圈的泡沫暴跌跟38
[問卦] 財經網美說Deepseek開發成本謊報中國AI公司DeepSeek(深度求索)以低晶片數開發出與OpenAI O1相當的新模型,經過查 詢成本降低98%引外界矚目,對此財經網美胡采蘋認為,DeepSeek的母公司「幻方量化」 聲稱,他們是用A800、降速晶片開發,這根本是無從驗證的說法,且Deepseek沒有報上背 後語言模型的成本,開發成本必然是謊報的。 但deepseek成本降98%指的根本不是開發成本![[問卦] 財經網美說Deepseek開發成本謊報 [問卦] 財經網美說Deepseek開發成本謊報](https://img.ltn.com.tw/Upload/business/page/800/2025/01/27/phpUGAksb.jpg)
67
Re: [新聞] DeepSeek R1來了,追平o1!它現在不但比OpenAI開放,也應該不用那麼久 重點是DS是開源的 現在應該有許多數據中心已經開始實驗DS的演算法 我們先假設DS的創新 是往AGI道路上的王道![Re: [新聞] DeepSeek R1來了,追平o1!它現在不但比OpenAI開放,也 Re: [新聞] DeepSeek R1來了,追平o1!它現在不但比OpenAI開放,也](https://i.imgur.com/OBFxyQJb.png)
61
Re: [請益] 費半成份股全線崩盤 怎麼辦?DeepSeek這塊有幾個看法 Training端就等之後瓜出來再吃 在Inference這塊 因為受限於MoE 所有推論成本可以降下來 但需求變高的是用記憶空間 和各個node之間的通訊開銷 以及軟體上cpu/gpu的load balance 以deepseek v3來說 600GB+ fp8 需要許多平行運算 這意味通訊瓶頸很重要 因為在切換專家時候 延遲會因此也跟者追加 而記憶體需求開銷也很大![Re: [請益] 費半成份股全線崩盤 怎麼辦? Re: [請益] 費半成份股全線崩盤 怎麼辦?](https://i.imgur.com/1glBeN3b.jpeg)
47
[討論] Deepseek就之前吹過頭了呀 XD來看看DEEPSEEK之前怎麼吹的 「DeepSeek R1的問世,宣告AI訓練與推理成本大幅縮減,在不到600萬美元的極低投入成本 和2048塊性能遠低於H100與Blackwell的H800芯片條件下,DeepSeek團隊打造出性能堪比Ope nAI o1的開源AI模型,相比之下Anthropic與OpenAI訓練成本高達10億美元。該模型每百萬 個token的查詢成本僅爲0.14美元,而OpenAI的成本爲7.50美元,成本降幅高達驚人的98%。![[討論] Deepseek就之前吹過頭了呀 XD [討論] Deepseek就之前吹過頭了呀 XD](https://i.imgur.com/94BvQMzb.jpg)
22
[問卦] deepseek超低成本計算是真的嗎?deepseek賣點就是不堆算力 改進算法用少量算力做出很大的成果 不過有人說是唬爛的 財經網美說deepseek偷偷用了五萬顆H100 光這成本就幾千萬美金了![[問卦] deepseek超低成本計算是真的嗎? [問卦] deepseek超低成本計算是真的嗎?](https://i.imgur.com/U7JYqIkb.jpeg)
14
Re: [心得] DeepSeek對AI產業鏈影響懶人包先說結論 NV股票還是會漲啦 這十三年來在這大世代裡各個小世代AI進步頂峰幅度對應精確度 總結下來 因為這世代AI是用猜的 如要減少50%的錯誤 就要提升2的20次方算力 也就是Ai要提升一倍精確度 需要100萬倍的算力 這次DeepSeek只是讓這曲線抖動了一下 算是這個小世代AI算力最佳化的巔峰了![Re: [心得] DeepSeek對AI產業鏈影響懶人包 Re: [心得] DeepSeek對AI產業鏈影響懶人包](https://i.imgur.com/5J84LWDb.jpg)
4
[問卦] 用H200的算力去強化Deepseek的演算法有中國的Deepseek用低階的H800算力 幹掉美國高階H100海的OpenAI 相對的用高算力H200算力去優化中國Deepseek變成更強的OpenA I有沒搞頭? --![[問卦] 用H200的算力去強化Deepseek的演算法有 [問卦] 用H200的算力去強化Deepseek的演算法有](https://i.imgur.com/tzXrVVOb.jpeg)
1
Re: [問卦] 欸 為什麼deepseek要開源因為還不夠屌如果關起門自己玩 那你就要看你的實力夠不夠 sony當年出的記憶卡、錄影帶都自己玩 最後MS卡被SD卡弄死 錄影帶打不贏VHS1
Re: [問卦] 有鄉民看過deepseek強在哪了嗎?即便是這樣算力的需求還是向上吧 原本需要計算100次的東西新的模型只需要算1次 但人類肯定能找出100甚至10000倍的計算需求啊 就像當年電腦從1khz 到現在 5ghz且多核心以上 整天喊效能過剩,![Re: [問卦] 有鄉民看過deepseek強在哪了嗎? Re: [問卦] 有鄉民看過deepseek強在哪了嗎?](https://img.youtube.com/vi/JTyyqnAlFrU/mqdefault.jpg)
44
[討論] 卓榮泰好像要用行政拳了![[討論] 卓榮泰好像要用行政拳了 [討論] 卓榮泰好像要用行政拳了](https://i.meee.com.tw/heTOZ8B.png)
12
[討論] 原本以為高雄2026最不可能出線的是邱議瑩
[討論] 愛莉莎莎打臉政黑![[討論] 愛莉莎莎打臉政黑 [討論] 愛莉莎莎打臉政黑](https://i.imgur.com/P7VejTRb.jpeg)
8
[討論] 小紅書幹嘛不設代表就好, 抖音都有了4
[黑特] 綠畜又在喊倒閣了,真是學不乖欸
[討論] 蔣經國: 三民主義統一中國 取代 反攻大陸X
[討論] 翁曉玲真的被綠媒綠粉黑得很嚴重![[討論] 翁曉玲真的被綠媒綠粉黑得很嚴重 [討論] 翁曉玲真的被綠媒綠粉黑得很嚴重](https://i.meee.com.tw/SCgQmE0.png)
4
[討論] 劉向婕夫妻交保、科技監控3
[討論] 我爸連戰的故事原來是真的?2
[討論] 賴清德的十講呢?1
Re: [討論] 第10屆韓國頒獎典禮「AAA」移師高雄![Re: [討論] 第10屆韓國頒獎典禮「AAA」移師高雄 Re: [討論] 第10屆韓國頒獎典禮「AAA」移師高雄](https://i.imgur.com/ITyXE7Rb.jpeg)
X
[討論] 麥玉珍根本越南IU
Re: [討論] 卓榮泰好像要用行政拳了X
[討論] 感覺打詐,國民黨略勝一籌X
Re: [新聞] 憲訴法公投破3萬人連署 自然人憑證申請
[討論] 卓院長該滾了
[討論] 一年後選舉結果會影響小紅書解不解禁嗎?
[討論] 法案明明三黨一起過,藍白幹嘛崩潰?![[討論] 法案明明三黨一起過,藍白幹嘛崩潰? [討論] 法案明明三黨一起過,藍白幹嘛崩潰?](https://i.meee.com.tw/Wfd1E3Z.jpg)
Re: [新聞] 館長臥推失誤遭「槓鈴重擊壓胸」
[討論] 11月CPI 1.23,是不是該降息?