Re: [討論] 台派財經網美:Deepseek不可能那麼省錢
這幾天R1版橫空出世之前,網上本來就告訴你了。在拜登禁令之前
幻方量化就已經囤了大量GPU。
庫存和投入研發的數量是兩回事
研發成本和復現成本也是兩回事啊
開發和維護windows,幾百億美元成本,但是妳買一張WINDOWS光盤成本幾毛。售價幾百而已網絡下載更是零成本,只需要付出license的價格
簡單的道理。不知道那些愚蠢的哥布林,尤其是文組網紅在亂什麼
美國和香港的大學團隊,已經復現模型訓練結果
而早就有很多人在低價GPU甚至手機上部署成功了蒸餾模型
※ 引述《Manzini (Manzini)》之銘言:
: 台派青鳥黑熊lgbt聽團仔
: 心中唯一的財經導師
: 台派網美反指標 開示:Deepseek 不可能那麼省錢
: 果然一群文組集中起來信仰是真的很強大
: 怎麼跟矽谷的大佬?還有川普講的都相反呢?
: 果然去年會在特斯拉160的時候唱衰
: 鴻海唱衰在108
: 港股唱衰在15,000
: 台派財經導師
: 青鳥的最愛
--
https://www.bilibili.com/video/BV11a411y7we
蘇貞昌說進核食跨越了進入cptpp的最重大障礙
--
※ PTT 留言評論
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 223.89.14.114 (中國)
※ PTT 網址
噓
blablablabla
噓
之前不是說AI是泡沫嗎ww
→
怎麼又現在開始自慰呢
推
要是聽他的買長榮還套著呢
爆
Re: [新聞] Meta陷入恐慌?內部爆料:在瘋狂分析複製DeepSeek,高預teamblind 匿名的可能有人不信 與其聽匿名、鄉民互吹/貶 不如來聽聽 Meta 現任 CEO Mark Zuckerberg 本人對於 Deepseek AI 模型的看法 2025/01/11 Mark Zuckerberg 接受美國知名喜劇演員 Joe Rogan 專訪 截至今日有 840 萬人看過這個影片![Re: [新聞] Meta陷入恐慌?內部爆料:在瘋狂分析複製DeepSeek,高預 Re: [新聞] Meta陷入恐慌?內部爆料:在瘋狂分析複製DeepSeek,高預](https://i.imgur.com/HlQlJzkb.png)
爆
[情報] AMD 興奮宣布 Instinct MI300X GPUs 支援 DeepSeek-V3標題: AMD Instinct GPUs Power DeepSeek-V3: Revolutionizing AI Development with SGLang 來源: AMD's X (Twitter) 網址:![[情報] AMD 興奮宣布 Instinct MI300X GPUs 支援 DeepSeek-V3 [情報] AMD 興奮宣布 Instinct MI300X GPUs 支援 DeepSeek-V3](https://i.imgur.com/xVyT4dsb.png)
38
[問卦] 財經網美說Deepseek開發成本謊報中國AI公司DeepSeek(深度求索)以低晶片數開發出與OpenAI O1相當的新模型,經過查 詢成本降低98%引外界矚目,對此財經網美胡采蘋認為,DeepSeek的母公司「幻方量化」 聲稱,他們是用A800、降速晶片開發,這根本是無從驗證的說法,且Deepseek沒有報上背 後語言模型的成本,開發成本必然是謊報的。 但deepseek成本降98%指的根本不是開發成本![[問卦] 財經網美說Deepseek開發成本謊報 [問卦] 財經網美說Deepseek開發成本謊報](https://img.ltn.com.tw/Upload/business/page/800/2025/01/27/phpUGAksb.jpg)
47
[討論] Deepseek就之前吹過頭了呀 XD來看看DEEPSEEK之前怎麼吹的 「DeepSeek R1的問世,宣告AI訓練與推理成本大幅縮減,在不到600萬美元的極低投入成本 和2048塊性能遠低於H100與Blackwell的H800芯片條件下,DeepSeek團隊打造出性能堪比Ope nAI o1的開源AI模型,相比之下Anthropic與OpenAI訓練成本高達10億美元。該模型每百萬 個token的查詢成本僅爲0.14美元,而OpenAI的成本爲7.50美元,成本降幅高達驚人的98%。![[討論] Deepseek就之前吹過頭了呀 XD [討論] Deepseek就之前吹過頭了呀 XD](https://i.imgur.com/94BvQMzb.jpg)
8
Re: [新聞] 市值蒸發19.7兆!輝達聲明:DeepSeek未簡單說明一下為什麼NVDA暴跌 很多人一定覺得很奇怪,然後各種文組出來表演秀下限 簡單說NVDA能在40系GPU出來的時候打爛AMD , 就是因為他們的AI級伺服器GPU , 例如A100 還有H100 然後Deepseek現在告訴你 , 這些為了AI打造的GPU都是垃圾 接下來我舉個簡單的例子,Intel曾經想推動WiMAX 來一統高速無線網路![Re: [新聞] 市值蒸發19.7兆!輝達聲明:DeepSeek未 Re: [新聞] 市值蒸發19.7兆!輝達聲明:DeepSeek未](https://i.imgur.com/N5n7y8Ob.jpeg)
11
Re: [心得] DeepSeek將是刺破本輪泡沫的那根釘子DeepSeek其實真正的創新在model的高效設計,其真正的關鍵在efficient MOE還有MLA設計 這其實是2024年初DeepSeek V2就發表的東西 R1是把這個高效model設計+O1推理模型的LLM+RL合併出來的效應 我覺得歐美廠商因為本錢大所以忽略了降本增效的飛輪效應,所以第二個推理模型反而是中 國公司出圈了,推理模型的Test Time Compute對模型效率的敏感性就非常強烈了,訓練中3X
[討論] DeepSeek與超導技術,誰能笑到最後?目前,關於中國研究團隊聲稱開發出「DeepSeek」技術,以及南韓所謂的「常溫常壓超導 體(如LK-99)」的真實性,都存在廣泛的爭議。 1. 中國的DeepSeek 這項技術據說是一種具有革命性的量子計算與通訊技術,但相關細節尚未公開,且缺乏經 過國際認證的第三方評估或審查。對於如此重大的科學突破,如果缺乏透明性或無法經得![[討論] DeepSeek與超導技術,誰能笑到最後? [討論] DeepSeek與超導技術,誰能笑到最後?](https://attach.setn.com/newsimages/2025/01/27/4984840-PH.jpg)
X
Re: [新聞] DeepSeek爆紅引熱議 傳偷用5萬顆輝達H10"世界一開源 中國就領先" 這是一句最近流傳的諺語~~~ 之前中國嘴砲7奈米量產 結果一開蓋 發現是TSMC like的製程 多重曝光 現在要驗證 deepseek是否真的是便宜成本就可以訓練好 只要請deepseek 公佈模型架構 不要提供完整訓練好的模型3
Re: [問卦] ChatGpt為什麼開始變笨了?正好半夜看到這篇無聊來回一下 GPT4能力下降大概5月多開始就有人注意到了 但你要怎麼定義能力衰退這件事而且量化他? 於是七月就有一篇論文在討論這件事![Re: [問卦] ChatGpt為什麼開始變笨了? Re: [問卦] ChatGpt為什麼開始變笨了?](https://static.arxiv.org/static/browse/0.3.4/images/arxiv-logo-fb.png)
1
Re: [新聞] 成本低廉 中國AI初創DeepSeek震撼矽谷前文恕刪 : 據報導,DeepSeek僅用2048片H800顯示卡 (GPU)、耗時兩個月,就訓練出了一個6710億參 : 數的DeepSeek-V3。相較於Meta訓練參數量4050億的Llama 3,用了1萬6384片更強的H100 : 顯示卡,花了54天。DeepSeek的訓練效率提升了11倍。 這比法很不公平
![[討論] 台派財經網美:Deepseek不可能那麼省錢 [討論] 台派財經網美:Deepseek不可能那麼省錢](https://i.imgur.com/fOXcw7Vb.jpeg)