Re: [問卦] Deepseek為什麼光速過氣?
因為沒有足夠的H100來燒
請參照我一月底的文章
https://www.ptt.cc/Gossiping/E.MLNcajdnq3tc
"如果有一個更有效率的架構/模型 假設你拿五千張H100就能做出Deepseek R1"
"那些有十萬張的公司就能搞出更屌的東西"
Deepseek很好 提出reasoning, multi-head latent attention這兩個東西
其他AI公司有資本的抄一抄 馬上就趕出一樣的東西還超前
Deepseek當下就像是珍珠港時刻 或者美國海軍飛行員看到零戰在天上飛的瞬間
嚇死
但是最後還是工業力勝出 誰財大氣粗就能做出更屌的東西
除非今天給Deepseek同等級的財力跟算力 不然有什麼新架構橫空出世
那些十萬張等級的公司訓練新模型就是一個禮拜的事情而已
Deepseek比較像是研究中心 不是AI公司 其他家是真的打算把自家的AI服務拿來賺錢
但是Deepseek就是提出一個很屌的東西 但是軟體服務沒跟上 用戶體驗下降
就回到其他家 體驗更好 模型更屌
※ 引述《markban (馬克白)》之銘言:
: 看安卓商店deepseek下載數卡在谷底
: 現在也沒什麼人講deepseek
: 講到ai不是馬斯克的grok3
: 就是傳統的chatgpt
: 是什麼讓deepseek光速過氣
: 你各位中國人怎麼說==
--
更屌的東西在哪?
聰明度是有的 但數據庫不夠新
還好吧,免費的已經夠鄉民使用,
不像chatgpt聊沒幾句就說免費額度滿了
寫程式 畫圖的 誰用DEEPSEEK了 (嘻嘻
gemini 目前沒跟我靠杯沒給錢還一直問
就是了
就像輔助駕駛那樣 還是不能無腦放心用
不過google出了新的晶片 是有機會改善
確實 你抄我 我抄你的再改一下 就比你好
市面上大部分的模型都更屌
不能產圖 很爛吧
中國的東西不EY,都是自嗨一陣子就無
人問津了
李飛飛二月就打臉過了
比挪吒還詐
過氣了?
寫程式應該還好吧
DS不用賺錢,他是AI平權的開拓者,完
全無私分享技術原理
就...沒宣稱的好 吹過頭
每款都裝 給他們不同的任務同時工作正解
打壓
chatgpt 知道財富密碼,弄個吉卜力產圖風
潮就屌打ds了
其實過氣是假的 這些都是推動AI發展
本來一開始講 就是講這技術阿 傻傻的
81
首Po看安卓商店deepseek下載數卡在谷底 現在也沒什麼人講deepseek 講到ai不是馬斯克的grok3 就是傳統的chatgpt 是什麼讓deepseek光速過氣![[問卦] Deepseek為什麼光速過氣? [問卦] Deepseek為什麼光速過氣?](https://img.youtube.com/vi/xvwkNdPsI6w/mqdefault.jpg)
3
deepseek是開源離線模型 不需要他們的服務 一台33萬台幣的mac就能在家自己跑接近chatgpt的效果 有點基礎的還能串接api做更多事,這才是ds真正的價值 meta會放出倒退的llama4 應該也是被嚇到自亂陣腳了5
這個天才IT大臣唐鳳姐姐沒教過你們嗎? deepseek r1大家都下載離線版在家玩了 現在都在想辦法做微調訓練 打算變出自己的deepsick這樣 --3
Deepseek 本來只是為自家量子基金 投入資本是不如Google 微軟 輝達 甚至中國境內百度 阿里巴巴 甚至抖音的母體字節跳動都不如 自開發低成本高效能的R1
爆
[情報] 50美元訓練出媲美DeepSeek R1標題: 李飛飛團隊用不到50美元訓練出媲美DeepSeek R1的AI推理模型 來源: Futu 網址:![[情報] 50美元訓練出媲美DeepSeek R1 [情報] 50美元訓練出媲美DeepSeek R1](https://i.imgur.com/kFg9GjUb.jpeg)
爆
Re: [新聞] DeepSeek 遇大規模網路攻擊,暫時只支援1. DeepSeek創辦人梁文鋒,少年股神變AI大神 2. 紐約時報指出,DeepSeek是由中國對沖基金幻方量化(High-Flyer)創辦 3. DeepSeek 宣稱,訓練成本僅 557.6 萬美元,幾乎是其他科技巨頭大型語言模型的十 分之一成本,這個費用也差不多是一位 AI 主管的年薪而已。 綜合以上媒體報導與揭露來看,DeepSeek是什麼狀況,不就很清楚了嗎?![Re: [新聞] DeepSeek 遇大規模網路攻擊,暫時只支援 Re: [新聞] DeepSeek 遇大規模網路攻擊,暫時只支援](https://img.youtube.com/vi/l3iL-tlAbl0/mqdefault.jpg)
爆
[情報] 微軟官方:DeepSeek R1 現已在 Azure 及 G標題: DeepSeek R1 is now available on Azure AI Foundry and GitHub DeepSeek R1 現已在 Azure AI Foundry 和 GitHub 上提供。 來源: 微軟 Azure 官方 Blog![[情報] 微軟官方:DeepSeek R1 現已在 Azure 及 G [情報] 微軟官方:DeepSeek R1 現已在 Azure 及 G](https://i.imgur.com/Mn5ppb7b.png)
68
Re: [情報] Perplexity CEO:實驗性整合DeepSeek R1模更新: 年初一大新聞 美國上市公司(NET)、CDN市佔80%的 Cloudflare 宣佈引入 Deepseek R1 模型至他們的 serverless GPUs 產品 Workers AI 中![Re: [情報] Perplexity CEO:實驗性整合DeepSeek R1模 Re: [情報] Perplexity CEO:實驗性整合DeepSeek R1模](https://i.imgur.com/rDAhYVDb.png)
54
Re: [新聞] 市值蒸發19.7兆!輝達聲明:DeepSeek未Deepseek用更多輝達晶片有兩條路 第一、用更多H100,輝達跟這個ai產業鏈股價崩盤, 現在市場給輝達跟Ai產業鏈的股價是基於必須生產更高階的晶片, 如果Deepseek證明大型ai模型只需要H100等級的晶片就足夠, 那市場還會買單gb200、gb300甚至輝達說一年隔代一款ai伺服器的構想嗎?![Re: [新聞] 市值蒸發19.7兆!輝達聲明:DeepSeek未 Re: [新聞] 市值蒸發19.7兆!輝達聲明:DeepSeek未](https://i.imgur.com/N5n7y8Ob.jpeg)
57
Re: [討論] 其實Deepseek真的很厲害了OpenAI:已掌握DeepSeek盜用模型證據 (中央社倫敦29日綜合外電報導)中國新創公司「深度求索」(DeepSeek)引發的疑慮日 增。OpenAI今天表示已掌握證據,顯示DeepSeek盜用其模型進行開發;業界也指DeepSeek 握有大量輝達H100高階晶片,形同直接挑戰美國出口管制規定。![Re: [討論] 其實Deepseek真的很厲害了 Re: [討論] 其實Deepseek真的很厲害了](https://imgcdn.cna.com.tw/www/WebPhotos/1024/20250129/1200x800_wmkn_324524490661_0.jpg)
47
[討論] Deepseek就之前吹過頭了呀 XD來看看DEEPSEEK之前怎麼吹的 「DeepSeek R1的問世,宣告AI訓練與推理成本大幅縮減,在不到600萬美元的極低投入成本 和2048塊性能遠低於H100與Blackwell的H800芯片條件下,DeepSeek團隊打造出性能堪比Ope nAI o1的開源AI模型,相比之下Anthropic與OpenAI訓練成本高達10億美元。該模型每百萬 個token的查詢成本僅爲0.14美元,而OpenAI的成本爲7.50美元,成本降幅高達驚人的98%。![[討論] Deepseek就之前吹過頭了呀 XD [討論] Deepseek就之前吹過頭了呀 XD](https://i.imgur.com/94BvQMzb.jpg)
25
[請益] AI最花錢的時間已經過了嗎?就算Deepseek是蒸餾其他AI模型 但就是能夠做出效能好成本低的模型 而那幾間巨頭砸在AI的錢 就是在奠下AI發展的基礎 以Deepseek的發展來說![[請益] AI最花錢的時間已經過了嗎? [請益] AI最花錢的時間已經過了嗎?](https://i.imgur.com/SJ4QAmCb.jpeg)
10
Re: [問卦] deepseek的天才少女不出來救場嗎?5 微軟CEO納德拉在電話會上強調,DeepSeek R1模型目前已可通過微軟的AI平台Azure AI Fou ndry和GitHub獲取,並且很快就能在Copilot+電腦上運行。納德拉稱DeepSeek“有一些真的 創新”,AI成本下降是趨勢:“縮放定律(Scaling Law)在預訓練和推理時間計算中不斷![Re: [問卦] deepseek的天才少女不出來救場嗎? Re: [問卦] deepseek的天才少女不出來救場嗎?](https://i.imgur.com/QqCGkqvb.jpeg)
3
Re: [問卦] deepseek 到底是不是抄的 風向好亂Deepseek AI的訓練過程確實有用到蒸餾技術 蒸餾技術,就是在前人製造AI(例如chatgpt)的基礎上, 拿別人AI的回答當作訓練自己AI的材料 這種作法雖然有點像抄襲他人AI的能力,但在學術界已經是行之有年的做法 各國很多頂尖實驗室都用過這種方法訓練自己的AI