Re: [問卦] Deepseek為什麼光速過氣?
※ 引述《markban (馬克白)》之銘言:
Deepseek 本來只是為自家量子基金
投入資本是不如Google 微軟 輝達
甚至中國境內百度 阿里巴巴
甚至抖音的母體字節跳動都不如
自開發低成本高效能的R1
現在實力在全球已經有名號了
討論度不高
是高效節能對一般人沒啥意思
一般人也不過問些蠢問題和畫色圖
幹正事的真不多
但Deepseek會付費訂購的也大幅增長
拿來部署到用戶本機的也提高不少
輝達昨天也發表了更節能的新模型
Llama-3.1-Nemotron-Ultra-253B
但效能也不過直逼Deepseek R1
在演算法上雖然被大幅模仿
R1依然具有高度優勢
http://i.imgur.com/6oiagQH.jpg
黃仁勳也在海湖宴上遊說
較低階的閹割AI晶片組
H20應該要賣到中國去
趁還有機會趕緊多賣點
在Ai產業Deepseek 可沒過氣
至少他改革過去一兩年的Ai產業
就是無腦堆積演算晶片組的做法
-----
Sent from JPTT on my Xiaomi 2410FPCC5G.
--
※ PTT 留言評論
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 27.53.224.51 (臺灣)
※ PTT 網址
→
過氣了才不會卡
→
對 DSeek在業界仍然很紅 因為開創ㄌ低階
→
就能搞AI的一條路 但鄉民只關注在應用端
→
當然覺得人家過氣 但現實並沒有
→
現實就是過氣了 只在你們AI小圈圈
推
Deepseek 只是證明 CUDA 有在浪費算力
→
,所以跳過以後,低階也夠用,像是appl
→
e/ms可能都有偷偷在新版OS浪費CPU/RAM/
→
DISK逼著使用者升級
推
deepseek在最近歐美大量企業部署在公
→
司服務器,同時拋棄了收費的openai
推
open source 一堆應用用到
81
首Po看安卓商店deepseek下載數卡在谷底 現在也沒什麼人講deepseek 講到ai不是馬斯克的grok3 就是傳統的chatgpt 是什麼讓deepseek光速過氣![[問卦] Deepseek為什麼光速過氣? [問卦] Deepseek為什麼光速過氣?](https://img.youtube.com/vi/xvwkNdPsI6w/mqdefault.jpg)
7
因為沒有足夠的H100來燒 請參照我一月底的文章 "如果有一個更有效率的架構/模型 假設你拿五千張H100就能做出Deepseek R1" "那些有十萬張的公司就能搞出更屌的東西"![Re: [問卦] Deepseek為什麼光速過氣? Re: [問卦] Deepseek為什麼光速過氣?](https://img.youtube.com/vi/xvwkNdPsI6w/mqdefault.jpg)
3
deepseek是開源離線模型 不需要他們的服務 一台33萬台幣的mac就能在家自己跑接近chatgpt的效果 有點基礎的還能串接api做更多事,這才是ds真正的價值 meta會放出倒退的llama4 應該也是被嚇到自亂陣腳了5
這個天才IT大臣唐鳳姐姐沒教過你們嗎? deepseek r1大家都下載離線版在家玩了 現在都在想辦法做微調訓練 打算變出自己的deepsick這樣 --
爆
[情報] 微軟官方:DeepSeek R1 現已在 Azure 及 G標題: DeepSeek R1 is now available on Azure AI Foundry and GitHub DeepSeek R1 現已在 Azure AI Foundry 和 GitHub 上提供。 來源: 微軟 Azure 官方 Blog![[情報] 微軟官方:DeepSeek R1 現已在 Azure 及 G [情報] 微軟官方:DeepSeek R1 現已在 Azure 及 G](https://i.imgur.com/Mn5ppb7b.png)
68
Re: [情報] Perplexity CEO:實驗性整合DeepSeek R1模更新: 年初一大新聞 美國上市公司(NET)、CDN市佔80%的 Cloudflare 宣佈引入 Deepseek R1 模型至他們的 serverless GPUs 產品 Workers AI 中![Re: [情報] Perplexity CEO:實驗性整合DeepSeek R1模 Re: [情報] Perplexity CEO:實驗性整合DeepSeek R1模](https://i.imgur.com/rDAhYVDb.png)
54
Re: [新聞] 市值蒸發19.7兆!輝達聲明:DeepSeek未Deepseek用更多輝達晶片有兩條路 第一、用更多H100,輝達跟這個ai產業鏈股價崩盤, 現在市場給輝達跟Ai產業鏈的股價是基於必須生產更高階的晶片, 如果Deepseek證明大型ai模型只需要H100等級的晶片就足夠, 那市場還會買單gb200、gb300甚至輝達說一年隔代一款ai伺服器的構想嗎?![Re: [新聞] 市值蒸發19.7兆!輝達聲明:DeepSeek未 Re: [新聞] 市值蒸發19.7兆!輝達聲明:DeepSeek未](https://i.imgur.com/N5n7y8Ob.jpeg)
47
[討論] Deepseek就之前吹過頭了呀 XD來看看DEEPSEEK之前怎麼吹的 「DeepSeek R1的問世,宣告AI訓練與推理成本大幅縮減,在不到600萬美元的極低投入成本 和2048塊性能遠低於H100與Blackwell的H800芯片條件下,DeepSeek團隊打造出性能堪比Ope nAI o1的開源AI模型,相比之下Anthropic與OpenAI訓練成本高達10億美元。該模型每百萬 個token的查詢成本僅爲0.14美元,而OpenAI的成本爲7.50美元,成本降幅高達驚人的98%。![[討論] Deepseek就之前吹過頭了呀 XD [討論] Deepseek就之前吹過頭了呀 XD](https://i.imgur.com/94BvQMzb.jpg)
10
Re: [問卦] deepseek的天才少女不出來救場嗎?5 微軟CEO納德拉在電話會上強調,DeepSeek R1模型目前已可通過微軟的AI平台Azure AI Fou ndry和GitHub獲取,並且很快就能在Copilot+電腦上運行。納德拉稱DeepSeek“有一些真的 創新”,AI成本下降是趨勢:“縮放定律(Scaling Law)在預訓練和推理時間計算中不斷![Re: [問卦] deepseek的天才少女不出來救場嗎? Re: [問卦] deepseek的天才少女不出來救場嗎?](https://i.imgur.com/QqCGkqvb.jpeg)
1X
[討論] DeepSeek這一仗,是民進黨輸了對啊 剛剛輝達官方發文表示,DeepSeek-R1是一個具有最先進推理能力的開放模型,與傳統型相比 不會直接提供回應,DeepSeek-R1會針對問題進行多次推理及查詢,採用思路鏈、共識和搜尋 方法以提供最佳答案與可靠性。 輝達進一步說明,DeepSeek-R1證明為何加速運算對於AI推理的需求至關重要,由於模型可以7
Re: [新聞] 中國「DeepSeek」威脅美國AI主導地位?遭1. DeepSeek上個月就有了,R1也是20日就發布了,如果真的是AI晶片突如其來的黑天鵝的話,應該可以直接迎來一波直衝地府的大行情,但近期輝達股價怎麼會走成這種尿性? 2. 最近又被拿出來炒是因為站上了蘋果APP下載排行 3. AI晶片業務有分訓練跟推理,DeepSeek可能帶來影響的是訓練的部分,實際會不會影響晶片供需還要看OpenAI這些巨頭會不會想因為DeepSeek而調整策略;但近期看除了Meta有出來講講話,以及媒體替他們恐慌外,其他巨頭倒是沒有什麼回應 4. DeepSeek就是後進者優勢,已經知道市場喜歡什麼、測試者都在測什麼,針對重點去開發,當然能節省成本![Re: [新聞] 中國「DeepSeek」威脅美國AI主導地位?遭 Re: [新聞] 中國「DeepSeek」威脅美國AI主導地位?遭](https://i.imgur.com/T83UMmEb.jpg)
1
[討論] 所以可以開吹Deepseek了嗎?微軟Ai副總: DeepSeek R1 is now available in the model catalog on Azure AI Foundry and GitHub, joining a diverse portfolio of over 1,800 models, including frontier, open-source, industry-specific, and task-based AI models. As part of Azure AI Foundry, DeepSeek R1 is accessible on a trusted, scalable, and![[討論] 所以可以開吹Deepseek了嗎? [討論] 所以可以開吹Deepseek了嗎?](https://i.imgur.com/YdMmsJwb.jpeg)
X
Re: [新聞] 快新聞/DeepSeek崛起 輝達:R1可在NVIDIA NIM使用: : 繼微軟之後輝達也讓DS納入自己的平台 : 此外輝達還對DS稱讚幾句打臉政黑 : 唉政黑真的應該改改逢中必反的心態了 民視不演了