Re: [討論] deepseek 開源是類核擴散嗎?
※ 引述《lovepork (我愛豬肉不愛牛肉)》之銘言:
: 前幾年印象是美國知名科學家把AI看成是一種現代版核武軍備競賽。
: 那deepseek開源,概念上是否是一種核擴散?
: 大家都沒發現這事情好像有點讓人細思極恐嗎?
並不是核擴散,是未來必然會走的路,
因為中國被制裁,所以先被 deepseek 發表了
原因是 deepseek 是小公司,沒有資源優勢,
而小公司的技術優勢很容易被大公司超越
我認為應該是模型權重優勢
deekseek open model (用 open source 是錯的)
實質上是另一種策略,讓世界幫你的 open model 背書
進而讓某些自己沒有技術能力大公司能捨棄自己研發,
改和 deepseek 合作的策略
而這個策略非常成功,其實上輪就已經很成功的用 V3 打下
中國其它大模型的價格,但是本輪因為大家都可以靠降價
壓到跟 deepseek 差不多價格
但是 r1 思維鏈等級的成功是公司能掌握壓榨資源科技的結果
而且這是具有絕對優勢
deepseek-r1 的 open model 小而效率高, 而且產出的品質非常好
尤其是中文的語意辨識和產出都比 OpenAI 好非常非常多
那全功能的 deepseek 就更值得接入了
重點是價格比自己搞還低很多,自己搞就沒必要了
至於原班人馬大概就改為跟 deepseek 合作,畢竟各家自己用的大模型
還是有很多事情要做的,這邊就不確定會用什麼方式,
沒錢 RAG 有錢 fine-tune
目前華為和榮耀手機 AI 已經決定要接入 deepseek
有幾家大陸車廠的 AI 終端也要入接入 deepseek
對小公司來說的 deepseek 應該是這一階段大獲全勝
而且還能吸引不少一線的人才參與,贏麻了
這輪 AI 應用才剛開始吧,主要是打開了 FP8 省資源的姿勢
下輪沒辦法學 FP8 應用的,錢不夠的就會被狠狠踩在腳下
OpenAI 應該不需要擔心 deepseek ,它後面的 Claude 和 Gemini
就有可能趕上 OpenAI 了
中國 GPU 算力不夠是大問題,
不過 deepseek 看起來跟中國的 GPU 廠商大部份都接上了
誰能提供最多的 GPU 給 deepseek 就可以勝出
應用/中介/硬體都有了,只差在硬體 C/P 值不好,但是有能源
和人力優勢,這場中美 AI 技術大戰還有得打
--
爆
Re: [新聞] Meta陷入恐慌?內部爆料:在瘋狂分析複製DeepSeek,高預teamblind 匿名的可能有人不信 與其聽匿名、鄉民互吹/貶 不如來聽聽 Meta 現任 CEO Mark Zuckerberg 本人對於 Deepseek AI 模型的看法 2025/01/11 Mark Zuckerberg 接受美國知名喜劇演員 Joe Rogan 專訪 截至今日有 840 萬人看過這個影片![Re: [新聞] Meta陷入恐慌?內部爆料:在瘋狂分析複製DeepSeek,高預 Re: [新聞] Meta陷入恐慌?內部爆料:在瘋狂分析複製DeepSeek,高預](https://i.imgur.com/HlQlJzkb.png)
爆
[情報] AMD 興奮宣布 Instinct MI300X GPUs 支援 DeepSeek-V3標題: AMD Instinct GPUs Power DeepSeek-V3: Revolutionizing AI Development with SGLang 來源: AMD's X (Twitter) 網址:![[情報] AMD 興奮宣布 Instinct MI300X GPUs 支援 DeepSeek-V3 [情報] AMD 興奮宣布 Instinct MI300X GPUs 支援 DeepSeek-V3](https://i.imgur.com/xVyT4dsb.png)
68
Re: [情報] Perplexity CEO:實驗性整合DeepSeek R1模更新: 年初一大新聞 美國上市公司(NET)、CDN市佔80%的 Cloudflare 宣佈引入 Deepseek R1 模型至他們的 serverless GPUs 產品 Workers AI 中![Re: [情報] Perplexity CEO:實驗性整合DeepSeek R1模 Re: [情報] Perplexity CEO:實驗性整合DeepSeek R1模](https://i.imgur.com/rDAhYVDb.png)
31
[請益] OpenAI的敵人難道只有一個DeepSeek嗎?前幾天的美股真實上演狼來了,嚇得投資人四處逃竄 昨天開始各家執行長靠大內宣穩住士氣。 搞得像邪教(信仰)一樣,還讓人一度以為是佈道大會。 DeepSeek的出現,是不是足以能構成OpenAI的威脅這一點 跟它的性能(算法)跟成本(算力)好壞已然無關。![[請益] OpenAI的敵人難道只有一個DeepSeek嗎? [請益] OpenAI的敵人難道只有一個DeepSeek嗎?](https://i.imgur.com/F1UMcjBb.jpg?fb)
30
Re: [問卦] deepseek的天才少女不出來救場嗎?: 奇怪,為什麼有一堆不知所謂的人出來說DeepSeek翻車,DeepSeek再那之後 還是繼續推出vision model,照樣殺翻Github DeepSeek以及其背後團隊,發表了不下十餘篇論文,一堆連蒸餾技術, LLM微調技術![Re: [問卦] deepseek的天才少女不出來救場嗎? Re: [問卦] deepseek的天才少女不出來救場嗎?](http://www.bing.com/sa/simg/facebook_sharing_5.png)
20
Re: [問卦] 為什麼deepseek會影響台積電 不懂?DeepSeek厲害的地方不是他便宜,不是他厲害,最重要的地方是他開源。 他的原始碼開源,權重開源(資料沒有開源),而且開放商業授權,他的 原始碼是MIT授權,權重則是基於OpenRail的特殊開源架構,也就是只有 一些特別場合他沒有授權,例如製造有害軟體,製造毒品等等 簡單來說你現在馬上就可以在你的電腦,你的公司使用了,你只要用很普4
[問卦]DeepSeek是不是台積電的救世主?[問卦] DeepSeek是不是台積電的救世主? 最近看到DeepSeek在那邊吹什麼MLA架構、MoE模型,說什麼訓練效率超高、推理速度超快 ,笑死,還不是靠台積電的5nm、3nm製程在撐?沒了GG的晶片,你這些所謂的「創新」還 能跑得動? DeepSeek這種吃硬體怪獸,光是訓練一個模型就要幾萬顆A100、H100,這些GPU還不都是![[問卦]DeepSeek是不是台積電的救世主? [問卦]DeepSeek是不是台積電的救世主?](https://i.imgur.com/Z7twi0Sb.jpg)
X
Re: [新聞] OpenAI:已掌握DeepSeek盜用模型證據Open AI真的提出了證據再說,而且我比較好奇的是,本來我以為Open AI第一時間應該會 出面駁斥的是DeepSeek訓練成本不可能這麼低的事,結果竟然是在指控對方盜用模型。 說真的,對於世界上廣大的公司來說,比較關心的事是否真的能用那麼低的成本來建構出 一樣的東西,如果可以,那麼之前要耗費大筆金錢再搞AI的公司不就是傻子? 到底Open AI骨子裏是知道事實的(就是本來成本就不用這麼多),又或者DeepSeek宣稱![Re: [新聞] OpenAI:已掌握DeepSeek盜用模型證據 Re: [新聞] OpenAI:已掌握DeepSeek盜用模型證據](https://i.imgur.com/7tjAlIub.jpeg)
3
Re: [問卦] deepseek 到底是不是抄的 風向好亂Deepseek AI的訓練過程確實有用到蒸餾技術 蒸餾技術,就是在前人製造AI(例如chatgpt)的基礎上, 拿別人AI的回答當作訓練自己AI的材料 這種作法雖然有點像抄襲他人AI的能力,但在學術界已經是行之有年的做法 各國很多頂尖實驗室都用過這種方法訓練自己的AI
Re: [討論] 紐約教授:DeepSeek比OpenAI更Open綠營人士看到沒有?集十四億中華兒女所發明出來既便宜 又強大的AI模型DeepSeek連高傲的美帝人士也讚嘆不已。 被DeepSeek打擊到快掛點的英偉達也不得不低頭,宣布 DeepSeek R1版可支援新的繪圖卡硬體,現在科技大廠紛 紛跪求和DeepSeek合作,只有綠營逆世界潮流,禁止