Re: [問卦] DeepSeek是真貨,版圖會不會大改?
※ 引述 《hass231470》 之銘言:
: 幾天過去,似乎也沒有什麼證據可以證明是假的
: 不然那些專家或政客都是傻瓜嗎?
: 如果DeepSeek是真貨,那世界和產業版圖會不會大改?
: 更甚至,直接開始引發一連串後續的奇點?
Deepseek真正改變的是讓開源生態系注入了新的活水,過去半年其實大家都是被OpenAI的生態系越玩越死,新創很怕自己做出的服務馬上就被閉源的chatGPT直接取代,然後要做出服務還要付出大筆服務費,要自己搭還需要大量計算能力。
但DeepSeek R1直接告訴你要讓語言模型有推理能力根本不需要真的做大,要訓練推理能力也不需要讓人去轉出人類的思考過程(TTT模式),直接拿好的基礎我們去蒸餾再去給他環境規則讓他適應規則就好了。
這幾天阿肥自己看到真正引發恐慌的都是非技術領域憑政治腦在思考事情的人在亂說話亂黑,反而真正技術領域都是在試用開源版的Deepseek R1。
是不是靠GPT蒸餾直接試就知道了,像國外就有人拿他來實驗撰寫物體碰撞的程式,反而o1沒辦法模擬流體力學的程式碼但R1做到了,要知道如果只是單純蒸餾拿模型的輸出分佈頂多逼近教師模型而已,但事實是人家R1確實有超越OpenAI最強模型的行為,而且要說模型瓢竊數據是要有絕對證據證明模型分佈一致的,但到目前OpenAI根本就沒有提出絕對證據那隨便定罪就不太適合就是了。
撇開這點其實R1在很多技術上都證明可行,那根本就沒必要排斥,討厭用線上版交資料給中國那你也可以用開源離線版,反而用政治腦思考的人眼界真的蠻狹隘的。
以上
--
好 中或贏
台肯
可惜對於滿腦子意識形態的人說再清楚都沒用
越玩越死?
阿肥矽谷蠻多朋友的,OpenAI出來兩年新創圈就真的越玩越死,VC也不太願意花大錢投資一 個串OpenAI的服務怕哪天就被整併進OpenAI,大家都想弄下那幾隻閉源惡龍但做不到。
確實 懂的人應該是自己先玩玩看
推推
Openai 開始搞錢後大家都不爽啊
爆
[情報] 50美元訓練出媲美DeepSeek R1標題: 李飛飛團隊用不到50美元訓練出媲美DeepSeek R1的AI推理模型 來源: Futu 網址:![[情報] 50美元訓練出媲美DeepSeek R1 [情報] 50美元訓練出媲美DeepSeek R1](https://i.imgur.com/kFg9GjUb.jpeg)
爆
Re: [新聞] OpenAI:已掌握DeepSeek盜用模型證據以下部分資訊來自於Reddit anitakirkovska文章的翻譯 LDPC哥哥講到一個重點 Reinforcement Learning =/= Reinforcement Learning from Human Feedback 這也是R1為什麼爆紅的原因![Re: [新聞] OpenAI:已掌握DeepSeek盜用模型證據 Re: [新聞] OpenAI:已掌握DeepSeek盜用模型證據](https://i.imgur.com/lunsvb2b.jpg)
57
Re: [討論] 其實Deepseek真的很厲害了OpenAI:已掌握DeepSeek盜用模型證據 (中央社倫敦29日綜合外電報導)中國新創公司「深度求索」(DeepSeek)引發的疑慮日 增。OpenAI今天表示已掌握證據,顯示DeepSeek盜用其模型進行開發;業界也指DeepSeek 握有大量輝達H100高階晶片,形同直接挑戰美國出口管制規定。![Re: [討論] 其實Deepseek真的很厲害了 Re: [討論] 其實Deepseek真的很厲害了](https://imgcdn.cna.com.tw/www/WebPhotos/1024/20250129/1200x800_wmkn_324524490661_0.jpg)
44
Re: [新聞] OpenAI:已掌握DeepSeek盜用模型證據比較好奇這段: 儘管蒸餾是AI業界常見做法,但DeepSeek若利用蒸餾技術來打造自家模型,並與OpenAI競 爭,將違反OpenAI服務條款,因此產生疑慮。 OpenAI婉拒進一步說明或提供證據細節。根據該公司的服務條款,用戶不得「複製」任何 OpenAI的服務,或是「利用輸出結果,來開發與OpenAI競爭的模型」。 各個ai 大語言模型不是都會互相參照比較和訓練嗎? 我以為這是業界常識…![Re: [新聞] OpenAI:已掌握DeepSeek盜用模型證據 Re: [新聞] OpenAI:已掌握DeepSeek盜用模型證據](https://i.imgur.com/9N2QFY1b.png)
23
Re: [新聞] OpenAI:已掌握DeepSeek盜用模型證據各家互相參考, 指的是訓練方法還有訓練的文本挑選, 蒸餾不太一樣 AI = 模型的程式碼+訓練 能開源的部分只有程式碼, 訓練是看各自調教 模型的能力夠, 差不多的調教方式就會得到差不多的結果 訓練方法更好, 或是文本品質越高、越多樣、量越多, 模型就越強![Re: [新聞] OpenAI:已掌握DeepSeek盜用模型證據 Re: [新聞] OpenAI:已掌握DeepSeek盜用模型證據](https://i.imgur.com/ey5mX61b.png)
18
Re: [新聞] DeepSeek 遇大規模網路攻擊,暫時只支援Musk贊同投資公司Atreides Management合夥人兼資訊長貝克(Gavin Baker)在X提到 DeepSeek的R1低成本來自在訓練和推理效率上,取得了真正的算法突破 例如 FP8 訓練、MLA(機器學習加速)和多 token 預測。 訓練過程中涉及大量的知識蒸餾(distillation) 這意味著在沒有無限制存取 GPT-4o 和 o1 的情況下,這項訓練幾乎不可能完成。![Re: [新聞] DeepSeek 遇大規模網路攻擊,暫時只支援 Re: [新聞] DeepSeek 遇大規模網路攻擊,暫時只支援](https://i.imgur.com/wNCJOYBb.jpg)
14
[爆卦] 50美元訓練出媲美DeepSeek R1李飛飛團隊用不到50美元訓練出媲美DeepSeek R1的AI推理模型 李飛飛等斯坦福大學和華盛頓大學研究人員近日以不到50美元的雲計算費用訓練了一個名 叫s1的人工智能推理模型。該模型在數學和編碼能力測試中的表現與OpenAI的o1和DeepSe![[爆卦] 50美元訓練出媲美DeepSeek R1 [爆卦] 50美元訓練出媲美DeepSeek R1](https://i.imgur.com/kFg9GjUb.jpeg)
5
[討論] DeepSeek盜用!貓咪釣魚梗圖揭惡劣手法!中國AI新創公司DeepSeek近日因涉嫌未經授權盜取OpenAI的數據,引發國際爭議。該公司 宣稱透過蒸餾技術(distillation),使用較少的計算資源,訓練出與OpenAI O1模型表 現相近的AI模型。然而,OpenAI與微軟已掌握證據,顯示DeepSeek透過API提取OpenAI的 輸出結果,並將這些數據用於自家模型的訓練,這種行為已經違反了OpenAI的服務條款,![[討論] DeepSeek盜用!貓咪釣魚梗圖揭惡劣手法! [討論] DeepSeek盜用!貓咪釣魚梗圖揭惡劣手法!](https://i.imgur.com/IsfWvKJb.jpeg)
6
Re: [新聞] OpenAI:已掌握DeepSeek盜用模型證據這段一定很多人沒看懂。 正確的說法是,蒸餾可以讓較小的模型(學生)在特定任務上得到比原本的小模型更好, 近似於大模型(教師)的結果。 近似,就不可能比教師模型更好,只會更差。另外由於OpenAI沒有開源,所以這種叫做 黑箱蒸餾。如果可以蒸餾把模型變小可以維持原來的品質,那就一直蒸餾一直蒸餾蒸餾![Re: [新聞] OpenAI:已掌握DeepSeek盜用模型證據 Re: [新聞] OpenAI:已掌握DeepSeek盜用模型證據](https://i.imgur.com/uznnxpcb.jpeg)
4
Re: [新聞] OpenAI:已掌握DeepSeek盜用模型證據這裡的說法如果是正確的話,那DeepSeek就不是只靠蒸餾來達成的. Scale AI’s 28-Year-Old Billionaire CEO Warns About This Scarily Good Chinese Startup 這個CEO就是指控DeepSeek事實上擁有並使用50000個H100 GPU的人.![Re: [新聞] OpenAI:已掌握DeepSeek盜用模型證據 Re: [新聞] OpenAI:已掌握DeepSeek盜用模型證據](https://observer.com/wp-content/uploads/sites/2/2025/01/GettyImages-1540568234.jpg?quality=80)