[心得] deepseek是蒸餾chatGPT的嗎?
DS剛出的時候 有討論DS是否蒸餾chatGPT
後來好像不了了之 不知結論如何
昨天meta祖克柏和微軟執行長納德拉聊天
講到蒸餾 似乎暗指DS是蒸餾來的
https://youtu.be/HZ47Fts1JDE?t=1544
股點是 如果DS只是蒸餾來的
那因為DS跌的部分 會漲回來嗎?
--
從來沒有"因為DS跌"這回事 那只是編的故事...
摸摸擬的LP,你認為DS會造成AI跌嗎
蒸餾也沒差
大家都開始蒸餾
早就說是蒸餾的
昨天說有 small LLAMA , mini LLAMA
目標就是蒸餾到 可以在手機本地執行
其實要蒸餾的好也很是有技術 不然model怎會那麼大
心得?
一開始訪問 databank的Ali Ghodsi
現在開始 就是比看誰有資料 可以訓練
進入 業務邏輯的 蒸餾
databricks
能夠靠蒸餾賺錢也是一個技術
資料很值錢的 就像醫院的X光
這些AI模型用的資料有付過版權嗎 你沒看OPEN AI都
MRI CT
說不會提告了
現在一堆 在海量訓練 PDF論文的 版權都說不明白
chatgpt 有開源嗎?
但是 現在是爆炸比速度的時代
等你發現 提告 搞不好都進入下一階段了
根本沒空打官司
而且 全部都新創 根本沒賺錢 提告也沒用
現在沒人賺錢好嗎
事實是 蒸餾大家都在用 只是當時是中國的 所以反應
才大 一方面 仇中 一方面 美各種制裁/限制還是被人
搞出生成式AI 然後美研究AI 有超過一半是中國人
記得現在AI領域 中國人佔比70% 剩下的白人分
恐怖的是 下一個階段
現在 大陸已經開始用MCP 做 智慧家電 聊天玩具
然後 白色家電 因為紅海市場 所以沒人在做
所以 只有大陸在搞 智慧家電 通吃
跟冰箱聊天 跟冷氣聊天 和超可動玩具聊天
仿真狗 仿真貓 可以聊天的寵物
最快看到的應該是 智慧電風扇吧 $3000以內
是不是蒸餾根本沒有很重要 AI能用低成本回答你的問
題 你無聊去管他蒸不蒸餾?後面要怎麼競爭才是重點
早就說是了啊 但chatgpt那個本來就是開放的 他也不
能說啥
過氣 跟電子狗和電子雞一樣過時了
台灣人軟體實在爛到不行
這篇是時空旅人嗎 Lag這麼久
阿祖過氣的的llama這麼曝光度這麼低是不是很氣阿
那葛羊駝4還被踢爆是作弊 只能說不愧是meta
阿祖沒差 他進入下一個時代 開始配帶眼鏡
你那邊還來得及,小心川普的對等關稅會很誇張,是
直接用貿易逆差去課關稅
2.5超神 sonet也不錯但是貴人家10倍
樓上混測 怎麼準
大模型 和邏輯模型要分開吧
LLM Leaderboard
現在分很多 領域
好用便宜 gemini2.5就夠了 但真的感謝ds幫忙卷價格
排名每天變 對我們不重要
Nvidia 還搞了一個1.5B 的奧數模型
奧數 Leetcode 這些 未來還會有一堆各種領域
4
DA並無法取代GTP ,只能是萃取GTP優化
DS就是二房東的概念 但是DS的出現演變成
AI不一定要軍備競賽 低成本也能優化
只有神知道股市為什麼跌 不要自己掰理由
不重要 現在都看糞川一句話
有一隻美股專門在防DS蒸餾ㄉ
蒸餾也是技術,你以為跟製酒一樣簡單?
DS現在跟屎一樣
不但速度慢 回的答案還是沒用的
主要是 成本沒有想像中低而已 效率已經跟不上其他
Deepseek有開放蒸餾過的小模型。蒸餾是用於產生小
模型用於邊緣運算。
DeekSeek是利用其它大語言模型產生訓練資料。
千問還比ds強
開源模型其實會更好被蒸餾
搞不好千問才是最大受害者
但不管怎麼說 在這樣的環境下 中國模型新創卻沒有多
起來 代表DS顯然就是偷買了很多GPU
按照DS說的那種成本 加上現在蒸餾技術與開源資料集
照理說應該要更捲才對 畢竟DS說600萬鎂
至於API的價格 DS能這麼低主要還是靠Token限制
其次就是 他提供服務也不需要賺錢 能賺到Data更重要
就是啊 yt很多人在講 就中吹整天說沒抄襲 笑死
ds 影響利潤 怎麼會沒影響股市
隨便 反正現在過渡期 最後只有一個贏的 用贏的就是
假議題
Llama con 2005 回到影片 Satya 真的全力輸出阿
2025 這個影片 含金量真的高!!!
他們已經想打破邊界了
重構linux kernel , 把word excel powerpoint整合
過去的 萬年遺毒 現在已經不用考慮沿革
讓ai 繼續疊代下去 再大的專案也不怕
如果DS是蒸餾的,還能贏過GPT老師就講不通了
DS開源週發布的論文也都是ClosedAI想不到的,也被各
大機構驗證確實有效
最後中國六大開源模型圍毆ClosedAI的態勢已成,奧特
曼準備打包回家了
Satya 已經在用AI suite agents
真的要追一下 各大廠的blog
大象真的要起飛
現在 是模型協同合作的鳴槍起跑
你有新的專業模型 就加入MCP
大模型主要賽道 已經沒人了
現在就是 比如何整合專業模型 然後開始賣錢
譬如 房地產AI仲介
這一兩年 就是成千上萬的專業模型開始廝殺
回家勒 等你會生吉卜力再來 笑死
但最近使用,程式deep寫比較好
googl不是還上了個A2A?
現在大多是搞推理
meta就是靠不用錢的用戶個資發大財的啊
那時候不是就說是蒸餾了
叫deepseek R2 來免費生成吉卜力,結果連吉卜力都
生成不了,根本看破手腳
還在deepseek.. 現在最夯的是阿里巴巴的qwen3
其實大家都在蒸餾, 自己蒸餾自己爭議比較小罷了
就空軍拿來炒作跟小粉紅在吹而已,後來發現DS跟Chat
GPT比,大概就幼兒園生比大學生,現在沒人吹了
台灣的人才都在ptt上分析國際局勢,沒時間研發軟體
啦
我就問除了OpenAI 和 Gemini 有誰沒在蒸餾別人模型
的
人家都開源了 還在問是不是
OpenAI沒開源怎麼蒸餾?付費蒸餾?OpenAI沒提告也
沒拿出證據。重點是DS用創新方法降低算力需求是事
實,而且用他的模型蒸餾出來,反而更好用
DS又開源又寫論文,啊OpenAI咧?
反正openAI多花錢買的算力拿去畫吉卜力也差不多啦
現在已經朝向圖片生成 甚至影片生成了 還在搞蒸餾c
ostdown是在是太落後
不能創造多媒體的模型=糞
最近新出的低設備需求、高推理能力的模型,蠻多都
有說是蒸餾來的
*推論
不蒸餾怎麼本地跑啦
說ds寫程式比chatgpt 好的大概沒啥再用
一直提gpt 真的都在看熱鬧..
有在搞開發的都自己下去弄ai了,還在比較deepseek
gpt?
有多少RD 感謝 deepseek 做領頭羊 還不知道?
阮慕驊跟洩精合 古越含8zz是齊名的
你網路是接撥的嗎xd
你那邊還來的急,晚點要課關稅了,記得歐印反一
一個很好控盤的工具
婊蒸餾沒意義 因為大家都在幹
好不好 下載到電腦玩玩看各種蒸餾版本就有一手體驗
了
44
Re: [新聞] OpenAI:已掌握DeepSeek盜用模型證據比較好奇這段: 儘管蒸餾是AI業界常見做法,但DeepSeek若利用蒸餾技術來打造自家模型,並與OpenAI競 爭,將違反OpenAI服務條款,因此產生疑慮。 OpenAI婉拒進一步說明或提供證據細節。根據該公司的服務條款,用戶不得「複製」任何 OpenAI的服務,或是「利用輸出結果,來開發與OpenAI競爭的模型」。 各個ai 大語言模型不是都會互相參照比較和訓練嗎? 我以為這是業界常識…![Re: [新聞] OpenAI:已掌握DeepSeek盜用模型證據 Re: [新聞] OpenAI:已掌握DeepSeek盜用模型證據](https://i.imgur.com/9N2QFY1b.png)
47
Re: [情報] 50美元訓練出媲美DeepSeek R1好的 google 要不要把昨天財報上的說750億設備支出 變成50美元支出? 李飛飛能直接表明蒸餾Google Google 最好不知道還給你研究所蒸餾![Re: [情報] 50美元訓練出媲美DeepSeek R1 Re: [情報] 50美元訓練出媲美DeepSeek R1](https://img.youtube.com/vi/3O7b2HZCXKM/mqdefault.jpg)
23
Re: [新聞] OpenAI:已掌握DeepSeek盜用模型證據各家互相參考, 指的是訓練方法還有訓練的文本挑選, 蒸餾不太一樣 AI = 模型的程式碼+訓練 能開源的部分只有程式碼, 訓練是看各自調教 模型的能力夠, 差不多的調教方式就會得到差不多的結果 訓練方法更好, 或是文本品質越高、越多樣、量越多, 模型就越強![Re: [新聞] OpenAI:已掌握DeepSeek盜用模型證據 Re: [新聞] OpenAI:已掌握DeepSeek盜用模型證據](https://i.imgur.com/ey5mX61b.png)
21
[問卦] 別雞同鴨講說抄襲 先搞懂什麼是蒸餾阿肥實在受不了一堆文盲吵不對焦還硬要吵 來先來看看 GPT是怎麼解釋蒸餾的 覺得太長的可以直接下滑到總結 Q: 在Deep learning領域 什麼是蒸餾? 以下來自ChatGPT的回答:![[問卦] 別雞同鴨講說抄襲 先搞懂什麼是蒸餾 [問卦] 別雞同鴨講說抄襲 先搞懂什麼是蒸餾](https://i.imgur.com/VCuiyUXb.jpeg)
13
[問卦] chatGPT再蒸餾DeepSeek不就好了?是這樣啦 一堆人說Deep Seek是透過蒸餾chatGPT來的 所以用的成本比較低,能力也比較強 那ChatGPT 只要再去蒸餾Deep Seek不就好了 這樣又會有更低成本,更精準的AI模型![[問卦] chatGPT再蒸餾DeepSeek不就好了? [問卦] chatGPT再蒸餾DeepSeek不就好了?](https://i.imgur.com/H4tAVlub.jpeg)
12
[政治] DeepSeek盜用OpenAI ?本日政治文? (1/1) 總部設在美國舊金山(San Francisco)的OpenAI公司向英國「金融時報」(Financial Times)證實,已掌握疑似DeepSeek利用「蒸餾」(distillation)技術的證據。OpenAI 是聊天機器人ChatGPT的開發商。![[政治] DeepSeek盜用OpenAI ? [政治] DeepSeek盜用OpenAI ?](https://money.udn.com/static/img/moneyudn.jpg)
7
[問卦] ChatGPT o3新模型怎麼防蒸餾?Deepseek公布了低成本蒸餾法 能把現成的LLM模型以另一個模型蒸餾出來 省去初期開發成本以極低的成本搶佔資本市場 o3新模型就面臨抉擇 1.開放API等著被模型各種蒸餾5
[問卦] 所以DeepSeek 是學別人AI 的AI嗎?這幾天八卦版突然有很多AI專家 那剛好問一下 這兩天看到很多人說 DeepSeek 是用蒸餾(Distillation)手法學習chatgpt的 所以訓練費才會這麼便宜4
[問卦] 語言模型用蒸餾是不是要寫上純度?大家都說deepseek蒸餾gpt來的 廣義上來說 GPT也是蒸餾整個網路資料來的 然後李飛飛用50美金重現deepseek的論文 算不算二次蒸餾三次蒸餾 那這樣以後語言模型是不是都要標註純度? --1
Re: [新聞] 成本低廉 中國AI初創DeepSeek震撼矽谷前文恕刪 : 據報導,DeepSeek僅用2048片H800顯示卡 (GPU)、耗時兩個月,就訓練出了一個6710億參 : 數的DeepSeek-V3。相較於Meta訓練參數量4050億的Llama 3,用了1萬6384片更強的H100 : 顯示卡,花了54天。DeepSeek的訓練效率提升了11倍。 這比法很不公平