Re: [問卦] deepseek 到底是不是抄的 風向好亂
Deepseek AI的訓練過程確實有用到蒸餾技術
蒸餾技術,就是在前人製造AI(例如chatgpt)的基礎上,
拿別人AI的回答當作訓練自己AI的材料
這種作法雖然有點像抄襲他人AI的能力,但在學術界已經是行之有年的做法
各國很多頂尖實驗室都用過這種方法訓練自己的AI
chatgpt之前也不反對別人拿它的AI的api回答來訓練模型
總體來說 deepseek的訓練過程其實沒什麼不光彩的地方,
但確實也不必過分神話deepseek
deepseek 在訓練方法與架構上確實有自己的突破與學術貢獻在
這方面很值得讚賞
但它也有不少承襲前人的地方,也參考了美國其他機構的開源AI模型
它並不是自己閉門造車,更像是在前人的成果上進一步向上突破
如果沒有openai以及其他美國公司機構作為ai的前沿探索
deepseek大概也不太可能無中生有自己生出來
所以抱持客觀態度看待即可
不用過分貶低deepseek,但也不必太過輕視openai等美國企業
此外Deepseek願意分享自己的成果,將自己開源分享自己的模型,
公開自己的技術與模型參數,這也是讓人讚賞的
這也是歐美網路上不少人對deepseek有正面評價的原因
這代表每個人都可以免費下載deepseek的原始參數程式
自己復現並改造一個私人版本的deepseek ai,也能參考它的技術挪為己用
所以審查只是枝微末節
因為每個人大可以免費下載一個不需要聯網的AI模型
在自己的機器上改掉審查的部分以供自己使用
--
※ PTT 留言評論
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 1.200.18.169 (臺灣)
※ PTT 網址
→
要憨鳥接受,他們價值觀會崩潰
推
感謝分享
噓
蟾蜍只需要義和團式的無腦黑 懂?
推
ChatGPT o1白菜價,要重拾信心就看
→
o3有什麼驚人的表現。話說Deepseek
→
R1有辦法繼續進化嗎?
推
你說這些鳥鳥不懂啊
→
有說法是可以拿GPT訓練,但只能發論文,
→
而不能拿來營利
推
好文推
55
首Po如題 Deepseek最近幾天風向一直變 先說成本造假 又說會影響輝達 台積電 現在又說是抄的![[問卦] deepseek 到底是不是抄的 風向好亂 [問卦] deepseek 到底是不是抄的 風向好亂](https://i.imgur.com/x1Ei9hFb.png)
X
絕對是抄的,藍白雜草不用再吹了,100%是抄的。 原子彈抄歐本海默 東風抄義勇兵 福建號抄福特號 姦20抄F22
原神已經示範過了 抄贏的最大 各位別爭了== Ai市場要變天了 --27
現在還在說抄襲,基本上就搞不清楚狀況而已 Deepseek已經全部開源給你看了,甚至論文跟模型都公開 國外沒啥人鳥指控抄襲的OpenAI,就是因為OpenAI根本沒公開過什麼東西 想幫忙護航的連找是哪邊抄襲都找不到 Deepseek開源是影響下面這件事![Re: [問卦] deepseek 到底是不是抄的 風向好亂 Re: [問卦] deepseek 到底是不是抄的 風向好亂](https://i.imgur.com/dUBRYYnb.jpeg)
1
鋼鐵人二裡頭,安東萬科拿著低價玩具,把鋼鐵人的億萬鋼鐵S級套裝電的嘰嘰叫。 1月20日,我川上任,大發慈悲給了TIKTOK 75天,好好想想要賣美國多少錢,畢竟美式民主 好喝好舔。 隔週,一個早在12月26日就上架的Deepseek,突然聲名大噪,用600萬鎂不到的成本,打爆 宣稱要幾百幾千億的openAI,瞬時ai概念股崩盤,資本全部縮手,高盛也 宣布暫緩ai相關3
AI時代,抄沒抄已經不能用過去對軟體的理解來判斷了。 過去的軟體大多是確定性演算法,也就是任何輸入都會經過 相同的規則處理,所有的規則都寫在程式碼裡頭,所以程式 碼就是軟體的一切。 AI時代,很抱歉,程式碼頂多佔50%重要性。另外50%是數據
爆
[心得] DeepSeek對AI產業鏈影響懶人包最這幾天股板跟 X 上的AI金融圈吵的火爆 DeepSeek 對全球 AI 技術發展影響 吵的火爆示意圖 金融人士擔憂影響![[心得] DeepSeek對AI產業鏈影響懶人包 [心得] DeepSeek對AI產業鏈影響懶人包](https://i.imgur.com/WiusWatb.jpg)
57
Re: [討論] 其實Deepseek真的很厲害了OpenAI:已掌握DeepSeek盜用模型證據 (中央社倫敦29日綜合外電報導)中國新創公司「深度求索」(DeepSeek)引發的疑慮日 增。OpenAI今天表示已掌握證據,顯示DeepSeek盜用其模型進行開發;業界也指DeepSeek 握有大量輝達H100高階晶片,形同直接挑戰美國出口管制規定。![Re: [討論] 其實Deepseek真的很厲害了 Re: [討論] 其實Deepseek真的很厲害了](https://imgcdn.cna.com.tw/www/WebPhotos/1024/20250129/1200x800_wmkn_324524490661_0.jpg)
44
Re: [新聞] OpenAI:已掌握DeepSeek盜用模型證據比較好奇這段: 儘管蒸餾是AI業界常見做法,但DeepSeek若利用蒸餾技術來打造自家模型,並與OpenAI競 爭,將違反OpenAI服務條款,因此產生疑慮。 OpenAI婉拒進一步說明或提供證據細節。根據該公司的服務條款,用戶不得「複製」任何 OpenAI的服務,或是「利用輸出結果,來開發與OpenAI競爭的模型」。 各個ai 大語言模型不是都會互相參照比較和訓練嗎? 我以為這是業界常識…![Re: [新聞] OpenAI:已掌握DeepSeek盜用模型證據 Re: [新聞] OpenAI:已掌握DeepSeek盜用模型證據](https://i.imgur.com/9N2QFY1b.png)
47
[討論] Deepseek就之前吹過頭了呀 XD來看看DEEPSEEK之前怎麼吹的 「DeepSeek R1的問世,宣告AI訓練與推理成本大幅縮減,在不到600萬美元的極低投入成本 和2048塊性能遠低於H100與Blackwell的H800芯片條件下,DeepSeek團隊打造出性能堪比Ope nAI o1的開源AI模型,相比之下Anthropic與OpenAI訓練成本高達10億美元。該模型每百萬 個token的查詢成本僅爲0.14美元,而OpenAI的成本爲7.50美元,成本降幅高達驚人的98%。![[討論] Deepseek就之前吹過頭了呀 XD [討論] Deepseek就之前吹過頭了呀 XD](https://i.imgur.com/94BvQMzb.jpg)
31
[請益] OpenAI的敵人難道只有一個DeepSeek嗎?前幾天的美股真實上演狼來了,嚇得投資人四處逃竄 昨天開始各家執行長靠大內宣穩住士氣。 搞得像邪教(信仰)一樣,還讓人一度以為是佈道大會。 DeepSeek的出現,是不是足以能構成OpenAI的威脅這一點 跟它的性能(算法)跟成本(算力)好壞已然無關。![[請益] OpenAI的敵人難道只有一個DeepSeek嗎? [請益] OpenAI的敵人難道只有一個DeepSeek嗎?](https://i.imgur.com/F1UMcjBb.jpg?fb)
30
[情報] 馮驥:DeepSeek是國運級的科技成果大推DeepSeek 「黑悟空」製作人:國運級別的科技成果 中國大陸AI新創公司DeepSeek發表的DeepSeek-V3及DeepSeek-R1兩款大模型近期受到大量關 注,連《黑神話:悟空》的製作人馮驥也發文大力推薦,甚至稱DeepSeek可能是「國運級別 的科技成果」。![[情報] 馮驥:DeepSeek是國運級的科技成果 [情報] 馮驥:DeepSeek是國運級的科技成果](https://cdn2.ettoday.net/images/7808/e7808891.jpg)
23
Re: [新聞] OpenAI:已掌握DeepSeek盜用模型證據各家互相參考, 指的是訓練方法還有訓練的文本挑選, 蒸餾不太一樣 AI = 模型的程式碼+訓練 能開源的部分只有程式碼, 訓練是看各自調教 模型的能力夠, 差不多的調教方式就會得到差不多的結果 訓練方法更好, 或是文本品質越高、越多樣、量越多, 模型就越強![Re: [新聞] OpenAI:已掌握DeepSeek盜用模型證據 Re: [新聞] OpenAI:已掌握DeepSeek盜用模型證據](https://i.imgur.com/ey5mX61b.png)
18
Re: [新聞] DeepSeek 遇大規模網路攻擊,暫時只支援Musk贊同投資公司Atreides Management合夥人兼資訊長貝克(Gavin Baker)在X提到 DeepSeek的R1低成本來自在訓練和推理效率上,取得了真正的算法突破 例如 FP8 訓練、MLA(機器學習加速)和多 token 預測。 訓練過程中涉及大量的知識蒸餾(distillation) 這意味著在沒有無限制存取 GPT-4o 和 o1 的情況下,這項訓練幾乎不可能完成。![Re: [新聞] DeepSeek 遇大規模網路攻擊,暫時只支援 Re: [新聞] DeepSeek 遇大規模網路攻擊,暫時只支援](https://i.imgur.com/wNCJOYBb.jpg)
7
Re: [問卦] deepseek會刺破ai泡沫嗎?有人問deepseek是什麼模型 deepseek回答是chatgpt 不過這不確定是不是最新版 而且不是每次都回答chatgpt5
[問卦] 所以DeepSeek 是學別人AI 的AI嗎?這幾天八卦版突然有很多AI專家 那剛好問一下 這兩天看到很多人說 DeepSeek 是用蒸餾(Distillation)手法學習chatgpt的 所以訓練費才會這麼便宜