Re: [問卦] deepseek是騙局嗎?已經涼了?
餓死抬頭,阿肥外商碼農阿肥啦!
Deepseek其實一直以來主打的用戶就不是對外面向全面通用型的服務公司,其實以當前純開源讓企業用戶可以自架的模型來說,DS v3 0324還是很好用的,拿來做合成數據或是自架自家的Agent flow都很香的,尤其是當前v3.2 Exp採用DSA架構(簡單理解就是把超長文本在進入模型的時候直接濃縮,優勢在於這樣可以大幅減少超長文本計算量,可以把企業的上百頁的ESG文檔直接餵給他朔造公司專用的AI文檔查詢系統還保持跟3.1一樣的速度跟計算量)。如果要規避政府單位不給用DS還可以用DS來生成大規模的合成數據做蒸餾給GPT-oss這種小模型再做Negative Sampling提取數據,像這種專用領域搭配RAG目前實驗都可以有效提升小模型的準確率,中國口癖這種也用一些小模型直接採樣拒絕掉。
尤其是像Claude最近改動了用戶規範為了讓他能合法使用用戶資料而犧牲隱私,真的不要覺得美國公司就不會出賣個資,企業為了利益、他國政府為了自身利益沒有什麼是不能賣的,開源優勢就在於企業能掌握自己的技術跟價值。
差不多4講
--
※ PTT 留言評論
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 49.216.233.111 (臺灣)
※ 文章網址:
https://www.ptt.cc/Gossiping/E.fQfIy3bVssuU
→
廉價堪用 很中國
→
口合,真用開源的,也要用馬老闆的Grok
→
,這才是真開源。
Grok3也沒有開源,Grok-2馬斯克也只提供權重而已,訓練方法也沒提供,很多東西最後老 馬都膨風,沒看到他後來也不太敢說自己是真開源。
→
直接開源表示可以抓下來自己改造
→
※ 編輯: sxy67230 (49.216.233.111 臺灣), 10/05/2025 16:06:49
也只有訓練用的標記資料和部份模型開源吧
→
ai未來是大者恆大的局面 搶不贏只能撿渣
13
首Po乳題 之前剛出的時候全世界驚訝 中國被美國禁高階晶片的情況下 竟然可以用那麼少的資源, 造出一個AI可以跟全世界頂尖企業的AI PK9
其實他在某方面回應還是不錯啦 尤其是中文圈的知識基本上還是表現的滿強的 只是跑的真的太慢了 不過要專業用途需求就會比較少一點 但平常要回答閒聊的議題表現很好16
9月17日Deepseek登上Nature雜誌封面 裡面提到訓練成本是29.4萬美元左右 並且沒有蒸餾OpenAI 「DeepSeek-R1論文首次公開了僅靠強化學習,就能激發大模型推理能力的重要研究成果,啟發全球AI研究者;這一模型還成為全球最受歡迎的開源推理模型,Hugging Face下載量超1090萬次。此番獲得《自然》的認證,可謂是實至名歸。![Re: [問卦] deepseek是騙局嗎?已經涼了? Re: [問卦] deepseek是騙局嗎?已經涼了?](https://hao.cnyes.com/download_image.ashx?file=%2FUpload%2Fdb2596fd327e4f56940ebd884aab293d.png)
2
看青鳥隔一陣沒看到DS新聞就要跳一跳唱衰一 下的酸葡萄心理真的很趣味,好像以為阿共那 邊就只有一家DS 阿共那邊真的該注意的是阿里巴巴啦,他才是 資本支出可以跟美國那邊搞軍備的。DS比較像6
這個真的擋不了 川普盡全力擋了 但是中國還是有其他管道偷渡 像是從馬來西亞進口之類的 此外中國還有一招直接在國外訓練![Re: [問卦] deepseek是騙局嗎?已經涼了? Re: [問卦] deepseek是騙局嗎?已經涼了?](https://imgs.gvm.com.tw/upload/gallery/20250818/211838.jpg)
44
Re: [新聞] OpenAI:已掌握DeepSeek盜用模型證據比較好奇這段: 儘管蒸餾是AI業界常見做法,但DeepSeek若利用蒸餾技術來打造自家模型,並與OpenAI競 爭,將違反OpenAI服務條款,因此產生疑慮。 OpenAI婉拒進一步說明或提供證據細節。根據該公司的服務條款,用戶不得「複製」任何 OpenAI的服務,或是「利用輸出結果,來開發與OpenAI競爭的模型」。 各個ai 大語言模型不是都會互相參照比較和訓練嗎? 我以為這是業界常識…![Re: [新聞] OpenAI:已掌握DeepSeek盜用模型證據 Re: [新聞] OpenAI:已掌握DeepSeek盜用模型證據](https://i.imgur.com/9N2QFY1b.png)
23
Re: [新聞] OpenAI:已掌握DeepSeek盜用模型證據各家互相參考, 指的是訓練方法還有訓練的文本挑選, 蒸餾不太一樣 AI = 模型的程式碼+訓練 能開源的部分只有程式碼, 訓練是看各自調教 模型的能力夠, 差不多的調教方式就會得到差不多的結果 訓練方法更好, 或是文本品質越高、越多樣、量越多, 模型就越強![Re: [新聞] OpenAI:已掌握DeepSeek盜用模型證據 Re: [新聞] OpenAI:已掌握DeepSeek盜用模型證據](https://i.imgur.com/ey5mX61b.png)
5
[討論] DeepSeek盜用!貓咪釣魚梗圖揭惡劣手法DeepSeek,這家中國AI新創公司,近日被指控盜用OpenAI的數據,迅速成為國際熱議的焦 點。該公司聲稱利用蒸餾技術開發出與OpenAI O1模型相似的效果,但OpenAI發現DeepSee k涉嫌違反服務條款,通過未經授權的方式大量提取API輸出數據來訓練自己的模型,這一 行為被視為數據盜竊。![[討論] DeepSeek盜用!貓咪釣魚梗圖揭惡劣手法 [討論] DeepSeek盜用!貓咪釣魚梗圖揭惡劣手法](https://i.imgur.com/n8JQWqjb.jpeg)
5
[討論] DeepSeek盜用!貓咪釣魚梗圖揭惡劣手法!中國AI新創公司DeepSeek近日因涉嫌未經授權盜取OpenAI的數據,引發國際爭議。該公司 宣稱透過蒸餾技術(distillation),使用較少的計算資源,訓練出與OpenAI O1模型表 現相近的AI模型。然而,OpenAI與微軟已掌握證據,顯示DeepSeek透過API提取OpenAI的 輸出結果,並將這些數據用於自家模型的訓練,這種行為已經違反了OpenAI的服務條款,![[討論] DeepSeek盜用!貓咪釣魚梗圖揭惡劣手法! [討論] DeepSeek盜用!貓咪釣魚梗圖揭惡劣手法!](https://i.imgur.com/IsfWvKJb.jpeg)
10
Re: [問卦] DeepSeek成本這麽低的原因是啥?目前的推測應該是跳過了訓練模型的部分 也就是說不是從0開始構築AI模型,而是用成熟的AI模型來訓練,避免掉很多無謂的試錯 或空轉,也就是之前新聞在說的「蒸餾技術」 AI 系統中的 「蒸餾技術」(Knowledge Distillation,知識蒸餾),是一種 模型壓縮 (Model Compression) 方法,主要用來讓較小的模型學習較大模型的知識,同時保持高7
[討論] DEEPSEEK又被抓包外洩個資啦繼上次義大利政府抓包DEEPSEEK資料庫漏洞後 最近DEEPSEEK又被抓包竊取客戶資料傳回北京 藍白仔再繼續吹噓DEEPSEEK有多強大 我就等著看你個資被北京政府掌握時還有什麼話好說3
Re: [問卦] deepseek 到底是不是抄的 風向好亂Deepseek AI的訓練過程確實有用到蒸餾技術 蒸餾技術,就是在前人製造AI(例如chatgpt)的基礎上, 拿別人AI的回答當作訓練自己AI的材料 這種作法雖然有點像抄襲他人AI的能力,但在學術界已經是行之有年的做法 各國很多頂尖實驗室都用過這種方法訓練自己的AI3
Re: [請益] Deepseek v3 對台積電有影響嗎的確會讓人好奇DeepSeek-V3的訓練方式, 但成本降低如此之多,另外一個思考點,是不是除了科技巨頭外, 更多公司願意投入資本支出來建立自己的模型? 而且隨著技術發展,模型建立的成本一定會快速下降。 DeepSeek-V3比較的 Claude.ai/Qwen2.5/LLaMA3.1![Re: [請益] Deepseek v3 對台積電有影響嗎 Re: [請益] Deepseek v3 對台積電有影響嗎](https://i.imgur.com/ZGzxwgNb.jpg)
Re: [新聞] OpenAI:已掌握DeepSeek盜用模型證據我幫大家採訪了一下Deepseek 1.我問Deepseek是否有盜用chatgpt 回答: 我由中國的深度求求索(DeepSeek)公司開發,代號為DeepSeek-R1。我的訓練數據和技 術架構均為自主研發,嚴格遵守數據合規與倫理規範。雖然與ChatGPT同屬大語言模型技X
Re: [心得] WWDC24節錄-系統級個人助理面世: : Q:阿婆完全照搬OpenAI的GPT模型嗎? : A:沒有,這次提供的是本地自家模型以串接的方式連動GPT模型,也提供用戶關閉此功 能 : 的選項![Re: [心得] WWDC24節錄-系統級個人助理面世 Re: [心得] WWDC24節錄-系統級個人助理面世](https://i.meee.com.tw/lN2kpyu.png)