PTT評價

Re: [新聞] OpenAI:已掌握DeepSeek盜用模型證據

看板HatePolitics標題Re: [新聞] OpenAI:已掌握DeepSeek盜用模型證據作者
lono
(lono)
時間推噓 X 推:1 噓:9 →:30

你發這種文章
大陸人就知道這裡是井蛙版了

: 別別這種蒸鰡效果是基於原有資料的基礎上加工
: 如果原本的資料無法回答的問題
: 蒸鰡出來的結果也不可能

https://i.imgur.com/Hq1Xx9m.jpeg

圖 OpenAI:已掌握DeepSeek盜用模型證據

事實上DeekSeek在某些項目的表現超過openai的產品

: : Deepseek主打就是蒸餾法,就是高效的AI抄襲工具

蒸餾法老早就有了
為什麼現在效能突飛猛進呢?

Deepseek對於記憶體運用效率做了額外的改良

根據外媒的報導,他們在短短兩個月時間,在2,048個H800 GPU叢集上,訓出6710億參數的MoE語言模型,比頂尖AI效率高出10倍。

這項突破不是用CUDA實現的,而是通過大量細粒度最佳化以及使用輝達的類彙編等級的PTX(平行執行緒執行)程式設計。

https://hao.cnyes.com/post/133219

你可以先查資料再發文嗎?


※ 引述《treasurehill (寶藏巖公社,你還未夠班S)》之銘言:
: 其實這種抓取他人數據再行訓練行為絕對是違法的
: 就連中國自己的人民法院判決都認為這種盜用他人網站數據的行為構成不正競爭
: 我是不知道一旦追訴起來,中國還有什麼臉面對美方的指控
: 這鐵定會成為下一波貿易制裁的主要爭點
: http://yn.people.com.cn/BIG5/n2/2022/0330/c361322-35199254.html
: 法院經審理認為,原告主張權利的5萬余條用戶投訴信息系經過長期經營、管理、維護

: 形成的數據信息,能夠給原告帶來特定的社會效益和經濟效益,屬於其市場競爭優勢,
: 當受到法律保護。被告在其網站中使用原告網站5萬余條投訴信息的行為,本質上是不
: 當利用原告網站投訴信息、違法將該信息據為己有的行為,違反了誠實信用原則和公認
: 商業道德,給原告造成了實際損失,應當適用反不正當競爭法一般條款予以規制。此外
: 被告在其網站虛構投訴數量及處理進展等行為,容易造成相關公眾對其網站經營規模、
: 響力、服務效率產生誤認,亦構成虛假宣傳的不正當競爭行為。最終,法院判決被告停
: 涉案不正當競爭行為、消除影響,並賠償原告105萬元。
: 而且就算在法律上的追訴行為無效,擁有數據所有權者也不是沒有反制的方法
: 他只要在輸出的數據上加上隱密的干擾訊息即可
: 這樣就會嚴重影響直接抓取數據來進行訓練者的訓練結果的正確性
: 這招在之前的商業資料庫就常常被使用
: 不管是明碼或浮水印都可為數位識別的足跡追蹤
: 在AI時代更可以用此手段來干擾抓取資料者的訓練成果
: 讓他GIGO
: 別別這種蒸鰡效果是基於原有資料的基礎上加工
: 如果原本的資料無法回答的問題
: 蒸鰡出來的結果也不可能超越
: 所以這種抄襲手法最多只有短期功效,長期來說是不可能超越數據擁有者的
: 頂多滿足一下民族自信心而已
: ※ 引述《VXcc (挖靠是逆風)》之銘言:
: : https://imgur.com/7jQICgp
: : Deepseek主打就是蒸餾法,就是高效的AI抄襲工具
: : 哥爾D系柯 不只要抄,還要開源
: : 開起來大抄襲時代
: : 人人有600萬就能參加慈善AI抄襲大賽
: : 目的也很簡單就是對付美國的AI封殺
: : 一來減少對硬體的需求
: : 二讓認真發展算力的AI都像個白癡,人人都可以抄
: : 投入再多,輕輕鬆鬆就能被學走8成功力,減少投資者繼續投資的意願
: : 美國都封鎖中國的AI發展,你覺得他會在意抄不抄嗎

--

※ PTT 留言評論
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 1.200.32.105 (臺灣)
PTT 網址

Berotec 01/30 12:32又在刷benchmark了 支那跑分仔沒別招

你這句拿來臭黃仁勳爸爸也可以

fdtu0928 01/30 12:33所以這樣厲害的發明,應該開個全球記者

fdtu0928 01/30 12:33會廣為宣傳吧?人呢?

如果沒宣傳 我們怎麼會知道這件事? 這家公司研發AI很久了 現在他們的宣傳部門總算開始動了

※ 編輯: lono (1.200.32.105 臺灣), 01/30/2025 12:35:25

jackie0414 01/30 12:34好的

markban 01/30 12:34美國已經宣布要查偷買了

怎麼查?去問Deepseek員工他們公司的晶片序號?

Berotec 01/30 12:36老黃刷benchmark?笑死

你肯定沒在打電動

※ 編輯: lono (1.200.32.105 臺灣), 01/30/2025 12:38:57

Xceberus 01/30 12:37不懂就別出來丟你媽的臉啦

derekhsu 01/30 12:37你不要嘗試對政黑這些AI白痴溝通

derekhsu 01/30 12:38他們連論文的一個字都沒看過

derekhsu 01/30 12:38更不要說用Ollama下載去嘗試比較

boogieman 01/30 12:38你先去查一下openAI的使用規範允不允

boogieman 01/30 12:38許蒸餾吧阿娘威 不懂也好意思出來洗地

mitsloanboy 01/30 12:39笑死,我理組民進黨支持者,看到政

mitsloanboy 01/30 12:39黑一堆文組白痴真的是覺得汗顏,政

mitsloanboy 01/30 12:39治偏激極端起來,無論藍綠白都會較

mitsloanboy 01/30 12:39低智商啦哈哈

derekhsu 01/30 12:39DeepSeek是真的他們的世界會崩潰

derekhsu 01/30 12:39蒸餾不可能做出達到同等效果的模型

boogieman 01/30 12:40derekhsu你連使用者協議都看不懂 好意

boogieman 01/30 12:40思說論文?

使用者協議有屁用 一堆AI模型都說自己是ChatGPT

derekhsu 01/30 12:40我已經說了,黑箱蒸餾是不可能用小模型

derekhsu 01/30 12:41作到跟原始模型一樣的水準的

boogieman 01/30 12:41https://infosecu.technews.tw/2025/0

boogieman 01/30 12:411/29/microsoft-and-openai-are-inves

boogieman 01/30 12:41tigating-the-possible-unauthorized-

boogieman 01/30 12:41use-of-data-from-deepseek/

JoJo2330 01/30 12:41就算我信也沒用啊,我只是個小散散而已

JoJo2330 01/30 12:42你們要去洗主力的腦才對啊。主力又不來

derekhsu 01/30 12:42你會查使用條款,你知道OpenAI使用條款

derekhsu 01/30 12:42只能保留30天歷史資料嗎?

derekhsu 01/30 12:43他要拿什麼log去查30天前的使用紀錄?

JoJo2330 01/30 12:43政黑玩。主力都在小柯版股版同溫層玩。

boogieman 01/30 12:44https://i.imgur.com/fDe92lW.jpeg

JoJo2330 01/30 12:44小柯版不聊政治,主力說什麼他們都信,

JoJo2330 01/30 12:44超好薛的。

Berotec 01/30 12:48老子沒在打電動 幹我肚子痛 笑死

有哪家廠商不會針對benchmark優化的?

※ 編輯: lono (1.200.32.105 臺灣), 01/30/2025 12:50:58

Berotec 01/30 12:56只有廢物小廠才在跟你玩跑分遊戲

William 01/30 12:58手機soc每家都在玩跑分遊戲..原來都是小

William 01/30 12:58廠..

Berotec 01/30 13:21對啊只能拿跑分出來講 實際一坨的都小廠