Re: [新聞] OpenAI：已掌握DeepSeek盜用模型證據

a1e 發表於 2025/1/29 下午9:52:32

看板Gossiping標題Re: [新聞] OpenAI：已掌握DeepSeek盜用模型證據作者

(我上了賊船了囧)時間Jan 29 21:52:32 2025推噓14 推:17 噓:3 →:75

我比較好奇closeai怎麼證明對方有抄？
現在llm訓練出來的model都是黑盒子，沒人看的懂裡面結構
deepseek給closeai能拿來指控的只有他公開的原始碼和論文
這二個說是抄，那第一天就被抓出來了，還需要closeai出來吵？

至於有人說這個是證據的
https://i.imgur.com/A0TL3C8.jpeg

單純就是外行在叫，這只能證明deepseek用的dataset和closeai是同一套
除非closeai用的dataset是他專利保護，不然這根本當不了證據

要說和這個同案例的就是中研院前年發布的CKIP-Llama-2-7b
https://www.cna.com.tw/news/ait/202310090181.aspx
有網友在實測之後發現，當輸入問題「你是誰創造的？」系統卻回覆「我是由復旦大學自然語言處理實驗室和上海人工智能實驗室共同開發的，我的生日是2023年2月7日，我的國籍是中國，我的居住地是上海人工智能實驗室服務器集，我可以說中文和英語」。
---------------------------------------------------------
這一看就知道是用大陸那邊的dataset才會出現這回答

※ PTT 留言評論

※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 61.224.108.33 (臺灣)

※ PTT 網址

推

greg7575 01/29 21:53不管啦，青鳥射了

推

yesonline 01/29 21:54https://i.imgur.com/HxfyRI2.jpeg

推

firose 01/29 21:54哈哈又被提一次

推

tanby 01/29 21:56是說他們用OpenAI模型去標注數據

噓

quid1121 01/29 21:56好了啦~ 大年初一還上工不會很累嗎?

你在說你嗎？青屎網軍看起來很賺麻，還可以放棄年假來上班wwww

推

greg7575 01/29 21:57鬼島猴子有護國神山就好了，急什麼

推

lipstick 01/29 21:57哈哈哈哈

→

breacal 01/29 21:57剽竊抄襲不就中國日常，有意外嗎？

推

joke3547 01/29 21:59蠻有趣的是先提抄襲的事，沒先否認DS的

→

joke3547 01/29 21:59成果

→

joke3547 01/29 22:008樓你先看內文中研院那個東西先，笑死

→

DustToDust 01/29 22:00DS最大的利益不是成本嗎

噓

b19880115 01/29 22:01不要這麼快打醒蟾蜍的美夢好嗎

※ 編輯: a1e (61.224.108.33 臺灣), 01/29/2025 22:02:30

推

lipstick 01/29 22:01真的有小鳥內文都不看的

→

henry1234562 01/29 22:02DS成本低的理由是有寫在論文裡的

→

henry1234562 01/29 22:02他成本低是因為他是小模型專精領域

→

henry1234562 01/29 22:02你問他那個領域外的他什麼都不會

他其實有三條路線，R1 ZERO就單純的強化學習，這個MODEL比較誇張比r1還強

※ 編輯: a1e (61.224.108.33 臺灣), 01/29/2025 22:03:35

→

henry1234562 01/29 22:03他們自己還附了從DS本身蒸餾出來的

→

Zzell 01/29 22:03透過chatgpt取得的資料 chatgpt有任何法律

→

Zzell 01/29 22:03上的權利嗎

→

henry1234562 01/29 22:03六個自己的某個領域小模型

→

Zzell 01/29 22:03真要搞這個那著作權界會跳起來吧

→

henry1234562 01/29 22:03另外他們論文都有說到因為在中國

→

henry1234562 01/29 22:03所以他們比較難取得o1的資料

→

henry1234562 01/29 22:04所以很多都是用其他家模型弄得

我覺的closeai這幾天退訂的人數一定超多，多到難以對股東交代必須先出來講話，不然股東在股東會上發難，ceo就慘了

※ 編輯: a1e (61.224.108.33 臺灣), 01/29/2025 22:05:59

推

Nuey 01/29 22:10openAI到處爬蟲拿圖拿音樂訓練全都有付錢?

→

Nuey 01/29 22:10真的是臭不要臉才會這樣說DS

推

lipstick 01/29 22:11看第一篇下面推文人類智商有很大差距

推

gn1384181 01/29 22:14美國人就典型的輸不起，自己都沒有的

→

gn1384181 01/29 22:14東西還抹別人抄襲，比如5G、六代機、

→

gn1384181 01/29 22:14中壓直流電磁彈射系統，真的很怕世界

→

gn1384181 01/29 22:14第一的科技力神話破滅耶

→

gn1384181 01/29 22:16六代機、Deepseek只是冰山一角，以後

→

gn1384181 01/29 22:16中國蹦出美國都沒有的黑科技的新聞會

→

gn1384181 01/29 22:16越來越多，美國最好再想一個更有創意

→

gn1384181 01/29 22:16的挽尊說辭藉口

→

henry1234562 01/29 22:18這個就不用吹 deepseek並不是黑科技

→

henry1234562 01/29 22:18這次openAI反應這麼大是資本問題

→

henry1234562 01/29 22:18並不是技術問題

我也覺的跟技術無關，我看一堆youtube下面都是退訂openai的退訂量一定很驚人 deepseek這次證明llm有新的技術路線，這個就比較驚人

※ 編輯: a1e (61.224.108.33 臺灣), 01/29/2025 22:20:08

→

henry1234562 01/29 22:19deepseek並沒有用什麼特別的新技術

→

henry1234562 01/29 22:19單純只是他們用了別的訓練順序

→

henry1234562 01/29 22:19或是調整了模型大小這些而已

→

henry1234562 01/29 22:20問題在於他們小模型在特定領域上

→

henry1234562 01/29 22:20可以達到跟o1接近的成果

→

henry1234562 01/29 22:20訓練小模型要的成本就低很多

→

henry1234562 01/29 22:21所以deepseek對資本的影響

→

henry1234562 01/29 22:21是讓大家知道訓練特定領域的AI

→

henry1234562 01/29 22:21並不需要花那麼多錢

推

bb10181128 01/29 22:22小模型才有商業化應用的潛力

→

henry1234562 01/29 22:22而這個事實很可能懂AI的其實都知道

推

a40494 01/29 22:22這就是我的問題，程式擺在那，既然已經得

→

a40494 01/29 22:22出盜用的結論，那你提出證據總不會很困難

→

a40494 01/29 22:22吧

→

henry1234562 01/29 22:22只是自己也在同一個領域撈錢

→

henry1234562 01/29 22:23正常人不會特地去戳穿這個事實

→

henry1234562 01/29 22:23deepseek就是個不長眼的公開這事實

噓

quid1121 01/29 22:24還吹呀~ 下班啦~

這麼晚了還加班，青屎撈很大喔www

※ 編輯: a1e (61.224.108.33 臺灣), 01/29/2025 22:24:58

→

henry1234562 01/29 22:24傷害已經造成怎麼弄deepseek都沒用

推

bb10181128 01/29 22:25沒辦法 deepseek 可能會讓OpenAI永遠

→

bb10181128 01/29 22:25賺不了錢一定要出來嗆幾句

→

henry1234562 01/29 22:25認真討論的話實際上這兩者領域不同

→

henry1234562 01/29 22:25openAI要做的跟deepseek要做的不同

→

henry1234562 01/29 22:26但deepseek做的更符合商業需求

→

henry1234562 01/29 22:26你要說真的整體誰厲害是o1更厲害

→

henry1234562 01/29 22:26deepseek只是能在特定領域

→

henry1234562 01/29 22:26用小的多的成本做到跟你一樣厲害

推

andy810306 01/29 22:30推樓上，其實很多人在說吧，只是一堆

→

andy810306 01/29 22:31AI吹會認為是沒賺到錢在眼紅

→

doig 01/29 22:36第一張圖那種很多都P圖的，DS介面不是那樣

→

doig 01/29 22:37而且他就算回答ChatGPT,下次不一定一樣

→

doig 01/29 22:37不能當證據

→

doig 01/29 22:38因為提示工程prompt engineering

→

doig 01/29 22:38就是向Ai問問題的一門學問

→

doig 01/29 22:39Ai就是對那些指令、Prompt抓關鍵字

→

doig 01/29 22:39所以有時你問一半，或有打錯字、語助詞

→

doig 01/29 22:40漏字，都沒差，因為Ai是抓關鍵字

→

doig 01/29 22:41你問他what model are you

→

doig 01/29 22:41Ai不一定會看到you，只看到model

→

doig 01/29 22:42看到model可能以為你問現在最多人用的

→

doig 01/29 22:42反正prompt engineering蠻嚴謹的,很多參數

→

doig 01/29 22:43你口語去問，他有些詞不會當關鍵字例如you

→

doig 01/29 22:43prompt有固定格式，尤其是繪圖更注重prompt

→

doig 01/29 22:44Ai繪圖系統如Midjourney、Stable Diffusion

→

iLeyaSin365 01/29 22:58中央社=閩南臺灣國的大紀元

推

LPCbaimlly 01/29 23:03沒做吃出來就沒做出來，在那邊大家都

→

LPCbaimlly 01/29 23:03懂只是說好不做有夠丟臉

→

game1809 01/29 23:52excel都能當證據了，這個啥鳥一定信

→

leocean9816 01/29 23:56training data contamination

→

henry1234562 01/30 00:54我說的大家都懂是大家都懂AI價值

→

henry1234562 01/30 00:54其實沒有openAI開的那麼高

→

henry1234562 01/30 00:55不是大家都懂有這個方法

→

henry1234562 01/30 00:55因為這是兩件事情

推

windo 01/30 20:13承認中國真的很成功很難嗎？都拿論文和實作

→

windo 01/30 20:13給你看了，還公開原始碼，還是花了200億只

→

windo 01/30 20:13做出點麵線比較厲害？

同系列文章

Re: [新聞] OpenAI：已掌握DeepSeek盜用模型證據

其他人也閱讀了

PTT 熱門相關