PTT評價

Re: [新聞] OpenAI:已掌握DeepSeek盜用模型證據

看板Gossiping標題Re: [新聞] OpenAI:已掌握DeepSeek盜用模型證據作者
a1e
(我上了賊船了囧)
時間推噓14 推:17 噓:3 →:75

我比較好奇closeai怎麼證明對方有抄?
現在llm訓練出來的model都是黑盒子,沒人看的懂裡面結構
deepseek給closeai能拿來指控的只有他公開的原始碼和論文
這二個說是抄,那第一天就被抓出來了,還需要closeai出來吵?

至於有人說這個是證據的
https://i.imgur.com/A0TL3C8.jpeg

單純就是外行在叫,這只能證明deepseek用的dataset和closeai是同一套
除非closeai用的dataset是他專利保護,不然這根本當不了證據

要說和這個同案例的就是中研院前年發布的CKIP-Llama-2-7b
https://www.cna.com.tw/news/ait/202310090181.aspx
有網友在實測之後發現,當輸入問題「你是誰創造的?」系統卻回覆「我是由復旦大學自然語言處理實驗室和上海人工智能實驗室共同開發的,我的生日是2023年2月7日,我的國籍是中國,我的居住地是上海人工智能實驗室服務器集,我可以說中文和英語」。
---------------------------------------------------------
這一看就知道是用大陸那邊的dataset才會出現這回答

--

※ PTT 留言評論
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 61.224.108.33 (臺灣)
PTT 網址

greg7575 01/29 21:53不管啦,青鳥射了

yesonline 01/29 21:54https://i.imgur.com/HxfyRI2.jpeg

firose 01/29 21:54哈哈 又被提一次

tanby 01/29 21:56是說他們用OpenAI模型去標注數據

quid1121 01/29 21:56好了啦~ 大年初一還上工 不會很累嗎?

你在說你嗎?青屎網軍看起來很賺麻,還可以放棄年假來上班wwww

greg7575 01/29 21:57鬼島猴子有護國神山就好了,急什麼

lipstick 01/29 21:57哈哈哈哈

breacal 01/29 21:57剽竊抄襲不就中國日常,有意外嗎?

joke3547 01/29 21:59蠻有趣的是先提抄襲的事,沒先否認DS的

joke3547 01/29 21:59成果

joke3547 01/29 22:008樓你先看內文中研院那個東西先,笑死

DustToDust 01/29 22:00DS最大的利益不是成本嗎

b19880115 01/29 22:01不要這麼快打醒蟾蜍的美夢好嗎

※ 編輯: a1e (61.224.108.33 臺灣), 01/29/2025 22:02:30

lipstick 01/29 22:01真的有小鳥內文都不看的

henry1234562 01/29 22:02DS成本低的理由是有寫在論文裡的

henry1234562 01/29 22:02他成本低是因為他是小模型 專精領域

henry1234562 01/29 22:02你問他那個領域外的他什麼都不會

他其實有三條路線,R1 ZERO就單純的強化學習,這個MODEL比較誇張 比r1還強

※ 編輯: a1e (61.224.108.33 臺灣), 01/29/2025 22:03:35

henry1234562 01/29 22:03他們自己還附了從DS本身蒸餾出來的

Zzell 01/29 22:03透過chatgpt取得的資料 chatgpt有任何法律

Zzell 01/29 22:03上的權利嗎

henry1234562 01/29 22:03六個自己的某個領域小模型

Zzell 01/29 22:03真要搞這個那著作權界會跳起來吧

henry1234562 01/29 22:03另外他們論文都有說到 因為在中國

henry1234562 01/29 22:03所以他們比較難取得o1的資料

henry1234562 01/29 22:04所以很多都是用其他家模型弄得

我覺的closeai這幾天退訂的人數一定超多,多到難以對股東交代 必須先出來講話,不然股東在股東會上發難,ceo就慘了

※ 編輯: a1e (61.224.108.33 臺灣), 01/29/2025 22:05:59

Nuey 01/29 22:10openAI到處爬蟲拿圖拿音樂訓練全都有付錢?

Nuey 01/29 22:10真的是臭不要臉才會這樣說DS

lipstick 01/29 22:11看第一篇下面推文 人類智商有很大差距

gn1384181 01/29 22:14美國人就典型的輸不起,自己都沒有的

gn1384181 01/29 22:14東西還抹別人抄襲,比如5G、六代機、

gn1384181 01/29 22:14中壓直流電磁彈射系統,真的很怕世界

gn1384181 01/29 22:14第一的科技力神話破滅耶

gn1384181 01/29 22:16六代機、Deepseek只是冰山一角,以後

gn1384181 01/29 22:16中國蹦出美國都沒有的黑科技的新聞會

gn1384181 01/29 22:16越來越多,美國最好再想一個更有創意

gn1384181 01/29 22:16的挽尊說辭藉口

henry1234562 01/29 22:18這個就不用吹 deepseek並不是黑科技

henry1234562 01/29 22:18這次openAI反應這麼大 是資本問題

henry1234562 01/29 22:18並不是技術問題

我也覺的跟技術無關,我看一堆youtube下面都是退訂openai的 退訂量一定很驚人 deepseek這次證明llm有新的技術路線,這個就比較驚人

※ 編輯: a1e (61.224.108.33 臺灣), 01/29/2025 22:20:08

henry1234562 01/29 22:19deepseek並沒有用什麼特別的新技術

henry1234562 01/29 22:19單純只是他們用了別的訓練順序

henry1234562 01/29 22:19或是調整了模型大小這些而已

henry1234562 01/29 22:20問題在於他們小模型在特定領域上

henry1234562 01/29 22:20可以達到跟o1接近的成果

henry1234562 01/29 22:20訓練小模型要的成本就低很多

henry1234562 01/29 22:21所以deepseek對資本的影響

henry1234562 01/29 22:21是 讓大家知道 訓練特定領域的AI

henry1234562 01/29 22:21並不需要花那麼多錢

bb10181128 01/29 22:22小模型才有商業化應用的潛力

henry1234562 01/29 22:22而這個事實很可能懂AI的其實都知道

a40494 01/29 22:22這就是我的問題,程式擺在那,既然已經得

a40494 01/29 22:22出盜用的結論,那你提出證據總不會很困難

a40494 01/29 22:22

henry1234562 01/29 22:22只是自己也在同一個領域撈錢

henry1234562 01/29 22:23正常人不會特地去戳穿這個事實

henry1234562 01/29 22:23deepseek就是個不長眼的公開這事實

quid1121 01/29 22:24還吹呀~ 下班啦~

這麼晚了還加班,青屎撈很大喔www

※ 編輯: a1e (61.224.108.33 臺灣), 01/29/2025 22:24:58

henry1234562 01/29 22:24傷害已經造成 怎麼弄deepseek都沒用

bb10181128 01/29 22:25沒辦法 deepseek 可能會讓OpenAI永遠

bb10181128 01/29 22:25賺不了錢 一定要出來嗆幾句

henry1234562 01/29 22:25認真討論的話 實際上這兩者領域不同

henry1234562 01/29 22:25openAI要做的跟deepseek要做的不同

henry1234562 01/29 22:26但deepseek做的更符合商業需求

henry1234562 01/29 22:26你要說真的整體誰厲害 是o1更厲害

henry1234562 01/29 22:26deepseek只是能在特定領域

henry1234562 01/29 22:26用小的多的成本做到跟你一樣厲害

andy810306 01/29 22:30推樓上,其實很多人在說吧,只是一堆

andy810306 01/29 22:31AI吹會認為是沒賺到錢在眼紅

doig 01/29 22:36第一張圖那種很多都P圖的,DS介面不是那樣

doig 01/29 22:37而且他就算回答ChatGPT,下次不一定一樣

doig 01/29 22:37不能當證據

doig 01/29 22:38因為提示工程prompt engineering

doig 01/29 22:38就是向Ai問問題的一門學問

doig 01/29 22:39Ai就是對那些指令、Prompt抓關鍵字

doig 01/29 22:39所以有時你問一半,或有打錯字、語助詞

doig 01/29 22:40漏字,都沒差,因為Ai是抓關鍵字

doig 01/29 22:41你問他what model are you

doig 01/29 22:41Ai不一定會看到you,只看到model

doig 01/29 22:42看到model可能以為你問現在最多人用的

doig 01/29 22:42反正prompt engineering蠻嚴謹的,很多參數

doig 01/29 22:43你口語去問,他有些詞不會當關鍵字例如you

doig 01/29 22:43prompt有固定格式,尤其是繪圖更注重prompt

doig 01/29 22:44Ai繪圖系統如Midjourney、Stable Diffusion

iLeyaSin365 01/29 22:58中央社=閩南臺灣國的大紀元

LPCbaimlly 01/29 23:03沒做吃出來就沒做出來,在那邊大家都

LPCbaimlly 01/29 23:03懂只是說好不做有夠丟臉

game1809 01/29 23:52excel都能當證據了,這個啥鳥一定信

leocean9816 01/29 23:56training data contamination

henry1234562 01/30 00:54我說的大家都懂 是大家都懂AI價值

henry1234562 01/30 00:54其實沒有openAI開的那麼高

henry1234562 01/30 00:55不是大家都懂有這個方法

henry1234562 01/30 00:55因為這是兩件事情

windo 01/30 20:13承認中國真的很成功很難嗎?都拿論文和實作

windo 01/30 20:13給你看了,還公開原始碼,還是花了200億只

windo 01/30 20:13做出點麵線比較厲害?