PTT評價

Re: [新聞] OpenAI:已掌握DeepSeek盜用模型證據

看板HatePolitics標題Re: [新聞] OpenAI:已掌握DeepSeek盜用模型證據作者
treasurehill
(寶藏巖公社,你還未夠班S)
時間推噓 8 推:9 噓:1 →:3

其實這種抓取他人數據再行訓練行為絕對是違法的

就連中國自己的人民法院判決都認為這種盜用他人網站數據的行為構成不正競爭

我是不知道一旦追訴起來,中國還有什麼臉面對美方的指控

這鐵定會成為下一波貿易制裁的主要爭點

http://yn.people.com.cn/BIG5/n2/2022/0330/c361322-35199254.html

法院經審理認為,原告主張權利的5萬余條用戶投訴信息系經過長期經營、管理、維護而形成的數據信息,能夠給原告帶來特定的社會效益和經濟效益,屬於其市場競爭優勢,應當受到法律保護。被告在其網站中使用原告網站5萬余條投訴信息的行為,本質上是不正當利用原告網站投訴信息、違法將該信息據為己有的行為,違反了誠實信用原則和公認的商業道德,給原告造成了實際損失,應當適用反不正當競爭法一般條款予以規制。此外,被告在其網站虛構投訴數量及處理進展等行為,容易造成相關公眾對其網站經營規模、影響力、服務效率產生誤認,亦構成虛假宣傳的不正當競爭行為。最終,法院判決被告停止涉案不正當競爭行為、消除影響,並賠償原告105萬元。


而且就算在法律上的追訴行為無效,擁有數據所有權者也不是沒有反制的方法

他只要在輸出的數據上加上隱密的干擾訊息即可

這樣就會嚴重影響直接抓取數據來進行訓練者的訓練結果的正確性

這招在之前的商業資料庫就常常被使用

不管是明碼或浮水印都可為數位識別的足跡追蹤

在AI時代更可以用此手段來干擾抓取資料者的訓練成果

讓他GIGO

別別這種蒸鰡效果是基於原有資料的基礎上加工

如果原本的資料無法回答的問題

蒸鰡出來的結果也不可能超越

所以這種抄襲手法最多只有短期功效,長期來說是不可能超越數據擁有者的

頂多滿足一下民族自信心而已


※ 引述《VXcc (挖靠是逆風)》之銘言:
: https://imgur.com/7jQICgp
: Deepseek主打就是蒸餾法,就是高效的AI抄襲工具
: 哥爾D系柯 不只要抄,還要開源
: 開起來大抄襲時代
: 人人有600萬就能參加慈善AI抄襲大賽
: 目的也很簡單就是對付美國的AI封殺
: 一來減少對硬體的需求
: 二讓認真發展算力的AI都像個白癡,人人都可以抄
: 投入再多,輕輕鬆鬆就能被學走8成功力,減少投資者繼續投資的意願
: 美國都封鎖中國的AI發展,你覺得他會在意抄不抄嗎

--

※ PTT 留言評論
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 42.70.83.123 (臺灣)
PTT 網址
※ 編輯: treasurehill (42.70.83.123 臺灣), 01/30/2025 12:17:00

lono 01/30 12:17別胡扯

胡扯的人是你吧! hiQ Labs, Inc. v. LinkedIn Corp.,938 F.3d 985(第九巡迴法院,2019 年),是美 國第九巡迴法院的一起關於網路抓取的案件。 hiQ 是一家小型數據分析公司,使用自動 化機器人從公共 LinkedIn 個人資料中抓取資訊。 LinkedIn使用法律手段來阻止這種情 況發生。 hiQ Labs 在地方法院對 LinkedIn 提起訴訟,尋求禁止這些手段的禁令,並獲 得批准。領英提出上訴。第九巡迴法院維持了地區法院的初步禁令,阻止LinkedIn拒絕原 告 hiQ Labs 訪問 LinkedIn 公開的 LinkedIn 會員資料。然而,在另一家法院進一步上 訴後,hiQ 被發現違反了 LinkedIn 的條款,並達成和解。 第九巡迴法院裁定 hiQ 有權進行網路擷取。然而,最高法院根據其 Van Buren 訴美國案的裁決,於2021 年6 月撤銷了該裁決並將案件發回重審。次裁 決中第九巡迴法院維持了其決定。2022年11月,美國加州北區地方法院裁定 hiQ違反了LinkedIn的使用者協議,雙方達成和解協議。 美聯社訴 Meltwater US Holdings, Inc.(SDNY,2013 年 3 月 21 日)是一個地區法院 案件,美聯社(AP) 對美國Meltwater 集團(Meltwater)提起訴訟,指控其剪輯和分享侵犯 版權的新聞項目,並紐約普通法下的熱門新聞」挪用行為。在簡易判決的交叉動議中, Meltwater 辯稱,根據合理使用的要求,他們沒有侵權。 Meltwater 聲稱他們的服務具 有變革性,因此不侵犯版權。法院認為 Meltwater 的複製行為不受合理使用原則的保護 ,並且侵犯了美聯社的版權。 然而,2013 年,英國最高法院以相同理由提起的一個平行案件以另一種方式做出了裁決 (對 Meltwater 有利,對同等的報紙許可業務不利),但須接受歐洲法院提交的問題並 旨在澄清跨境性質的問題。

abc12812 01/30 12:17笑死openai自己偷別人數據偷最兇

abc12812 01/30 12:18被告幾個侵犯版權官司了 好意思抱怨?

ok771105 01/30 12:20告的贏再說

這是中國人民法院自己的判決喔! 原告北京某信息技術有限公司訴稱,其運營的某網站主要服務汽車消費者投訴受理,消費 者在網站提交針對汽車質量問題的投訴后,網站會與汽車廠商聯系並督促解決。自2014年 成立以來,該網站已累計處理了約39萬條消費者投訴信息,建立起了包括消費者投訴處理 、汽車產品缺陷問題檢測等為一體的服務體系。   2021年6月,原告發現,被告北京某公司運營的網站中有52000余條消費者投訴信息與 原告網站展示的信息相同或者近似,且投訴日期均晚於或等同於原告網站上的日期,部分

投訴信息的附圖中甚至還帶有原告水印。此外,被告網站顯示的投訴編號數量超過11萬, 但無處於該網站投訴流程中“完成”狀態的投訴信息,原告認為,被告網站的投訴數量及 處理進展均為虛構。原告遂將被告訴至法院。

  法院經審理認為,原告主張權利的5萬余條用戶投訴信息系經過長期經營、管理、維 護而形成的數據信息,能夠給原告帶來特定的社會效益和經濟效益,屬於其市場競爭優勢 ,應當受到法律保護。

被告在其網站中使用原告網站5萬余條投訴信息的行為,本質上是 不正當利用原告網站投訴信息、違法將該信息據為己有的行為,違反了誠實信用原則和公 認的商業道德,給原告造成了實際損失,應當適用反不正當競爭法一般條款予以規制。此 外,被告在其網站虛構投訴數量及處理進展等行為,容易造成相關公眾對其網站經營規模 、影響力、服務效率產生誤認,亦構成虛假宣傳的不正當競爭行為。最終,法院判決被告 停止涉案不正當競爭行為、消除影響,並賠償原告105萬元。

※ 編輯: treasurehill (42.70.83.123 臺灣), 01/30/2025 12:24:14

Xceberus 01/30 12:23一樓又在搞笑了

※ 編輯: treasurehill (42.70.83.123 臺灣), 01/30/2025 12:28:43

shoeii 01/30 12:28一樓翁曉玲法學學派 不要太意外

frozenmoon 01/30 12:29

s952013 01/30 12:29照這說法GPT搜資料本身也犯法了

※ 編輯: treasurehill (42.70.83.123 臺灣), 01/30/2025 12:31:16

langeo 01/30 12:31這就漢芯2.0阿 支那最常見的抄襲手法

indium111 01/30 12:36中國人就是愛抄襲,然後吹自己超厲害

yoriniyote 01/30 12:40為何藍白紅壯世代都能搶頭香?

lbowlbow 01/30 13:14因為支那網軍有設關鍵字啊

Finarfin 01/30 16:28中國人又在崩潰了