Re: [新聞] OpenAI:已掌握DeepSeek盜用模型證據
你發這種文章
大陸人就知道這裡是井蛙版了
: 別別這種蒸鰡效果是基於原有資料的基礎上加工
: 如果原本的資料無法回答的問題
: 蒸鰡出來的結果也不可能
https://i.imgur.com/Hq1Xx9m.jpeg

事實上DeekSeek在某些項目的表現超過openai的產品
: : Deepseek主打就是蒸餾法,就是高效的AI抄襲工具
蒸餾法老早就有了
為什麼現在效能突飛猛進呢?
Deepseek對於記憶體運用效率做了額外的改良
根據外媒的報導,他們在短短兩個月時間,在2,048個H800 GPU叢集上,訓出6710億參數的MoE語言模型,比頂尖AI效率高出10倍。
這項突破不是用CUDA實現的,而是通過大量細粒度最佳化以及使用輝達的類彙編等級的PTX(平行執行緒執行)程式設計。
https://hao.cnyes.com/post/133219
你可以先查資料再發文嗎?
※ 引述《treasurehill (寶藏巖公社,你還未夠班S)》之銘言:
: 其實這種抓取他人數據再行訓練行為絕對是違法的
: 就連中國自己的人民法院判決都認為這種盜用他人網站數據的行為構成不正競爭
: 我是不知道一旦追訴起來,中國還有什麼臉面對美方的指控
: 這鐵定會成為下一波貿易制裁的主要爭點
: http://yn.people.com.cn/BIG5/n2/2022/0330/c361322-35199254.html
: 法院經審理認為,原告主張權利的5萬余條用戶投訴信息系經過長期經營、管理、維護而
: 形成的數據信息,能夠給原告帶來特定的社會效益和經濟效益,屬於其市場競爭優勢,應
: 當受到法律保護。被告在其網站中使用原告網站5萬余條投訴信息的行為,本質上是不正
: 當利用原告網站投訴信息、違法將該信息據為己有的行為,違反了誠實信用原則和公認的
: 商業道德,給原告造成了實際損失,應當適用反不正當競爭法一般條款予以規制。此外,
: 被告在其網站虛構投訴數量及處理進展等行為,容易造成相關公眾對其網站經營規模、影
: 響力、服務效率產生誤認,亦構成虛假宣傳的不正當競爭行為。最終,法院判決被告停止
: 涉案不正當競爭行為、消除影響,並賠償原告105萬元。
: 而且就算在法律上的追訴行為無效,擁有數據所有權者也不是沒有反制的方法
: 他只要在輸出的數據上加上隱密的干擾訊息即可
: 這樣就會嚴重影響直接抓取數據來進行訓練者的訓練結果的正確性
: 這招在之前的商業資料庫就常常被使用
: 不管是明碼或浮水印都可為數位識別的足跡追蹤
: 在AI時代更可以用此手段來干擾抓取資料者的訓練成果
: 讓他GIGO
: 別別這種蒸鰡效果是基於原有資料的基礎上加工
: 如果原本的資料無法回答的問題
: 蒸鰡出來的結果也不可能超越
: 所以這種抄襲手法最多只有短期功效,長期來說是不可能超越數據擁有者的
: 頂多滿足一下民族自信心而已
: ※ 引述《VXcc (挖靠是逆風)》之銘言:
: : https://imgur.com/7jQICgp
: : Deepseek主打就是蒸餾法,就是高效的AI抄襲工具
: : 哥爾D系柯 不只要抄,還要開源
: : 開起來大抄襲時代
: : 人人有600萬就能參加慈善AI抄襲大賽
: : 目的也很簡單就是對付美國的AI封殺
: : 一來減少對硬體的需求
: : 二讓認真發展算力的AI都像個白癡,人人都可以抄
: : 投入再多,輕輕鬆鬆就能被學走8成功力,減少投資者繼續投資的意願
: : 美國都封鎖中國的AI發展,你覺得他會在意抄不抄嗎
--
又在刷benchmark了 支那跑分仔沒別招
你這句拿來臭黃仁勳爸爸也可以
所以這樣厲害的發明,應該開個全球記者
會廣為宣傳吧?人呢?
如果沒宣傳 我們怎麼會知道這件事? 這家公司研發AI很久了 現在他們的宣傳部門總算開始動了
※ 編輯: lono (1.200.32.105 臺灣), 01/30/2025 12:35:25好的
美國已經宣布要查偷買了
怎麼查?去問Deepseek員工他們公司的晶片序號?
老黃刷benchmark?笑死
你肯定沒在打電動
※ 編輯: lono (1.200.32.105 臺灣), 01/30/2025 12:38:57不懂就別出來丟你媽的臉啦
你不要嘗試對政黑這些AI白痴溝通
他們連論文的一個字都沒看過
更不要說用Ollama下載去嘗試比較
你先去查一下openAI的使用規範允不允
許蒸餾吧阿娘威 不懂也好意思出來洗地
笑死,我理組民進黨支持者,看到政
黑一堆文組白痴真的是覺得汗顏,政
治偏激極端起來,無論藍綠白都會較
低智商啦哈哈
DeepSeek是真的他們的世界會崩潰
蒸餾不可能做出達到同等效果的模型
derekhsu你連使用者協議都看不懂 好意
思說論文?
使用者協議有屁用 一堆AI模型都說自己是ChatGPT
我已經說了,黑箱蒸餾是不可能用小模型
作到跟原始模型一樣的水準的
1/29/microsoft-and-openai-are-inves
tigating-the-possible-unauthorized-
use-of-data-from-deepseek/
就算我信也沒用啊,我只是個小散散而已
你們要去洗主力的腦才對啊。主力又不來
你會查使用條款,你知道OpenAI使用條款
只能保留30天歷史資料嗎?
他要拿什麼log去查30天前的使用紀錄?
政黑玩。主力都在小柯版股版同溫層玩。
小柯版不聊政治,主力說什麼他們都信,
超好薛的。
老子沒在打電動 幹我肚子痛 笑死
有哪家廠商不會針對benchmark優化的?
※ 編輯: lono (1.200.32.105 臺灣), 01/30/2025 12:50:58只有廢物小廠才在跟你玩跑分遊戲
手機soc每家都在玩跑分遊戲..原來都是小
廠..
對啊只能拿跑分出來講 實際一坨的都小廠
X
開始了 正如預期的 美國佬就是見不得別人比他們優秀 用自己狹隘的見識來否定他人 只要別人比他們優秀就會用屁眼看人X
一天前,綠共閩南台派 還處於挨打的狀態 猶如黑悟空甫推出的幾天那時的情景 八卦版還可以光明正大的質疑: 為什麼中國不自由卻做得出3A? 外國看起來黑神話也引起轟動!?X
Open AI真的提出了證據再說,而且我比較好奇的是,本來我以為Open AI第一時間應該會 出面駁斥的是DeepSeek訓練成本不可能這麼低的事,結果竟然是在指控對方盜用模型。 說真的,對於世界上廣大的公司來說,比較關心的事是否真的能用那麼低的成本來建構出 一樣的東西,如果可以,那麼之前要耗費大筆金錢再搞AI的公司不就是傻子? 到底Open AI骨子裏是知道事實的(就是本來成本就不用這麼多),又或者DeepSeek宣稱20
Deepseek主打就是蒸餾法,就是高效的AI抄襲工具 哥爾D系柯 不只要抄,還要開源 開起來大抄襲時代 人人有600萬就能參加慈善AI抄襲大賽8
其實這種抓取他人數據再行訓練行為絕對是違法的 就連中國自己的人民法院判決都認為這種盜用他人網站數據的行為構成不正競爭 我是不知道一旦追訴起來,中國還有什麼臉面對美方的指控 這鐵定會成為下一波貿易制裁的主要爭點3
笑死!你這資訊門外漢就別在這耍寶自曝其短了! 我從來就沒有跟你爭論效率的問題 我爭論的是資料來源的正確性 蒸鰡模型是基於原有模型的再訓練 也就說他繼承原有模型的瑕疵2
推 skyyo: 這篇雙方都很專業了 想不到綠色濾鏡可以影 27.247.1.211 01/30 14:54 → skyyo: 響這麼大@@ 27.247.1.211 01/30 14:54 → skyyo: 其實應該要問寶藏巖你覺得你的綠共友們說 27.247.1.211 01/30 14:55 → skyyo: 問不到64+用了蒸餾就是垃圾AI 27.247.1.211 01/30 14:55 → skyyo: 這種觀點的看法 嘻嘻 27.247.1.211 01/30 14:552
→ William: 現代ML跟混沌有關?也太亂套了... 223.137.83.145 01/30 15:55 → William: 還有deepseek的實作就不是你想像的用同 223.137.83.145 01/30 15:59 → William: 一份資料重複學習.. 223.137.83.145 01/30 15:59 → William: deepseek r1跟你的論文的實作就不同..先 223.137.83.145 01/30 16:13 → William: 去看過deepseek的論文再來討論.. 223.137.83.145 01/30 16:13
57
Re: [討論] 其實Deepseek真的很厲害了OpenAI:已掌握DeepSeek盜用模型證據 (中央社倫敦29日綜合外電報導)中國新創公司「深度求索」(DeepSeek)引發的疑慮日 增。OpenAI今天表示已掌握證據,顯示DeepSeek盜用其模型進行開發;業界也指DeepSeek 握有大量輝達H100高階晶片,形同直接挑戰美國出口管制規定。44
Re: [新聞] OpenAI:已掌握DeepSeek盜用模型證據比較好奇這段: 儘管蒸餾是AI業界常見做法,但DeepSeek若利用蒸餾技術來打造自家模型,並與OpenAI競 爭,將違反OpenAI服務條款,因此產生疑慮。 OpenAI婉拒進一步說明或提供證據細節。根據該公司的服務條款,用戶不得「複製」任何 OpenAI的服務,或是「利用輸出結果,來開發與OpenAI競爭的模型」。 各個ai 大語言模型不是都會互相參照比較和訓練嗎? 我以為這是業界常識…47
[討論] Deepseek就之前吹過頭了呀 XD來看看DEEPSEEK之前怎麼吹的 「DeepSeek R1的問世,宣告AI訓練與推理成本大幅縮減,在不到600萬美元的極低投入成本 和2048塊性能遠低於H100與Blackwell的H800芯片條件下,DeepSeek團隊打造出性能堪比Ope nAI o1的開源AI模型,相比之下Anthropic與OpenAI訓練成本高達10億美元。該模型每百萬 個token的查詢成本僅爲0.14美元,而OpenAI的成本爲7.50美元,成本降幅高達驚人的98%。16
[情報] DeepSeek繞過CUDA 自己優化底層編程語言關於DeepSeek的優化改進 許多人沒注意到的是: DeepSeek也繞過了CUDA並使用底層編程語言PTX做優化 在輝達的PTX語言實際編譯流程中18
Re: [新聞] DeepSeek 遇大規模網路攻擊,暫時只支援Musk贊同投資公司Atreides Management合夥人兼資訊長貝克(Gavin Baker)在X提到 DeepSeek的R1低成本來自在訓練和推理效率上,取得了真正的算法突破 例如 FP8 訓練、MLA(機器學習加速)和多 token 預測。 訓練過程中涉及大量的知識蒸餾(distillation) 這意味著在沒有無限制存取 GPT-4o 和 o1 的情況下,這項訓練幾乎不可能完成。4
[問卦]DeepSeek是不是台積電的救世主?[問卦] DeepSeek是不是台積電的救世主? 最近看到DeepSeek在那邊吹什麼MLA架構、MoE模型,說什麼訓練效率超高、推理速度超快 ,笑死,還不是靠台積電的5nm、3nm製程在撐?沒了GG的晶片,你這些所謂的「創新」還 能跑得動? DeepSeek這種吃硬體怪獸,光是訓練一個模型就要幾萬顆A100、H100,這些GPU還不都是4
Re: [新聞] OpenAI:已掌握DeepSeek盜用模型證據這裡的說法如果是正確的話,那DeepSeek就不是只靠蒸餾來達成的. Scale AI’s 28-Year-Old Billionaire CEO Warns About This Scarily Good Chinese Startup 這個CEO就是指控DeepSeek事實上擁有並使用50000個H100 GPU的人.1
Re: [新聞] OpenAI:已掌握DeepSeek盜用模型證據前文恕刪 : 看到這東西,反正是開源的,程式碼都攤開在那邊給你看 : 應該是要想著怎麼去利用,而不是討論中/美或成最大贏家嗎? : 怎麼搞到變成政治意識形態的爭執了? : 有些推文一直扯到超導體,我就不懂有什麼可比性...- Deepseek目前是有同時釋出開源模型(權重、Code、訓練模型的方法報告都開源)的,走跟 llama一樣的路線,所以理論上只要GPU卡夠你就可以建一個完全一樣的環境包含重新微調模 型讓DeepSeek 做瑟瑟的事情跟串接對話還有Agent去執行任務。 目前初步測試繁中能力真的屌打一堆拿喇嘛微調的台灣llama模型,重點是MoE的架構可以很 省GPU(如果是llama同精度需要32張H100卡才能佈起來)。其實這次比較新釋出的是他的R1
72
[討論] 小草發現 他的預算 被砍了......44
[討論] 花蓮民政處長 凌晨聲押禁見42
[討論] 凌濤在節目上被尚公嗆XDD14
[討論]民政處7人涉嫌恐嚇罷免聯屬民眾 誰是余文14
[討論] 壯世代=獨立遊戲殺手36
[討論] 八卦板:換黨執政,陸配亞亞才能回台灣11
Re: [新聞] 國民黨曝:年輕人吹起「台灣人反綠」風潮18
[討論] 誰是國民黨親美派的領袖?40
[討論] 亞亞申請團聚可待6個月.那跟依親有何差?7
[討論] 恐嚇罪是不是可以廢除了?32
[討論] 藍白怎麼不把突襲開會的精力用在民生法9
[討論] 想到政黑板常提到的館長13
[討論] 0掏在節目上護航 真的有對國民黨加分嗎?18
[轉錄] 林俊憲FB 在院會硬闖表決過的2項空殼公投7
Re: [討論] 公投逕付二讀 柯建銘:會議無效將釋憲15
[討論] 亞亞這件事,最尷尬的是不是中國啊41
[討論] 藍白女神亞亞:我會做出團聚申請!25
[討論] 祖國歡迎你回家16
[討論] 公投逕付二讀 柯建銘:會議無效將釋憲6
[討論] 她,來自深淵?4
[討論] 支持台灣武統大陸臭了嗎?4X
[討論] 為什麼親中就是支持統一?27
[討論] 端木正也翻供惹37
[討論] 亞亞小孩怪怪的X
[轉錄] 羅智強:勝利!4
[討論] 是不是很多深藍仔支持武統?45
[討論] 亞亞落地直播被封怎不見藍白幫忙開記者1X
[黑特] 2025/3/25 台灣言論自由忌日 賴清德殺的4
Re: [討論] 亞亞申請團聚可待6個月.那跟依親有何差?4
Re: [討論] 公投逕付二讀 柯建銘:會議無效將釋憲