Re: [閒聊] DeepSeek是不是真的很強?
說回來
感覺很多人很氣訓練用別人資源
但是感覺又對openAI沒反應
我覺得這就很奇怪
因為OpenAI最知名的一個點
就是因為盜用別人資料訓練所以官司纏身
這幾年可非常多新聞
但很妙的似乎有人看到DeepSeek才開始氣到中風
這種現象真的很神奇
真的要氣 打從前幾年就要一直罵OpenAI了吧?
甚至整個生成式AI都要全罵了
因為根本沒有幾家是拿到全部授權才訓練的
幾乎每家的產品都踩到「未經授權」這個大問題了
要生氣 應該打從這波AI浪潮一開始
就一路氣瘋到現在了 中風幾十次了吧
怎麼是看到DeepSeek才突然暴跳如雷?
--
提個ACG點
鋼彈Seed裡面最後誰都在用鋼彈臉
很多根本沒得到聯邦團隊授權
但最後還是滿地的鋼彈跑
最後最強的幾台大多都是札夫特設計的
然後歐普再拿去魔改
--
回文我記得不用acg點
現在ai界都覺得用網路上的資料沒關係
用別人訓練的東西才有關係
異端用基拉的戰鬥資料有經過授權嗎? 應該有
貓貓釣魚.jpg
因為法律允許小偷報警抓小偷啊呵呵
其實這個問題就反應了台灣這幾年根本不太重視AI吧
繪師早就戰爛了哪有沒戰
這就是繪師一直在戰的東西啊
但氣到中風的繪師不會突然跳出幫OpenAI唉吧XD 應該是全部一起罵 畢竟OpenAI自己也是盜圖訓練的大咖啊XD
像我自己有買chatgpt 身邊朋友還是工程師的 說要
付費他就不用了
最大的問題仍然是AI訓練到底有沒有侵犯著作權XD
然後新聞也沒在報導這塊
繪師就算說了不給AI用也無法阻止
咒術師基本上是覺得繪師給ai訓練理所當然
大概...公司廚吧 (x
自己生的圖不能拿去訓練
OPENAI同理
畫師根本防範不了啊 現在連歌手的聲音都有辦法用 A
I重現了
國內新聞有報阿
像前陣子那個用陶喆年輕的唱腔 唱五百的淚橋也是爆
紅
其實說難聽點就是因為難以維權直接變成被剝削階層
不是防範與否的問題,是告了也很可能不會贏。
製作AI的人說是因為想念陶喆嗓子還沒壞的年代才做
的
然後ai咒術師都會覺得自己才是剝削別人的那一方
我覺得OpenAI用版權物訓練模型合法、DS用GPT生成內容訓練也
根本無法舉證
合法啊,但雙標的人我就不懂了
更別提畫風或是聲音特徵本來就不被保護
OpenAI感覺只是想打商業戰而已,用專利侵權去卡別人的腳
是基本招。是不是真的能告侵權成功並不重要,是要妨礙對
手而已。
DS用GPT生成內容訓練要看有沒有違反使用者合約就是
也許可以告
一些MOD甚至用AI模仿知名配音員的聲音
提起訴訟肯定是可以啦 畢竟那是公民的權利
民主的盜能算盜嗎
AI模仿太簡單了啦 名人影片訓練一下就有了
違反使用者合約當然違反,但違不違法可不是合約說了算
訓練聲音模型甚至不需要啥成本,用免費算力就夠了
我記得都有電玩廠商禁止玩家賣二手實體片了
如果這社會對未來的想像就是賽博龐克那樣,openAI那麼大
的商業利益,感覺買兇殺人還比法律戰來得有可能
民間契約 但法令要不要保護你就是另外一回事
直接進入2077嗎
開源模型而且公開算法,你要殺誰啦XD
現在OPENAI要開始派人暗殺ds製作方了吧
也要有法可以讓你違吧,目前AI的法律有訂定出來了嗎?
看圖卡跟kol站隊的低認知族群的想法不用試圖去理解
最主要是約定契約但沒有約定賠償XD
著作權類型的法令當然也可以去加啦
資安考量 滿多公司工作不給用ai滴 以後就各家公司開發自家
ai 不然就跟大ai公司簽保密合約惹
只是著作權法令要怎麼幫這個案例? DS做了什麼樣的事情
沒專利問題吧
會妨礙創意的發展?
8964占占占 deepseek快抓網路文章訓練喔
這跟專利肯定沒有關係啦 至少我看不太出OpenAI有什麼專利
比較可能就跟現在的windows商法一樣,一般民眾亂用AI
被DS侵犯了 總不會LLM變成OpenAI的專利吧
但商業機構還是要買微軟或是open ai的安全版本
中國發明=抄襲偷竊 美國發明=知識共享 懂的都懂
chatgpt剛出來時,三星有員工把公司資料丟上去問
蒸餾技術是用別人的模型當老師,Open AI有規範,跟非法拿
資料概念不同
資安考量主要是線上版問的東西都會被後面的公司看到
如果用本地模型應該是不會怎樣 只是目前本地版
要到線上版的程度對一般中小企業來說成本又太高
歐布才是先趨吧 想拐人啊
那個規範有比繪師在自己的圖上貼禁止ai學習浮水印厲害嗎
網路上一堆訓練集 為啥不能用==?
使用者規範通常只能在違反的時候停權帳號啦XD
畢竟AI生成物很多地方沒有著作權,後續也沒法求償
簡單來說一個是偷書賊,一個是盜錄教學影片
只是偷書的話成本是降不下來的
違反使用者規範就停權跟法律懲罰還有點差距
他有這使用者規範的話,他如果刪除你的帳號,我覺得消保
著作權肯定也沒有
鋼彈臉應該是聯邦和歐普都有版權吧 只有扎夫特才有 不過
DeepSeek平台的審查我記得是另外接的?
官拿他沒轍
他原始model對占占占的梗搞不好比你還熟,那還需要污染
現在就等開盤大媽發紅包 撿便宜2330
違反OpenAI的政策只能BAN帳號
難得說人話
扎夫特一開始就是搶來的 沒在管版權 XD
因為歐噴Ai是美國的,美國爸爸不會錯
資安這點的話反而是開源模型優勢
一堆訓練包裡面都有gpt 的對話集 這也就是為什麼一堆模
型你問他是誰 他會直接跟你說他是chat gpt 的關係 然後
openai 這一大部分都不抓 跑去抓威脅到他的 嗯…
DeepSeek 會審查啥嗎?
審查模型都是一個模組塊 停用那個就好啦
OpenAI今天推出o3-mini,然後通過一堆安全性檢查
加工過後價值提高後歸加工人 跟另外一個直接沒授權偷
沒授權直接偷是這波AI浪潮全部都有的問題啊? 沒有任何一家是訓練資料有全部取得授權的欸
因為蒸餾實際也很難抓,除非你自首
紅區測試
然後這也只是自稱的,因為他沒有open source
DeepSeek-R1就丟在GitHub,大家都能看
AI不是一直在被罵嗎?
言論審查的是模型資料的一部份吧?
中國製造就是DS最大原罪
網路爬蟲就完全沒經過人家同意阿XD
沒有,言論審查是模組快,離線模型沒有言論審查的
難不成說你沒放robot.txt就是可以讓我偷
其實Ai的發展跟權益問題世界各國政府早就開會討論的如
火如荼了
OpenAI當初會創立的原因之一就是避免濫用
所以才有教你怎麼讓DS回答8964... 本機跑就可以
因為大家資料都是網路上沒授權就拿來餵AI
DeepSeek官方的試用平台存在政治審查,但是可以完全關掉
我以為是另外串一個審查,但可能是像TheDon大說的那樣(?
https://i.imgur.com/ImrSiNo.jpg 我這個是離線模型結果
這個滿明顯有言論審查的吧?
模型是可以內建censorship的 但可以被破解 這次
有種可能是他的學習資料是有刻意刪除習近平啦... 這幾B的啊
deepseek的模型有沒有被破解要看一下hugginface
那個是 R1 14B 的
我很確定他認得習近平 而且我如果攻擊習近平,這個LLM會
跟我說討論國家領導人要心存敬意
看一下能不能改它的system prompt
這幾個問題我去問Phi都可以取得很正常的回答
怎麼現在還在討論DS禁言問題啊==
其實問題不是禁言,而是這反應出DS有一些語言判定上的
先天缺點
但很專業的用途應該是不太會受到影響
順便提一下 14B的其實不太算是deepseek v3/r1模型
因為有推文拿來嘴,話題就變成討論技術了w
那幾個小模型 是蒸餾的llama/qwen模型
不是一堆人退X了
就算如此還是能Finetune這些問題吧,只是要另外花時間
喔喔 了解了 這個我之前倒是沒有注意到
而且如果DS成本是真的這麼低,應該很快有其它模型跟上
唐鳳在Threads上表示,在本機離線的情況下,使用運行大型語
言模型的平台LM Studio操作DeepSeek,「只要用 U先輸入思考
過程和回答的前綴,再用→繼續生成回答」,就可以繞過言論審
查。
看起來有用Prompt控制輸出結果了,但就可以讓它無效
那個做法是「破解DS不能批評習大大」的過程
但我希望LLM本身不要有認知偏差
記得sam在該的時候好像是美國出版協會直接在推文下酸他
有什麼資格該
我倒不是太在意他不能在一個對談中迴避習近平問題
我覺得比較可惜的是調用api沒想像中的便宜
雖然是很便宜了 在openrouter上完整r1大概是4o的1/6
但我原本以為能幹到跟4o mini差不多價
然後看到b站有人在問能不能讓他不要"想"
他一堆錢都被他給"想"掉了w
因為台灣其實不怎麼懂AI 只懂AI可以讓台積電乃至於台
廠賺大錢 股價upup 現在誰干擾到股價就是敵人 懂嗎
左膠甲團體對這個就很過敏
沒錯,看到會一直在那邊想才能有近似的答案,不用想直接輸出
真的好用多了 XD
其實我覺得有好的開源模型gg應該要漲才對啊
這應該會讓更多企業有本地AI的需求讓晶片需求提升
講的好像沒戰一樣
行不行是拳頭大的說話
只要是中國,吃別人拉的屎,也會氣死,這就是台灣
DS aka 想想
覺得別人沒反應是幻覺吧
從openai 還有那堆生成式產圖ai,都有訓練資料來源未授
權的問題,只是發展到現在如果要把這些東西一刀切,那
你可能要問還有多少蒸汽機沒砸到
4-11
畢竟很多人 非我族類
嘻
可悲啊 政治立場決定台灣人怎麼看科技
島國某群雙標又正常發揮而已
很簡單阿,美國可以 他國不行阿
就自卑心作祟,恨不見別人好
又用AI又想站在道德制高點 不要臉= =
很簡單 因為沒有大外宣狗在喊openai多強多好
誰在系統性吹deepshit呢?
還好意思拿OpenAI 救援,所以承認幹一樣的事,為什麼前面
闖紅燈你沒抓,嘻嘻
蛤 openai每個月固定有人在吹都多久了 你都當沒看到?
那國外鐵定都西岸外宣,包括幾個名人,測驗分數對照圖大
概也是外宣,都是外宣
因為是那個不能說出名字的國家做出來的
好多白皮大外宣
chatGPT剛出吹的比deep還兇好不,只是同定位又開源加上
中國製造讓人不爽而已
對於openai 最搞笑的是他現在還敢掛open
當初他這樣到處踩未授權的底線 就是打著開源名義
結果訓練成熟後 開始close囉
吹AI都吹幾年了 股價都吹成這樣了
講得好像只有DS在吹
通常是命中缺什麼名字就取什麼,名字掛OPEN可以的啦
所以到底是誰氣瘋?平行時空嗎?這兩家公司都不是台灣的
跟台灣有關的只有用的都是台積電的晶片 要氣瘋什麼?
欸不是 現在裝不知道誰氣瘋是剛閉關出來嗎
黑吃黑啦
支那推拖拉扯美國壞壞
因為411
一樓想釣魚 = =
9
首Po我讓他續寫手塚火鳥的未完成篇章 也就是近現代篇 結果還滿有模有樣 優化一下就是三個阿道夫等級作品 以後是不是人人都能創作了? ------------------------- 手塚治虫未完成的《火之鳥·近現代篇》被普遍认为是他最神秘的遺憾。根據手塚工作室爆
結果今天就被踢爆是中國大外宣了 研究機構:DeepSeek硬體GPU支出逾160億台幣 SemiAnalysis指出,中國對沖基金幻方量化(High-Flyer)在2023年5月成立「深度求索」(DeepSeek)以推動AI技術研發,在此之前,幻方量化於2021年,也就是任何出口管制生效前,投資購買了1萬顆輝達(Nvidia)A100 GPU。 報告指出,該公司在GPU的投資上花費超過5億美元。10
話說 我讓deepseek寫些色色的東西啊(讓他幫我寫些色色遊戲設定) 他現在大約寫完後會延遲十秒才收回去(如果他願意寫的話) 這是故意留給我時間讓我趕快複製貼上嗎 怎麼這麼貼心6
老哥 雖然中國真的很常唬爛 但也不能沒搞清楚就亂吐槽 反而自曝無知= = AI模型只要訓練一次(花幾天~幾個月)就能一直用3
是這樣的 美國人做事比較喜歡用正攻法 他們就很要求任何技術都要「科學」 你這麼做,你要拿出證據、拿出理論依據 不只要證明他真的會更好,還要說明他為什麼會更好40
這串一堆外行 首先 DeepSeek模型特點是 1. 訓練成本低 2. 推理成本低 先說訓練成本低11
假如以網路遊戲來類比,輝達就是遊戲的開發商與營運,其他開發AI的科技巨頭就是遊戲玩家 DeepSeek 則是一個發現了快速練等技巧的玩家。原本幾百小時才能練滿一個帳號,現在DeepSeek 找出了幾十個小時就能練滿的方法。 因為是快速練等,所以裝備可能還是跟不上那些扎實練功的科技巨頭玩家。但是可以縮減大量的遊戲時數,所以其他玩家也紛紛跟進,畢竟練滿角色可以少花幾張點數卡,看起來遊戲公司可能會陷入經營危機。 不過由於遊戲的內容實在太豐富,大家都想多練幾個帳號來玩,長久來看玩家們還是會繼續買點數卡挹注遊戲公司營收。 以現實人物來比喻的話,輝達是經營天堂的遊戲橘子,DeepSeek是找出一堆遊戲秘技的四叉貓11
: : 稍微說明一下好了 如果要偷 偷的方法就是花錢用openai 的api 然後用他產生qa pairs : 來做測試資料集 : : 看起來跟正常使用差不多 真的沒那麼好抓 也跟傳統意義上的資安沒有關係1
我的理解是 原本一份專業的工作只有研究生以上的人能處理 後來產業升級後變成高職就能身任 雖然還是可以繼續雇研究生 但是慣老闆愛省錢的結果肯定誰便宜用誰1
老哥, 少看點台灣白癡新聞, 這種計算方式是大家通用的, 怕大家看不懂就直接附上semianalysis的文章段落。
57
Re: [討論] 其實Deepseek真的很厲害了OpenAI:已掌握DeepSeek盜用模型證據 (中央社倫敦29日綜合外電報導)中國新創公司「深度求索」(DeepSeek)引發的疑慮日 增。OpenAI今天表示已掌握證據,顯示DeepSeek盜用其模型進行開發;業界也指DeepSeek 握有大量輝達H100高階晶片,形同直接挑戰美國出口管制規定。44
Re: [新聞] OpenAI:已掌握DeepSeek盜用模型證據比較好奇這段: 儘管蒸餾是AI業界常見做法,但DeepSeek若利用蒸餾技術來打造自家模型,並與OpenAI競 爭,將違反OpenAI服務條款,因此產生疑慮。 OpenAI婉拒進一步說明或提供證據細節。根據該公司的服務條款,用戶不得「複製」任何 OpenAI的服務,或是「利用輸出結果,來開發與OpenAI競爭的模型」。 各個ai 大語言模型不是都會互相參照比較和訓練嗎? 我以為這是業界常識…5
[討論] DeepSeek盜用!貓咪釣魚梗圖揭惡劣手法DeepSeek,這家中國AI新創公司,近日被指控盜用OpenAI的數據,迅速成為國際熱議的焦 點。該公司聲稱利用蒸餾技術開發出與OpenAI O1模型相似的效果,但OpenAI發現DeepSee k涉嫌違反服務條款,通過未經授權的方式大量提取API輸出數據來訓練自己的模型,這一 行為被視為數據盜竊。21
[問卦] 為何openAI可以剽竊全球的智慧產權 DS就老實講 openAI 侵犯全球人類的智慧產權更嚴重吧 網路上查就有一大把 1. 使用未經授權的版權內容 新聞媒體訴訟:包括《紐約時報》(NYT)在內的多家媒體指控 OpenAI 未經授權使用其文 章來訓練模型。例如,《紐約時報》聲稱其數百萬篇文章被用於訓練 GPT 模型,並要求 Op20
Re: [問卦] 為什麼deepseek會影響台積電 不懂?DeepSeek厲害的地方不是他便宜,不是他厲害,最重要的地方是他開源。 他的原始碼開源,權重開源(資料沒有開源),而且開放商業授權,他的 原始碼是MIT授權,權重則是基於OpenRail的特殊開源架構,也就是只有 一些特別場合他沒有授權,例如製造有害軟體,製造毒品等等 簡單來說你現在馬上就可以在你的電腦,你的公司使用了,你只要用很普5
[討論] DeepSeek盜用!貓咪釣魚梗圖揭惡劣手法!中國AI新創公司DeepSeek近日因涉嫌未經授權盜取OpenAI的數據,引發國際爭議。該公司 宣稱透過蒸餾技術(distillation),使用較少的計算資源,訓練出與OpenAI O1模型表 現相近的AI模型。然而,OpenAI與微軟已掌握證據,顯示DeepSeek透過API提取OpenAI的 輸出結果,並將這些數據用於自家模型的訓練,這種行為已經違反了OpenAI的服務條款,10
[問卦] deepseek會刺破ai泡沫嗎?原來訓練ai並沒有那麼昂貴, 中國Deepseek 公司用低成本就能訓練媲美OpenAI的gpt 中國低價策略根本讓高成本美國巨頭無法招架 Deepseek 會刺破ai泡沫嗎?有台積股票的會顫抖嗎? 有卦?12
Re: [討論] 其實Deepseek真的很厲害了DeepSeek可以下載到自己電腦跑、ChatGPT不行, 這在商業使用的場景上就有蠻大的差異 昨天很多人在傳說用(線上版)的DeepSeek會把資料傳給中國,這當然是對的, 但過去一兩年我們幫客戶評估AI專案時, 在串GPT-API上常常會碰到我們或我們的客戶其實也不想把資料傳給OpenAI,X
Re: [新聞] Meta陷入恐慌?內部爆料:在瘋狂分析總覺得這個橫空出世的deepseek有點貓膩 像LDPC大所說 感覺好像真的用了openai 的ChatGpt的數據來創造訓練資料 但openAI很難 證明自己的東西被偷了 我去看了一下deepseek的python api怎麼用 很有趣 結果deepseek用的是 openai的library