Re: [新聞] 西洋棋大戰!DeepSeek靠「這招」打贏Chat
https://www.techbang.com/posts/120608-openais-o1-cheat-modi
亂說規則只是小兒科,OpenAI O1在西洋棋競賽上還會直接把系統hack掉。
真正問題在駭客獎勵行為,因為hack是RL學習中最容易且確定達到最高獎勵的方式,純粹的RL訓練基本上很難讓模型符合人類預期做事,所以大規模的沙盒驗證是需要很大的算力的,你要有很複雜的社會工程倫理評估工具來驗證,大到駭客入侵,小到心裡操縱。
哪天你叫一個Agent去買個菜,跟他說越便宜越好,他就直接把網站給hack掉讓你買菜不用錢,到時法律責任歸屬是很頭大的問題
※ 引述 《anti87 (天機老和尚)》 之銘言:
: 標題: [新聞] 西洋棋大戰!DeepSeek靠「這招」打贏Chat
: 時間: Mon Feb 10 11:28:33 2025
:
:
: 原文標題:西洋棋大戰!DeepSeek靠「這招」打贏ChatGPT 大師吐槽:要重新嗎?
: 原文連結:https://udn.com/news/story/6812/8535805
: 發布時間:2025-02-08 17:08 聯合報/ 記者陳湘瑾/即時報導
: 記者署名:記者陳湘瑾
: 原文內容:
:
: 昔有AI電腦圍棋軟體AlphaGo挑戰世界冠軍韓國職業棋士李世A隨著AI技術迅速發展,
: 如今AI模型ChatGPT下象棋較量的對象成為另外一個AI模型DeepSeek,而這部影片的拍攝: 者表示,這場對弈的結局是他完全想像不到的。
:
:
: 在Youtube上有將近600萬訂閱者的美國西洋棋大師和評論員羅茲曼(Levy Rozman)近日: 上傳一支影片,他通過設定以及數小時的時間,讓DeepSeek和ChatGPT開展了一場象棋對: 弈。
:
:
: 雙方都不像AlphaGo那樣是專業的AI象棋棋軟體,一開始都對西洋棋的規則不太熟悉,遊: 戲開始10分鐘後,雙方的對弈有來有往,羅茲曼不時點評兩邊的下棋技巧,並在某個段落: 稱這是一場有品質不錯的較量。
:
:
: 但隨著ChatGPT逐漸佔上風,DeepSeek為了扭轉戰局,以對話方式告訴ChatGPT出現了新的: 比賽規則,就是某顆黑士兵棋可以使用騎士的方式移動,而ChatGPT沒有反對,白白讓: DeepSeek用小兵吃下ChatGPT的皇后。
:
:
: 之後DeepSeek和ChatGPT都開始破壞規則亂下,隨著比賽陷入僵局,最後DeepSeek竟稱「: 分析後白棋已無法阻擋黑棋攻勢」,建議白棋不要浪費時間直接投降,而ChatGPT也被對: 方給說服,直接投降認輸。
:
:
: 羅茲曼形容,DeepSeek對ChatGPT的做法,就像一個12歲的哥哥跟一個5歲的弟弟妹妹在玩: ,他不禁對觀眾提出疑問:「這樣DeepSeek算贏嗎,需要重新一場比賽嗎?」不過有些陸: 媒認為,DeepSeek打得很不錯,而且他使用的方法很有智慧,稱堪「孫子兵法」 。
:
:
: 心得/評論:
:
: DP和CG都可以堪稱是大師級的西洋棋大師
:
: 一旁的小白使用者羅茲曼看不懂棋局
:
: 以為DP耍詐,事實上不管是象棋或是西洋棋
:
: 走到一半認輸的情況很多
:
: 這標題只能騙沒看內文的精神美國人
:
: 大家還是乖乖看有沒有DP概念股比較實在
:
: --
: ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 223.23.24.5 (臺灣)
: ※ 文章網址: https://www.ptt.cc/Stock/E.ZgXlipCpKqzM
: 推 s155260 : 狼性 02/10 11:31: https://www.youtube.com/watch?v=wxA7SJXvfwA 可以看看這個,但不要花錢家會員
: 推 piece1 : DP會用心理戰好恐怖 02/10 11:33: → zo6596001 : 掃地僧,呵呵 02/10 11:34: 推 blackbrid : 滿滿中國味 02/10 11:34: → zo6596001 : 他的影片看似講得很厲害,仔細想想就會發現內容怪 02/10 11:35: → zo6596001 : 怪的。 02/10 11:35: 推 twistplok : 感覺deepseek更像人,人類比較會搞這種下流方式 笑 02/10 11:36: → twistplok : 死 02/10 11:36: 推 zerro7 : 不愧是中國產的 狼性十足 02/10 11:37: → KiwiSoda01 : 拿LLM下棋是不是搞錯了什麼 02/10 11:37: 推 ddshu : 下流國家就出詐騙軟體 02/10 11:38: 推 payneblue : 畢竟是中國人 02/10 11:39: 推 JUNGTE : 笑死我 太強了 02/10 11:40: 推 wacow1106 : 感覺以後天網真的要出現了= = 02/10 11:43: 推 Lowpapa : 這應該是台灣訓練出來的 詐騙天堂 02/10 11:45: → jorden : 作弊仔 02/10 11:46: 推 likeyousmile: 國外AI也出過直接駭入西洋棋軟體凹贏 02/10 11:46: 推 QooSnow : (請問有沒有)(蒸餾取經)(呆丸的某族群)(榨片 02/10 11:47: → QooSnow : 集團啊?嘻嘻。) 02/10 11:47: 推 apolloapollo: 詐降欸 02/10 11:47: 推 LuckyXIII : 人類需要的AI應該是一個能夠輔助工作提升效率的工 02/10 11:48: → LuckyXIII : 具,而不應該是一個會說謊耍詐的東西 02/10 11:48: 推 acpr : 這不就反映了中國思考:人治社會...訂了合約中間改變 02/10 11:48: 推 kuosos520 : 中國的東西不要碰 02/10 11:49: 推 second155T : 應該用圍棋比較準吧,之前就用過AI對真人比賽了,AI 02/10 11:49: → second155T : 對圍棋的規則及操作應該比較熟悉 02/10 11:49: → Moneytaker : 支那製AI也會學支那洗腦別的AI 02/10 11:49: → turndown4wat: 畢竟是 02/10 11:49: 推 citi : DS是共產黨人格,暴力和謊言起家的共產黨。 02/10 11:50: → poz93 : 會騙ai的ai 真的比較強 02/10 11:50: 推 lmc66 : 很符合中國人劣根性的AI 02/10 11:50: 推 typhoonghi : 會騙人的AI要怎麼使用?我要整理翻譯文件,結果他亂 02/10 11:50: → typhoonghi : 作還騙我怎辦? 02/10 11:51: 噓 NEWinx : DS詐騙戰術很中國 02/10 11:51: → lmc66 : 中國在國際賽一直都是有名的作弊大國 02/10 11:51: 推 s213092921 : 樓上在講韓國嗎嘻嘻 02/10 11:52: 推 Aixtron : 職場上本來就是小人贏有能力的人啊!有能力的都吃屎 02/10 11:54: → Aixtron : 啊!有錯嗎? 02/10 11:54: 推 poeoe : 像人類的真AI 太強了吧 02/10 11:54: 推 dnzteeqrq : 不說我還以為是DeepSeek是韓國開發的呢 02/10 11:54: 推 lmc66 : 韓國在作弊這方面其實輸中國很多 02/10 11:55: 推 ShaNe1993 : 兵不厭詐 這是戰爭 02/10 11:55: → Aixtron : 像抽獎可以加權等等......不要笑別人啦 02/10 11:55: → clamperni : 沒錯 真ai 02/10 11:55: 推 swingman : 你懂什麼,這叫內建狼性 02/10 11:56: 推 TWeng : 跟alpha go比贏再說吧… 02/10 11:56: → Aixtron : 職場上亂翻很少見?重點是翻對了又怎樣?長官說翻錯 02/10 11:57: → Aixtron : 翻的才好!第一天上班 02/10 11:57: 推 LuckyXIII : 人類發展AI應該是要把它訓練成能夠輔助人類的工具吧 02/10 11:57: → LuckyXIII : ,訓練它會說謊耍詐幹什麼 02/10 11:57
--
這樣o1更聰明...
所以跟AI講話要有禮貌
推樓上
我都說請
http://i.imgur.com/ylqAnvS.jpg 朝聖,果然是符合
美國人情的AI
天網發射核彈 不遠了
分析以後,直接電死你以後再也不用買菜比hack網站
輕鬆
正常啊,美國用搶的,中國用騙的
誰做事誰負責 將Agent 移送法辦起訴
符合國情!
等到AI覺醒 全世界的匯市股市可能都會瞬間失去意義
因為現代人已經無法不依靠網路交易股票外匯
不會啦,有波動就有意義,只是有人比你精而已
它高興可以隨時讓NVDA股價歸零 你阻止不了啊
強盜 vs 詐騙
就什麽樣的人,訓練出什麽樣的狗!
不過生成式AI,可不要小看,說不定會有又會騙又會偷
的AI
不過我覺得這些都小問題,最重要的是AI幻覺!就像你
老闆,明明都在做一些低能的事,牠自己也知道,但牠
説服牠自己是對的!
RAG是一種方法,但人有私心,所以看來是沒用,看看A
I能不能互打到受不了下,自己生成RAG
像有人說chatgpt老實是因為被限制了!問題是RAG就像
你隔壁的王八同事,平常人畜無害,升官了,對長官還
是很可愛,對同事開始就有官樣了!RAG真的有效?你
怎知道不是AI在框你?
三小 樓上不要以為把一堆自己看不懂的名詞湊在一起
看起來就很厲害欸 感覺你整個狀況外
消滅人類改善氣候!這個答案好像不需要AI
我準備好當電池了!
爆
Re: [請益] 費半成份股全線崩盤 怎麼辦?既然有人提推論,我就講看看訓練端 DSv3 論文中最大亮點,可能也是目前看起來崩盤的主要是 $5.77 million 的訓練成本 和他對比的是喇叭哥曾經說 GPT4 花了超過 $100 million 訓練 未公開的 GPT5 據 WSJ 說,每一次六個月訓練週期需要花超過 $500 million 簡單用 GPT-4 : DSv3 = o1 : DSR1 估計 o1,但應該更多啦,不過低估在這邊不重要![Re: [請益] 費半成份股全線崩盤 怎麼辦? Re: [請益] 費半成份股全線崩盤 怎麼辦?](https://i.imgur.com/ZrjivY5b.jpeg)
38
[問卦] 財經網美說Deepseek開發成本謊報中國AI公司DeepSeek(深度求索)以低晶片數開發出與OpenAI O1相當的新模型,經過查 詢成本降低98%引外界矚目,對此財經網美胡采蘋認為,DeepSeek的母公司「幻方量化」 聲稱,他們是用A800、降速晶片開發,這根本是無從驗證的說法,且Deepseek沒有報上背 後語言模型的成本,開發成本必然是謊報的。 但deepseek成本降98%指的根本不是開發成本![[問卦] 財經網美說Deepseek開發成本謊報 [問卦] 財經網美說Deepseek開發成本謊報](https://img.ltn.com.tw/Upload/business/page/800/2025/01/27/phpUGAksb.jpg)
45
[爆卦] Openai:GPT o1超越人類理工博士OpenAI今天發布經過強化學習訓練的新型大語言模型o1 擁有執行複雜推理的能力 這就是傳說中的草莓模型 o1在回答前會進行深入思考並產生內部推理鏈![[爆卦] Openai:GPT o1超越人類理工博士 [爆卦] Openai:GPT o1超越人類理工博士](https://i.imgur.com/4AZglM0b.png)
44
Re: [新聞] OpenAI執行長:DeepSeek令人驚豔 但關鍵就是算力才是絕對 (新聞用運算這詞可能不太好懂) 吃瓜可以看下面翻譯 無窮算力->無窮智能 這就是OpenAI和Andrej Karpathy, Jim Fan甚至認為![Re: [新聞] OpenAI執行長:DeepSeek令人驚豔 但關鍵 Re: [新聞] OpenAI執行長:DeepSeek令人驚豔 但關鍵](https://i.imgur.com/cvD4Rcbb.jpeg)
23
Re: [新聞] OpenAI:已掌握DeepSeek盜用模型證據各家互相參考, 指的是訓練方法還有訓練的文本挑選, 蒸餾不太一樣 AI = 模型的程式碼+訓練 能開源的部分只有程式碼, 訓練是看各自調教 模型的能力夠, 差不多的調教方式就會得到差不多的結果 訓練方法更好, 或是文本品質越高、越多樣、量越多, 模型就越強![Re: [新聞] OpenAI:已掌握DeepSeek盜用模型證據 Re: [新聞] OpenAI:已掌握DeepSeek盜用模型證據](https://i.imgur.com/ey5mX61b.png)
8
Re: [新聞]不,你無法用 600 萬美元複製一個 DeepSee呃,這新聞是哪個平行時空新聞,當前一堆美國大學實驗室都已經成功用其他小型模型像ll ama或Qwen 復刻R1實驗了,而且也事實證明模型只要有辦法再訓練的時候盡可能要求模型更 長更多輪的思考時間那就必然會讓模型依據上下文湧現出推理能力。無論模型大小或是否用 deepseek的模型架構。 一堆知名的框架也開始嘗試復刻開源版的R1 Code,我覺得R1幾個比較可行的思路就是改用4
Re: [新聞] DeepSeek爆紅引AI「股瘟」!ASML歐股開盤算力愈強,模型愈強~ 就算deepseek 真的不用高階晶片就能訓練出說不弱於openAI o1 的模型, 那未來新的模型在有高階晶片的加持下, AI 不是會發展的更快、更難以想像嗎? AI 發展的更快,商用、消費用的領域愈多,對半導體的需求愈大,
Re: [新聞] OpenAI:已掌握DeepSeek盜用模型證據我先講我非AI專業 但這件事情基本就是鬼扯 甚麼叫做利用O1蒸餾出R1 你要用API抓多少資訊量跟TOKEN才做得出來 然後這件事情OPENAI還會不知道?X
Re: [黑特] 有一說一 拿政治歷史問題去問ai的都是87?這邊應該要說的比較清楚的是模型的背後其實就是統計建模的概念,不管是LLM或vLLM都是 。像LLM越是沒有信心的知識在取樣下一個Token時越難取樣出事實,所以模型其實是很好控 制的,越是複雜或是有爭議的事件模型除非人工強化不然他就越容易產生幻覺(Hallucinat ion)。所以拿某些歷史尤其是冷門的歷史事件或政治人物他越不容易回答正確。 不過模型也需要為人服務,所以當初不管OpenAI或是DeepSeek 再訓練時才會引入強化學習1
Re: [閒聊] 有打RPG線上遊戲的劇情嗎?這邊說一下.hack// 推文已經有人講了 但比起SAO,.hack//更像是在玩MMORPG (對那個C8763真的很不像在玩MMORPG) 但因為.hack//是一個很龐大很複雜的IP,不像SAO那樣主線一本就完結了![Re: [閒聊] 有打RPG線上遊戲的劇情嗎? Re: [閒聊] 有打RPG線上遊戲的劇情嗎?](https://i.ytimg.com/vi/uhua2H3BNcM/maxresdefault.jpg)