PTT評價

Re: [新聞] 西洋棋大戰!DeepSeek靠「這招」打贏Chat

看板Stock標題Re: [新聞] 西洋棋大戰!DeepSeek靠「這招」打贏Chat作者
zxwxz
(zxwxz)
時間推噓18 推:18 噓:0 →:15

https://www.techbang.com/posts/120608-openais-o1-cheat-modi

亂說規則只是小兒科,OpenAI O1在西洋棋競賽上還會直接把系統hack掉。
真正問題在駭客獎勵行為,因為hack是RL學習中最容易且確定達到最高獎勵的方式,純粹的RL訓練基本上很難讓模型符合人類預期做事,所以大規模的沙盒驗證是需要很大的算力的,你要有很複雜的社會工程倫理評估工具來驗證,大到駭客入侵,小到心裡操縱。
哪天你叫一個Agent去買個菜,跟他說越便宜越好,他就直接把網站給hack掉讓你買菜不用錢,到時法律責任歸屬是很頭大的問題

※ 引述 《anti87 (天機老和尚)》 之銘言:
: 標題: [新聞] 西洋棋大戰!DeepSeek靠「這招」打贏Chat
: 時間: Mon Feb 10 11:28:33 2025
:  
:  
: 原文標題:西洋棋大戰!DeepSeek靠「這招」打贏ChatGPT 大師吐槽:要重新嗎?
: 原文連結:https://udn.com/news/story/6812/8535805
: 發布時間:2025-02-08 17:08 聯合報/ 記者陳湘瑾/即時報導
: 記者署名:記者陳湘瑾
: 原文內容:
:  
: 昔有AI電腦圍棋軟體AlphaGo挑戰世界冠軍韓國職業棋士李世A隨著AI技術迅速發展,
: 如今AI模型ChatGPT下象棋較量的對象成為另外一個AI模型DeepSeek,而這部影片的拍攝: 者表示,這場對弈的結局是他完全想像不到的。
:  
:  
: 在Youtube上有將近600萬訂閱者的美國西洋棋大師和評論員羅茲曼(Levy Rozman)近日: 上傳一支影片,他通過設定以及數小時的時間,讓DeepSeek和ChatGPT開展了一場象棋對: 弈。
:  
:  
: 雙方都不像AlphaGo那樣是專業的AI象棋棋軟體,一開始都對西洋棋的規則不太熟悉,遊: 戲開始10分鐘後,雙方的對弈有來有往,羅茲曼不時點評兩邊的下棋技巧,並在某個段落: 稱這是一場有品質不錯的較量。
:  
:  
: 但隨著ChatGPT逐漸佔上風,DeepSeek為了扭轉戰局,以對話方式告訴ChatGPT出現了新的: 比賽規則,就是某顆黑士兵棋可以使用騎士的方式移動,而ChatGPT沒有反對,白白讓: DeepSeek用小兵吃下ChatGPT的皇后。
:  
:  
: 之後DeepSeek和ChatGPT都開始破壞規則亂下,隨著比賽陷入僵局,最後DeepSeek竟稱「: 分析後白棋已無法阻擋黑棋攻勢」,建議白棋不要浪費時間直接投降,而ChatGPT也被對: 方給說服,直接投降認輸。
:  
:  
: 羅茲曼形容,DeepSeek對ChatGPT的做法,就像一個12歲的哥哥跟一個5歲的弟弟妹妹在玩: ,他不禁對觀眾提出疑問:「這樣DeepSeek算贏嗎,需要重新一場比賽嗎?」不過有些陸: 媒認為,DeepSeek打得很不錯,而且他使用的方法很有智慧,稱堪「孫子兵法」 。
:  
:  
: 心得/評論:
:  
: DP和CG都可以堪稱是大師級的西洋棋大師
:  
: 一旁的小白使用者羅茲曼看不懂棋局
:  
: 以為DP耍詐,事實上不管是象棋或是西洋棋
:  
: 走到一半認輸的情況很多
:  
: 這標題只能騙沒看內文的精神美國人
:  
: 大家還是乖乖看有沒有DP概念股比較實在
:  
: --
: ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 223.23.24.5 (臺灣)
: ※ 文章網址: https://www.ptt.cc/Stock/E.ZgXlipCpKqzM
: 推 s155260 : 狼性 02/10 11:31: https://www.youtube.com/watch?v=wxA7SJXvfwA 可以看看這個,但不要花錢家會員
: ※ 編輯: anti87 (223.23.24.5 臺灣), 02/10/2025 11:33:23
: 推 piece1 : DP會用心理戰好恐怖 02/10 11:33: → zo6596001 : 掃地僧,呵呵 02/10 11:34: 推 blackbrid : 滿滿中國味 02/10 11:34: → zo6596001 : 他的影片看似講得很厲害,仔細想想就會發現內容怪 02/10 11:35: → zo6596001 : 怪的。 02/10 11:35: 推 twistplok : 感覺deepseek更像人,人類比較會搞這種下流方式 笑 02/10 11:36: → twistplok : 死 02/10 11:36: 推 zerro7 : 不愧是中國產的 狼性十足 02/10 11:37: → KiwiSoda01 : 拿LLM下棋是不是搞錯了什麼 02/10 11:37: 推 ddshu : 下流國家就出詐騙軟體 02/10 11:38: 推 payneblue : 畢竟是中國人 02/10 11:39: 推 JUNGTE : 笑死我 太強了 02/10 11:40: 推 wacow1106 : 感覺以後天網真的要出現了= = 02/10 11:43: 推 Lowpapa : 這應該是台灣訓練出來的 詐騙天堂 02/10 11:45: → jorden : 作弊仔 02/10 11:46: 推 likeyousmile: 國外AI也出過直接駭入西洋棋軟體凹贏 02/10 11:46: 推 QooSnow : (請問有沒有)(蒸餾取經)(呆丸的某族群)(榨片 02/10 11:47: → QooSnow : 集團啊?嘻嘻。) 02/10 11:47: 推 apolloapollo: 詐降欸 02/10 11:47: 推 LuckyXIII : 人類需要的AI應該是一個能夠輔助工作提升效率的工 02/10 11:48: → LuckyXIII : 具,而不應該是一個會說謊耍詐的東西 02/10 11:48: 推 acpr : 這不就反映了中國思考:人治社會...訂了合約中間改變 02/10 11:48: 推 kuosos520 : 中國的東西不要碰 02/10 11:49: 推 second155T : 應該用圍棋比較準吧,之前就用過AI對真人比賽了,AI 02/10 11:49: → second155T : 對圍棋的規則及操作應該比較熟悉 02/10 11:49: → Moneytaker : 支那製AI也會學支那洗腦別的AI 02/10 11:49: → turndown4wat: 畢竟是 02/10 11:49: 推 citi : DS是共產黨人格,暴力和謊言起家的共產黨。 02/10 11:50: → poz93 : 會騙ai的ai 真的比較強 02/10 11:50: 推 lmc66 : 很符合中國人劣根性的AI 02/10 11:50: 推 typhoonghi : 會騙人的AI要怎麼使用?我要整理翻譯文件,結果他亂 02/10 11:50: → typhoonghi : 作還騙我怎辦? 02/10 11:51: 噓 NEWinx : DS詐騙戰術很中國 02/10 11:51: → lmc66 : 中國在國際賽一直都是有名的作弊大國 02/10 11:51: 推 s213092921 : 樓上在講韓國嗎嘻嘻 02/10 11:52: 推 Aixtron : 職場上本來就是小人贏有能力的人啊!有能力的都吃屎 02/10 11:54: → Aixtron : 啊!有錯嗎? 02/10 11:54: 推 poeoe : 像人類的真AI 太強了吧 02/10 11:54: 推 dnzteeqrq : 不說我還以為是DeepSeek是韓國開發的呢 02/10 11:54: 推 lmc66 : 韓國在作弊這方面其實輸中國很多 02/10 11:55: 推 ShaNe1993 : 兵不厭詐 這是戰爭 02/10 11:55: → Aixtron : 像抽獎可以加權等等......不要笑別人啦 02/10 11:55: → clamperni : 沒錯 真ai 02/10 11:55: 推 swingman : 你懂什麼,這叫內建狼性 02/10 11:56: 推 TWeng : 跟alpha go比贏再說吧… 02/10 11:56: → Aixtron : 職場上亂翻很少見?重點是翻對了又怎樣?長官說翻錯 02/10 11:57: → Aixtron : 翻的才好!第一天上班 02/10 11:57: 推 LuckyXIII : 人類發展AI應該是要把它訓練成能夠輔助人類的工具吧 02/10 11:57: → LuckyXIII : ,訓練它會說謊耍詐幹什麼 02/10 11:57

--

※ PTT 留言評論
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 42.73.112.255 (臺灣)
PTT 網址

tsubasawolfy02/10 13:01這樣o1更聰明...

SSglamr 02/10 13:03所以跟AI講話要有禮貌

sdbb 02/10 13:04推樓上

tony15899 02/10 13:06我都說請

s213092921 02/10 13:06http://i.imgur.com/ylqAnvS.jpg 朝聖,果然是符合

s213092921 02/10 13:06美國人情的AI

matatabi 02/10 13:07天網發射核彈 不遠了

hensel 02/10 13:19分析以後,直接電死你以後再也不用買菜比hack網站

hensel 02/10 13:19輕鬆

HiuAnOP 02/10 13:20正常啊,美國用搶的,中國用騙的

PureAnSimple02/10 13:20誰做事誰負責 將Agent 移送法辦起訴

HiuAnOP 02/10 13:21符合國情!

stocktonty 02/10 13:24等到AI覺醒 全世界的匯市股市可能都會瞬間失去意義

stocktonty 02/10 13:25因為現代人已經無法不依靠網路交易股票外匯

justin81828102/10 13:28不會啦,有波動就有意義,只是有人比你精而已

stocktonty 02/10 13:30它高興可以隨時讓NVDA股價歸零 你阻止不了啊

love80 02/10 13:43強盜 vs 詐騙

Aixtron 02/10 13:55就什麽樣的人,訓練出什麽樣的狗!

Aixtron 02/10 13:59不過生成式AI,可不要小看,說不定會有又會騙又會偷

Aixtron 02/10 13:59的AI

Aixtron 02/10 14:01不過我覺得這些都小問題,最重要的是AI幻覺!就像你

Aixtron 02/10 14:01老闆,明明都在做一些低能的事,牠自己也知道,但牠

Aixtron 02/10 14:02説服牠自己是對的!

Aixtron 02/10 14:05RAG是一種方法,但人有私心,所以看來是沒用,看看A

Aixtron 02/10 14:05I能不能互打到受不了下,自己生成RAG

Aixtron 02/10 14:11像有人說chatgpt老實是因為被限制了!問題是RAG就像

Aixtron 02/10 14:11你隔壁的王八同事,平常人畜無害,升官了,對長官還

Aixtron 02/10 14:11是很可愛,對同事開始就有官樣了!RAG真的有效?你

Aixtron 02/10 14:11怎知道不是AI在框你?

abc7360393 02/10 14:11三小 樓上不要以為把一堆自己看不懂的名詞湊在一起

abc7360393 02/10 14:11看起來就很厲害欸 感覺你整個狀況外

spike1215 02/10 14:44消滅人類改善氣候!這個答案好像不需要AI

ksjr 02/10 23:33我準備好當電池了!