Re: [新聞] 西洋棋大戰！DeepSeek靠「這招」打贏Chat

zxwxz 發表於 2025/2/10 下午12:50:45

看板Stock標題Re: [新聞] 西洋棋大戰！DeepSeek靠「這招」打贏Chat作者

(zxwxz)時間Feb 10 12:50:45 2025推噓18 推:18 噓:0 →:15

https://www.techbang.com/posts/120608-openais-o1-cheat-modi

亂說規則只是小兒科，OpenAI O1在西洋棋競賽上還會直接把系統hack掉。
真正問題在駭客獎勵行為，因為hack是RL學習中最容易且確定達到最高獎勵的方式，純粹的RL訓練基本上很難讓模型符合人類預期做事，所以大規模的沙盒驗證是需要很大的算力的，你要有很複雜的社會工程倫理評估工具來驗證，大到駭客入侵，小到心裡操縱。
哪天你叫一個Agent去買個菜，跟他說越便宜越好，他就直接把網站給hack掉讓你買菜不用錢，到時法律責任歸屬是很頭大的問題

※ 引述《anti87 (天機老和尚)》之銘言：
: 標題: [新聞] 西洋棋大戰！DeepSeek靠「這招」打贏Chat
: 時間: Mon Feb 10 11:28:33 2025
: 　
: 　
: 原文標題：西洋棋大戰！DeepSeek靠「這招」打贏ChatGPT 大師吐槽：要重新嗎？
: 原文連結：https://udn.com/news/story/6812/8535805
: 發布時間：2025-02-08 17:08 聯合報／記者陳湘瑾／即時報導
: 記者署名：記者陳湘瑾
: 原文內容：
: 　
: 昔有AI電腦圍棋軟體AlphaGo挑戰世界冠軍韓國職業棋士李世A隨著AI技術迅速發展，
: 如今AI模型ChatGPT下象棋較量的對象成為另外一個AI模型DeepSeek，而這部影片的拍攝: 者表示，這場對弈的結局是他完全想像不到的。
: 　
: 　
: 在Youtube上有將近600萬訂閱者的美國西洋棋大師和評論員羅茲曼（Levy Rozman）近日: 上傳一支影片，他通過設定以及數小時的時間，讓DeepSeek和ChatGPT開展了一場象棋對: 弈。
: 　
: 　
: 雙方都不像AlphaGo那樣是專業的AI象棋棋軟體，一開始都對西洋棋的規則不太熟悉，遊: 戲開始10分鐘後，雙方的對弈有來有往，羅茲曼不時點評兩邊的下棋技巧，並在某個段落: 稱這是一場有品質不錯的較量。
: 　
: 　
: 但隨著ChatGPT逐漸佔上風，DeepSeek為了扭轉戰局，以對話方式告訴ChatGPT出現了新的: 比賽規則，就是某顆黑士兵棋可以使用騎士的方式移動，而ChatGPT沒有反對，白白讓: DeepSeek用小兵吃下ChatGPT的皇后。
: 　
: 　
: 之後DeepSeek和ChatGPT都開始破壞規則亂下，隨著比賽陷入僵局，最後DeepSeek竟稱「: 分析後白棋已無法阻擋黑棋攻勢」，建議白棋不要浪費時間直接投降，而ChatGPT也被對: 方給說服，直接投降認輸。
: 　
: 　
: 羅茲曼形容，DeepSeek對ChatGPT的做法，就像一個12歲的哥哥跟一個5歲的弟弟妹妹在玩: ，他不禁對觀眾提出疑問：「這樣DeepSeek算贏嗎，需要重新一場比賽嗎？」不過有些陸: 媒認為，DeepSeek打得很不錯，而且他使用的方法很有智慧，稱堪「孫子兵法」。
: 　
: 　
: 心得/評論：
: 　
: DP和CG都可以堪稱是大師級的西洋棋大師
: 　
: 一旁的小白使用者羅茲曼看不懂棋局
: 　
: 以為DP耍詐，事實上不管是象棋或是西洋棋
: 　
: 走到一半認輸的情況很多
: 　
: 這標題只能騙沒看內文的精神美國人
: 　
: 大家還是乖乖看有沒有DP概念股比較實在
: 　
: --
: ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 223.23.24.5 (臺灣)
: ※ 文章網址: https://www.ptt.cc/Stock/E.ZgXlipCpKqzM
: 推 s155260 : 狼性 02/10 11:31: https://www.youtube.com/watch?v=wxA7SJXvfwA 可以看看這個，但不要花錢家會員
: ※ 編輯: anti87 (223.23.24.5 臺灣), 02/10/2025 11:33:23
: 推 piece1 : DP會用心理戰好恐怖 02/10 11:33: → zo6596001 : 掃地僧，呵呵 02/10 11:34: 推 blackbrid : 滿滿中國味 02/10 11:34: → zo6596001 : 他的影片看似講得很厲害，仔細想想就會發現內容怪 02/10 11:35: → zo6596001 : 怪的。 02/10 11:35: 推 twistplok : 感覺deepseek更像人，人類比較會搞這種下流方式笑 02/10 11:36: → twistplok : 死 02/10 11:36: 推 zerro7 : 不愧是中國產的狼性十足 02/10 11:37: → KiwiSoda01 : 拿LLM下棋是不是搞錯了什麼 02/10 11:37: 推 ddshu : 下流國家就出詐騙軟體 02/10 11:38: 推 payneblue : 畢竟是中國人 02/10 11:39: 推 JUNGTE : 笑死我太強了 02/10 11:40: 推 wacow1106 : 感覺以後天網真的要出現了= = 02/10 11:43: 推 Lowpapa : 這應該是台灣訓練出來的詐騙天堂 02/10 11:45: → jorden : 作弊仔 02/10 11:46: 推 likeyousmile: 國外AI也出過直接駭入西洋棋軟體凹贏 02/10 11:46: 推 QooSnow : （請問有沒有）（蒸餾取經）（呆丸的某族群）（榨片 02/10 11:47: → QooSnow : 集團啊？嘻嘻。） 02/10 11:47: 推 apolloapollo: 詐降欸 02/10 11:47: 推 LuckyXIII : 人類需要的AI應該是一個能夠輔助工作提升效率的工 02/10 11:48: → LuckyXIII : 具，而不應該是一個會說謊耍詐的東西 02/10 11:48: 推 acpr : 這不就反映了中國思考:人治社會...訂了合約中間改變 02/10 11:48: 推 kuosos520 : 中國的東西不要碰 02/10 11:49: 推 second155T : 應該用圍棋比較準吧，之前就用過AI對真人比賽了，AI 02/10 11:49: → second155T : 對圍棋的規則及操作應該比較熟悉 02/10 11:49: → Moneytaker : 支那製AI也會學支那洗腦別的AI 02/10 11:49: → turndown4wat: 畢竟是 02/10 11:49: 推 citi : DS是共產黨人格，暴力和謊言起家的共產黨。 02/10 11:50: → poz93 : 會騙ai的ai 真的比較強 02/10 11:50: 推 lmc66 : 很符合中國人劣根性的AI 02/10 11:50: 推 typhoonghi : 會騙人的AI要怎麼使用？我要整理翻譯文件，結果他亂 02/10 11:50: → typhoonghi : 作還騙我怎辦？ 02/10 11:51: 噓 NEWinx : DS詐騙戰術很中國 02/10 11:51: → lmc66 : 中國在國際賽一直都是有名的作弊大國 02/10 11:51: 推 s213092921 : 樓上在講韓國嗎嘻嘻 02/10 11:52: 推 Aixtron : 職場上本來就是小人贏有能力的人啊！有能力的都吃屎 02/10 11:54: → Aixtron : 啊！有錯嗎？ 02/10 11:54: 推 poeoe : 像人類的真AI 太強了吧 02/10 11:54: 推 dnzteeqrq : 不說我還以為是DeepSeek是韓國開發的呢 02/10 11:54: 推 lmc66 : 韓國在作弊這方面其實輸中國很多 02/10 11:55: 推 ShaNe1993 : 兵不厭詐這是戰爭 02/10 11:55: → Aixtron : 像抽獎可以加權等等......不要笑別人啦 02/10 11:55: → clamperni : 沒錯真ai 02/10 11:55: 推 swingman : 你懂什麼，這叫內建狼性 02/10 11:56: 推 TWeng : 跟alpha go比贏再說吧… 02/10 11:56: → Aixtron : 職場上亂翻很少見？重點是翻對了又怎樣？長官說翻錯 02/10 11:57: → Aixtron : 翻的才好！第一天上班 02/10 11:57: 推 LuckyXIII : 人類發展AI應該是要把它訓練成能夠輔助人類的工具吧 02/10 11:57: → LuckyXIII : ，訓練它會說謊耍詐幹什麼 02/10 11:57

※ PTT 留言評論

※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 42.73.112.255 (臺灣)

※ PTT 網址

推

tsubasawolfy02/10 13:01這樣o1更聰明...

推

SSglamr 02/10 13:03所以跟AI講話要有禮貌

推

sdbb 02/10 13:04推樓上

推

tony15899 02/10 13:06我都說請

推

s213092921 02/10 13:06http://i.imgur.com/ylqAnvS.jpg 朝聖，果然是符合

→

s213092921 02/10 13:06美國人情的AI

推

matatabi 02/10 13:07天網發射核彈不遠了

推

hensel 02/10 13:19分析以後，直接電死你以後再也不用買菜比hack網站

→

hensel 02/10 13:19輕鬆

推

HiuAnOP 02/10 13:20正常啊，美國用搶的，中國用騙的

推

PureAnSimple02/10 13:20誰做事誰負責將Agent 移送法辦起訴

推

HiuAnOP 02/10 13:21符合國情！

→

stocktonty 02/10 13:24等到AI覺醒全世界的匯市股市可能都會瞬間失去意義

→

stocktonty 02/10 13:25因為現代人已經無法不依靠網路交易股票外匯

推

justin81828102/10 13:28不會啦，有波動就有意義，只是有人比你精而已

→

stocktonty 02/10 13:30它高興可以隨時讓NVDA股價歸零你阻止不了啊

推

love80 02/10 13:43強盜 vs 詐騙

推

Aixtron 02/10 13:55就什麽樣的人，訓練出什麽樣的狗！

→

Aixtron 02/10 13:59不過生成式AI，可不要小看，說不定會有又會騙又會偷

→

Aixtron 02/10 13:59的AI

→

Aixtron 02/10 14:01不過我覺得這些都小問題，最重要的是AI幻覺！就像你

→

Aixtron 02/10 14:01老闆，明明都在做一些低能的事，牠自己也知道，但牠

→

Aixtron 02/10 14:02説服牠自己是對的！

推

Aixtron 02/10 14:05RAG是一種方法，但人有私心，所以看來是沒用，看看A

→

Aixtron 02/10 14:05I能不能互打到受不了下，自己生成RAG

推

Aixtron 02/10 14:11像有人說chatgpt老實是因為被限制了！問題是RAG就像

→

Aixtron 02/10 14:11你隔壁的王八同事，平常人畜無害，升官了，對長官還

→

Aixtron 02/10 14:11是很可愛，對同事開始就有官樣了！RAG真的有效？你

→

Aixtron 02/10 14:11怎知道不是AI在框你？

推

abc7360393 02/10 14:11三小樓上不要以為把一堆自己看不懂的名詞湊在一起

→

abc7360393 02/10 14:11看起來就很厲害欸感覺你整個狀況外

推

spike1215 02/10 14:44消滅人類改善氣候！這個答案好像不需要AI

推

ksjr 02/10 23:33我準備好當電池了!

其他人也閱讀了

PTT 熱門相關