PTT評價

Re: [閒聊] AI打星海爭霸,後來如何?

看板C_Chat標題Re: [閒聊] AI打星海爭霸,後來如何?作者
kuoyipong
(petohtalrayn)
時間推噓24 推:24 噓:0 →:56

: 大家可以看 2:10:16 開始的部分 https://youtu.be/cUTMhmVh1qs?t=7816
: 這時候AlphaStar有一大票追獵者,看起來非常兇悍。
: 但 Mana 只要用稜鏡把部隊運到對方家裡騷擾,AlphaStar的大軍就會班師回朝
: 戰鬥上 AlphaStar 只有「大部隊集結抗衡敵人」的概念
: 同時,AlphaStar 策略上也不太屌兵種對抗優劣,從頭至尾貫徹「追獵者最棒!」
: 這個大家在猜是因為AlphaStar覺得這兵種在消耗上最有效率
: 然後面對 Mana 的 不朽+破壞能 大軍,AlphaStar一樣用追獵者上去對幹。
: 想當然爾當然是輸了 從人類的角度看起來這兵種對抗要贏實在太難了

我覺得這部分當然應該是訓練給的APM相關參數有問題
也就是說給AI的APM上限還是太高,導致AI可以靠操作硬幹

我個人的推測是AI對局那個兩百年數據量,不太可能沒有用到不朽
那如果數據裡面有不朽結果還是敢用追獵硬推,而且確實也給他推成功了
那簡單來說就是這種微操無敵的兵種對AI來說太強
強到一般人類理解的優劣跟AI對局時的優劣是不同的

其實個人覺得星海一部分的問題在這裡
有沒有微操的情況下兵種強度存在差異

微操算是職業選手的基本功
雖然AI做出來的微操有點太離譜,但其實在一般人眼中選手的微操也很離譜
而重點是-不同微操能力下兵種克制的狀態也不同
就像一般人而言被毒爆衝生化會被換的很傷
但對選手而言,傷不傷取決於你散兵的能力

因此同理,對AI而言
如果部隊交戰時的微操對對局的影響大於你運營、策略、兵種克制的影響
那AI就會傾向於在部隊交戰時微操最大化
那就會回歸上面那個前提-APM設定太高導致兵種克制的概念與人類不同

某程度確實算是訓練失敗,因為前提與人類有明顯差距
但可以5:0可能代表在AI那個APM之下,閃追幹正面是局部最佳解
就跟人類以前找出來的三不朽等局部最佳解類似

: 當然你可以說結果就是 4:1 ,AlphaStar屌虐。
: 但我同時也相信那個時間點找其他人類高手跟AlphaStar打,
: AlphaStar的贏面應該是很低。因為策略認知上的缺陷被Mana暴露出來了

我是覺得AI的策略有時候是這樣
AI的局部最佳解不一定跟人類的局部最佳解一樣
而星海這個遊戲的微操會大幅影響遊戲的特質
讓AI只要在操作上設定的不夠貼近人類,那他得到的答案就會跟人類差距很大

以前圍棋沒有所謂的微操問題
具體來說只有每一步有多少思考時間的差別
但星海爭霸這款微操會影響策略的遊戲
這次AI讓人不服氣的點是交戰時APM過高導致兵種克制與我們認知的差距太大

但其實AI下棋的時候也有類似的狀況
很多職業棋手看到AI的下法都會困惑,更會直接建議初學者不要學AI的下法
因為AI的策略不會告訴你他的邏輯是什麼

所以直接說AI的策略有問題可能只是人類的一廂情願
因為可能在AI的領域中,那個策略問題都是可以解決的
也因此回到前面的部分,你要為AI設下多少限制才「公平」
這次是閃追獵的操作上限太高,職業選手也做不到這個上限
所以變成騎摩托車跑一百公尺那種感覺
但是AI的自我對局中,大家(自己跟自己的分身)都是騎摩托車的
所以策略都是基於騎摩托車來發展

不過似乎這計畫沒有要繼續做下去
所以也很難看到AI再壓低APM之後的策略轉變了

--

※ PTT 留言評論
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 61.64.25.104 (臺灣)
PTT 網址

tonyy80110108/30 17:58手速太高基本上不是跟AI打,是跟外掛打

tonyy80110108/30 17:59那個人類也做不到的操作基本上就是不公平的存在

lsd2596808/30 18:00是說AI是不是情蒐都做得很到位? 大招有用嗎XD 雖然我想

lsd2596808/30 18:00大招成功幾次後 AI懂得怎麼防了就沒用了

hh123yaya08/30 18:01情蒐也是要犧牲單位去巡邏才有 AI有養成嗎?

hh123yaya08/30 18:01不管有沒有情蒐都閃追幹死你的話 也沒必要情蒐了

arrenwu08/30 18:01@lsd25968 你講的這種思考方式是人類的思考方式

goliath08/30 18:01早期搞人的手段 微操好可以解決七八成吧

Senkanseiki08/30 18:02問題是高手速前提下大招可能都不是大招,我記得之前

Senkanseiki08/30 18:02AI被先知搞結果損失都是微乎其微

arrenwu08/30 18:02另外關於APM的部分,我沒有相關證據,但我自己認為APM

arrenwu08/30 18:02會設定成我們看到的那種高度很可能是因為如果不這樣設定

arrenwu08/30 18:03AlphaStar可能沒辦法訓練到能拿出來DEMO的程度

LeeXX08/30 18:03同意在ai的apm下 會有和人類玩家不同的meta

arrenwu08/30 18:03至少我覺得沒啥道理他如果 APM 150就能打贏人類他會需要

arrenwu08/30 18:03給到 300 APM

arrenwu08/30 18:04畢竟這項實驗,APM設定越低 結果的價值就越高

LeeXX08/30 18:05這也是RTS對遊戲公司而言為難的地方 最早期人族打針高階玩

LeeXX08/30 18:05家無敵中低階就是被滾爛燒爛 沒有一個平衡性是能高低階環

LeeXX08/30 18:05境兼顧的

goliath08/30 18:05畢竟實驗結果是跟你說AI和人的apm操作結果不同了

tasin08/30 18:05選手的微操不會在一般人眼中離譜啊 做不到而已 ai那個叫肉

tasin08/30 18:05眼看就知道人類做不到

LeeXX08/30 18:07不不選手的操作看起來也一點都不像人類啊 每個都像有四隻

LeeXX08/30 18:07手 屏幕一秒刷一次的

cycy77148908/30 18:08取消戰爭迷霧,AI還會選擇爆單一兵種嗎?

LeeXX08/30 18:08而且像parting也有打過完全無損閃追操作贏下一局 那也是很

LeeXX08/30 18:08非人類

arrenwu08/30 18:08取消戰爭迷霧那玩的就不是星海爭霸了

hh123yaya08/30 18:09其實這也牽扯到遊戲本身平衡的方向了 兵種的操作性本來

hh123yaya08/30 18:10就在平衡的考量中

cycy77148908/30 18:10先讓他學習

jeeyi34508/30 18:10本來想看策略 結果AI覺得微操就夠了

cycy77148908/30 18:10兵種相剋,再開啟戰爭迷霧讓它擬定策略

Senkanseiki08/30 18:11問題是這其實不是這種AI的訓練方式

arrenwu08/30 18:12是啊 你不能想像他是個人類XD

LeeXX08/30 18:12當初會選星海來訓練就是因為不像圍棋,星海有迷霧吧

arrenwu08/30 18:13我聽到的也是想嘗試看看RL下AI在非全知遊戲下的表現

jeeyi34508/30 18:15不然回去比非即時呢

LeeXX08/30 18:15回到職業選手 先不管地圖快捷 一般大後期為了閃AOE和方便

LeeXX08/30 18:15施法 加上要顧後方 控制群組至少要6、7個時時緊盯 這你覺

LeeXX08/30 18:15得是人類幹得出來的事?

NoLimination08/30 18:15結果AI:戰爭迷霧?閃現追獵能解決一切問題

LeeXX08/30 18:16非即時到alphago養好就已經不用再比啦

goliath08/30 18:16按鍵太多 手就開始跟不上腦袋了 AI可沒這個問題

arrenwu08/30 18:18另外,策略認知有無問題是結果論。不是說AI在模擬環境

arrenwu08/30 18:18覺得這是最佳解那就正確

根據我的認知,這種AI並沒有很明確的邏輯跟因果 而是把每一場訓練出來的參數透過神經元疊層等複雜的計算方式給予不同的權重 是比較類似人類大腦運作方式的AI 因為不是靠邏輯推演,給他更多資訊他只會告訴你我的訓練的資料不是長這樣 所以直接把戰爭迷霧解除對AI而言可能只會讓她困惑「這種場面我沒看過」 然後為什麼我說AI的局部最佳解會因為APM設定過寬鬆而跟人類顯著不同 原因是這種AI是左右互搏在訓練的 如果你設定的微操速度過高,那AI就會基於那個微操速度來左右互搏 因此在人類看起來很傻眼的閃追獵,在AI對局裡面應該是基本戰術 然後這個戰術強無敵導致AI只要速爬閃追獵就能吃掉所有對局 所以進一步的讓AI寧可冒不偵查的風險也要賺那一點資源來抵達這個「終點」 類似的狀況還有AI跟人對局,工兵數一樣但AI的資源生產效率就是快1成 這多半也是AI為了盡快抵達特定戰略目標而產生的「產資源微操」

※ 編輯: kuoyipong (61.64.25.104 臺灣), 08/30/2022 18:30:22

LeeXX08/30 18:21職業選手恐怖就在那些按鍵腦袋和手都能處理 而且是非公式

LeeXX08/30 18:21化的應對 至少在serral碾壓的時候是這麼一回事 歐美的大後

LeeXX08/30 18:21期靈活打法更勝韓國的公式化打法

tasin08/30 18:28Serral明明是個完美呈現公式化應對到極致的玩家XD 所以他最

tasin08/30 18:28不會打ZVZ這種主動的對抗

chang1248w08/30 18:32要說準備戰術不得不提bo無敵的男人rogue

chang1248w08/30 18:32看他打zvz根本藝術

KuBiLife08/30 18:35就AI發現剪刀石頭布裡面石頭其實是手榴彈

KuBiLife08/30 18:36他學怎麼丟手榴彈就好 管他剪刀跟布

black8073108/30 18:40之前有 沒限制的 影片

black8073108/30 18:40ai的可以 把部隊散開 閃aoe 太扯

kuoyipong08/30 18:42AlphaStar有限制,但看來限制太寬鬆

kuoyipong08/30 18:42導致AS得到的結果就是閃追OP

kuoyipong08/30 18:42然後鳳凰強無敵

Minesweeper08/30 18:44沒限制不就跟悍馬一樣,有意義嗎

沒限制的意義就是悍馬內戰誰最強 這也是說這個計畫不是那麼成功的原因 我知道了閃追強無敵,但這不是我想知道的 我有找到一些其他的AS對戰影片,等我看完再來告訴大家一些結論

※ 編輯: kuoyipong (61.64.25.104 臺灣), 08/30/2022 18:47:08

kluele58508/30 18:55事實上你指的 人類不知道AI這麼做的原因是什麼<—這點

kluele58508/30 18:55這幾年一直是研究的方向之一 以圍棋舉例好了 現在的AI

kluele58508/30 18:55已經能告訴你出這步棋他為什麼這麼下 好是好在哪裡 甚

kluele58508/30 18:55至人類下一手也能分析出勝率跟優劣

Minesweeper08/30 19:32看勝率本來就可以了吧,能夠自解釋倒是聞所未聞,哪

Minesweeper08/30 19:32家的圍棋ai?

Minesweeper08/30 19:33要解釋這一手好在哪,是什麼解釋法?

pleaseask08/30 19:46ai自練,可能因為總是在找最佳化策略(而非針對所有策

pleaseask08/30 19:46略的應對模式),最終的答案就是閃追互打,打了幾千萬

pleaseask08/30 19:46局之後就只是一直優化這個策略,人類出奇招(甚至只是

pleaseask08/30 19:46很普通的偷家)就會讓ai整個錯愕然後失常

kuoyipong08/30 20:01其實奇招是有考慮的

kuoyipong08/30 20:02而且結論就是,你就算奇招還是打不贏我閃追(遠目)

kuoyipong08/30 20:03至少這五場閃追都是強到超乎人類所知的策略

人類方出的奇招在AI方算不算奇招其實要打個問號 因為如果微操強無敵的話,照理來說完美操作的大招應該也很強 但從AI應對先知騷擾等手段來看, 其實人類認知的大招在AI眼中幾乎是可以用操作來處理的

※ 編輯: kuoyipong (61.64.25.104 臺灣), 08/30/2022 20:05:33

km85010508/30 20:09阿法星當初去打天梯也被養壞,被三族各路大招快攻搞到只

km85010508/30 20:09會大召

km85010508/30 20:12然後韓國的星海風和歐洲完全不同,想搞出kespa鼎盛期韓

km85010508/30 20:12國的大將級選手機乎不可能