Re: [閒聊] AI打星海爭霸，後來如何？

kuoyipong 發表於 2022/8/30 下午5:55:46

看板C_Chat標題Re: [閒聊] AI打星海爭霸，後來如何？作者

(petohtalrayn)時間Aug 30 17:55:46 2022推噓24 推:24 噓:0 →:56

: 大家可以看 2:10:16 開始的部分 https://youtu.be/cUTMhmVh1qs?t=7816
: 這時候AlphaStar有一大票追獵者，看起來非常兇悍。
: 但 Mana 只要用稜鏡把部隊運到對方家裡騷擾，AlphaStar的大軍就會班師回朝
: 戰鬥上 AlphaStar 只有「大部隊集結抗衡敵人」的概念
: 同時，AlphaStar 策略上也不太屌兵種對抗優劣，從頭至尾貫徹「追獵者最棒！」
: 這個大家在猜是因為AlphaStar覺得這兵種在消耗上最有效率
: 然後面對 Mana 的不朽+破壞能大軍，AlphaStar一樣用追獵者上去對幹。
: 想當然爾當然是輸了從人類的角度看起來這兵種對抗要贏實在太難了

我覺得這部分當然應該是訓練給的APM相關參數有問題
也就是說給AI的APM上限還是太高，導致AI可以靠操作硬幹

我個人的推測是AI對局那個兩百年數據量，不太可能沒有用到不朽
那如果數據裡面有不朽結果還是敢用追獵硬推，而且確實也給他推成功了
那簡單來說就是這種微操無敵的兵種對AI來說太強
強到一般人類理解的優劣跟AI對局時的優劣是不同的

其實個人覺得星海一部分的問題在這裡
有沒有微操的情況下兵種強度存在差異

微操算是職業選手的基本功
雖然AI做出來的微操有點太離譜，但其實在一般人眼中選手的微操也很離譜
而重點是－不同微操能力下兵種克制的狀態也不同
就像一般人而言被毒爆衝生化會被換的很傷
但對選手而言，傷不傷取決於你散兵的能力

因此同理，對AI而言
如果部隊交戰時的微操對對局的影響大於你運營、策略、兵種克制的影響
那AI就會傾向於在部隊交戰時微操最大化
那就會回歸上面那個前提－APM設定太高導致兵種克制的概念與人類不同

某程度確實算是訓練失敗，因為前提與人類有明顯差距
但可以5:0可能代表在AI那個APM之下，閃追幹正面是局部最佳解
就跟人類以前找出來的三不朽等局部最佳解類似

: 當然你可以說結果就是 4:1 ，AlphaStar屌虐。
: 但我同時也相信那個時間點找其他人類高手跟AlphaStar打，
: AlphaStar的贏面應該是很低。因為策略認知上的缺陷被Mana暴露出來了

我是覺得AI的策略有時候是這樣
AI的局部最佳解不一定跟人類的局部最佳解一樣
而星海這個遊戲的微操會大幅影響遊戲的特質
讓AI只要在操作上設定的不夠貼近人類，那他得到的答案就會跟人類差距很大

以前圍棋沒有所謂的微操問題
具體來說只有每一步有多少思考時間的差別
但星海爭霸這款微操會影響策略的遊戲
這次AI讓人不服氣的點是交戰時APM過高導致兵種克制與我們認知的差距太大

但其實AI下棋的時候也有類似的狀況
很多職業棋手看到AI的下法都會困惑，更會直接建議初學者不要學AI的下法
因為AI的策略不會告訴你他的邏輯是什麼

所以直接說AI的策略有問題可能只是人類的一廂情願
因為可能在AI的領域中，那個策略問題都是可以解決的
也因此回到前面的部分，你要為AI設下多少限制才「公平」
這次是閃追獵的操作上限太高，職業選手也做不到這個上限
所以變成騎摩托車跑一百公尺那種感覺
但是AI的自我對局中，大家(自己跟自己的分身)都是騎摩托車的
所以策略都是基於騎摩托車來發展

不過似乎這計畫沒有要繼續做下去
所以也很難看到AI再壓低APM之後的策略轉變了

※ PTT 留言評論

※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 61.64.25.104 (臺灣)

※ PTT 網址

推

tonyy80110108/30 17:58手速太高基本上不是跟AI打，是跟外掛打

→

tonyy80110108/30 17:59那個人類也做不到的操作基本上就是不公平的存在

推

lsd2596808/30 18:00是說AI是不是情蒐都做得很到位? 大招有用嗎XD 雖然我想

→

lsd2596808/30 18:00大招成功幾次後 AI懂得怎麼防了就沒用了

推

hh123yaya08/30 18:01情蒐也是要犧牲單位去巡邏才有 AI有養成嗎?

→

hh123yaya08/30 18:01不管有沒有情蒐都閃追幹死你的話也沒必要情蒐了

推

arrenwu08/30 18:01@lsd25968 你講的這種思考方式是人類的思考方式

→

goliath08/30 18:01早期搞人的手段微操好可以解決七八成吧

推

Senkanseiki08/30 18:02問題是高手速前提下大招可能都不是大招，我記得之前

→

Senkanseiki08/30 18:02AI被先知搞結果損失都是微乎其微

→

arrenwu08/30 18:02另外關於APM的部分，我沒有相關證據，但我自己認為APM

→

arrenwu08/30 18:02會設定成我們看到的那種高度很可能是因為如果不這樣設定

→

arrenwu08/30 18:03AlphaStar可能沒辦法訓練到能拿出來DEMO的程度

推

LeeXX08/30 18:03同意在ai的apm下會有和人類玩家不同的meta

→

arrenwu08/30 18:03至少我覺得沒啥道理他如果 APM 150就能打贏人類他會需要

→

arrenwu08/30 18:03給到 300 APM

→

arrenwu08/30 18:04畢竟這項實驗，APM設定越低結果的價值就越高

→

LeeXX08/30 18:05這也是RTS對遊戲公司而言為難的地方最早期人族打針高階玩

→

LeeXX08/30 18:05家無敵中低階就是被滾爛燒爛沒有一個平衡性是能高低階環

→

LeeXX08/30 18:05境兼顧的

→

goliath08/30 18:05畢竟實驗結果是跟你說AI和人的apm操作結果不同了

推

tasin08/30 18:05選手的微操不會在一般人眼中離譜啊做不到而已 ai那個叫肉

→

tasin08/30 18:05眼看就知道人類做不到

推

LeeXX08/30 18:07不不選手的操作看起來也一點都不像人類啊每個都像有四隻

→

LeeXX08/30 18:07手屏幕一秒刷一次的

推

cycy77148908/30 18:08取消戰爭迷霧，AI還會選擇爆單一兵種嗎？

→

LeeXX08/30 18:08而且像parting也有打過完全無損閃追操作贏下一局那也是很

→

LeeXX08/30 18:08非人類

推

arrenwu08/30 18:08取消戰爭迷霧那玩的就不是星海爭霸了

推

hh123yaya08/30 18:09其實這也牽扯到遊戲本身平衡的方向了兵種的操作性本來

→

hh123yaya08/30 18:10就在平衡的考量中

推

cycy77148908/30 18:10先讓他學習

→

jeeyi34508/30 18:10本來想看策略結果AI覺得微操就夠了

→

cycy77148908/30 18:10兵種相剋，再開啟戰爭迷霧讓它擬定策略

推

Senkanseiki08/30 18:11問題是這其實不是這種AI的訓練方式

→

arrenwu08/30 18:12是啊你不能想像他是個人類XD

→

LeeXX08/30 18:12當初會選星海來訓練就是因為不像圍棋，星海有迷霧吧

→

arrenwu08/30 18:13我聽到的也是想嘗試看看RL下AI在非全知遊戲下的表現

→

jeeyi34508/30 18:15不然回去比非即時呢

→

LeeXX08/30 18:15回到職業選手先不管地圖快捷一般大後期為了閃AOE和方便

→

LeeXX08/30 18:15施法加上要顧後方控制群組至少要6、7個時時緊盯這你覺

→

LeeXX08/30 18:15得是人類幹得出來的事?

→

NoLimination08/30 18:15結果AI:戰爭迷霧？閃現追獵能解決一切問題

→

LeeXX08/30 18:16非即時到alphago養好就已經不用再比啦

→

goliath08/30 18:16按鍵太多手就開始跟不上腦袋了 AI可沒這個問題

推

arrenwu08/30 18:18另外，策略認知有無問題是結果論。不是說AI在模擬環境

→

arrenwu08/30 18:18覺得這是最佳解那就正確

根據我的認知，這種AI並沒有很明確的邏輯跟因果而是把每一場訓練出來的參數透過神經元疊層等複雜的計算方式給予不同的權重是比較類似人類大腦運作方式的AI 因為不是靠邏輯推演，給他更多資訊他只會告訴你我的訓練的資料不是長這樣所以直接把戰爭迷霧解除對AI而言可能只會讓她困惑「這種場面我沒看過」然後為什麼我說AI的局部最佳解會因為APM設定過寬鬆而跟人類顯著不同原因是這種AI是左右互搏在訓練的如果你設定的微操速度過高，那AI就會基於那個微操速度來左右互搏因此在人類看起來很傻眼的閃追獵，在AI對局裡面應該是基本戰術然後這個戰術強無敵導致AI只要速爬閃追獵就能吃掉所有對局所以進一步的讓AI寧可冒不偵查的風險也要賺那一點資源來抵達這個「終點」類似的狀況還有AI跟人對局，工兵數一樣但AI的資源生產效率就是快1成這多半也是AI為了盡快抵達特定戰略目標而產生的「產資源微操」

※ 編輯: kuoyipong (61.64.25.104 臺灣), 08/30/2022 18:30:22

推

LeeXX08/30 18:21職業選手恐怖就在那些按鍵腦袋和手都能處理而且是非公式

→

LeeXX08/30 18:21化的應對至少在serral碾壓的時候是這麼一回事歐美的大後

→

LeeXX08/30 18:21期靈活打法更勝韓國的公式化打法

推

tasin08/30 18:28Serral明明是個完美呈現公式化應對到極致的玩家XD 所以他最

→

tasin08/30 18:28不會打ZVZ這種主動的對抗

→