PTT評價

Re: [問題] 如果要用Deep learning訓練Boss

看板C_Chat標題Re: [問題] 如果要用Deep learning訓練Boss作者
MikiSayaka
(美樹さやか)
時間推噓 1 推:1 噓:0 →:0

※ 引述《attacksoil (第三方程式)》之銘言:
: 該怎麼做比較實際?
: 想像中:
: 1. 先讓AI跟rule-based AI對戰N場
: 2. 再讓AI跟高手玩家對戰N場
: 3. 自己跟自己打N場
: 所以實際上會怎麼做?

---

這個問題是這樣子...

I. 首先是怎樣的遊戲很重要.
所謂的 1./2. => 3. 最後說啥 Alpha/Mu-Zero
一開始是所謂的棋類遊戲,
再來推到紅白機型遊戲可能就有些怪怪的了.
(好像推到這一步就已經會去鑽遊戲設計 bug)
更別說推文當中說星海會跑出更詭異的東西.

棋類遊戲狀態有限結果有限盤面資訊隨時可完整取得.
紅白機不太確定, 可是可能也是場地資訊打久了會全都學到的感覺.
這些感覺起來用到 3. 都不會太糟.

星海就沒有這種事了, 正常狀況下, 不能開圖啊 XD
看到推文的感覺是... 看來用自己打自己會練成企圖秒掉對方.


II. 什麼樣的 Boss 是好 Boss? (你的 reward function 怎麼設?)
a. 難到就算手上能做出所有的配置,
也只有很少的方式可以打贏.
b. 不用腦都能速勝的 Boss.
c. 不能隨便亂組隊, 但是確實存在多種取勝思路的 Boss.

但是這個就跟遊戲內環境有很大關係了.
想起之前有看到 G 社有在探討深度學習應用於平衡遊戲內環境的研究.


III. 實際上喔, 還沒有力氣碰到這一塊,
但是前兩個問題已經夠麻煩了.
像是 Deep Reinforcement Learning 只是解題方法論.
實際上要考慮的事情當中, 方法論已經變成比較簡單的一環 Orz

---

坦白說, 像是最近的 KRF 超高難...
可以感覺到難度其實比前幾次超高難來說,
有一定程度的下降 (暈值變成 0.8, 不用考慮屬性耐性, 但是有狀態)
於是打法就產生出多樣性, 找得出規則的話組隊難度會低些.

但是 KRF 的職業平衡是腳做的, 主流打法永遠是速殺流,
總是降防堆 buff 為底, 這次還有機會用速操.

對玩家來說多樣性大概也就是全三星/全四星/作品限/平屬or不利屬等等...
對設計 Boss 端來說多樣性是: 行動邏輯中設定出明顯的取勝手段.
所以才總是有騙錢的超高難推薦角色池給盤子抽 XD

(謎之聲: 本職都快倒了, 少回點這種東西 XDDDD)

--

※ PTT 留言評論
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 140.112.30.49 (臺灣)
PTT 網址

Emerson15803/12 15:09阿爽這大笨蛋~~~~(大喊)

※ 編輯: MikiSayaka (140.112.30.49 臺灣), 03/12/2022 15:22:25