PTT評價

Re: [討論] 為何機器人AI不透過強化式學習訓練?

看板Tech_Job標題Re: [討論] 為何機器人AI不透過強化式學習訓練?作者
cateran
(雲川閒步)
時間推噓 6 推:6 噓:0 →:1

強化學習只有在遊戲取得成功是有原因的
因為遊戲世界本身就是一個純虛擬的環境
操控的自由度也不高 比如說圍棋就是19*19取一格落子
(19*19看起來很高 可是特斯拉的機器人光手掌就有二十幾個dof)
所以下圍棋可以一秒鐘就下幾千萬盤棋
但你如果要做一隻機械手臂拿實體棋子取棋
然後落子在棋盤上
光是第一手天元 這個動作可能就要訓練幾個小時
實體世界的維度超乎想像得高
然後機械零件是有壽命的
除非AI能真正發展出像人腦一樣的推理能力
不然以現有RL那樣讓機器人在一個環境瞎雞巴亂弄
就算有錢如馬斯克也是會被實體世界的複雜度擊垮


--

※ PTT 留言評論
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 96.230.198.240 (美國)
PTT 網址

whatzup1124 10/17 09:42這個第一手天元太熟悉了

aria0520 10/17 10:01其實就算不第一手天元應該也能贏

xu3vul3vmp 10/17 11:46Omniverse

steven88669 10/17 12:55RL目前看到比較多在封閉的倉儲agv 應用

dildoe 10/17 13:21想這麼多 不考慮亞洲大外包嗎?

DrizztMon 10/17 13:37其實loss寫得出來的問題都沒有必要用RL阿

han3rd 10/19 10:39sim2real研究研究