剛閉幕的巴黎奧運會中,中國乒乓球隊取得 5 金 1 銀的成績。在人工智能和機械人技術發展迅速的今日,機械人會否有能加在乒乓球桌上擊敗人類?Google 旗下的人工智能研發部門 Deepmind 日前發表一項研究成果,讓機械人與業餘乒乓球員對賽,展示機械人能像人類一樣透過學習來實現現實世界中需要身體技能、感知和制訂戰略的複雜任務。
原來自上世紀 80 年代開始,研究人員就以乒乓球作為這類研究的基準,機械人不單要學會低階控制的回球技巧,還要學會為達成目標而制訂戰略和長期規劃等高階技能。
研究人員收集了乒乓球初始狀態的數據集,包括球的位置、速度和旋轉的資料,機械人就以那些資料來學習各種乒乓球技巧,包括正手上旋、反手抽擊和接發球等。研究人員建立了一套持續回饋的學習系統,機械人最初是在一個準確模擬乒乓球物理的虛擬環境裡進行訓練,然後在現實世界去收集與人類對賽的表現數據,以便在模擬環境中改善技巧。
研究人員還設計了一套系統追蹤不同對手的行為和比賽風格,例如他們傾向於向球桌哪一邊回球,令機械人嘗試不同技巧,監察其成功率,並且動態調整戰略。
研究中機械人與 29 位素未謀面的人類對手進行對賽,涵蓋初階到高階 4 種不同技能級別。結果機械人的得分處於參賽者的中間位置,顯示這系統具備中階業餘球手的水平,不過就無法擊敗高階球手。研究人員指當中涉及一些物理和技巧限制,例如反應速度、鏡頭感測能力,旋球處理和球拍的橡膠,這些都是難以在模擬環境中準確建立模型的。