更多

    打乒乓球學戰略規劃 Deepmind 機械人達中階業餘球手水平

    Mickey Chan
    Mickey Chan
    愛模擬飛行、希望終有一日回到單車上的宅,眼鏡娘控。座右銘: 1.膽固醇跟美味是成正比的; 2.所有人都可以騙,但絕對不能騙自己; 3.賣掉的貨才是錢,不賣的收藏品不值一文; 4.踩單車,是為了吃更多美食! 5.正義的話語,不一定出自正義之人的口;

    剛閉幕的巴黎奧運會中,中國乒乓球隊取得 5 金 1 銀的成績。在人工智能和機械人技術發展迅速的今日,機械人會否有能加在乒乓球桌上擊敗人類?Google 旗下的人工智能研發部門 Deepmind 日前發表一項研究成果,讓機械人與業餘乒乓球員對賽,展示機械人能像人類一樣透過學習來實現現實世界中需要身體技能、感知和制訂戰略的複雜任務。

    原來自上世紀 80 年代開始,研究人員就以乒乓球作為這類研究的基準,機械人不單要學會低階控制的回球技巧,還要學會為達成目標而制訂戰略和長期規劃等高階技能。

    研究人員收集了乒乓球初始狀態的數據集,包括球的位置、速度和旋轉的資料,機械人就以那些資料來學習各種乒乓球技巧,包括正手上旋、反手抽擊和接發球等。研究人員建立了一套持續回饋的學習系統,機械人最初是在一個準確模擬乒乓球物理的虛擬環境裡進行訓練,然後在現實世界去收集與人類對賽的表現數據,以便在模擬環境中改善技巧。

    研究人員還設計了一套系統追蹤不同對手的行為和比賽風格,例如他們傾向於向球桌哪一邊回球,令機械人嘗試不同技巧,監察其成功率,並且動態調整戰略。

    研究中機械人與 29 位素未謀面的人類對手進行對賽,涵蓋初階到高階 4 種不同技能級別。結果機械人的得分處於參賽者的中間位置,顯示這系統具備中階業餘球手的水平,不過就無法擊敗高階球手。研究人員指當中涉及一些物理和技巧限制,例如反應速度、鏡頭感測能力,旋球處理和球拍的橡膠,這些都是難以在模擬環境中準確建立模型的。

    最新影片

    您會感興趣的內容

    相關文章