一、前言:
2024年奧運的男子桌球金牌戰,在樊振東與莫雷加德 (MOREGARD) 的激戰中結束了。Google旗下的DeepMind團隊隨後也在2024年8月7日釋出了一份關於桌球機器人的論文,宣稱其開發的桌球機器人已經能夠與桌球的業餘愛好者匹敵。那麼,Google這次開發之桌球機器人的桌球技術究竟達到了什麼樣的程度呢?
二、說明:
其實,開發出一款能夠與人類在球桌上有來有往的機器人,一直是機器人研究領域所追求的目標之一。除了市面上販售的發球機之外,庫卡公司 (KUKA) 在2014年發布了一段機械手臂與桌球名將波爾 (Boll) 在球桌上來回對打的廣告;歐姆龍(OMRON)公司也在2016年發表了第一款的機器桌球教練 (FORPHEUS);Google在2022年更是發表了一款能和人類往來最多150拍的桌球機器人,並且在2022至2024年間也發表了多項與桌球機器人相關的研究。
開發桌球機器人,不僅只是為了從旁協助人類訓練桌球技巧;其最終的目的更是希望開發出一款能夠根據人類反應、迅速決斷並且做出精準動作的機器人來與人類協同合作。而桌球運動參與者往往需要根據對手的來球軌跡、決定回球路線並且控制回球的落點,且這一切都發生在快速運行的桌球往來活動於面積不大之球桌的時間內。因此,機器人能否在球桌上與人類有來有往,普遍被視為評估機器人是否足以與人類協作的觀察指標。
回到Google由DeepMind團隊在2024年所發表的桌球機器人;DeepMind是研發出打敗職業圍棋士李世乭的AlphaGo,並且成功讓AlphaGo取得職業圍棋九段稱號的團隊。然而,不同於以往只是在棋盤上預測落子、預估勝率及制定策略的AlphaGo;該團隊本次的主要目的是開發出能與人類在現實環境中進行桌球比賽的一款桌球機器人,再由比賽的結果評估該機器人是否已經具備了能與人類匹敵的桌球能力。
其中,桌球機器人的本體是一個設於龍門定位平台的機械手臂,能沿著x軸和y軸活動,機械手臂固持球拍來進行擊球。此外,團隊還設置專門觀察球桌上之桌球活動的攝影機,以及專門觀察對手球拍活動的攝影機。相較於Google在2022年所發表的桌球機器人,本次DeepMind團隊採用一種分層模組化的策略架構 (hierarchical and modular policy architecture) 來控制機器人。其中,所謂的分層模組化策略架構包括了模組化的多個低階控制器 (low level controllers),以及一個高階控制器(high level controller);每個低階控制器對應著一種如正手擊球、反手擊球及正手上旋球等桌球技巧,且具有對該技巧的描述。而高階控制器則用於從多個低階控制器中選擇一個來作為機器人回球的技巧。
進一步,高階控制器結合以下6個要素來選擇回球的低階控制器:(1)決定以正手回球或以反手回球;(2)根據來球的旋轉資訊來判斷來球是上旋或下旋;(3)低階控制器的技巧描述,這些描述如依據特定來球條件所預估的回球機率、擊球速度及落點;(4)人類和機器人的對戰統計;(5)根據要素(1)、(3)和(4)來列出低階控制器之桌球技巧的候選清單;以及(6)做出低階控制器的最後選擇。
為了節省和真人對練所耗費的成本,DeepMind團隊本次在初期沒有讓機器人和真人對練,而是先讓高階控制器和多個低階控制器在虛擬的環境中進行訓練。團隊以人和人對戰的40分鐘影片和發球機所發出的480個發球作為初始的訓練資料,先在虛擬環境中訓練高階控制器和低階控制器。完成初始的訓練後,接著再讓機器人與真人對練,將對練過程中所收集到的資料反饋給高階控制器和低階控制器。
為了能在比賽結束之後,明確界定桌球機器人的桌球能力程度;該團隊在比賽前先對59名自願者進行事先研究,依這些自願者參與桌球活動的程度,歸納得到初級者、中級者、進階者和高級者的定義,並且依此研究設計出一份問卷。
接下來,其中29名自願者被安排與桌球機器人進行比賽;前述29名自願者是機器人在真人對練過程中未遭遇過的對手,他們先填寫問卷,並且被區分為7位初級者、11為中級者、5位進階者和6位高級者。機器人與這29名對手對戰的結果是:機器人擊敗了其中的13位對手、並且取得了45%的勝率。這13位對手都是每週參與桌球活動一定次數,但球齡不長且沒有經過專業教練指導的初級者和中級者。乍看之下,機器人看似取得了不錯的勝率,但機器人卻在比賽中完全輸給了進階者和高級者。
目前機器人還沒有辦法與進階者和高級者一較高下的原因有很多,諸如攝影機捕捉影像的能力不足、機械手臂的活動速度不夠快且靈活性不足,以及從產生指令到控制機械手臂回球的時間不夠短等因素,這些都是讓機器人目前仍無法應對進階者和高級者的旋轉球和快速回球的關鍵原因。
到此,DeepMind團隊所做的研究尚未完全結束;為了暸解人們是否願意再次與桌球機器人一起進行桌球活動,在取得了比賽結果之後,團隊繼續研究這29名對手和桌球機器人一起進行桌球活動的感受。團隊在論文中表示,他們能夠想像當機器人以重複動作回球,或者當人們每一球都被機器人殺球時,和機器人一起進行桌球活動顯然是不吸引人的;因此,高階控制器所做的選擇不全然是為了提升表現,而是同時基於能讓參與者樂在其中的考量。在探討人們感受的研究中,團隊藉由觀察這些對手與機器人進行桌球活動時,對於惱人的、挑戰的、簡單的、有吸引力的、挫折的和有趣的感受的程度,得到了這些對手認為與機器人一起進行桌球活動是有趣且具有吸引力的結論,這些對手也都有興趣再次和機器人一起進行桌球活動。
三、結語:
未來,人類與機器人協力合作來完成一項工作或許已是不可避免的趨勢;除了桌球機器人之外,製作漢堡的機器人、製作薯條的機器人都已經上線和餐廳的員工一起工作,不僅機器人要學會與人類協同工作,人類或許也要逐漸做出調整來適應與機器人協進行同作業。
Google的DeepMind團隊在2024年所發表的論文和開發的桌球機器人,不僅以不同的訓練方式降低了機器人的訓練成本,其分層模組化的策略架構也讓機器人從最高能和人們往來150拍進化到能與沒交手過的業餘愛好者一起進行桌球活動的程度。
而本次研究,在少量的初始資料下訓練出能與桌球業餘愛好者匹敵之機器人的成果固然讓人驚艷;然而,這次的發表最能引起筆者注意的卻是團隊在最後關於29名對手與桌球機器人一起進行桌球活動的感受研究。在論文中,關於人們對機器人一起活動感受的研究雖然篇幅不多,也不是論文的重點,甚至有可能僅是為了安撫人們對於陌生變化的不安。但這也表示了生產出高性能機器人的未來或許已經離人們不遠;在確定了人們不可避免的要與機器人協同工作的前提下,研究的目標已經由開發出高性能的機器人,逐漸轉變為開發出讓人們願意合作的機器人。確實,能夠讓人們感到安心並且願意一起相處,又何嘗不是機器人的一種能力呢?
參考資料:
1. https://www.kuka.com/timo
2. https://www.omron.com/global/en/technology/information/forpheus/
3. https://sites.google.com/view/is2r
4. https://deepmind.google/research/publications/107741/
2024年奧運的男子桌球金牌戰,在樊振東與莫雷加德 (MOREGARD) 的激戰中結束了。Google旗下的DeepMind團隊隨後也在2024年8月7日釋出了一份關於桌球機器人的論文,宣稱其開發的桌球機器人已經能夠與桌球的業餘愛好者匹敵。那麼,Google這次開發之桌球機器人的桌球技術究竟達到了什麼樣的程度呢?
二、說明:
其實,開發出一款能夠與人類在球桌上有來有往的機器人,一直是機器人研究領域所追求的目標之一。除了市面上販售的發球機之外,庫卡公司 (KUKA) 在2014年發布了一段機械手臂與桌球名將波爾 (Boll) 在球桌上來回對打的廣告;歐姆龍(OMRON)公司也在2016年發表了第一款的機器桌球教練 (FORPHEUS);Google在2022年更是發表了一款能和人類往來最多150拍的桌球機器人,並且在2022至2024年間也發表了多項與桌球機器人相關的研究。
開發桌球機器人,不僅只是為了從旁協助人類訓練桌球技巧;其最終的目的更是希望開發出一款能夠根據人類反應、迅速決斷並且做出精準動作的機器人來與人類協同合作。而桌球運動參與者往往需要根據對手的來球軌跡、決定回球路線並且控制回球的落點,且這一切都發生在快速運行的桌球往來活動於面積不大之球桌的時間內。因此,機器人能否在球桌上與人類有來有往,普遍被視為評估機器人是否足以與人類協作的觀察指標。
回到Google由DeepMind團隊在2024年所發表的桌球機器人;DeepMind是研發出打敗職業圍棋士李世乭的AlphaGo,並且成功讓AlphaGo取得職業圍棋九段稱號的團隊。然而,不同於以往只是在棋盤上預測落子、預估勝率及制定策略的AlphaGo;該團隊本次的主要目的是開發出能與人類在現實環境中進行桌球比賽的一款桌球機器人,再由比賽的結果評估該機器人是否已經具備了能與人類匹敵的桌球能力。
其中,桌球機器人的本體是一個設於龍門定位平台的機械手臂,能沿著x軸和y軸活動,機械手臂固持球拍來進行擊球。此外,團隊還設置專門觀察球桌上之桌球活動的攝影機,以及專門觀察對手球拍活動的攝影機。相較於Google在2022年所發表的桌球機器人,本次DeepMind團隊採用一種分層模組化的策略架構 (hierarchical and modular policy architecture) 來控制機器人。其中,所謂的分層模組化策略架構包括了模組化的多個低階控制器 (low level controllers),以及一個高階控制器(high level controller);每個低階控制器對應著一種如正手擊球、反手擊球及正手上旋球等桌球技巧,且具有對該技巧的描述。而高階控制器則用於從多個低階控制器中選擇一個來作為機器人回球的技巧。
進一步,高階控制器結合以下6個要素來選擇回球的低階控制器:(1)決定以正手回球或以反手回球;(2)根據來球的旋轉資訊來判斷來球是上旋或下旋;(3)低階控制器的技巧描述,這些描述如依據特定來球條件所預估的回球機率、擊球速度及落點;(4)人類和機器人的對戰統計;(5)根據要素(1)、(3)和(4)來列出低階控制器之桌球技巧的候選清單;以及(6)做出低階控制器的最後選擇。
為了節省和真人對練所耗費的成本,DeepMind團隊本次在初期沒有讓機器人和真人對練,而是先讓高階控制器和多個低階控制器在虛擬的環境中進行訓練。團隊以人和人對戰的40分鐘影片和發球機所發出的480個發球作為初始的訓練資料,先在虛擬環境中訓練高階控制器和低階控制器。完成初始的訓練後,接著再讓機器人與真人對練,將對練過程中所收集到的資料反饋給高階控制器和低階控制器。
為了能在比賽結束之後,明確界定桌球機器人的桌球能力程度;該團隊在比賽前先對59名自願者進行事先研究,依這些自願者參與桌球活動的程度,歸納得到初級者、中級者、進階者和高級者的定義,並且依此研究設計出一份問卷。
接下來,其中29名自願者被安排與桌球機器人進行比賽;前述29名自願者是機器人在真人對練過程中未遭遇過的對手,他們先填寫問卷,並且被區分為7位初級者、11為中級者、5位進階者和6位高級者。機器人與這29名對手對戰的結果是:機器人擊敗了其中的13位對手、並且取得了45%的勝率。這13位對手都是每週參與桌球活動一定次數,但球齡不長且沒有經過專業教練指導的初級者和中級者。乍看之下,機器人看似取得了不錯的勝率,但機器人卻在比賽中完全輸給了進階者和高級者。
目前機器人還沒有辦法與進階者和高級者一較高下的原因有很多,諸如攝影機捕捉影像的能力不足、機械手臂的活動速度不夠快且靈活性不足,以及從產生指令到控制機械手臂回球的時間不夠短等因素,這些都是讓機器人目前仍無法應對進階者和高級者的旋轉球和快速回球的關鍵原因。
到此,DeepMind團隊所做的研究尚未完全結束;為了暸解人們是否願意再次與桌球機器人一起進行桌球活動,在取得了比賽結果之後,團隊繼續研究這29名對手和桌球機器人一起進行桌球活動的感受。團隊在論文中表示,他們能夠想像當機器人以重複動作回球,或者當人們每一球都被機器人殺球時,和機器人一起進行桌球活動顯然是不吸引人的;因此,高階控制器所做的選擇不全然是為了提升表現,而是同時基於能讓參與者樂在其中的考量。在探討人們感受的研究中,團隊藉由觀察這些對手與機器人進行桌球活動時,對於惱人的、挑戰的、簡單的、有吸引力的、挫折的和有趣的感受的程度,得到了這些對手認為與機器人一起進行桌球活動是有趣且具有吸引力的結論,這些對手也都有興趣再次和機器人一起進行桌球活動。
三、結語:
未來,人類與機器人協力合作來完成一項工作或許已是不可避免的趨勢;除了桌球機器人之外,製作漢堡的機器人、製作薯條的機器人都已經上線和餐廳的員工一起工作,不僅機器人要學會與人類協同工作,人類或許也要逐漸做出調整來適應與機器人協進行同作業。
Google的DeepMind團隊在2024年所發表的論文和開發的桌球機器人,不僅以不同的訓練方式降低了機器人的訓練成本,其分層模組化的策略架構也讓機器人從最高能和人們往來150拍進化到能與沒交手過的業餘愛好者一起進行桌球活動的程度。
而本次研究,在少量的初始資料下訓練出能與桌球業餘愛好者匹敵之機器人的成果固然讓人驚艷;然而,這次的發表最能引起筆者注意的卻是團隊在最後關於29名對手與桌球機器人一起進行桌球活動的感受研究。在論文中,關於人們對機器人一起活動感受的研究雖然篇幅不多,也不是論文的重點,甚至有可能僅是為了安撫人們對於陌生變化的不安。但這也表示了生產出高性能機器人的未來或許已經離人們不遠;在確定了人們不可避免的要與機器人協同工作的前提下,研究的目標已經由開發出高性能的機器人,逐漸轉變為開發出讓人們願意合作的機器人。確實,能夠讓人們感到安心並且願意一起相處,又何嘗不是機器人的一種能力呢?
參考資料:
1. https://www.kuka.com/timo
2. https://www.omron.com/global/en/technology/information/forpheus/
3. https://sites.google.com/view/is2r
4. https://deepmind.google/research/publications/107741/