
Opracowano technikę, która pozwala robotowi na efektywne wnioskowanie o poruszających się obiektach przy użyciu czegoś więcej niż tylko opuszków palców.
W skrócie
Naukowcy z MIT opracowali metodę wykorzystującą techniki wygładzania AI w celu uproszczenia planowania manipulacji dla robotów.
Takie podejście umożliwia robotom efektywne planowanie i wykonywanie zadań związanych z manipulacją całym ciałem, potencjalnie zmniejszając zużycie energii i umożliwiając wykorzystanie mniejszych, bardziej zwinnych robotów do różnych zastosowań, od pracy w fabryce po misje eksploracyjne.
Proszę sobie wyobrazić, że chcą Państwo wnieść duże, ciężkie pudło po schodach. Mogliby Państwo rozprostować palce i podnieść to pudło obiema rękami, a następnie trzymać je na przedramionach i balansować na klatce piersiowej, używając całego ciała do manipulowania pudłem.
Ludzie są ogólnie dobrzy w manipulowaniu całym ciałem, ale roboty zmagają się z takimi zadaniami. Dla robota każde miejsce, w którym pudełko może dotknąć dowolnego punktu na palcach, ramionach i tułowiu przewoźnika , stanowi zdarzenie kontaktowe, o którym musi myśleć. Przy miliardach potencjalnych zdarzeń kontaktowych planowanie tego zadania szybko staje się skomplikowane.
Teraz naukowcy z MIT znaleźli sposób na uproszczenie tego procesu, znanego jako planowanie manipulacji bogatej w kontakty. Wykorzystują oni technikę sztucznej inteligencji zwaną wygładzaniem, która podsumowuje wiele zdarzeń kontaktowych w mniejszą liczbę decyzji, aby umożliwić nawet prostemu algorytmowi szybkie zidentyfikowanie skutecznego planu manipulacji dla robota.
Choć metoda ta jest wciąż na wczesnym etapie rozwoju, może potencjalnie umożliwić fabrykom korzystanie z mniejszych, mobilnych robotów, które mogą manipulować obiektami za pomocą całych ramion lub ciał, zamiast dużych ramion robotycznych, które mogą chwytać tylko opuszkami palców. Może to pomóc zmniejszyć zużycie energii i obniżyć koszty. Ponadto, technika ta mogłaby być przydatna w robotach wysyłanych na misje eksploracyjne na Marsa lub inne ciała Układu Słonecznego, ponieważ mogłyby one szybko dostosowywać się do środowiska, korzystając jedynie z komputera pokładowego.
“Zamiast myśleć o tym jako o systemie czarnej skrzynki, jeśli możemy wykorzystać strukturę tego rodzaju systemów robotycznych za pomocą modeli, istnieje możliwość przyspieszenia całej procedury podejmowania tych decyzji i wymyślania planów bogatych w kontakty” – powiedział H.J. Terry Suh, absolwent inżynierii elektrycznej i informatyki (EECS) i współautor artykułu na temat tej techniki.
Do Suh dołączają współautor artykułu dr Tao Pang ’23, robotyk w Boston Dynamics AI Institute; Lujie Yang, absolwentka EECS; oraz starszy autor Russ Tedrake, profesor Toyota EECS, aeronautyki i astronautyki oraz inżynierii mechanicznej, a także członek Laboratorium Informatyki i Sztucznej Inteligencji (CSAIL). Badania ukazały się w tym tygodniu w IEEE Transactions on Robotics.
Nauka o uczeniu się
Uczenie ze wzmocnieniem to technika uczenia maszynowego, w której agent, taki jak robot, uczy się wykonywać zadanie metodą prób i błędów z nagrodą za zbliżanie się do celu. Naukowcy twierdzą, że ten rodzaj uczenia się przyjmuje podejście “czarnej skrzynki”, ponieważ system musi uczyć się wszystkiego o świecie metodą prób i błędów.
Został on skutecznie wykorzystany do planowania manipulacji z wykorzystaniem kontaktu, gdzie robot stara się nauczyć najlepszego sposobu poruszania obiektem w określony sposób.
Ponieważ mogą istnieć miliardy potencjalnych punktów styku, o których robot musi myśleć, określając, jak używać palców, dłoni, ramion i ciała do interakcji z obiektem, to podejście typu “prób i błędów” wymaga dużej ilości obliczeń.
“Uczenie się ze wzmocnieniem może wymagać milionów lat symulacji, aby faktycznie móc nauczyć się zasad” – powiedział Suh.
Z drugiej strony, jeśli badacze specjalnie zaprojektują model oparty na fizyce, wykorzystując swoją wiedzę o systemie i zadaniu, które robot ma wykonać, model ten zawiera strukturę tego świata, która czyni go bardziej wydajnym.
Jednak podejścia oparte na fizyce nie są tak skuteczne, jak uczenie ze wzmocnieniem, jeśli chodzi o planowanie manipulacji bogatych w kontakt – Suh i Pang zastanawiali się dlaczego.
Przeprowadzili oni szczegółową analizę i odkryli, że technika znana jako wygładzanie umożliwia tak dobre wyniki uczenia ze wzmocnieniem.
Wiele decyzji, które robot może podjąć podczas określania sposobu manipulowania obiektem, nie jest ważnych w ogólnym rozrachunku. Na przykład każda nieskończenie mała regulacja jednego palca, niezależnie od tego, czy powoduje kontakt z obiektem, czy nie, nie ma większego znaczenia. Wygładzanie uśrednia wiele z tych nieistotnych, pośrednich decyzji, pozostawiając kilka ważnych.
Uczenie ze wzmocnieniem dokonuje wygładzania w sposób ukryty, próbując wielu punktów styku, a następnie obliczając średnią ważoną wyników. Opierając się na tym spostrzeżeniu, naukowcy z MIT zaprojektowali prosty model, który wykonuje podobny rodzaj wygładzania, umożliwiając mu skupienie się na podstawowych interakcjach robota z obiektem i przewidywanie długoterminowych zachowań. Wykazali oni, że podejście to może być równie skuteczne jak uczenie ze wzmocnieniem w generowaniu złożonych planów.
“Jeśli wiedzą Państwo nieco więcej o swoim problemie, mogą Państwo zaprojektować bardziej wydajne algorytmy” – powiedział Pang.

Zwycięska kombinacja
Pomimo tego, że wygładzanie znacznie upraszcza decyzje, przeszukiwanie pozostałych decyzji nadal może być trudnym problemem. Naukowcy połączyli więc swój model z algorytmem, który może szybko i skutecznie przeszukiwać wszystkie możliwe decyzje, jakie może podjąć robot.
Dzięki tej kombinacji czas obliczeń został skrócony do około minuty na standardowym laptopie.
Najpierw przetestowali swoje podejście w symulacjach, w których robotyczne ręce otrzymywały zadania, takie jak przesuwanie długopisu do pożądanej konfiguracji, otwieranie drzwi lub podnoszenie talerza. W każdym przypadku ich podejście oparte na modelu osiągnęło taką samą wydajność jak uczenie ze wzmocnieniem, ale w ułamku czasu. Podobne wyniki zaobserwowali, gdy przetestowali swój model sprzętowo na prawdziwych ramionach robotów.
“Te same pomysły, które umożliwiają manipulację całym ciałem, działają również w przypadku planowania za pomocą zręcznych, podobnych do ludzkich rąk. Wcześniej większość badaczy twierdziła, że uczenie ze wzmocnieniem było jedynym podejściem, które skalowało się do zręcznych rąk, ale Terry i Tao pokazali, że biorąc tę kluczową ideę (losowego) wygładzania z uczenia ze wzmocnieniem, mogą sprawić, że bardziej tradycyjne metody planowania również będą działać wyjątkowo dobrze” – powiedział Tedrake.
Opracowany przez nich model opiera się jednak na prostszym przybliżeniu świata rzeczywistego, więc nie radzi sobie z bardzo dynamicznymi ruchami, takimi jak spadające obiekty. Chociaż ich podejście jest skuteczne w przypadku wolniejszych zadań manipulacyjnych, nie może stworzyć planu, który umożliwiłby robotowi na przykład wrzucenie puszki do kosza na śmieci. W przyszłości naukowcy planują ulepszyć swoją technikę, aby mogła poradzić sobie z tymi bardzo dynamicznymi ruchami.
“Jeśli dokładnie przeanalizują Państwo swoje modele i naprawdę zrozumieją problem, który próbują Państwo rozwiązać, z pewnością można osiągnąć pewne korzyści. Są korzyści z robienia rzeczy, które wykraczają poza czarną skrzynkę” – powiedział Suh.
Chris Vavra, kierownik ds. treści internetowych, CFE Media and Technology