Stanford-forskere tester to rammer, der, sammen, kunne gøre det hurtigere og nemmere at lære disse robotarme grundlæggende færdigheder. Kredit:Stanford Vision and Learning Lab
I kælderen i Gates Computer Science Building ved Stanford University, en skærm knyttet til en rød robotarm lyser op. Et par tegneserieøjne blinker. "Mød Bender, " siger Ajay Mandlekar, Ph.D. studerende i elektroteknik.
Bender er en af de robotarme, som et hold af Stanford-forskere bruger til at teste to rammer, der sammen, kunne gøre det hurtigere og nemmere at lære robotter grundlæggende færdigheder. RoboTurk-rammen giver folk mulighed for at dirigere robotarmene i realtid med en smartphone og en browser ved at vise robotten, hvordan man udfører opgaver som at samle genstande op. SURREAL fremskynder læringsprocessen ved at køre flere oplevelser på én gang, i det væsentlige giver robotterne mulighed for at lære af mange oplevelser samtidigt.
"Med RoboTurk og SURREAL, vi kan rykke grænsen for, hvad robotter kan gøre ved at kombinere masser af data indsamlet af mennesker og koble det med storstilet forstærkningslæring, sagde Mandlekar, et medlem af teamet, der har udviklet rammerne.
Gruppen vil præsentere RoboTurk og SURREAL 29. oktober på konferencen om robotlæring i Zürich, Schweiz.
Mennesker lærer robotter
Yuke Zhu, en ph.d. studerende i datalogi og et medlem af teamet, viste, hvordan systemet fungerer ved at åbne appen på sin iPhone og vifte den gennem luften. Han guidede robotarmen – som en mekanisk kran i et arkadespil – til at svæve over sin præmie:en træklods malet til at ligne en bøf. Dette er en simpel pick-and-place-opgave, der involverer identifikation af objekter, at tage dem op og lægge dem i skraldespanden med den rigtige etiket.
Til mennesker, opgaven virker latterligt let. Men for nutidens robotter, det er ret svært. Robotter lærer typisk ved at interagere med og udforske deres miljø – hvilket normalt resulterer i masser af tilfældige armvifter – eller fra store datasæt. Ingen af disse er så effektive som at få noget menneskelig hjælp. På samme måde som forældre lærer deres børn at børste tænder ved at guide deres hænder, folk kan demonstrere for robotter, hvordan man udfører specifikke opgaver.
Imidlertid, disse lektioner er ikke altid perfekte. Da Zhu trykkede hårdt på sin telefonskærm, og robotten slap sit greb, træbøffen ramte kanten af skraldespanden og klaprede ud på bordet. "Mennesker er på ingen måde optimale til dette, " sagde Mandlekar, "men denne oplevelse er stadig en integreret del af robotterne."
Hurtigere læring parallelt
Disse forsøg – selv fejlene – giver uvurderlig information. Demonstrationer indsamlet gennem RoboTurk vil give robotterne baggrundsviden til at kickstarte deres læring. SURREAL kan køre tusindvis af simulerede oplevelser af mennesker verden over på én gang for at fremskynde læringsprocessen.
"Med SURREAL, vi ønsker at fremskynde denne proces med at interagere med miljøet, " sagde Linxi Fan, en ph.d. studerende i datalogi og medlem af teamet. Disse rammer øger drastisk mængden af data, som robotterne kan lære af.
"De kombinerede to rammer kan give en mekanisme til AI-assisteret menneskelig udførelse af opgaver, hvor vi kan bringe mennesker væk fra farlige miljøer, mens vi stadig bevarer et tilsvarende niveau af opgaveudførelsesfærdigheder, " sagde postdoc Animesh Garg, et medlem af teamet, der har udviklet rammerne.
Teamet forestiller sig, at robotter vil være en integreret del af hverdagen i fremtiden:hjælpe med huslige pligter, at udføre gentagne montageopgaver i fremstillingen eller udføre farlige opgaver, der kan udgøre en trussel for mennesker.
"Du skal ikke bede robotten om at dreje sin arm 20 grader og 10 centimeter fremad, " sagde Zhu. "Du vil gerne være i stand til at bede robotten om at gå i køkkenet og få et æble."