Jenga! #RoboFail. Kredit:Fazeli et al., Sci. Robot. 4, eaav3123 (2019)
I kælderen i MIT's Building 3, en robot overvejer nøje sit næste træk. Det stikker forsigtigt i et tårn af blokke, leder efter den bedste blok at udtrække uden at vælte tårnet, i en ensom, langsomt i gang, alligevel overraskende smidig Jenga -spil.
Robotten, udviklet af MIT ingeniører, er udstyret med en blødtang, en kraftfølende håndledsmanchet, og et eksternt kamera, alt det bruger den til at se og mærke tårnet og dets individuelle blokke.
Da robotten forsigtigt skubber mod en blok, en computer optager visuel og taktil feedback fra kameraet og manchetten, og sammenligner disse målinger med bevægelser, som robotten tidligere foretog. Det overvejer også resultaterne af disse tiltag - specifikt om en blok, i en bestemt konfiguration og skubbet med en vis mængde kraft, blev hentet med succes eller ej. I realtid, robotten "lærer" derefter, om den skal blive ved med at skubbe eller flytte til en ny blok, for at forhindre tårnet i at falde.
Detaljer om den Jenga-spillende robot er offentliggjort i tidsskriftet Science Robotics . Alberto Rodriguez, Walter Henry Gale Karriereudviklingsassistent i Institut for Maskinteknik på MIT, siger robotten demonstrerer noget, der har været svært at opnå i tidligere systemer:evnen til hurtigt at lære den bedste måde at udføre en opgave på, ikke kun ud fra visuelle tegn, som det almindeligt studeres i dag, men også fra taktil, fysiske interaktioner.
"I modsætning til mere rent kognitive opgaver eller spil som skak eller Go, at spille Jenga kræver også beherskelse af fysiske færdigheder som sondering, skubber, trækker, placering, og justering af stykker. Det kræver interaktiv opfattelse og manipulation, hvor du skal hen og røre ved tårnet for at lære, hvordan og hvornår du skal flytte blokke, "Rodriguez siger." Dette er meget svært at simulere, så robotten skal lære i den virkelige verden, ved at interagere med det rigtige Jenga -tårn. Den centrale udfordring er at lære af et relativt lille antal eksperimenter ved at udnytte sund fornuft om objekter og fysik. "
Han siger, at det taktile læringssystem, forskerne har udviklet, kan bruges i applikationer ud over Jenga, især i opgaver, der kræver omhyggelig fysisk interaktion, herunder adskillelse af genanvendelige genstande fra affald til losseplads og samling af forbrugerprodukter.
"I en samlebånd til mobiltelefoner, i næsten hvert eneste trin, følelsen af en snap-fit, eller en gevindskrue, kommer fra kraft og berøring frem for vision, "Siger Rodriguez." Læringsmodeller for disse handlinger er førsteklasses ejendomme for denne form for teknologi. "
Papirets hovedforfatter er MIT -kandidatstuderende Nima Fazeli. Teamet omfatter også Miquel Oller, Jiajun Wu, Zheng Wu, og Joshua Tenenbaum, professor i hjerne og kognitive videnskaber ved MIT.
Skub og træk
I spillet Jenga - Swahili til "build" - stables 54 rektangulære blokke i 18 lag med tre blokke hver, med blokkene i hvert lag orienteret vinkelret på nedenstående blokke. Formålet med spillet er omhyggeligt at udtrække en blok og placere den på toppen af tårnet, dermed bygge et nyt niveau, uden at vælte hele strukturen.
For at programmere en robot til at spille Jenga, traditionelle maskinlæringsordninger kan kræve at fange alt, hvad der muligvis kan ske mellem en blok, robotten, og tårnet-en dyr beregningsopgave, der kræver data fra tusinder, hvis ikke titusinder af blokekstraktionsforsøg.
I stedet, Rodriguez og hans kolleger ledte efter en mere dataeffektiv måde for en robot at lære at spille Jenga, inspireret af menneskelig erkendelse og den måde, vi selv kan gribe spillet an på.
Teamet tilpassede en industristandard ABB IRB 120 robotarm, sæt derefter et Jenga -tårn op inden for robotens rækkevidde, og begyndte en træningsperiode, hvor robotten først valgte en tilfældig blok og et sted på blokken, som den skulle skubbe imod. Det udøvede derefter en lille mængde kraft i et forsøg på at skubbe blokken ud af tårnet.
For hvert blokforsøg, en computer registrerede de tilhørende visuelle og kraftmålinger, og mærket om hvert forsøg var en succes.
I stedet for at udføre titusinder af sådanne forsøg (hvilket ville indebære rekonstruktion af tårnet næsten lige så mange gange), robotten trænet på cirka 300, med forsøg på lignende målinger og resultater grupperet i klynger, der repræsenterer visse blokadfærd. For eksempel, en klynge af måske repræsenterer forsøg på en blok, der var svær at flytte, mod en, der var lettere at flytte, eller der væltede tårnet, når det blev flyttet. For hver dataklynge, robotten udviklede en simpel model til at forudsige en blok adfærd givet dens nuværende visuelle og taktile målinger.
Fazeli siger, at denne grupperingsteknik dramatisk øger effektiviteten, hvormed robotten kan lære at spille spillet, og er inspireret af den naturlige måde, hvorpå mennesker klynger lignende adfærd:"Robotten bygger klynger og lærer derefter modeller for hver af disse klynger, i stedet for at lære en model, der fanger absolut alt, hvad der kunne ske. "
Stabler op
Forskerne testede deres tilgang mod andre state-of-the-art maskinlæringsalgoritmer, i en computersimulering af spillet ved hjælp af simulatoren MuJoCo. Erfaringerne fra simulatoren informerede forskerne om, hvordan robotten ville lære i den virkelige verden.
Jenga-spiller robot. Kredit:Fazeli et al., Sci. Robot. 4, eaav3123 (2019)
"Vi giver disse algoritmer de samme oplysninger, som vores system får, for at se, hvordan de lærer at spille Jenga på et lignende niveau, "Siger Oller." Sammenlignet med vores tilgang, disse algoritmer skal udforske størrelsesordener flere tårne for at lære spillet. "
Nysgerrig efter, hvordan deres machine-learning tilgang stabler op mod egentlige menneskelige spillere, holdet gennemførte et par uformelle forsøg med flere frivillige.
"Vi så, hvor mange blokke et menneske var i stand til at udtrække, før tårnet faldt, og forskellen var ikke så stor, "Siger Oller.
Men der er stadig en vej at gå, hvis forskerne konkurrencedygtigt vil lægge deres robot mod en menneskelig spiller. Ud over fysiske interaktioner, Jenga kræver strategi, såsom at udtrække den helt rigtige blok, der vil gøre det svært for en modstander at trække den næste blok ud uden at vælte tårnet.
For nu, holdet er mindre interesseret i at udvikle en robot Jenga -mester, og mere fokuseret på at anvende robotens nye færdigheder på andre applikationsdomæner.
"Der er mange opgaver, vi udfører med vores hænder, hvor følelsen af at gøre det 'den rigtige vej' kommer i kræfternes sprog og taktile tegn, "Siger Rodriguez." Til opgaver som disse, en lignende tilgang til vores kunne finde ud af det. "
Denne forskning blev støttet, delvis, af National Science Foundation gennem National Robotics Initiative.