Kredit:CC0 Public Domain
Trænger du til en bid af en frisk grillet boldbane? To robotter ved navn Jaco og Baxter kan tjene en. Boston University ingeniører har taget et spring i at bruge maskinlæring til at lære robotter at udføre komplekse opgaver, en ramme, der kan anvendes på en lang række opgaver, som at identificere kræftpletter på mammografi eller bedre at forstå talte kommandoer til at spille musik. Men først, som et bevis på konceptet – de har lært, hvordan man forbereder den perfekte hotdog.
Forskere forstår stadig ikke helt præcis, hvordan maskinlæringsalgoritmer – ja, lære. Den blinde plet gør det vanskeligt at anvende teknikken på komplekse, højrisikoopgaver såsom autonom kørsel, hvor sikkerhed er et problem. I et skridt fremad offentliggjort i Videnskab robotik , Calin Belta, en BU College of Engineering professor, og forskere i hans laboratorium lærte to robotter at lave mad, samle, og server hotdogs sammen. Deres metode kombinerer teknikker fra maskinlæring og formelle metoder, et område inden for datalogi, der typisk bruges til at garantere sikkerhed, mest bemærkelsesværdigt brugt i flyelektronik eller cybersikkerhedssoftware. Disse forskellige teknikker er svære at kombinere matematisk og at sætte sammen til et sprog, som en robot vil forstå.
Belta, en professor i mekanisk, systemer, og el- og datateknik, og hans team benyttede en gren af maskinlæring kendt som forstærkningslæring. Når en computer udfører en opgave korrekt, den modtager en belønning, der styrer dens læreproces. Selvom trinene i opgaven er skitseret i en "forudgående viden"-algoritme, hvordan man præcist udfører disse trin er ikke. Når robotten bliver bedre til at udføre et trin, dens belønning stiger, skabe en feedbackmekanisme, der skubber robotten til at lære den bedste måde at, for eksempel, læg en hotdog på en bolle.
Integrering af tidligere viden med forstærkende læring og formelle metoder er det, der gør denne teknik ny. Ved at kombinere disse tre teknikker, holdet kan skære ned på mængden af muligheder, som robotterne skal løbe igennem for at lære at lave mad, samle, og server en hotdog sikkert. Belta ser dette arbejde som en proof-of-concept demonstration af deres generelle rammer, og han håber, at det fremover kan anvendes til andre komplekse opgaver, såsom autonom kørsel.