En lille ubemandet Clearpath Husky robot, som blev brugt af ARL -forskere til at udvikle en ny teknik til hurtigt at lære robotter nye traversal adfærd med minimalt menneskeligt tilsyn. Kredit:US Army
Forskere ved U.S. Army Research Laboratory og Robotics Institute ved Carnegie Mellon University udviklede en ny teknik til hurtigt at lære robotter ny traversal adfærd med minimalt menneskeligt tilsyn.
Teknikken gør det muligt for mobile robotplatforme at navigere autonomt i miljøer, mens de udfører handlinger, som et menneske ville forvente af robotten i en given situation.
Eksperimenterne i undersøgelsen blev for nylig offentliggjort og præsenteret på Institute of Electrical and Electronics Engineers' International Conference on Robotics and Automation afholdt i Brisbane, Australien.
ARL -forskere Dr. Maggie Wigness og John Rogers engagerede sig i ansigt-til-ansigt diskussioner med hundredvis af konferencedeltagere under deres to og en halv times interaktive præsentation.
Ifølge Wigness, et af forskerholdets mål inden for forskning i autonome systemer er at levere pålidelige autonome robotholdkammerater til soldaten.
"Hvis en robot fungerer som en holdkammerat, opgaver kan udføres hurtigere og mere situationsfornemmelse kan opnås, " sagde Wigness. "Videre, robot holdkammerater kan bruges som en indledende efterforsker for potentielt farlige scenarier, derved holde soldater længere fra skade."
For at opnå dette, Wigness sagde, at robotten skal være i stand til at bruge sin tillærte intelligens til at opfatte, begrunde og træffe beslutninger.
"Denne forskning fokuserer på, hvordan robotintelligens kan læres fra nogle få menneskelige eksempler, " sagde Wigness. "Læringsprocessen er hurtig og kræver minimal menneskelig demonstration, gør det til en ideel læringsteknik til on-the-fly læring i felten, når missionskravene ændrer sig."
ARL- og CMU-forskere fokuserede deres indledende undersøgelse på at lære robottraversal adfærd med hensyn til robottens visuelle perception af terræn og objekter i miljøet.
Mere specifikt, robotten blev undervist i, hvordan man navigerer fra forskellige steder i miljøet, mens den opholder sig nær kanten af en vej, og også hvordan man krydser skjult ved at bruge bygninger som dækning.
Ifølge forskerne, givet forskellige missionsopgaver, den mest passende indlærte traversale adfærd kan aktiveres under robotdrift.
Dette gøres ved at udnytte omvendt optimal kontrol, også almindeligvis omtalt som omvendt forstærkningslæring, som er en klasse af maskinlæring, der søger at genoprette en belønningsfunktion givet en kendt optimal politik.
ARL-forskere Drs. Maggie Wigness og John Rogers poserer med en lille ubemandet Clearpath Husky-robot i deres laboratorium på Adelphi Laboratory Center i Maryland. Kredit:US Army
I dette tilfælde, et menneske demonstrerer den optimale politik ved at køre en robot langs en bane, der bedst repræsenterer den adfærd, der skal læres.
Disse baneeksempler er derefter relateret til det visuelle terræn/objektfunktioner, såsom græs, veje og bygninger, at lære en belønningsfunktion med hensyn til disse miljøegenskaber.
Mens lignende forskning findes inden for robotik, hvad ARL laver er særligt unikt.
"De udfordringer og driftsscenarier, som vi fokuserer på her hos ARL, er ekstremt unikke sammenlignet med anden forskning, der udføres, "Wigness sagde." Vi søger at skabe intelligente robotsystemer, der pålideligt fungerer i krigsflymiljøer, hvilket betyder, at scenen er meget ustruktureret, muligvis støjende, og vi er nødt til at gøre dette i betragtning af relativt lidt a priori viden om den nuværende tilstand af miljøet. Det faktum, at vores problemformulering er så anderledes end så mange andre forskere, gør det muligt for ARL at gøre en enorm indflydelse på forskning i autonome systemer. Vores teknikker, ved selve definitionen af problemet, skal være robust over for støj og have evnen til at lære med relativt små mængder data."
Ifølge Wigness, denne foreløbige forskning har hjulpet forskerne med at demonstrere muligheden for hurtigt at lære en kodning af traversal adfærd.
"Når vi skubber denne forskning til næste niveau, vi vil begynde at fokusere på mere kompleks adfærd, som kan kræve læring fra mere end blot visuelle perceptionsfunktioner, " sagde Wigness. "Vores læringsramme er fleksibel nok til at bruge a priori information, der kan være tilgængelig om et miljø. Dette kan omfatte oplysninger om områder, der sandsynligvis er synlige for modstandere, eller områder, der vides at have pålidelig kommunikation. Disse yderligere oplysninger kan være relevante for visse missionsscenarier, og læring med hensyn til disse funktioner ville forbedre mobilrobotens intelligens. "
Forskerne undersøger også, hvordan denne type adfærdslæring overføres mellem forskellige mobile platforme.
Deres evaluering til dato er blevet udført med en lille ubemandet Clearpath Husky robot, which has a visual field of view that is relatively low to the ground.
"Transferring this technology to larger platforms will introduce new perception viewpoints and different platform maneuvering capabilities, " Wigness said. "Learning to encode behaviors that can be easily transferred between different platforms would be extremely valuable given a team of heterogeneous robots. I dette tilfælde, the behavior can be learned on one platform instead of each platform individually."
This research is funded through the Army's Robotics Collaborative Technology Alliance, or RCTA, which brings together government, industrial and academic institutions to address research and development required to enable the deployment of future military unmanned ground vehicle systems ranging in size from man-portables to ground combat vehicles.
"ARL is positioned to actively collaborate with other members of the RCTA, leveraging the efforts of top researchers in academia to work on Army problems, " Rogers said. "This particular research effort was the synthesis of several components of the RCTA with our internal research; it would not have been possible if we didn't work together so closely."
Ultimativt, this research is crucial for the future battlefield, where Soldiers will be able to rely on robots with more confidence to assist them in executing missions.
"The capability for the Next Generation Combat Vehicle to autonomously maneuver at optempo in the battlefield of the future will enable powerful new tactics while removing risk to the Soldier, " Rogers said. "If the NGCV encounters unforeseen conditions which require teleoperation, our approach could be used to learn to autonomously handle these types of conditions in the future."