Videnskab
 science >> Videnskab >  >> Elektronik

En tilgang til dyb læring til koordinering af defensive escortteams

Kredit:Garg et al.

Fremskridt inden for robotteknologi og kunstig intelligens (AI) muliggør udvikling af kunstige midler, der er designet til at hjælpe mennesker i en række forskellige hverdagslige omgivelser. En af de mange mulige anvendelser til disse systemer kan være at eskortere mennesker eller værdifulde varer, der overføres fra et sted til et andet, at forsvare dem mod trusler eller angreb.

Fascineret over denne idé, et team af forskere ved University of New Mexico har for nylig introduceret en ny ende-til-ende-løsning til koordinering af robot-escortteams, der beskytter nyttelast eller varer af høj værdi. Den teknik, de foreslog, præsenteret i et papir, der på forhånd er offentliggjort på arXiv, er baseret på dyb forstærkningslæring (RL), hvilket indebærer træningsalgoritmer til at lave effektive forudsigelser ved at analysere data.

"Jeg kom først på ideen bag denne undersøgelse, da jeg tænkte på at slæbe min kuffert gennem en overfyldt lufthavn, "Lydia Tapia, den ledende forsker på undersøgelsen, fortalte TechXplore. "Jeg tænkte ved mig selv:Hvad hvis det kunne hjælpe min navigation ved at blive hos mig og vogte mig, mens jeg gik?"

Inden de begyndte at udvikle deres løsning til koordinering af defensive eskortehold, Tapia og hendes team gennemgik tidligere litteratur på udkig efter inspiration eller lignende tilgange. Desværre, imidlertid, de kunne ikke finde andre undersøgelser, hvor robotter blev brugt til at forudsige indkommende trusler og opfange dem, beskytte menneskelige brugere og sikre, at de nåede deres destination sikkert.

"Der er meget arbejde med navigationsassistenter, men for det meste fungerer de ved at slå alarm for at stoppe en person fra at navigere i nærheden af ​​en indkommende trussel, "Tapia forklarede." Vi fandt ud af, at et robot escortteam kunne have flere andre applikationer i sikkerhedskritiske scenarier, meget vigtigere end min lufthavnskuffert, så vi fokuserede dette papir på nyttelastnavigation, hvilket er en almindelig opgave, hvor ledsagere holder nyttelasten sikker, mens de navigerer. "

Tapia og hendes kolleger uddannede deres dybe RL -model til at forudsige effektive positioner og strategier til at opfange mulige trusler. Ligesom andre RL -teknikker, under træning, deres model gennemgik en lang række forsøg, hvor den skulle foreslå handlinger for at opfange trusler og koordinere ledsagere, modtager belønninger, når den foreslåede strategi var effektiv. Over tid, modellen lærte at generalisere, hvad den lærte under træning og anvende den på helt nye situationer.

Kredit:Lydia Tapia

"Der er i øjeblikket ingen eksisterende intelligente metoder til at løse dette problem, så vi viste, hvordan agenter med en fast position kan bruges, "Tapia sagde." Dog, som du kan forestille dig, du ville have brug for en hel del defensive agenter, der er placeret på faste positioner for at beskytte en navigerende nyttelast. "

Forskerne evaluerede deres RL -teknik i en række simuleringer, hvor escortagenter beskytter et specifikt mål mod trusler eller forhindringer i det omgivende miljø. De fandt ud af, at deres model klarede sig bedre end state-of-the-art algoritmer til forhindring af forhindringer, øger navigationssuccesen med op til 31 procent. Ud over, eskorteholdene, der var koordineret ved hjælp af deres teknik, viste sig med succes at beskytte nyttelast med en succesrate, der var 75 procent større end den, eskortehold opnåede i statiske formationer.

"Det mest meningsfulde fund ved vores arbejde var at kunne repræsentere problemet på en måde, der er mulig for agenten at lære en fleksibel løsning, selv i tilfælde af uventede omstændigheder såsom agenter, der fjernes eller tilføjes, "Forklarede Tapia.

I fremtiden, tilgangen udviklet af Tapia og hendes team ved University of New Mexico kunne bruges til at koordinere teams, der eskorterer nyttelast eller menneskelige rejsende. Imidlertid, det kan også have andre applikationer, for eksempel at hjælpe udviklingen af ​​nye værktøjer til at hjælpe og ledsage svagsynede personer, mens de rejser eller navigerer i ukendte miljøer.

"Vi er glade for at undersøge yderligere anvendelser af dette arbejde for nye problemer, som vi endnu ikke har løst, "Tapia sagde." Det ville være rart også at se vores intelligente agenter demonstreret på hardware. "

© 2019 Science X Network




Varme artikler