Til sidste-mile levering, Fremtidens robotter kan bruge en ny MIT-algoritme til at finde hoveddøren, ved at bruge spor i deres miljø. Kredit:MIT News
I en ikke alt for fjern fremtid, robotter kan blive sendt som lastmile-lastbiler for at droppe din afhentningsordre, pakke, eller et abonnement på et måltidssæt lige ved døren – hvis de kan finde døren.
Standardtilgange til robotnavigation involverer kortlægning af et område i forvejen, derefter bruge algoritmer til at guide en robot mod et bestemt mål eller GPS-koordinater på kortet. Selvom denne tilgang kan give mening til at udforske specifikke miljøer, såsom layoutet af en bestemt bygning eller planlagt forhindringsbane, det kan blive uhåndterligt i forbindelse med levering på sidste kilometer.
Forestille, for eksempel, på forhånd at skulle kortlægge hvert enkelt kvarter inden for en robots leveringszone, inklusive konfigurationen af hvert hus i det pågældende kvarter sammen med de specifikke koordinater for hvert huss hoveddør. Sådan en opgave kan være svær at skalere til en hel by, især da husenes ydre ofte skifter med årstiderne. Kortlægning af hvert enkelt hus kan også løbe ind i problemer med sikkerhed og privatliv.
Nu har MIT-ingeniører udviklet en navigationsmetode, der ikke kræver kortlægning af et område på forhånd. I stedet, deres tilgang gør det muligt for en robot at bruge spor i sit miljø til at planlægge en rute til sin destination, som kan beskrives i generelle semantiske termer, f.eks. "hoveddør" eller "garage, "i stedet for som koordinater på et kort. F.eks. hvis en robot bliver bedt om at levere en pakke til en andens hoveddør, den starter måske på vejen og ser en indkørsel, som den er blevet trænet i at genkende som sandsynligt vil føre mod et fortov, hvilket igen sandsynligvis vil føre til hoveddøren.
Den nye teknik kan i høj grad reducere den tid, en robot bruger på at udforske en ejendom, før den identificerer sit mål, og den er ikke afhængig af kort over specifikke boliger.
"Vi ønsker ikke at skulle lave et kort over hver bygning, vi skal besøge, " siger Michael Everett, en kandidatstuderende i MIT's Department of Mechanical Engineering. "Med denne teknik, vi håber at kunne tabe en robot for enden af enhver indkørsel og få den til at finde en dør."
Everett vil præsentere gruppens resultater i denne uge på den internationale konference om intelligente robotter og systemer. Papiret, som er medforfatter af Jonathan How, professor i luftfart og astronautik ved MIT, og Justin Miller fra Ford Motor Company, er finalist for "Bedste papir til kognitive robotter."
"En fornemmelse af, hvad tingene er"
I de seneste år, forskere har arbejdet på at introducere naturlige, semantisk sprog til robotsystemer, træne robotter til at genkende objekter ved deres semantiske etiketter, så de visuelt kan behandle en dør som en dør, for eksempel, og ikke blot som et fast stof, rektangulær forhindring.
"Nu har vi en evne til at give robotter en fornemmelse af, hvad ting er, i realtid, "Siger Everett.
Everett, Hvordan, og Miller bruger lignende semantiske teknikker som et springbræt til deres nye navigationstilgang, som udnytter allerede eksisterende algoritmer, der udtrækker funktioner fra visuelle data for at generere et nyt kort over den samme scene, repræsenteret som semantiske spor, eller kontekst.
I deres tilfælde, forskerne brugte en algoritme til at bygge et kort over miljøet, mens robotten bevægede sig rundt, ved hjælp af de semantiske etiketter for hvert objekt og et dybdebillede. Denne algoritme kaldes semantisk SLAM (Simultan lokalisering og kortlægning).
Mens andre semantiske algoritmer har gjort det muligt for robotter at genkende og kortlægge objekter i deres miljø for, hvad de er, de har ikke tilladt en robot at træffe beslutninger i øjeblikket, mens de navigerer i et nyt miljø, på den mest effektive vej at tage til en semantisk destination såsom en "hoveddør."
"Før, at udforske var bare, pluk en robot ned og sig 'gå, "og det vil bevæge sig rundt og til sidst komme dertil, men det vil gå langsomt, "Hvordan siger.
Omkostningerne til at gå
Forskerne så på at fremskynde en robots vejplanlægning gennem en semantisk, kontekstfarvet verden. De udviklede en ny "cost-to-go estimator, "en algoritme, der konverterer et semantisk kort skabt af allerede eksisterende SLAM-algoritmer til et andet kort, repræsenterer sandsynligheden for, at en given placering er tæt på målet.
"Dette var inspireret af billed-til-billede oversættelse, hvor du tager et billede af en kat og får den til at ligne en hund, " siger Everett. "Den samme type idé sker her, hvor du tager et billede, der ligner et kort over verden, og gør det til dette andet billede, der ligner verdenskortet, men nu er farvet baseret på, hvor tæt forskellige punkter på kortet er på slutmålet."
Dette cost-to-go-kort er farvelagt, i gråskala, at repræsentere mørkere områder som steder langt fra et mål, og lettere regioner som områder, der er tæt på målet. For eksempel, fortovet, kodet med gult på et semantisk kort, kan blive oversat af cost-to-go-algoritmen som et mørkere område på det nye kort, sammenlignet med en indkørsel, som gradvist bliver lettere, efterhånden som den nærmer sig hoveddøren - det lyseste område på det nye kort.
Forskerne trænede denne nye algoritme på satellitbilleder fra Bing Maps indeholdende 77 huse fra et by- og tre forstadskvarterer. Systemet konverterede et semantisk kort til et cost-to-go kort, og kortlagt den mest effektive vej, efter lysere områder på kortet, til slutmålet. For hvert satellitbillede, Everett tildelte semantiske etiketter og farver til kontekstfunktioner i en typisk forhave, såsom grå til en hoveddør, blå for en indkørsel, og grøn til hæk.
Under denne uddannelsesproces, holdet anvendte også masker på hvert billede for at efterligne den delvise visning, som en robots kamera sandsynligvis ville have, når den krydser en gård.
"En del af tricket til vores tilgang var [at give systemet] masser af delvise billeder, " How forklarer. "Så det var virkelig nødt til at finde ud af, hvordan alle disse ting var indbyrdes forbundne. Det er en del af det, der får dette til at fungere robust."
Forskerne testede derefter deres tilgang i en simulering af et billede af et helt nyt hus, uden for træningsdatasættet, først ved at bruge den allerede eksisterende SLAM-algoritme til at generere et semantisk kort, derefter anvende deres nye cost-to-go estimator til at generere et andet kort, og vejen til et mål, I dette tilfælde, fordøren.
Gruppens nye cost-to-go-teknik fandt hoveddøren 189 procent hurtigere end klassiske navigationsalgoritmer, som ikke tager hensyn til kontekst eller semantik, og i stedet bruge for store trin på at udforske områder, der usandsynligt vil være i nærheden af deres mål.
Everett siger, at resultaterne illustrerer, hvordan robotter kan bruge kontekst til effektivt at lokalisere et mål, selv i ukendte, ukortlagte miljøer.
"Selvom en robot leverer en pakke til et miljø, den aldrig har været i, der kan være spor, der vil være det samme som andre steder, det er set, " siger Everett. "Så verden kan være indrettet lidt anderledes, men der er sikkert nogle ting til fælles."
Denne historie er genudgivet med tilladelse fra MIT News (web.mit.edu/newsoffice/), et populært websted, der dækker nyheder om MIT-forskning, innovation og undervisning.