Videnskab
 science >> Videnskab >  >> Elektronik

PoseRBPF:Et nyt partikelfilter til sporing af 6D -objekter

Visualisering af rotationsfordelinger. Linjerne repræsenterer sandsynligheden for rotationer, der er højere end en tærskel. Længden af ​​hver linje er proportional med sandsynligheden for dette synspunkt. Som kan ses, PoseRBPF repræsenterer naturligvis usikkerheder på grund af forskellige former for symmetrier, herunder rotationssymmetri i skålen, spejlsymmetri af skumstenen, og diskrete rotationssymmetrier af T-LESS-objekterne til højre. Kredit:Deng et al.

Forskere på NVIDIA, University of Washington, Stanford University, og University of Illinois Urbana-Champaign har for nylig udviklet et Rao-Blackwellized partikelfilter til 6-D pose tracking, kaldet PoseRBPF. Fremgangsmåden kan effektivt estimere 3D-oversættelsen af ​​et objekt og dets fulde fordeling over 3D-rotation. Papiret, der beskriver dette filter, forududgivet på arXiv, vil blive præsenteret på den kommende Robotics Science and Systems Conference i Freiburg, Tyskland.

Sporing af 6-D-stillinger af objekter i videoer kan forbedre robotternes ydeevne i en række forskellige opgaver, herunder manipulations- og navigationsopgaver. De fleste eksisterende teknikker til estimering af objektposer forsøger at forudsige et enkelt estimat for 6-D-stillingen (dvs. xyz-oversættelse og 3D-orientering) af et objekt i hver kameraramme.

Disse metoder har en række begrænsninger og problemer. For eksempel, de er ikke i stand til at fortælle posen af ​​delvist eller fuldstændigt lukkede objekter. I øvrigt, der er situationer, hvor på grund af symmetrier, der er ikke et enkelt korrekt svar på posen af ​​et objekt, hvilket komplicerer opgaven yderligere.

"Det viser sig, at mange objekter i vores hverdagsmiljøer er symmetriske, såsom middagsfade, skåle, flasker, eller terninger, "Arsalan Mousavian, en af ​​forskerne, der gennemførte undersøgelsen, fortalte TechXplore. "Disse objekter har ikke en unik 3D-orientering, da de ser identiske ud fra mange forskellige betragtningsvinkler. For at omgå disse problemer, vi foreslog en metode til at spore den fulde fordeling af et objekts positur (i modsætning til estimat af en enkelt pose) gennem tiden. Denne fordeling fanger præcist usikkerheden i objektets positur, og sporing over tid hjælper med at skelne objektets stilling. For eksempel, hvis et objekt er synligt på et tidspunkt og bliver lukket, metoden kan gendanne posen ved at spore den fra tidligere rammer. "

PoseRBPF, tilgang udviklet af Mousavian og hans kolleger, kan spore den fulde fordeling over 6-D-stillingen (dvs. 3-D-oversættelse, 3D-retning) for et givet objekt, i forhold til et bestemt kamera. Sandsynlighedsfordelinger over 6-D-rum er yderst komplekse, så hvis de ikke måles korrekt, er det umuligt at opdatere dem i realtid. For at sikre nøjagtigheden af ​​sporede distributioner, forskerne afkoblede deres estimater af 3D-objektoversættelse og 3D-objektorientering ved hjælp af en teknik kaldet Rao-Blackwellized partikelfiltrering.

"Ved Rao-Blackwellized partikelfiltrering, objektoversættelserne repræsenteres af prøver, eller partikler, og orienteringen diskretiseres i små bidder på tæt på 200, 000 mulige orienteringer, "Forklarede Mousavian." Vi brugte en dyb læringsteknik til at forudberegne indlejringer, der repræsenterer, hvordan objektet kan se ud i alle disse retninger og under vilkårlige lysforhold. Ved at drage fordel af stærkt paralleliseret NVIDIA GPU -behandling, vores tilgang kan derefter sammenligne det aktuelle kamerabillede med disse forudberegnede embeddings for alle mulige orienteringer og opdatere distributionen i realtid. "

Ved hvert trin, den fremgangsmåde, som forskerne har udtænkt, opdaterer partikelsættet ved at tage prøver fra det forrige partikelsæt, efter en model, der forudsiger, hvordan objektet og kameraet kan bevæge sig fra et trin til et andet. Denne proces gør det muligt for PoseRBPF at akkumulere information over tid, hvilket igen fører til mere robuste og nøjagtige stillingsestimater.

  • Visualisering af rotationsfordelinger. Kredit:Deng et al.

  • Illustration af beregningen for betinget rotation sandsynlighed ved kodebogs matchning. Til venstre) Hver partikel beskærer billedet baseret på dens oversættelseshypotese. RoI for hver partikel ændres, og den tilsvarende kode beregnes ved hjælp af indkoderen. Højre) Rotationsfordelingen P (R | Z, T) beregnes ud fra afstanden mellem koden for hver hypotese og dem i kodebogen. Kredit:Deng et al.

  • For hver partikel, orienteringsfordelingen estimeres betinget af oversættelsesestimering, mens oversættelsesestimatet evalueres med de tilsvarende RoI'er. Kredit:Deng et al.

  • Oversigt over PoseRBPF -rammer til sporing af 6D -objekter. Kredit:Deng et al.

  • Visualisering af rotationsfordelinger. Linjerne repræsenterer sandsynligheden for rotationer, der er højere end en tærskel. Længden af ​​hver linje er proportional med sandsynligheden for dette synspunkt. Som kan ses, PoseRBPF repræsenterer naturligvis usikkerheder på grund af forskellige former for symmetrier, herunder rotationssymmetri i skålen, spejlsymmetri af skumstenen, og diskrete rotationssymmetrier af T-LESS-objekterne til højre. Kredit:Deng et al.

Ved at bestemme orienteringsestimat på oversættelse, sporingssystemet foreslået af Mousavian og hans kolleger kan effektivt repræsentere komplekse usikkerhedsfordelinger i rummet mellem 6-D objektposer. Deres rammer giver også usikkerhedsoplysninger om et givet objekts positur, hvilket kan være særligt nyttigt i robotmanipulationsopgaver. I øvrigt, systemet blev uddannet ved hjælp af syntetiske og ikke-kommenterede data, dermed kan det spare forskere tid og ressourcer brugt på at kommentere data.

"Vores metode kombinerer den klassiske bayesiske estimeringsramme for partikelfiltrering med dyb læring, "Sagde Mousavian." Det samler derved veletablerede estimeringsteknikker udviklet i løbet af de sidste årtier og kraften i de seneste metoder til dyb læring. Som resultat, PoseRBPF kan robust estimere stillinger af vilkårlige objekter, herunder symmetriske. "

Forskerne evaluerede deres tilgang på to 6-D-estimeringsdatasæt:YCB-videosættet og T-LESS-datasættet. PoseRBPF opnåede state-of-the-art resultater, bedre end andre positurestimeringsteknikker. I fremtiden, partikelfilteret udviklet af Mousavian og hans kolleger kunne forbedre robotternes ydeevne i forskellige indstillinger, for eksempel ved at forbedre deres objektmanipulationsevner.

"Bevæger sig fremad, vi vil undersøge, hvordan vi bruger usikkerhedsestimaterne fra PoseRBPF i forbindelse med objektmanipulation, "Mousavian sagde." En anden vej til fremtidigt arbejde er aktivt at flytte kameraet for at reducere usikkerheden i et objekts stilling, såsom at se på et objekt fra et andet synspunkt for at løse uklarhed. "

© 2019 Science X Network