Eksempel fra det datasæt, forskerne arbejdede på. Kredit:Wang et al.
Mennesker har den medfødte evne til at forudsige effekten af kollisioner, blot ved at bruge deres sunde fornuft. I mange tilfælde, mennesker kan endda forudsige resultaterne af lignende kollisioner i situationer, hvor masse, friktion, eller andre faktorer varierer. Kunne maskiner også opnå en lignende kapacitet?
Forskere ved Carnegie Mellon Universitys Robotics Institute og ved Third Wave Automation har for nylig skabt en fortolkelig intuitiv fysikmodel til at forudsige virkningerne af kollisioner. Deres maskinlæringsbaserede model, præsenteret i et papir, der er forududgivet på arXiv, viste sig at generalisere godt, selv i situationer, hvor lignende scener simuleres med forskellige underliggende egenskaber.
"Når der opstår en kollision, vi mennesker kan udlede den underliggende fysik og bruge denne information til at forudsige effekten af kollisionen, "Xiaolong Wang, en af de forskere, der har udført undersøgelsen, fortalte TechXplore. "For eksempel, vi kan forudsige, at en kugle vil hoppe tilbage, når den kolliderer med en tungere kasse, mens kuglen bliver ved med at bevæge sig, hvis den kolliderer med en lettere genstand. Inspireret af dette, vi designet en intuitiv fysikmodel, som kan forstå de fysiske egenskaber (friktion, masse og hastighed) af objekterne ved at se videoer af objektkollisioner, hjælper til bedre at forudsige resultaterne af kollisioner."
I den intuitive fysikmodel udviklet af Wang og hans kolleger, specifikke dimensioner i flaskehalslagene i det konvolutionelle neurale netværk (CNN) svarer til forskellige fysiske egenskaber. Da disse egenskaber ofte afhænger af hinanden eller er forbundet, forskerne introducerede også en træningsplan og en generaliseret tabsfunktion, som viste sig at overgå baseline tilgange.
Resultater produceret af modellen. Kredit:Wang et al.
"Vores model er et encoder-decoder struktur foldet neuralt netværk, " Wang forklarede. "Input til modellen er videoframes før kollisionen sker, og tidspunktet for kollisionen. Modellen vil generere de løsrevne repræsentationer af massen, objekternes friktion og hastighed. Disse fysiske repræsentationer afkodes derefter for at forudsige den fremtidige ramme efter kollisioner."
I evalueringer foretaget af forskerne, modellen viste sig at generalisere godt på tværs af scener med forskellige underliggende fysiske egenskaber, eller hvor objekter havde forskellige former. Ud over, det var effektivt i stand til at forudsige fremtiden i tilfælde, hvor det fysiske miljø ændrede sig.
"At lære en fortolkelig fysikmodel giver os mulighed for at få en bedre forståelse af neurale netværk, "Sagde Wang." I stedet for at se på et neuralt netværk med en sort boks, vi kan nu manipulere og kontrollere netværksrepræsentationerne for at generere de forudsigelsesresultater, vi ønsker."
Undersøgelsen udført af Wang og hans kolleger giver et glimt af, hvor langt neurale netværk kan gå i at replikere medfødte menneskelige evner. I fremtiden, deres model kunne have en række interessante applikationer i virkelige scenarier, forudsige resultaterne af kollisioner mellem virkelige objekter i rummet.
"Vores arbejde er baseret på simuleringer, så vi prøver nu at tilpasse vores metode til den virkelige verden, "Sagde Wang." Ved at gå ind i den fysiske verden, vi tillader også mennesker eller robotter at interagere aktivt med objekterne for at forstå fysikken."
© 2018 Tech Xplore