Videnskab
 science >> Videnskab >  >> Elektronik

VRKitchen:Et interaktivt virtuelt miljø til at træne og teste AI-agenter

En prøvesekvens af en agent, der laver en sandwich i VRKitchen. Kredit:Gao et al.

Et team af forskere ved University of California Los Angeles (UCLA), under opsyn af prof. Song-Chun Zhu, har udviklet et interaktivt 3-D virtuelt miljø til træning og evaluering af AI-systemer. Deres platform, kaldet VRKitchen, blev for nylig præsenteret i et papir, der var forududgivet på arXiv.

"Det er dyrt at træne robotter i den virkelige verden, langsom og næppe reproducerbar, "Tianmin Shu, en ph.d. studerende ved UCLA, der udførte undersøgelsen, fortalte TechXplore. "På grund af dette, i de seneste år, vi har set store fremskridt med at bygge fysikaktiverede 3D virtuelle platforme (f.eks. AI2-THOR, House3D), hvor inkorporerede AI-agenter kan gå rundt og finde et målobjekt."

På trods af deres mange fordele, de fleste eksisterende virtuelle platforme til træning af AI-systemer muliggør ikke komplekse interaktioner med fysiske objekter, som er meget almindelige i virkelige situationer. Ud over, mange af disse platforme tillader ikke mennesker at deltage i træningen af ​​agenter i det virtuelle miljø.

"I dette arbejde, vi sigter mod at bygge en meget interaktiv og realistisk virtuel platform, giver forskere mulighed for at træne og evaluere deres AI-agenter i en lang række opgaver i den virkelige verden, der involverer komplekse objektmanipulationer (f.eks. madlavning af et måltid), "Shu sagde. "Et yderligere mål med vores forskning er at bygge VR-grænseflader, der gør det muligt for mennesker at undervise AI-agenter ved at give demonstrationer i det samme miljø."

VRK køkken, det virtuelle miljø skabt af Shu og hans kolleger, er baseret på Unreal Engine 4, en suite af værktøjer, der generelt bruges af spiludviklere til at designe spil eller simuleringer. Sammenlignet med eksisterende virtuelle miljøer, VRKitchen har to vigtige fordele.

Først, i VRK Kitchen, en AI-agent kan udføre en bred vifte af madlavningsopgaver med omfattende objekttilstandsændringer og sammensætningsmål. For eksempel, hvis en agent lærer at lave pizza, det virtuelle miljø simulerer visuelle effekter af osten, der rives, tomater skæres og ingredienserne lægges på dejen.

"Vi håbede virkelig, at evnen til at simulere disse komplekse madlavningsopgaver ville få VRKitchen til at skille sig ud fra andre platforme, "Xiaofeng Gao, Ph.D. studerende ved UCLA, der udførte undersøgelsen, fortalte TechXplore.

En anden fordel ved VRKitchen er, at den indbyggede agent, der navigerer i det virtuelle miljø, kan styres af både AI-algoritmer og menneskelige brugere. Dette giver mennesker mulighed for at give demonstrationer til AI-agenter, så sidstnævnte kan tilegne sig viden om, hvordan man udfører en opgave via observation, frem for at skulle lære opgaven selvstændigt.

"Vi byggede tre store moduler i VRKitchen, " Gao forklarede. "(1) den UE4 (Unreal Engine 4)-baserede fysikmotor og fotorealistiske gengivelsesmodul med adskillige humanoide agenter, og et sæt tilpassede køkkenscener bestående af forskellige møbler, køkkenmaskiner, fødevareingredienser, containere, og værktøjer til madlavning; (2) et brugergrænseflademodul, der tillader brugere eller algoritmer at udføre opgaver ved hjælp af virtual reality-enhed eller Python API; (3) en Python-UE4-bro, som overfører kommandoer på højt niveau til motorstyresignaler og sender dem til agenten."

Det virtuelle miljø udviklet af Shu, Gao og deres kolleger kan snart blive brugt til at træne agenter drevet af en bred vifte af maskinlæringsteknikker til komplekse opgaver, der involverer finkornet objektmanipulation. Sammen med VRKitchen, forskerne præsenterede nye standardiserede evalueringsbenchmarks og dataindsamlingsværktøjer, som er designet til at lette brugen af ​​deres platform i forskningsmiljøer.

"Populære tilgange i nyere litteratur, der fungerer godt i enklere virtuelle miljøer, opnår ikke en anstændig ydeevne på de madlavningsopgaver, der er implementeret i vores platform, påtvinger en ny udfordring for AI-forskning og fremhæver vigtigheden af ​​at bygge mere realistiske og komplekse virtuelle miljøer, "" sagde Shu. "Vi planlægger nu at open source vores platform og være vært for standardiserede udfordringer (VR Chef Challenge) for AI-fællesskabet. Vi arbejder også på at opbygge AI-agenter, der effektivt kan tilegne sig komplekse færdigheder ved selv at udforske den virtuelle verden såvel som ved at lære af mennesker demonstrationer."

© 2019 Science X Network




Varme artikler