Videnskab
 science >> Videnskab >  >> Elektronik

Kaolin:Det første omfattende bibliotek til 3D-forskning i dyb læring

Kaolin applikationer. Kredit:Murthy Jatavallabhula et al.

Da de fleste miljøer i den virkelige verden er tredimensionelle, Deep learning-modeller designet til at analysere videoer eller fuldføre opgaver i virkelige miljøer bør ideelt set trænes på 3D-data. Teknologiske værktøjer såsom robotter, selvkørende køretøjer, smartphones, og andre enheder genererer i øjeblikket en stigende mængde 3-D-data, der i sidste ende kan behandles af deep learning-algoritmer.

Indtil nu, imidlertid, uddannelse af deep learning-algoritmer om denne enorme mængde 3-D-data har været relativt vanskelig, da de nødvendige værktøjer og platforme kun er tilgængelige for nogle kunstig intelligens (AI) forskere. For at imødegå denne mangel på let tilgængelige værktøjer, et team af forskere ved NVIDIA har for nylig skabt Kaolin, et PyTorch open source-bibliotek med det formål at fremme og lette 3D-forskning i dyb læring.

"I øjeblikket, der er ikke et eneste open source-softwarebibliotek, der understøtter flere repræsentationer af 3-D-data, flere opgaver, og evalueringskriterier, " Krishna Murthy Jatavallabhula, en af ​​de forskere, der har udført undersøgelsen, fortalte TechXplore. "Vi besluttede at løse dette hul i litteraturen ved at skabe Kaolin, det første omfattende 3-D deep learning-bibliotek."

Kaolin, PyTorch -biblioteket præsenteret af Jatavallabhula og hans kolleger, indeholder en række værktøjer til at konstruere deep learning-arkitekturer, der kan analysere 3-D-data, som både er effektive og nemme at bruge. Det giver også forskere mulighed for at indlæse, forbehandling, og manipulere 3-D-data, før de bruges til at træne deep learning-algoritmer.

Kaolin indeholder flere grafikmoduler til redigering af 3D-billeder, med funktioner som gengivelse, belysning, skygge og se vridning. I øvrigt, det understøtter en lang række tabsfunktioner og evalueringsmetrics, giver forskere mulighed for let at evaluere deres deep learning algoritmer.

Kredit:Murthy Jatavallabhula et al.

"Typisk, 3-D deep learning forskere skal skrive en masse kedelkode til deres forskningsprojekter, " Jatavallabhula forklarede. "Med Kaolin, imidlertid, forskere behøver kun at implementere de nye dele af deres projekt, som Kaolin pakker et omfattende sæt af hjælpeprogrammer til dataindlæsning, konvertering og evaluering."

Kaolin er et værdifuldt værktøj for både udviklere, der har erfaring med at udvikle deep learning-modeller, og dem, der lige er startet. Inden for biblioteket, faktisk, udviklere kan også finde flere state-of-the-art arkitekturer, som de kan bruge som udgangspunkt eller som inspirationskilde til deres egne modeller.

"Mens aktive 3-D deep learning forskere ser Kaolin som et middel til at accelerere deres forskning, nytilkomne på dette felt henvender sig til Kaolin for at få en idé om, hvor de skal begynde, " sagde Jatavallabhula.

I fremtiden, open source-biblioteket præsenteret af disse forskere på NVIDIA kunne hjælpe med at accelerere 3-D deep learning-forskning, hjælpe udviklere med at skabe nye AI -arkitekturer, samt i træning og evaluering af dem. I mellemtiden, Jatavallabhula og hans kolleger planlægger at arbejde på at udvide Kaolin og forbedre dets muligheder yderligere.

"Vores plan er at tilføje flere deep learning-modeller til vores modelzoo (samling af AI-modeller) og udvide vores dækning til et bredere sæt af applikationer som selvkørende biler og embodied agents, der har brug for 3-D-læring, " sagde Jatavallabhula. "Kort sagt, vi planlægger at gøre Kaolin til en one-stop platform for 3-D deep learning forskning."

© 2019 Science X Network




Varme artikler