Fig. 1. Sammenligning af manuelt annoterede datasæt og automatisk genererede syntetiske datasæt. Den konventionelle metode kræver, at billeder mærkes i hånden, når træningssættet produceres, hvorimod vores foreslåede system automatisk kan oprette syntetiske data med instansannoteringer ved hjælp af digitale aktiver fra en by digital tvilling. Kredit:Journal of Computational Design and Engineering (2022). DOI:10.1093/jcde/qwac086
Spilmotorer blev oprindeligt udviklet til at bygge imaginære verdener til underholdning. Disse samme motorer kan dog bruges til at bygge kopier af virkelige miljøer, det vil sige digitale tvillinger. Forskere fra Osaka University har fundet en måde at bruge de billeder, der automatisk blev genereret af digitale bytvillinger, til at træne dyb læringsmodeller, der effektivt kan analysere billeder af rigtige byer og præcist adskille de bygninger, der optræder i dem.
Et foldet neuralt netværk er et neuralt netværk med dyb indlæring, der er designet til at behandle strukturerede arrays af data såsom billeder. Sådanne fremskridt inden for dyb læring har fundamentalt ændret den måde, opgaver, som arkitektonisk segmentering, udføres på. En nøjagtig model for dybt foldning af neuralt netværk (DCNN) kræver imidlertid en stor mængde mærkede træningsdata, og mærkning af disse data kan være en langsom og ekstremt dyr manuel opgave.
For at skabe de syntetiske digitale tvillingedata for byer brugte efterforskerne en 3D-bymodel fra PLATEAU-platformen, som indeholder 3D-modeller af de fleste japanske byer på et ekstremt højt detaljeringsniveau. De indlæste denne model i Unity-spilmotoren og lavede en kameraopsætning på en virtuel bil, som kørte rundt i byen og erhvervede de virtuelle databilleder under forskellige lys- og vejrforhold. Google Maps API blev derefter brugt til at opnå rigtige billeder på gadeniveau af det samme undersøgelsesområde til eksperimenterne.
Fig. 2. Tredimensionel bymodel af vores undersøgelsesområde. (a) Eksempel på en digital tvilling i byen med dens gadebillede i den virkelige verden (Wangan-doro Avenue, Tokyo; marts 2021; breddegrad:35.6283, længdegrad:139.7782). (b) Luftfoto af byens digitale tvilling. Kredit:CC BY, 2022 Jiaxin Zhang et al., Automatisk generering af syntetiske datasæt fra en by digital tvilling til brug ved segmentering af bygningsfacader, Journal of Computational Design and Engineering
Forskerne fandt ud af, at de digitale tvillingedata for byer fører til bedre resultater end rent virtuelle data uden modstykke i den virkelige verden. Desuden forbedrer tilføjelse af syntetiske data til et rigtigt datasæt segmenteringsnøjagtigheden. Men vigtigst af alt fandt efterforskerne ud af, at når en vis brøkdel af reelle data er inkluderet i det digitale syntetiske tvillingedatasæt, øges segmenteringsnøjagtigheden af DCNN betydeligt. Faktisk bliver dens ydeevne konkurrencedygtig med en DCNN, der er trænet på 100 % reelle data.
"Disse resultater afslører, at vores foreslåede syntetiske datasæt potentielt kan erstatte alle de rigtige billeder i træningssættet," siger Tomohiro Fukuda, den tilsvarende forfatter til papiret.
Fig. 3. Kvalitative resultater for forskellige typer og størrelser af bygninger, når Mask R-CNN trænes ved hjælp af HSRBFIA (Hybrid Collection of Synthetic and Real-world Building Facade Images and Annotations) datasæt med forskellige forhold mellem syntetiske og virkelige data:(a) lavhuse i Osaka; (b) lavhuse i Los Angeles; (c) højhuse i New York City; d) komplekse facader i Shanghai. (De røde stiplede rektangler fremhæver dele af streetview-billederne, der var tilbøjelige til at fejle under facadeforekomstsegmentering.). Kredit:CC BY, 2022 Jiaxin Zhang et al., Automatisk generering af syntetiske datasæt fra en by digital tvilling til brug ved segmentering af bygningsfacader, Journal of Computational Design and Engineering
Automatisk adskillelse af de enkelte bygningsfacader, der optræder på et billede, er nyttig til byggeledelse og arkitekturdesign, storskalamålinger til eftermontering og energianalyse og endda visualisering af bygningsfacader, der er blevet revet ned. Systemet blev testet på flere byer, hvilket viser den foreslåede rammes overførbarhed. Det hybride datasæt af ægte og syntetiske data giver lovende forudsigelsesresultater for de fleste moderne arkitektoniske stilarter. Dette gør det til en lovende tilgang til træning af DCNN'er til arkitektoniske segmenteringsopgaver i fremtiden - uden behov for dyre manuel dataannotering.
Undersøgelsen er offentliggjort i Journal of Computational Design and Engineering . + Udforsk yderligere