Videnskab
 science >> Videnskab >  >> Elektronik

Brug af kunstig intelligens til at berige digitale kort

En AI-model udviklet ved MIT og Qatar Computing Research Institute, som kun bruger satellitbilleder til automatisk at mærke vejfunktioner i digitale kort, kunne forbedre GPS-navigation, især i lande med begrænsede kortdata. Kredit:Google Maps/MIT News

En model opfundet af forskere ved MIT og Qatar Computing Research Institute (QCRI), der bruger satellitbilleder til at mærke vejegenskaber i digitale kort, kunne hjælpe med at forbedre GPS-navigation.

At vise chauffører flere detaljer om deres ruter kan ofte hjælpe dem med at navigere på ukendte steder. Bane tæller, for eksempel, kan gøre det muligt for et GPS-system at advare bilister om divergerende eller flettede baner. Inkorporering af oplysninger om parkeringspladser kan hjælpe chauffører med at planlægge fremad, mens kortlægning af cykelstier kan hjælpe cyklister med at forhandle travle bygader. At levere opdaterede oplysninger om vejforhold kan også forbedre planlægningen af ​​katastrofehjælp.

Men det er dyrt at lave detaljerede kort, tidskrævende proces udført hovedsagelig af store virksomheder, som Google, som sender køretøjer rundt med kameraer spændt på deres motorhjelm for at optage video og billeder af et områdes veje. Ved at kombinere det med andre data kan skabe nøjagtige, opdaterede kort. Fordi denne proces er dyr, imidlertid, nogle dele af verden ignoreres.

En løsning er at frigøre maskinlæringsmodeller på satellitbilleder – som er nemmere at få fat i og opdateres ret regelmæssigt – for automatisk at mærke vejfunktioner. Men veje kan blokeres af, sige, træer og bygninger, gør det til en udfordrende opgave. I et papir, der præsenteres på konferencen Association for the Advancement of Artificial Intelligence, MIT og QCRI forskerne beskriver "RoadTagger, " som bruger en kombination af neurale netværksarkitekturer til automatisk at forudsige antallet af baner og vejtyper (bolig eller motorvej) bag forhindringer.

Ved at teste RoadTagger på lukkede veje fra digitale kort over 20 amerikanske byer, modellen talte vognbanenumre med 77 procents nøjagtighed og udledte vejtyper med 93 procents nøjagtighed. Forskerne planlægger også at gøre det muligt for RoadTagger at forudsige andre funktioner, såsom parkeringspladser og cykelstier.

"De fleste opdaterede digitale kort er fra steder, som store virksomheder bekymrer sig mest om. Hvis du er steder, de er ligeglade med, du er dårligere stillet med hensyn til kvaliteten af ​​kortet, " siger medforfatter Sam Madden, en professor i Institut for Elektroteknik og Datalogi (EECS) og en forsker i Computer Science and Artificial Intelligence Laboratory (CSAIL). "Vores mål er at automatisere processen med at generere digitale kort af høj kvalitet, så de kan være tilgængelige i ethvert land."

Avisens medforfattere er CSAIL kandidatstuderende Songtao He, Favyen Bastani, og Edward Park; EECS bachelorstuderende Satvat Jagwani; CSAIL-professorerne Mohammad Alizadeh og Hari Balakrishnan; og QCRI-forskere Sanjay Chawla, Sofiane Abbar, og Mohammad Amin Sadeghi.

Kombinere CNN og GNN

Quatar, hvor QCRI er baseret, er ikke en prioritet for de store virksomheder, der bygger digitale kort, " siger Madden. Alligevel, det bygger hele tiden nye veje og forbedrer gamle, især som forberedelse til at være vært for 2022 FIFA World Cup.

"Mens du besøgte Qatar, vi har haft oplevelser, hvor vores Uber-chauffør ikke kan finde ud af, hvordan han kommer derhen, hvor han skal hen, fordi kortet er så off, Madden siger. "Hvis navigationsapps ikke har de rigtige oplysninger, til ting som vognbanesammenlægning, det kan være frustrerende eller værre."

RoadTagger er afhængig af en ny kombination af et konvolutionelt neuralt netværk (CNN) - almindeligvis brugt til billedbehandlingsopgaver - og et grafisk neuralt netværk (GNN). GNNs modellerer forhold mellem forbundne noder i en graf og er blevet populære til at analysere ting som sociale netværk og molekylær dynamik. Modellen er "ende-til-ende, "hvilket betyder, at den kun tilføres rådata og automatisk producerer output, uden menneskelig indblanding.

CNN tager som input rå satellitbilleder af målveje. GNN deler vejen i segmenter på omkring 20 meter, eller "fliser". Hver flise er en separat grafknude, forbundet med linjer langs vejen. For hver knude, CNN udtrækker vejtræk og deler denne information med sine umiddelbare naboer. Vejinformation forplanter sig langs hele grafen, med hver knude, der modtager information om vejattributter i hver anden knude. Hvis en bestemt flise er okkluderet i et billede, RoadTagger bruger information fra alle fliser langs vejen til at forudsige, hvad der ligger bag okklusionen.

Denne kombinerede arkitektur repræsenterer en mere menneskelignende intuition, siger forskerne. Lad os sige, at en del af en firesporet vej er lukket af træer, så visse fliser viser kun to baner. Mennesker kan let ane, at et par baner er gemt bag træerne. Traditionelle maskinlæringsmodeller – f.eks. bare en CNN – udtræk kun funktioner fra individuelle fliser og forudsige højst sandsynligt, at den tilstoppede flise er en to-sporet vej.

"Mennesker kan bruge information fra tilstødende fliser til at gætte antallet af baner i de okkluderede fliser, men netværk kan ikke gøre det, "Siger han. "Vores tilgang forsøger at efterligne menneskers naturlige adfærd, hvor vi fanger lokal information fra CNN og global information fra GNN for at lave bedre forudsigelser."

At lære vægte

For at træne og teste RoadTagger, forskerne brugte et kortdatasæt fra den virkelige verden, kaldet OpenStreetMap, som lader brugere redigere og kuratere digitale kort over hele kloden. Fra dette datasæt, de indsamlede bekræftede vejattributter fra 688 kvadratkilometer kort over 20 amerikanske byer – inklusive Boston, Chicago, Washington, og Seattle. Derefter, de samlede de tilsvarende satellitbilleder fra et Google Maps-datasæt.

I træning, RoadTagger lærer vægte - som tildeler forskellige grader af betydning til funktioner og knudeforbindelser - af CNN og GNN. CNN udtrækker funktioner fra pixelmønstre af fliser, og GNN udbreder de indlærte funktioner langs grafen. Fra tilfældigt udvalgte undergrafer af vejen, systemet lærer at forudsige vejegenskaberne ved hver flise. Derved, den lærer automatisk, hvilke billedfunktioner der er nyttige, og hvordan man udbreder disse funktioner langs grafen. For eksempel, hvis en målbrikke har uklare banemarkeringer, men dens naboflise har fire baner med tydelige vognbanemarkeringer og deler den samme vejbredde, så har målflisen sandsynligvis også fire baner. I dette tilfælde, modellen lærer automatisk, at vejbredden er en nyttig billedfunktion, så hvis to tilstødende fliser deler den samme vejbredde, de har sandsynligvis samme vognbaneantal.

Givet en vej, der ikke er set under træning fra OpenStreetMap, modellen deler vejen i fliser og bruger sine lærte vægte til at lave forudsigelser. Har til opgave at forudsige et antal baner i en okkluderet flise, modellen bemærker, at tilstødende fliser har matchende pixelmønstre og, derfor, stor sandsynlighed for at dele information. Så, hvis disse fliser har fire baner, den okkluderede flise skal også have fire.

I et andet resultat, RoadTagger forudsagde nøjagtigt banenumre i et datasæt af syntetiserede, meget udfordrende vejforstyrrelser. Som et eksempel, en overkørsel med to spor dækkede et par fliser af en målvej med fire spor. Modellen registrerede uoverensstemmende pixelmønstre på overføringen, så den ignorerede de to baner over de overdækkede fliser, præcist at forudsige fire baner var nedenunder.

Forskerne håber at kunne bruge RoadTagger til at hjælpe mennesker med hurtigt at validere og godkende løbende ændringer af infrastrukturen i datasæt som OpenStreetMap, hvor mange kort ikke indeholder vognbanetællinger eller andre detaljer. Et specifikt interesseområde er Thailand, Bastani siger, hvor vejene konstant ændrer sig, men der er få om nogen opdateringer i datasættet.

"Veje, der engang blev mærket som jordveje, er blevet asfalteret, så det er bedre at køre på, og nogle kryds er blevet bygget fuldstændig over. Der er ændringer hvert år, men digitale kort er forældede, " siger han. "Vi ønsker konstant at opdatere sådanne vejegenskaber baseret på de seneste billeder."

Denne historie er genudgivet med tilladelse fra MIT News (web.mit.edu/newsoffice/), et populært websted, der dækker nyheder om MIT-forskning, innovation og undervisning.




Varme artikler