En ny maskinlæringstilgang kan hjælpe forskere med at løse problemer såsom at finde ud af de bedste størrelser af cylindre til at fange elektromagnetisk energi. Kredit:Duke University School of Nursing
Elektriske ingeniører ved Duke University har udtænkt en ny metode til at løse vanskelige designproblemer med mange potentielle løsninger i et stort designrum ved hjælp af maskinlæring. Kaldet "neuralt-tilstødende metode, "tilgangen har med succes afdækket et optimeret design til en elektromagnetisk kommunikationsenhed og kan også bruges til mange andre designudfordringer lige fra biomedicinsk billeddannelse til holografi.
Undersøgelsen udkom online den 24. februar i tidsskriftet Optik Express , med titlen "Neural-adjoint metode til det omvendte design af al-dielektriske metasurfaces."
Den dilemma, som den nye maskinlæringsmetode løser, løser omvendte problemer, hvilket betyder, at forskere kender det resultat, de ønsker, men er ikke sikre på, hvordan de bedst kan opnå det. Inden for denne type udfordring er en klasse kaldet dårligt stillede omvendte problemer, hvilket betyder, at der er et uendeligt antal løsninger uden nogen vejledning om, hvilken der kan være den bedste.
"Hvis der gives to tal at tilføje, du kan få en direkte og enkel løsning, " forklarede Willie Padilla, professor i el- og computerteknik ved Duke. "Men hvis jeg siger, at jeg skal give mig to reelle tal, der summer op til tre, der er et uendeligt sæt tal, der kunne være svaret med nul forståelse, hvis det rigtige svar er blevet valgt. At vende denne enkle opgave viser, hvor udfordrende et dårligt stillet omvendt problem kan være."
I den nye forskning, den specifikke opgave Padilla søger at løse er at finde det bedste design til et dielektrisk (metalfrit) metamateriale, der producerer en specifik elektromagnetisk respons. Metamaterialer er syntetiske materialer sammensat af mange individuelle konstruerede funktioner, som tilsammen producerer egenskaber, der ikke findes i naturen. De opnår dette gennem deres struktur snarere end deres kemi. I Padillas dielektriske metamateriale-eksperiment, han bruger et stort ark bygget af individuelle to-og-to gitre af siliciumcylindre, der ligner korte, firkantede lego.
At beregne, hvordan de elektromagnetiske virkninger af et identisk sæt cylindre interagerer med hinanden, er en ligetil proces, der kan udføres af kommerciel software. Men at finde ud af det dårligt stillede omvendte problem med, hvilken geometri der bedst vil producere et ønsket sæt egenskaber, er et meget vanskeligere forslag. Fordi hver cylinder skaber et elektromagnetisk felt, der strækker sig ud over dets fysiske grænser, de interagerer med hinanden i en uforudsigelig, ikke-lineær måde.
"Hvis du forsøger at opbygge en ønsket reaktion ved at kombinere de elektromagnetiske effekter produceret af hver enkelt cylinder, du vil få et kompliceret kort over mange høje og lave toppe, der ikke blot er en sum af deres dele, " sagde professor Padilla. "Det er et enormt geometrisk parameterrum, og du er fuldstændig blind - der er ingen indikation af, hvilken vej du skal gå."
Padillas nye maskinlæringstilgang til at navigere i dette komplekse designrum starter med at træne et dybt neuralt netværk med 60, 000 simuleringer af forskellige designs og de elektromagnetiske egenskaber, de producerer. Selv når man tager 14 geometriske parametre i betragtning, maskinlæringsalgoritmen lærte funktionen, der forbinder den komplekse geometri med det elektromagnetiske resultat.
På dette tidspunkt, det dybe neurale netværk kunne give forskerne et svar på et omvendt spørgsmål om at finde en geometri, der kan producere et ønsket svar. Men med 1,04 billioner potentielle løsninger, det ville tage det neurale netværk over tre år at finde et svar.
"Mig bekendt, dette er det største fotonikproblem i geometrisk rum, som nogen har arbejdet på, " sagde Padilla. "Hvis du prøvede at løse det med en normal computeralgoritme, det ville tage 600 millioner år. Det dybe neurale netværk samplede kun 0,00000575 % af designrummet, men den lærte funktionen alligevel."
Mens en imponerende bedrift, det er det andet trin i denne proces, der virkelig er nyt. Selvom forskerne ikke ved præcis, hvordan den funktion, som det dybe neurale netværk kom frem til, faktisk ser ud, de kan bruge det til at arbejde hen imod et optimalt svar.
Den nye neural-adjoint-metode virker ved at starte ved 16, 000 tilfældige point og beregne hvor god en løsning hver er. Det giver derefter hver enkelt mulighed for at bevæge sig mod en bedre løsning - en proces kaldet gradientnedstigning. Ved at gentage denne proces flere gange, algoritmen arbejder sig frem til lokalt optimerede løsninger. Afgørende, forskerne sætter også minimums- og maksimumsgrænser baseret på deres viden om det rum, maskinlæringen er nøjagtig inden for, hvilket forhindrede algoritmen i at blive for skør med sine løsninger.
Efter 300 gentagelser, programmet ser på de 16, 000 lokalt optimale løsninger den fandt og vælger den bedste løsning. Det angiver også, om der kan være en grænse sat på en parameter, der kan muliggøre en bedre løsning, hvis den blev udvidet.
"Ved at lave denne forskning, vi så alle vores bedste løsninger sat fast i forhold til den maksimale højde, vi havde sat for cylindrene, " sagde Padilla. "Vi begrænsede os selv, men vidste det ikke. Så vi udvidede højden, lavede endnu flere simuleringer, og faktisk fundet en bedre løsning."
Anvendt på metamaterialer, Padilla siger, at denne metode kan hjælpe med at udvikle flade kommunikationsantenner til siderne af bygninger, der hurtigt kan omkonfigurere sig selv for bedre at nå brugere i nærheden. Men han siger, at det også kan bruges i en lang række applikationer, der indsamler information fra elektromagnetiske bølger. For eksempel, fortolkning af røntgenstråler eller magnetiske bølger i medicinsk billedbehandlingsudstyr eller udvikling af computergenererede hologrammer.
Sidste artikelNy metode til hurtig 3D-mikroskopi
Næste artikelIkke-lineære effekter i koblede optiske mikrokaviteter