Ny kunstig neurale netværksmodel bester MaxEnt i invers problemeksempel

Sammenligning af startspektralfunktionerne A (ω) (heltrukne linjer) med den forudsagte Aˆ (ω) beregnet ved hjælp af MaxEnt -tilgangen (orange prik stiplede linjer) og den foreslåede ANN -model (blå stiplede linjer) ved forskellige støjniveauer η for tre eksempler af spektraltæthedsfunktioner, der ikke findes i træningsdatasættet. ANN opfører sig lige så godt som MaxEnt ved lavt støjniveau, men opfører sig meget bedre end MaxEnt ved højt støjniveau. Kredit:EPFL

Numeriske simuleringer, generelt baseret på ligninger, der beskriver en given model og på indledende data, anvendes i en stadig voksende vifte af videnskabelige discipliner til at tilnærme processer på givne tidspunkter og rum. Med såkaldte omvendte problemer, disse kritiske data mangler - forskere skal rekonstruere tilnærmelser til inputdataene eller modellen, der ligger til grund for observerbare data, for at generere de ønskede forudsigelser.

Mens teknikker til at gøre det allerede findes, de er dårligt definerede, ude af stand til at tildele unikke fortolkninger eller værdier til et givet punkt. Som et eksempel, i den mest almindeligt anvendte metode til løsning af sådanne problemer, den såkaldte maksimal entropi (MaxEnt) tilgang, forudgående viden tilføjes ved at angive en standardfordeling, der svarer til forventede resultater i fravær af data. Algoritmen søger iterativt efter en distribution, der maksimerer entropi med hensyn til denne standardfordeling, samtidig med at den genererer en funktion tæt på eksisterende data. Fremgangsmåden inkluderer en parameter, der bruges til at afveje den relative betydning mellem entropien og fejltermerne. Der er flere metoder til at reparere det, der ofte giver forskellige resultater, når det anvendes i praksis.

I papiret Artificial Neural Network Approach to the Analytic Continuation Problem, QuanSheng Wu, en videnskabsmand og Romain Fournier, en kandidatstuderende ved EPFL's C3MP, ledet af professor Oleg Yazyev, og kollega professor Lei Wang ved Institut for Fysik ved det kinesiske videnskabsakademi præsenterer en overvåget læringstilgang til problemet. Baseret på et kunstigt neuralt netværk (ANN) - meget alsidig takket være en evne til at tilnærme kontinuerlige funktioner under milde forudsætninger og på grund af kraftfulde biblioteker, der muliggør en effektiv implementering af forskellige ANN -arkitekturer, der kan skræddersyes til at drage fordel af datastrukturer - den nye metode ser ud til at være lige så præcis som MaxEnt og betydeligt billigere beregningsmæssigt.

I en første test af ANN -rammen, forskerne valgte at undersøge et system, der har en analytisk løsning, men er vanskelig at løse ved hjælp af MaxEnt - nemlig, tids-korrelationsfunktionen for positionsoperatøren for en harmonisk oscillator lineært koblet til et ideelt miljø. Hamiltonianeren, eller operatør generelt svarende til systemets samlede energi, er kendt i denne sag, og dataene af interesse-den imaginære tidskorrelationsfunktion-kan genereres ved kvante Monte Carlo (QMC) simuleringer.

Den analytiske løsning giver effektspektrets relation til en imaginær-tidskorrelationsfunktion og leverede som sådan fysisk relevante træningsdata for ANN-modellen. Forskerne uddannede ANN med de genererede data og testede dem derefter ved at opnå den imaginære-tidskorrelationsfunktion beregnet i det tidligere trin af QMC. Modellen uddannet på hele datasættet viste næsten perfekt overensstemmelse med den analytiske løsning. MaxEnt formåede ikke at give nøjagtige resultater, selvom forskerne bemærkede, at der sandsynligvis ville være opnået bedre resultater ved at beregne korrelationsfunktionen på et større antal punkter.

For yderligere at teste modellen på en praktisk måde, forskerne søgte at gendanne elektronens enkeltpartikelspektraltæthed i det reelle frekvensdomæne fra en Greens funktion i det imaginære tidsdomæne. Mens både ANN- og MaxEnt -modellerne var i stand til at forudsige start af spektrale funktioner præcist for det laveste støjniveau, MaxEnt havde en tendens til at undertrykke toppe i den forudsagte spektrale funktion med stigende støj i systemet. Disse resultater viser, at ANN -modellen er alsidig og robust mod støjende data.

Den nye metode er også beregningsmæssigt mere effektiv. ANN tillod direkte kortlægning mellem Greens funktioner og spektraltæthederne og kan i den forstand løse problemet direkte. MaxEnt på den anden side er iterativ og genererer prøvefunktioner, indtil konvergens er nået. Med den beregningsmæssige opsætning, der bruges i papiret, den tid, der kræves for at konvertere et givet antal par ved et givet støjniveau, var 5 sekunder i tilfælde af ANN sammenlignet med de 51 minutter, MaxEnt ville have brug for ved hjælp af den samme opsætning.

Forskerne sagde, at sådanne ANN'er sandsynligvis vil være i stand til at løse andre omvendte problemer, forudsat at relevante datasæt - afledt, for eksempel, ved hjælp af tilgængelige eksperimentelle resultater kombineret med dataforstørrelsesteknikker - kan konstrueres. De uddannede modeller, der følger af arbejdet, kan hentes fra et offentligt arkiv på GitHub her:github.com/rmnfournier/ACANN.

Sidste artikelI akustiske bølger, ingeniører bryder gensidighed med rumtidsvarierende metamaterialer

Næste artikelBredbåndsoverførselstype kodende metasurface til elektromagnetisk stråledannelse og -scanning