Videnskab
 science >> Videnskab >  >> Fysik

Brugen af ​​grafiske neurale netværk til at opdage partikler

Det opgraderede kalorimeter med høj granularitet - en komponent i CMS-detektoren på Large Hadron Collider - producerer komplicerede billeder af partikler genereret fra kollisioner. Forskere arbejder på at implementere grafiske neurale netværk for at optimere analysen af ​​disse data for bedre at identificere og karakterisere partikelinteraktioner af interesse. Kredit:Ziheng Chen, Northwestern University

Maskinlæringsalgoritmer kan slå verdens hårdeste videospil på få minutter og løse komplekse ligninger hurtigere end den kollektive indsats fra generationer af fysikere. Men de konventionelle algoritmer kæmper stadig med at udvælge stopskilte på en travl gade.

Objektidentifikation fortsætter med at hæmme maskinlæringsområdet - især når billederne er flerdimensionelle og komplicerede, som dem, partikeldetektorer tager af kollisioner i højenergifysiske eksperimenter. Imidlertid, en ny klasse af neurale netværk hjælper disse modeller med at øge deres mønstergenkendelsesevner, og teknologien kan snart implementeres i partikelfysiske eksperimenter for at optimere dataanalysen.

Den her sommer, Fermilab-fysikere gjorde fremskridt i deres bestræbelser på at indlejre grafiske neurale netværk i de eksperimentelle systemer. Forsker Lindsey Gray opdaterede software, der gør det muligt at implementere disse banebrydende algoritmer på data fra Large Hadron Collider på CERN. For første gang, disse netværk vil blive integreret i partikelfysiske eksperimenter for at behandle detektordata direkte - hvilket åbner sluserne for et stort spring i effektivitet, der vil give mere præcis indsigt fra nuværende og fremtidige detektorer.

"Det, der kun var et forskningsobjekt for en uge siden, er nu et meget anvendeligt værktøj, der kunne transformere vores evne til at analysere data fra partikelfysiske eksperimenter, " sagde Gray.

Hans arbejde fokuserer oprindeligt på at bruge grafiske neurale netværk til at analysere data fra CMS-eksperimentet på LHC, et af kolliderens fire store partikelfysiske eksperimenter.

Programmører udvikler neurale netværk til at gennemsøge bjerge af data på jagt efter en specifik kategori eller mængde - f.eks. et stopskilt på et foto af en fyldt gade.

Normale digitale fotografier er i bund og grund et kæmpe gitter af rødt, grønne og blå firkantede pixels. Efter at være blevet trænet i at genkende, hvordan et stopskilt ser ud, klassiske neurale netværk inspicerer hele blokken af ​​pixels for at se, om målet er til stede eller ej. Denne metode er ineffektiv, imidlertid, da modellerne skal behandle en masse irrelevant, slørende data.

Dataloger har udviklet nye klasser af neurale netværk for at forbedre denne proces, men algoritmerne kæmper stadig med at identificere objekter i billeder, der er mere komplekse end blot et todimensionelt gitter af kvadratiske pixels.

Tag molekyler, for eksempel. For at afgøre, om et kemikalie er giftigt eller ej, kemikere er nødt til at lokalisere visse funktioner som carbonringe og carboxylgrupper i et molekyle. Fotografierne af kemikalierne taget med røntgenkromatografimaskiner producerer 3-D billeder af bundne atomer, som ser lidt anderledes ud hver gang de bliver set.

Da dataene ikke er gemt i et kvadratisk gitter, det er svært for typiske neurale netværk at lære at identificere de giftige forbindelser. For at komme uden om dette, kemikere er begyndt at anvende et nyt sæt neurale netværk:grafiske neurale netværk, eller GNN'er.

I modsætning til disse typiske neurale netværk, GNN'er er i stand til at fortælle, hvilke pixels der er forbundet med hinanden, selvom de ikke er i et 2-D-gitter. Ved at gøre brug af "kanterne" mellem "knuderne" af data (i dette tilfælde, bindingerne mellem atomerne), disse maskinlæringsmodeller kan identificere ønskede emner meget mere effektivt.

Grays vision er at bringe disse modeller og deres forbedrede målidentifikation til at strømline databehandling for partikelkollisioner.

"Med et grafisk neuralt net, du kan skrive en væsentligt bedre mønstergenkendelsesalgoritme, der skal bruges til noget så komplekst som partikelacceleratordata, fordi den har evnen til at se på relationer mellem alle de data, der kommer ind, for at finde de mest relevante dele af den information, " han sagde.

CMS-detektoren på Large Hadron Collider tager milliarder af billeder af højenergikollisioner hvert sekund for at søge efter beviser for nye partikler. Grafiske neurale netværk beslutter hurtigt, hvilke af disse data der skal beholdes til yderligere analyse. Kredit:CERN

Grays forskning fokuserer på at implementere GNN'er i CMS-detektorens kalorimeter med høj granularitet, eller HGCal. CMS tager milliarder af billeder af højenergikollisioner hvert sekund for at søge efter beviser for nye partikler.

En udfordring ved kalorimeteret er, at det indsamler så meget data - nok billeder til at fylde 20 millioner iPhones hvert sekund - at et stort flertal skal smides væk på grund af begrænsninger i lagerplads. HGCal's triggersystemer skal på få milliontedele af et sekund beslutte, hvilke dele af dataene der er interessante og skal gemmes. Resten bliver slettet.

"Hvis du har et neuralt netværk, som du kan optimere til at køre på en vis tid, så kan du træffe disse beslutninger mere pålideligt. Du går ikke glip af ting, og du beholder ikke ting, som du egentlig ikke har brug for, " sagde Kevin Pedro, en anden Fermilab-forsker, der arbejder med Gray.

HGCal-detektorerne indsamler mange forskellige informationer på samme tid om partikelinteraktioner, hvilket giver nogle meget komplicerede billeder.

"Disse data er underligt formet, de har tilfældige huller i dem, og de er ikke engang meget tæt på et sammenhængende gitter af firkanter, " sagde Gray. "Det er her, graferne kommer ind - fordi de giver dig mulighed for bare at springe alle de meningsløse ting over."

I teorien, GNN'erne ville blive trænet til at analysere forbindelserne mellem pixels af interesse og være i stand til at forudsige, hvilke billeder der skal gemmes, og hvilke der kan slettes meget mere effektivt og præcist. Imidlertid, fordi denne klasse af neurale net er så ny for partikelfysik, det er endnu ikke muligt at implementere dem direkte i trigger-hardwaren.

Grafens neurale netværk er velegnet til HGCal på en anden måde:HGCal's moduler er sekskantede, en geometri, der selvom det ikke er kompatibelt med andre typer neurale netværk, fungerer godt med GNN'er.

"Det er det, der gør netop dette projekt til et gennembrud, " sagde Fermilab Chief Information Officer Liz Sexton-Kennedy. "Det viser Kevins og Lindseys opfindsomhed:De arbejdede tæt sammen med kolleger, der designede kalorimeteret, og de brugte deres unikke ekspertise inden for software til yderligere at udvide eksperimentets muligheder."

Gray formåede også at skrive en kode, der udvider mulighederne for PyTorch, en udbredt open source maskinlæringsramme, at tillade, at grafiske neurale netværksmodeller kan køres eksternt på enheder rundt om i verden.

"Før dette, det var ekstremt klodset og omstændeligt at bygge en model og derefter implementere den, " sagde Gray. "Nu hvor det er funktionelt, du sender bare data ind i tjenesten, den finder ud af, hvordan den bedst udføres, og så bliver outputtet sendt tilbage til dig."

Gray og Pedro sagde, at de håber at have grafens neurale netværk funktionelle, når LHC's Run 3 genoptages i 2021. På denne måde, modellerne kan trænes og testes før kolliderens højlysstyrkeopgradering, hvis øgede dataindsamlingsmuligheder vil gøre GNN'er endnu mere værdifulde.

Når netværkene er oppe at køre ét sted, det burde være meget nemmere at få dem til at fungere i andre eksperimenter rundt om i laboratoriet.

"Du kan stadig anvende alle de samme ting, vi lærer om grafiske neurale netværk i HGCal til andre detektorer i andre eksperimenter, " sagde Gray. "Hastigheden, hvormed vi anvender maskinlæring i højenergifysik, er ikke engang tæt på mættet endnu. Folk vil blive ved med at finde flere og flere måder at anvende det på."


Varme artikler