Videnskab
 science >> Videnskab >  >> Fysik

Maskinlæring ændrer kvalitativt søgningen efter nye partikler

Figur 1:Diagram, der illustrerer konstruktionen af ​​blandede prøver til træning af en svagt overvåget CWoLa -klassifikator i bumpjagten. I ATLAS -søgningen, resonansfunktionen (mres) er dijetmassen og de andre træk (y) er masserne af de to stråler. Kredit:ATLAS Collaboration/CERN

ATLAS Collaboration på CERN undersøger nye måder at søge efter nye fænomener. Ved siden af ​​et omfattende forskningsprogram ofte inspireret af specifikke teoretiske modeller-lige fra kvante sorte huller til supersymmetri-anvender fysikere nye modeluafhængige metoder til at udvide deres søgninger. ATLAS har netop frigivet den første modeluafhængige søgning efter nye partikler ved hjælp af en ny teknik kaldet "svag overvågning."

Søgninger efter nye partikler starter typisk med en specifik teoretisk model. I betragtning af modellens fænomenologi og parametre, fysikere vil simulere, hvordan nye partikler ville blive produceret og henfalde i ATLAS -detektoren. De simulerer derefter standardmodelens baggrundsprocesser for at udvikle klassifikatorer (med eller uden maskinindlæring), der adskiller signaler fra baggrund. Disse klassifikatorer bestemmer den bedste fase-rum-region af de data, der skal undersøges, hvor et hypotetisk signal forventes at blive beriget. Endelig, fysikere vil sammenligne data og baggrundsforudsigelse på jagt efter anomalier.

ATLAS 'nye søgning anvender maskinlæringsklassifikatorer (neurale netværk) udviklet direkte på data for at reducere deres afhængighed af en bestemt model. Dette er en væsentlig afvigelse fra standardmetoderne, fordi dataene er umærkede:Det vides ikke, om en bestemt proton -proton -kollisionshændelse er baggrund eller signal. Denne metode-kendt som "svag overvågning"-udnytter strukturer i dataene uden at skulle bruge etiketter pr. Hændelse.

Sammen med denne metode, den nye ATLAS-søgning anvender en af ​​de mest traditionelle simuleringsuafhængige opdagelsesstrategier for anomali:"bumpjagten". Målet med en bumpjagt er at lede efter en lokaliseret "bump" oven på en glat baggrund. Sådanne bump er et generelt træk ved mange modeller af nye partikler, hvor bumpen sker ved massen af ​​den nye partikel. Den nye søgning bygger på dette stærke fundament for at øge følsomheden over for en lang række hypotetiske partikler uden at specificere deres egenskaber på forhånd.

Kombinationen af ​​bump jagt og svag overvågning resulterer i en analyse, der for det meste er fri for signal-model og baggrund-model afhængighed.

Figur 2:Det neurale netværksoutput i en dijet -massebakke. Som en todimensionel funktion, output kan let visualiseres som et billede, hvor intensiteten svarer til effektiviteten af ​​netværksoutputtet i dijet -massebakken. Det venstre plot har intet signal injiceret, og det højre plot viser output, når en hypotetisk partikel ved 3 TeV, der henfalder til to andre partikler ved 200 GeV, tilføjes til dataene. Kredit:ATLAS Collaboration/CERN

Opdage anomalier med svagt tilsyn

ATLAS -fysikere uddannede neurale netværk på data ved hjælp af en teknik kaldet "Klassificering uden etiketter" (CWoLa, udtales "Koala"). I denne tilgang, fysikere konstruerer to blandede datasæt sammensat af baggrund og potentielt også signal. Disse er identiske bortset fra de relative proportioner af det potentielle signal. Mens signal-vs-baggrund-etiketterne er ukendte for hver begivenhed, neurale netværk kan trænes til at skelne mellem de to datasæt. Med tilstrækkelige data og en stærk nok klassifikator, dette er faktisk optimalt til at skelne signal fra baggrund.

CWoLa -metoden kombineres med en bumpjagt, når de ovenstående blandede datasæt oprettes, som vist i figur 1. Signalhændelser ville være karakteriseret ved en lokaliseret resonansregion og et sidebåndsområde. Disse regioner ville have andre funktioner (y), der også kan bruges til at træne de neurale netværk. Hvis der ikke er noget signal, et neuralt netværk ville ikke lære noget, og hvis der er et signal, det kan lære at vælge det ud over baggrunden.

Den nye ATLAS-søgning er den første applikation af fuldt datadrevet maskindannelsesforbedret anomaliedetektering. Eftersøgningen undersøgte begivenheder med hadroniske sluttilstande, ved hjælp af den uforanderlige masse af par af partikel "jets" som resonansfunktionen og masserne af de enkelte jetfly som funktioner til at træne CWoLa -klassifikatoren. Ved hjælp af dette begrænsede sæt funktioner, fysikere har med succes etableret proceduren og har fundet ud af, at den allerede er følsom over for en lang række nye partikler.

Fysikere var i stand til at træne de neurale netværk, samtidig med at de undgik en statistisk forsøgsfaktor, som ville reducere følsomheden af ​​søgningen fra træning og testning af de samme data. Det neurale netværk (figur 2) er kortlagt til en effektivitet. For eksempel, 10% betyder, at 90% af begivenhederne har et netværksoutput, der er lavere end denne værdi. I mangel af signalet, netværket bør ikke lære noget (da de to blandede datasæt skal være ens), men der skal være et område med lav effektivitet ved design. Det rigtige plot i figur 2 viser, at netværket er i stand til at identificere det injicerede signal, selvom det ikke blev fortalt, hvor man skulle kigge på forhånd!

Figur 3:Særlige signaler simuleres og tilføjes derefter til dataene for at sætte grænser. De modeller, der er valgt her, repræsenterer en tung partikel A (med en masse på 3 TeV), der henfalder til to andre nye partikler B og C med masser skrevet på den vandrette akse. Den lodrette akse er grænsen - lavere tal angiver stærkere grænser. Den nye søgning sammenlignes med to eksisterende resultater fra ATLAS:den inklusive dijetsøgning (røde trekanter) og en dedikeret søgning efter jetfly produceret fra W og Z bosoner (gråt kryds). Kredit:ATLAS Collaboration/CERN

Giver ny præcision

Den nye søgning resulterede ikke i væsentlige beviser for nye partikler, og kvantificering af det, der ikke blev fundet, var dens egen udfordring. Som regel, fysikere kan simpelthen spørge, hvor meget signal der skal tilføjes for at registrere et betydeligt overskud, og derefter erklæres denne mængde signal ekskluderet, da der ikke blev observeret et overskud. For at opnå lignende undtagelser for denne analyse krævede, at alle neurale netværk genuddannedes for hver modelleret signaltype og signalmængde.

De resulterende grænser er vist i figur 3. At producere dette plot krævede uddannelse omkring 20, 000 neurale netværk! Nogle signaler var sværere for neurale netværk at finde end andre, med dem i regioner med meget baggrund, der viser sig at være særligt udfordrende. For andre signaler, de nye grænser er stærkere end tidligere grænser og forbedrer sig ved tidligere søgninger i et lignende faserum.

Ser til fremtiden

Denne nye tilgang fra ATLAS har mange muligheder for udvidelser. Den svagt overvågede bumpjagt kunne anvendes på yderligere begivenhedstopologier og flere funktioner kunne tilføjes for at udvide følsomheden over for nye partikler. Mere komplekse neurale netværk kan være nødvendige for at imødekomme højere dimensionelle funktionsrum, og dette vil kræve krævende beregningsressourcer. ATLAS-fysikere overvejer også en række alternative metoder til detektering af anomali, som muligvis kan supplere den CWoLa-baserede søgning. Det er sandsynligt, at ingen metode dækker alt - flere tilgange vil være nødvendige for at sikre bred, robust, og stærk følsomhed over for nye partikler.


Varme artikler