Videnskab
 science >> Videnskab >  >> Astronomi

Hvordan videnskabsmand anvendte anbefalingsalgoritmen til at forudse CMEs ankomsttider

Øverst:Fra venstre mod højre, snapshots af CME-begivenheden, der fandt sted den 16. august 2006 kl. 16 : 30 UT. Kredit:SOHO LASCO C2. Nederst:Fra venstre mod højre, snapshots af CME-begivenheden, der fandt sted den 7. april 1997 kl. 14 : 27 UT. Kredit:Rum:Videnskab og teknologi

Koronale masseudstødninger (CME'er) er eruptive solbegivenheder. De er ofte forbundet med soludbrud og filamenter. CME'er kan forårsage rumvejrhændelser såsom geomagnetiske storme, højenergielektronstorme, varm plasmainjektion, ionosfæriske storme og øget tæthed i den øvre atmosfære.

Store CME-begivenheder kan påvirke kommunikation, navigationssystemer, luftfartsaktiviteter og endda elnet. For at undgå potentiel skade og tab af aktiver er der behov for nøjagtigt at forudsige ankomsten af ​​CME'erne i to dele. Vil CME "ramme" eller "savne" jorden? Hvis forudsigelsen er "hit", så er det næste spørgsmål, hvad er den forventede ankomsttid for CME?

I en forskningsartikel for nylig offentliggjort i Space:Science &Technology , Yurong Shi fra National Space Science Center, Chinese Academy of Sciences, anvendte anbefalingsalgoritmen, som kunne bruges til at anbefale den lignende historiske CME-begivenhed for prognosemænd, til at forudse CME'ers ankomsttid og beviste, at anbefalingsalgoritme og logistisk regression kunne fungere sammen at give prognosemænd en mulighed for at forbedre forudsigelsesresultaterne.

Først blev data og metodologi udarbejdet. Forfatteren udvalgte prøver fra i alt 30.321 CME-begivenheder, som blev indsamlet fra SOHO/LASCO CME-kataloget fra 1996 til 2020. Oversampling blev brugt til at løse de ubalancerede data og har opnået 181 positive prøver (CME'er, der nåede jorden) og 3486 negative prøver (CME'er, der ikke nåede jorden).

Desuden samles 8 karakteristiske parametre ved valg af karakteristiske parametre, herunder vinkelbredde, central positionsvinkel (CPA), målepositionsvinkel (MPA), lineær hastighed, begyndelseshastighed, sluthastighed, hastigheden ved 20 solradier, masse. Et komplet og samlet dimensionsløst datasæt af de 8 karakteristiske parametre blev sat op og klar til at lette udviklingen af ​​forudsigelsesmodellen. For at søge efter den historiske begivenhed, der ligner mest den specificerede CME-begivenhed, anvender forfatterne desuden to distancer, der almindeligvis bruges i maskinlæring og computer kunstig intelligens:cosinusafstand og euklidisk distance, som begge viste sig at fungere godt under eksperimentet.

Bagefter blev eksperimentet, et kontrolleret forsøg, designet. Den første fase er datasampling. I alt 3.667 prøver inklusive 8 karakteristiske parametre er tilfældigt opdelt i to lige store undergrupper. Den ene (1.833 prøver) er til vægttræning, og den anden (1.834 prøver) er til den efterfølgende anbefalingstest. Under vægttræningsfasen brugte forfatteren 1.466 træningsprøver som træningssæt til at træne vægte efter både den logistiske regressionsprocedure og anbefalingsalgoritmen, mens resten var (367 prøver) valideringssættet.

Kort fortalt udføres i alt 6 eksperimenter for at træne vægte, og derfor opnås 6 sæt vægtkoefficienter med 4 fra den logistiske regressionsalgoritme og 2 fra anbefalingsalgoritmen. To logistiske regressionsrammer blev vedtaget til sammenligning. Den ene var logit-funktionen i det Python-baserede statsmodels-modul og refereret til som "sm.logit." Den anden, der også var Python-baseret, var LogisticRegression-klassifikatoren, der blev leveret i scikit-learn (sklearn) biblioteket og omtalt som "sk.LR."

Ved at sammenligne alle modeller klarede sm.logit-modellen sig bedst i både valideringssættet og testsættet. Det var hensigtsmæssigt at vælge vægtene af sm.logit som de optimale vægte i det efterfølgende trin i netop dette arbejde. Desuden kan det ses, at det var meget tidskrævende at bruge anbefalingsalgoritmerne til at træne vægten af ​​karakteristiske parametre, men det var lettere at opnå vægtene ved logistisk regression. Derfor var et nyt forsøg på at anvende vægtene opnået ved den logistiske regression på anbefalingsalgoritmen. Gennemførligheden af ​​en sådan operation blev testet i den sidste fase, anbefalingstestfasen.

Sammenfattende beregnede forfatteren først vægten af ​​de karakteristiske parametre for CME'er baseret på logistisk regression og indlæste dem derefter i anbefalingsalgoritmen for at give de mest lignende historiske begivenheder som reference for CME's effektivitetsprognose. Det kan konstateres, at i hver færdighedsscore var modellen, der anvendte vægtene af logistisk regression på anbefalingsalgoritmen, bedre end ved brug af anbefalingsalgoritmen alene, så denne hybridmodel var gennemførlig. En sådan behandling undgik at træne anbefalingsvægtene for at spare tid og computerressourcer.

På nuværende tidspunkt er det meget sjældent i litteraturen at anvende anbefalingsalgoritmen til forudsigelse af CME'er. Forfatteren beviste, at når først den logistiske regressionsmodel bekræfter effektiviteten for en CME, kan anbefalingsalgoritmen bruges til at anbefale lignende historiske begivenheder. At anbefale lignende historiske begivenheder som en levende reference for prognosefolk er en stor forbedring af prognosetjenesten i modsætning til den binære "ja" eller "nej" prognose, der kun leveres af den logistiske regressionsmodel. Rumvejrsprognosere kan muligvis gøre brug af denne metode til at udføre en sammenlignende analyse. + Udforsk yderligere

En ny tilgang til forudsigelse af softwarefejl ved hjælp af funktionsvalg




Varme artikler