Videnskab
 science >> Videnskab >  >> Natur

En ny metode til hurtigt at identificere udsving i overvågningsdata for luftkvalitet

PM2.5 -overvågningsinstrumenterne ved State Key Laboratory of Atmospheric Boundary Layer Physics and Atmospheric Chemistry (LAPC), Institut for Atmosfærisk Fysik, Kinesisk videnskabsakademi. Kredit:TANG Xiao

Overvågningsdata for luftkvalitet udgør den vigtigste kilde til offentlig bevidsthed om luftkvalitet, og er meget udbredt inden for mange forskningsområder, såsom forbedring af luftkvalitetsprognoser og analyse af disepisoder. Imidlertid, der er udsving blandt sådanne overvågningsdata, på grund af instrumentfejl, påvirkning af hårde miljøer, og begrænsning af målemetoder.

I praksis, manuel inspektion bruges ofte til at identificere disse afvigelser. Imidlertid, efterhånden som datamængden vokser hurtigt, denne metode bliver mere og mere besværlig.

For at håndtere problemet, Dr. Wu Huangjian og lektor Tang Xiao fra Institute of Atmospheric Physics, Det Kinesiske Videnskabsakademi, foreslå en fuldautomatisk outlier -detektionsmetode baseret på sandsynligheden for rester. Metoden anvender flere regressionsmetoder, og regressionsresterne bruges til at diskriminere outliers. Baseret på standardafvigelser for resterne, sandsynlighederne for resterne kan beregnes, og observationer med små sandsynligheder er mærket som ekstreme og fjernet af et computerprogram. Deres resultater offentliggøres i Fremskridt inden for atmosfæriske videnskaber .

"Ved at indføre sandsynlighederne for restprodukter, flere regler kan bruges til at identificere outliers på samme ramme, "siger Dr. Wu." F.eks. ved at antage, at resterne af rumlig regression og tidsmæssig regression adlyder en bivariat normalfordeling, rumlig og tidsmæssig konsistens kan evalueres på samme tid for bedre identifikation af outliers ".

Metoden kan markere potentielt fejlagtige data i timeobservationerne fra 1436 stationer i China National Environmental Monitoring Center (CNEMC) inden for et minut. Ja, det er blevet brugt i CNEMCs luftkvalitetsprognosesystem, og vil blive integreret i datastyringssystemet. Håbet er, at afvigelser i systemets data i realtid luftkvalitet vil blive fjernet i den nærmeste fremtid.

Metoden er offentliggjort i Fremskridt inden for Atmopheric Sciences .