Videnskab
 science >> Videnskab >  >> Andet

Ny metode til at identificere symmetrier i data ved hjælp af Bayesiansk statistik

Eksempler på farvede grafer, der angiver symmetrier af firedimensionelle data:Hjørner og kanter af samme farve og form i en graf er afbildet til hinanden ved en symmetripermutation, der bevarer datastrukturen. Kredit:Hideyuki Ishi, Osaka Metropolitan University

Et internationalt forskerhold ledet af forskere fra Osaka Metropolitan University har udviklet en metode til at identificere symmetrier i multi-dimensionelle data ved hjælp af Bayesianske statistiske teknikker.

Denne statistiske tilgang kræver komplekse beregninger af integraler, som ofte kun betragtes som tilnærmelser. I deres nye undersøgelse udledte forskerholdet med succes nye nøjagtige integralformler. Deres resultater bidrager til at forbedre nøjagtigheden af ​​metoder til at identificere datasymmetrier, hvilket muligvis udvider deres anvendelser til bredere interesseområder, såsom genetisk analyse.

Symmetrier i naturen gør tingene smukke; symmetrier i data gør datahåndteringen effektiv. Kompleksiteten i at identificere sådanne mønstre i data har dog altid forvirret forskere. Forskere fra Osaka Metropolitan University og deres kolleger har taget et stort skridt i retning af at detektere symmetrier i multi-dimensionelle data ved at bruge Bayesiansk statistik. Deres resultater blev offentliggjort i The Annals of Statistics .

Bayesiansk statistik har været i søgelyset i de senere år på grund af forbedringer i computerens ydeevne og dens potentielle anvendelser inden for kunstig intelligens. Bayesiansk statistik er en statistisk tilgang, der, selv når data er utilstrækkelige, udleder sandsynligheden for, at en hændelse indtræffer ved først at indstille en forudgående sandsynlighed og derefter, hver gang der opnås ny information, beregne en posterior sandsynlighed - en opdatering af den tidligere sandsynlighed - for at begivenhed vil forekomme. Beregningen af ​​posteriore sandsynligheder kræver komplekse beregninger af integraler og betragtes derfor ofte kun som en tilnærmelse.

Det internationale hold, herunder professor Hideyuki Ishi fra Osaka Metropolitan University, professor Piotr Graczyk fra University of Angers, professor Bartosz Kołodziejek fra Warszawa University of Technology, og den afdøde professor Hélène Massam fra York University (Toronto) er lykkedes med at udlede nye nøjagtige integralformler og ved at udvikle en metode til at søge efter symmetrier i multi-dimensionelle data ved hjælp af Bayesianske statistiske teknikker.

Når mængden af ​​data, der skal håndteres, stiger, skal det optimale mønster vælges blandt en lang række mønstre, hvilket gør det vanskeligt at løse problemet præcist. For at løse denne udfordring har teamet også udviklet en effektiv algoritme til at opnå en omtrentlig løsning selv i sådanne tilfælde.

Med professor Ishis ord:"Symmetrier i data er allestedsnærværende i en lang række modeller. Når først symmetrier er identificeret, kan antallet af parametre, der kræves for at vise strukturen af ​​dataene, og antallet af prøver, der kræves for at bestemme parametrene, blive væsentligt reduceret. I fremtiden forventes resultaterne af denne forskning at bidrage til genetisk analyse og opdage kromosomer, der har samme funktion forskellige steder." + Udforsk yderligere

Bayesiansk modelvalg viser ekstremt polariseret adfærd, når modellerne er forkerte




Varme artikler