Videnskab
 Science >> Videnskab >  >> Astronomi

Hvad kan AI lære om universet?

Illustration af en aktiv kvasar. Ny forskning viser, at AI kan identificere og klassificere dem. Kredit:ESO/M. Kornmesser

Kunstig intelligens og maskinlæring er blevet allestedsnærværende, med applikationer lige fra dataanalyse, cybersikkerhed, farmaceutisk udvikling, musikkomposition og kunstneriske gengivelser.



I de senere år er der også opstået store sprogmodeller (LLM'er), som tilføjer menneskelig interaktion og skrift til den lange liste af applikationer. Dette inkluderer ChatGPT, en LLM, der har haft en dyb indvirkning, siden den blev introduceret for mindre end to år siden. Denne applikation har udløst betydelig debat (og kontrovers) om AI's potentielle anvendelser og implikationer.

Astronomi har også haft stor gavn af, hvor maskinlæring bruges til at sortere gennem enorme mængder data for at lede efter tegn på planetariske transitter, korrigere for atmosfærisk interferens og finde mønstre i støjen. Ifølge et internationalt hold af astrofysikere kan dette kun være begyndelsen på, hvad AI kunne gøre for astronomi.

I en nylig undersøgelse finjusterede holdet en Generative Pre-trained Transformer (GPT) model ved hjælp af observationer af astronomiske objekter. I processen viste de med succes, at GPT-modeller effektivt kan hjælpe med videnskabelig forskning.

Undersøgelsen blev udført af International Center for Relativistic Astrophysics Network (ICRANet), et internationalt konsortium bestående af forskere fra International Center for Relativistic Astrophysics (ICRA), National Institute for Astrophysics (INAF), University of Science and Technology i Kina, det kinesiske videnskabsakademi Institut for højenergifysik (CAS-IHEP), University of Padova, Isfahan University of Technology og University of Ferrera.

Deres papir, "Can AI Understand Our Universe? Test of Fine-Tuning GPT by Astrophysical Data," blev for nylig sendt til arXiv preprint server.

Som nævnt er astronomer i vid udstrækning afhængige af maskinlæringsalgoritmer til at sortere gennem mængderne af data opnået af moderne teleskoper og instrumenter. Denne praksis begyndte for omkring et årti siden og er siden vokset med stormskridt til det punkt, hvor AI er blevet integreret i hele forskningsprocessen. Som ICRA-præsident og undersøgelsens hovedforfatter Yu Wang fortalte Universe Today via e-mail:

"Astronomi har altid været drevet af data, og astronomer er nogle af de første videnskabsmænd, der har adopteret og anvendt maskinlæring. Nu er maskinlæring blevet integreret i hele den astronomiske forskningsproces, lige fra fremstilling og kontrol af jordbaserede og rumbaserede teleskoper (f.eks. optimering af ydelsen af ​​adaptive optiksystemer, forbedring af initieringen af ​​specifikke handlinger (triggere) af satellitter under visse forhold osv.), til dataanalyse (f.eks. støjreduktion, dataimputation, klassificering, simulering osv.) , og etablering og validering af teoretiske modeller (f.eks. testning af modificeret tyngdekraft, begrænsning af tilstandsligningen for neutronstjerner osv.)."

Dataanalyse er fortsat den mest almindelige blandt disse applikationer, da det er det nemmeste område, hvor maskinlæring kan integreres. Traditionelt ville snesevis af forskere og hundredvis af borgerforskere analysere mængden af ​​data produceret af en observationskampagne.

Dette er dog ikke praktisk i en tid, hvor moderne teleskoper indsamler terabyte data dagligt. Dette inkluderer alle-sky-undersøgelser som Very Large Array Sky Survey (VLASS) og de mange faser udført af Sloan Digital Sky Survey (SDSS).

Til dato er LLM'er kun blevet anvendt sporadisk til astronomisk forskning, da de er en relativt ny skabelse. Men ifølge fortalere som Wang har det haft en enorm samfundsmæssig indvirkning og har et nedre grænsepotentiale svarende til en "industriel revolution."

Med hensyn til den øvre grænse forudsiger Wang, at det kan variere betydeligt og måske resultere i menneskehedens "oplysning eller ødelæggelse." Men i modsætning til den industrielle revolution er forandringstempoet og integrationen langt hurtigere for AI, hvilket rejser spørgsmål om, hvor langt dens indførelse vil gå.

For at bestemme dets potentiale for astronomiområdet, sagde Wang, adopterede han og hans kolleger en forudtrænet GPT-model og finjusterede den til at identificere astronomiske fænomener:

"OpenAI leverer forudtrænede modeller, og det, vi gjorde, var finjustering, som involverer at ændre nogle parametre baseret på den originale model, så den kan genkende astronomiske data og beregne resultater ud fra disse data. Det er lidt ligesom OpenAI giver os en bachelorstuderende, som vi derefter uddannede til at blive kandidatstuderende i astronomi.

"Vi leverede begrænsede data med beskeden opløsning og trænede GPT færre gange sammenlignet med normale modeller. Ikke desto mindre er resultaterne imponerende og opnåede en nøjagtighed på omkring 90%. Dette høje niveau af nøjagtighed kan tilskrives det robuste fundament af GPT, som forstår allerede databehandling og besidder logiske slutningsevner, såvel som kommunikationsevner."

For at finjustere deres model introducerede holdet observationer af forskellige astronomiske fænomener afledt af forskellige kataloger. Dette inkluderede 2.000 prøver af kvasarer, galakser, stjerner og bred absorptionslinje (BAL) kvasarer fra SDSS (500 hver). De integrerede også observationer af korte og lange gammastråleudbrud (GRB'er), galakser, stjerner og sorte hul-simuleringer. Da de blev testet, klassificerede deres model med succes forskellige fænomener, skelnede mellem typer af kvasarer, udledte deres afstand baseret på rødforskydning og målte sorte hullers spin og hældning.

"Dette arbejde viser i det mindste, at LLM'er er i stand til at behandle astronomiske data," sagde Wang. "Desuden er en models evne til at håndtere forskellige typer af astronomiske data en evne, som ikke besidder andre specialiserede modeller. Vi håber, at LLM'er kan integrere forskellige slags data og derefter identificere fælles underliggende principper for at hjælpe os med at forstå verden. Selvfølgelig , dette er en udfordrende opgave og ikke en, som astronomer kan klare alene."

Selvfølgelig anerkender holdet, at det datasæt, de eksperimenterede med, var meget lille sammenlignet med dataoutputtet fra moderne observatorier. Dette gælder især for næste generations faciliteter som Vera C. Rubin Observatory, som for nylig modtog sit LSST-kamera, det største digitale kamera i verden!

Når Rubin er operationel, vil den udføre den 10-årige Legacy Survey of Space and Time (LSST), som forventes at give 15 terabyte data pr. nat! At opfylde kravene til fremtidige kampagner, siger Wang, vil kræve forbedringer og samarbejde mellem observatorier og professionelle AI-virksomheder.

Ikke desto mindre er det en selvfølge, at der vil være flere LLM-ansøgninger til astronomi i den nærmeste fremtid. Dette er ikke kun en sandsynlig udvikling, men også en nødvendig udvikling i betragtning af de store mængder data, som astronomiske undersøgelser genererer i dag. Og da dette sandsynligvis vil stige eksponentielt i den nærmeste fremtid, vil kunstig intelligens sandsynligvis blive uundværlig for studieretningen.

Flere oplysninger: Yu Wang et al., Kan AI forstå vores univers? Test af finjustering af GPT ved astrofysiske data, arXiv (2024). DOI:10.48550/arxiv.2404.10019

Journaloplysninger: arXiv

Leveret af Universe Today