Kredit:International School of Advanced Studies (SISSA)
Information er indkodet i data. Dette gælder for de fleste aspekter af det moderne liv, men det gælder også i de fleste grene af nutidig fysik, og at udtrække nyttig og meningsfuld information fra meget store datasæt er en nøglemission for mange fysikere.
I statistisk mekanik, store datasæt er daglige forretninger. Et klassisk eksempel er partitionsfunktionen, et komplekst matematisk objekt, der beskriver fysiske systemer i ligevægt. Dette matematiske objekt kan ses som værende opbygget af mange punkter, hver beskriver en grad af frihed for et fysisk system - dvs. det mindste antal data, der kan beskrive alle dets egenskaber.
Et tværfagligt team af videnskabsmænd fra Abdus Salam Internationale Center for Teoretisk Fysik (ICTP) og Scuola Internazionale Superiore di Studi Avanzati (SISSA) viste, at en så massiv indsamling af data kan finkæmmes, at frembringe grundlæggende fysiske egenskaber ved et ukendt system.
Disse resultater blev fremhævet i et papir netop offentliggjort i Fysisk gennemgang X , introduktion af et nyt databaseret synspunkt på faseovergange. Holdet viste, at en generisk statistisk egenskab ved store datasæt, der beskriver en bred vifte af fysiske systemer i ligevægt, kendt som indre dimension, kan faktisk afsløre forekomsten af en faseovergang.
Forfatterne af papiret, koordineret af Marcello Dalmonte, en forsker i ICTP's sektion for kondenseret stof og statistisk fysik og SISSA-samarbejdspartner, kommer fra forskellige baggrunde. Tiago Mendes, en tidligere postdoc ved ICTP og nu ved Max Planck Institute for the Physics of Complex Systems, i Dresden, Tyskland, arbejder hovedsageligt i numeriske metoder anvendt til statistisk mekanik. Alex Rodriguez er kemiker, har tidligere arbejdet hos SISSA og nu hos ICTP, der arbejder med implementering af komplekse systemalgoritmer og udvikling af maskinlæringsmetoder. Xhek Turkeshi, en ph.d. studerende på SISSA, arbejder mest inden for statistisk fysik.
Forskerne fokuserede på en generisk statistisk egenskab ved datasættene, kaldet den indre dimension. Den enkleste måde at beskrive denne egenskab på er som det mindste antal variabler, der er nødvendige for at repræsentere et givet datasæt, uden tab af information. "Tage, for eksempel, alle mennesker rundt om i verden, " forklarer Rodriguez. "Det er et datasæt for sig selv. Nu, hvis du ønsker at specificere folks position rundt om i verden, i teorien, du ville have brug for koordinaterne for alle deres positioner i rummet, det er, tre data for hver person. Men da vi kan tilnærme Jorden som en todimensionel overflade, vi skal kun bruge to parametre, det er, breddegraden og længdegraden. Dette er, hvad den indre dimension er:Hvis datasættet var menneskeheden, ville den iboende dimension være 2, ikke 3."
I den mere teoretiske kontekst af statistiske systemer, papiret viser, at denne egenskab af iboende dimension kan afsløre kollektive egenskaber af partitionsfunktioner ved termiske faseovergange. Det betyder at, uanset hvilket system der er under overvejelse, dataene kan vise, om og hvornår systemet gennemgår en faseovergang. Holdet har udviklet en teoretisk ramme for at forklare, hvorfor generiske data udviser en sådan 'universel' adfærd, fælles for en bred vifte af forskellige faseovergange, fra smeltende is til ferromagneter.
"Værket introducerer et nyt syn på faseovergange ved at vise, hvordan den iboende dimension afslører korrespondentstrukturelle overgange i datarummet, " siger forskerne, "når isen smelter, dets datastruktur gør det også."
Det, der virkelig er nyt i dette arbejde, er, at rådata afspejler den fysiske adfærd af de systemer, der overvejes, og det er vigtigt for fysikere, da det giver dem mulighed for at analysere et system uden at kende den fysik, der ligger til grund for det. At se på dataene er nok til at se, om der sker en overgang i systemet eller ej, uden selv at vide, hvad det er for en overgang. "Vi kan sige, at denne metode er fuldstændig agnostisk, " siger Mendes. "Du behøver ikke på forhånd at kende alle systemets parametre; du arbejder bare med rådata og ser, hvad der kommer ud af dem."
Efter de interessante resultater opnået i denne undersøgelse, teamet planlægger at fortsætte med at arbejde sammen i samme retning, udvide deres analysefelt. De arbejder allerede på et andet papir, med fokus på de såkaldte 'kvantefaseovergange', det er, kvantesystemer, hvor faseovergange sker ved en temperatur lig nul og induceres af eksterne parametre, ligesom magnetfeltet.
Med hensyn til anvendelsen af disse resultater, mulighederne er mange - fra eksperimenter med computersimuleringer af kvantesystemer til mere fundamentale grene af fysikken, såsom kvantekromodynamik, som også kan have en indflydelse på kernefysikken. "En interessant anvendelsesmulighed er brugen af statistiske fysikteknikker til at forstå maskinlæring, " siger Rodriguez. "I denne form for forskning, der går fra kvanteberegning til studiet af neurale netværk for eksempel, faseovergange er meget ofte involveret, og vi kunne prøve at bruge vores metode til at tackle alle den slags forskellige problemer."