(a) Det generelle princip for Anticipated Learning Machine (ALM). Den observerede attraktor, en forsinkelsesattraktor og samplede ikke-forsinkelsesattraktorer er alle topologisk konjugerede med hinanden. Hver samplet ikke-forsinkelsesattraktor bevarer den dynamiske information om systemet på forskellige måder. Ved at integrere informationen indeholdt i disse samplede ikke-forsinkelsesattraktorer, vi kunne finde et nøjagtigt en-til-en kort selv under støjforringelse.(b) Forventet læremaskine. For hver fremtidig værdi, disse kort er co-trænet til et samlet kort Ψ. Når kortene er trænet, den vægtede sum bruges som forudsigelse. Den forudsagte værdi bruges derefter som etiketten, når du træner andre kort til at forudsige det næste tidspunkt. Klart, ALM Ψ transformerer det rumlige input X(tm) til det tidsmæssige output Z(tm) ved hvert punkt tm. Kredit:©Science China Press
At lave en nøjagtig forudsigelse baseret på observerede data, især fra kortsigtede tidsserier, er af stor bekymring inden for forskellige discipliner - fra molekylærbiologi, neurovidenskab, geovidenskab, og økonomi til atmosfæriske videnskaber - på grund af enten datatilgængelighed eller tidsvarierende ikke-stationaritet. Imidlertid, de fleste eksisterende metoder kræver tilstrækkeligt lange målinger af tidsserier eller et stort antal prøver, og der er ingen effektiv metode tilgængelig til forudsigelse med kortsigtede tidsserier på grund af mangel på information.
For at løse dette problem, Prof. Chen Luonan (Institutet for Biokemi og Cellebiologi, Chinese Academy of Sciences) med Dr. Chen Chuan (Sun Yat-sen University), Prof. Ma Huanfei (Soochow University) og Prof. Aihara Kazuyuki (University of Tokyo) foreslog en ny dynamik-baseret data-drevet metode, forventet læringsmaskine (ALM), for at opnå præcise forudsigelser om fremtidstilstand baseret på kortsigtede, men højdimensionelle data. ALM er et flerlags neuralt netværk, hvor højdimensionelle variable tages som inputneuroner (flere variable, men på et enkelt tidspunkt), men en målvariabel tages som outputneuroner (enkelt variabel, men på flere tidspunkter). På denne måde ALM er i stand til at transformere den seneste korrelation/rumlige information af højdimensionelle variabler til fremtidig dynamisk/temporel information for enhver målvariabel, dvs. ved rumlig-temporel informationstransformation (STI) ligninger.
Specifikt, ALM kan være godt trænet til at repræsentere det tilfældigt distribuerede indlejringskort (RDE) for STI-ligninger af et stort antal af de genererede træningsprøver med Dropout-skemaet og det foreslåede konsekvente træningsskema, dermed forudsige målvariablen på en nøjagtig og robust måde, selv fra kortsigtede data. Omfattende eksperimenter på kortsigtede højdimensionelle data fra både syntetiske og virkelige systemer viste betydeligt overlegne præstationer af ALM i forhold til eksisterende metoder.
Sammenlignet med traditionelle neurale netværk (eller andre maskinlæringsmetoder), som udgraver de historiske statistikker for det originale højdimensionelle system og dermed kræver et stort antal prøver, ALM rekonstruerer effektivt og robust sin dynamik selv med et lille antal prøver ved at begrænse til et lavdimensionelt rum, som faktisk er en iboende egenskab ved et sådant dissipativt system. Baseret på ikke-lineær dynamik for at transformere den rumlige information af de alle målte højdimensionelle variable til den tidsmæssige udvikling af målvariablen ved at lære STI-ligningerne, ALM åbner en ny vej for dynamikbaseret maskinlæring eller "intelligent" forventet læring.
"Hvordan man overvejer den stærke ikke-linearitet eller/og stokasticitet af de dynamiske systemer også med de observerede støjende data, og hvordan man kan lave mere dybdegående teoretisk analyse og videreudvikle en passende ramme, der tager disse spørgsmål i betragtning, forbliver et åbent og interessant problem i fremtiden, " oplyser forfatterne.