En vild gnu, også kendt som en gnu.
Opvarmning, ventilation, og klimaanlæg - kaldet HVAC-systemer - kan være en delikat balance. Der er mange faktorer at overveje, fra luftstrøm mellem rum til virkningen af menneskelig kropsvarme. I det seneste årti, forskere har henvendt sig til maskinlæring for at optimere disse systemer. Med smartere controllere, bygninger kan spare på energien uden at ofre komfort.
Der er i øjeblikket to hovedtilgange til problemet. I den første tilgang, controlleren bruger en detaljeret model af bygningen til at styre sine systemer. Imidlertid, modellen kræver en stor indsats at skabe. "En meget god model af en bygning er svær at lave, svært at vedligeholde, og skalerer ikke, " siger Mario Bergés, professor i civil- og miljøteknik. "Bygninger er ikke alle ens, så du skal lave en model for hver bygning."
Den anden tilgang involverer generering af enorme mængder data, som gør det muligt for controlleren at tilpasse sig forskellige bygningssystemer. I dette tilfælde, den største hindring er, hvor lang tid det tager. "Du ville have brug for omkring 40 års simuleringsdata til en relativt kompleks bygning, " siger Bergés. "I den virkelige verden, man kan ikke bare bruge 40 år på at finde ud af, hvordan man kontrollerer en bygning."
For at tackle disse udfordringer, Bergés arbejdede med ph.d. studerende Bingqing Chen og en Dell-samarbejdspartner. De udviklede en ny løsning, Gnu-RL, der inkorporerer det bedste fra begge tilgange.
Først, Gnu-RL fuldfører offline fortræning ved hjælp af historiske data. VVS-systemer har allerede kontrol, så Gnu-RL lærer at kopiere dem. På denne måde det undgår komplikationerne ved præcise modeller og store mængder data. "Den behøver kun historiske data, som vi allerede har mange af, " siger Chen.
Når fortræningen er afsluttet, Gnu-RL kan efterligne den tidligere controller pålideligt. Næste, det er lært at tilpasse sig og blive bedre. Bergés og Chen anvendte en nyligt udviklet differentierbar Model Predictive Control (MPC) politik. Denne politik belønner agenten for at maksimere belønningen og minimere omkostningerne, og midlet justerer i overensstemmelse hermed, indtil det opnår den optimale kontrol for HVAC-systemet. Denne metode kaldes forstærkende læring - hvilket er grunden til, at løsningen har RL i slutningen af sit navn.
Den første del af navnet, på den anden side, kommer fra en mere ukonventionel kilde. En gnu er en stor, mørk antilope fra Afrika. Disse dyr er utroligt præcociale, hvilket betyder, at de er født i en relativt fremskreden tilstand. "De kan løbe væk fra rovdyr inden for samme dag, som de er født, " siger Chen. "Og Gnu-RL kontrollerer rimeligt godt ved start." Denne lighed gjorde navnet til et naturligt valg.
Bergés og Chen støtter denne sammenligning med to tests. Den første test blev udført med en simulering af den intelligente arbejdsplads på toppen af Margaret Morrison. "Vi havde en forbedring på 40 år til fire uger med hensyn til træningstiden, " siger Bergés. "Og vi viste også omkring 6 % forbedring i energibesparelser uden at ofre komforten."
Bergés og Chen blev så opmuntret af simuleringsresultaterne, at de besluttede at anvende Gnu-RL i en virkelig verden. I tre uger, de lod Gnu-RL styre luftstrømmen i et mødelokale i Gates Center. Resultaterne af denne test var lige så lovende. "Det lærte at efterligne den eksisterende controller, " siger Bergés. "Så, ud over det, den lærte at forkøle rummet og give komfort, før folk ankom, hvilket er noget, den eksisterende controller ikke gjorde."
Imidlertid, mens deres arbejde er spændende, Bergés og Chen vil gerne anerkende arbejdet fra de forskere, der kom før dem. "Vores bidrag er en ansøgning, så vi bygger videre på andres arbejde, " siger Chen. Mest bemærkelsesværdigt, Gnu-RL vedtog den differentierbare MPC-politik udviklet af Brandon Amos og Zico Kolter. Denne politik gjorde det muligt for Gnu-RL at være både effektiv og fleksibel.
Bergés og Chen præsenterede deres papir om Gnu-RL på 6 th ACM International konference om systemer til energieffektive bygninger, byer, og Transport (BuildSys 2019). Konferencen fandt sted i New York City den 13. og 14. november.
Ser på fremtiden, Bergés og Chen mener, at der stadig er plads til, at Gnu-RL kan vokse. "Vi har kigget på relativt simple scenarier, " siger Bergés. "Der kan være komplikationer, når vi forsøger at kontrollere meget mere komplekse bygninger, så det er stadig et åbent spørgsmål. Men i det mindste peger vi det i en retning, der er ny, og som kan anspore en masse forskning til, hvordan man løser dette problem."