Kredit:Massachusetts Institute of Technology
"Deep Learning" edb -systemer, baseret på kunstige neurale netværk, der efterligner den måde, hjernen lærer på fra en ophobning af eksempler, er blevet et varmt emne inden for datalogi. Ud over at muliggøre teknologier såsom ansigts- og stemmegenkendelsessoftware, disse systemer kunne skure store mængder medicinske data for at finde mønstre, der kunne være nyttige diagnostisk, eller scan kemiske formler for mulige nye lægemidler.
Men de beregninger, disse systemer skal udføre, er meget komplekse og krævende, selv for de mest kraftfulde computere.
Nu, et team af forskere på MIT og andre steder har udviklet en ny tilgang til sådanne beregninger, ved hjælp af lys i stedet for elektricitet, som de siger, kunne forbedre hastigheden og effektiviteten af visse dybe læringsberegninger betydeligt. Deres resultater vises i dag i journalen Natur fotonik i et papir af MIT postdoc Yichen Shen, kandidatstuderende Nicholas Harris, professorer Marin Soljacic og Dirk Englund, og otte andre.
Soljacic siger, at mange forskere gennem årene har fremsat påstande om optikbaserede computere, men at "folk dramatisk overlovede, og det gav bagslag. "Mens mange foreslåede anvendelser af sådanne fotoniske computere ikke viste sig at være praktiske, et lysbaseret neuralt-netværkssystem udviklet af dette team "kan være anvendeligt til deep-learning for nogle applikationer, " han siger.
Traditionelle computerarkitekturer er ikke særlig effektive, når det kommer til den slags beregninger, der er nødvendige for visse vigtige neurale netværksopgaver. Sådanne opgaver involverer typisk gentagne multiplikationer af matricer, som kan være meget beregningsintensiv i konventionelle CPU- eller GPU -chips.
Efter mange års forskning, MIT -teamet er kommet frem til en måde at udføre disse operationer optisk på i stedet. "Denne chip, når du har indstillet det, kan udføre matrixmultiplikation med, i princippet, nul energi, næsten øjeblikkeligt, "Soljacic siger." Vi har demonstreret de afgørende byggesten, men endnu ikke det fulde system. "
I analogi med Soljacic påpeger, at selv en almindelig brilleglas udfører en kompleks beregning (den såkaldte Fouriertransformation) på de lysbølger, der passerer igennem den. Den måde, hvorpå lysstråler udfører beregninger i de nye fotoniske chips, er langt mere generel, men har et lignende underliggende princip. Den nye tilgang bruger flere lysstråler rettet på en sådan måde, at deres bølger interagerer med hinanden, producerer interferensmønstre, der formidler resultatet af den påtænkte operation. Den resulterende enhed er noget, forskerne kalder en programmerbar nanofotonisk processor.
Resultatet, Shen siger, er, at de optiske chips, der bruger denne arkitektur, kunne, i princippet, udføre beregninger udført i typiske kunstige intelligens-algoritmer meget hurtigere og bruge mindre end en tusindedel så meget energi pr. operation som konventionelle elektroniske chips. "Den naturlige fordel ved at bruge lys til matrixmultiplikation spiller en stor rolle i hastigheden og strømbesparelserne, fordi tætte matrixmultiplikationer er den mest effektsultne og tidskrævende del i AI -algoritmer, ”siger han.
Den nye programmerbare nanofotoniske processor, som blev udviklet i Englund -laboratoriet af Harris og samarbejdspartnere, bruger en række bølgeledere, der er sammenkoblet på en måde, der kan ændres efter behov, programmering af det sæt bjælker til en bestemt beregning. "Du kan programmere i enhver matrixoperation, "Siger Harris. Processoren leder lys gennem en række koblede fotoniske bølgeledere. Teamets fulde forslag kræver sammenflettede lag af enheder, der anvender en operation kaldet en ikke -lineær aktiveringsfunktion, i analogi med neurons funktion i hjernen.
For at demonstrere konceptet, teamet indstillede den programmerbare nanofotoniske processor til at implementere et neuralt netværk, der genkender fire grundlæggende vokallyde. Selv med dette rudimentære system, de var i stand til at opnå et 77 procent nøjagtighedsniveau, sammenlignet med cirka 90 procent for konventionelle systemer. Der er "ingen væsentlige forhindringer" for at skalere systemet for større nøjagtighed, Siger Soljacic.
Englund tilføjer, at den programmerbare nanofotoniske processor også kunne have andre applikationer, herunder signalbehandling til dataoverførsel. "Højhastigheds analog signalbehandling er noget dette kunne klare" hurtigere end andre tilgange, der først konverterer signalet til digital form, da lys er et iboende analogt medium. "Denne tilgang kunne behandle direkte i det analoge domæne, " han siger.
Teamet siger, at det stadig vil kræve meget mere indsats og tid at gøre dette system nyttigt; imidlertid, når systemet er skaleret op og fungerer fuldt ud, det kan finde mange brugersager, f.eks. datacentre eller sikkerhedssystemer. Systemet kan også være en velsignelse for selvkørende biler eller droner, siger Harris, eller "når som helst du skal lave en masse beregninger, men du ikke har megen strøm eller tid."
Denne historie er genudgivet med tilladelse fra MIT News (web.mit.edu/newsoffice/), et populært websted, der dækker nyheder om MIT -forskning, innovation og undervisning.