Videnskab
 science >> Videnskab >  >> Elektronik

Kommercielle cloud-tjenesteudbydere giver kunstig intelligens computing et løft

MIT-forskere træner et par generative modstridende netværk, eller GAN'er, at efterligne landet, hav, og skyteksturer set i satellitbilleder med det mål til sidst at visualisere den virkelige verdens havniveaustigning. Det er et af mange kunstig intelligens-forskningsprojekter, der er muliggjort af IBM og Google-donerede cloud-kreditter. Kredit:Brandon Leshchinskiy

Neurale netværk har givet forskere et stærkt værktøj til at se ind i fremtiden og komme med forudsigelser. Men en ulempe er deres umættelige behov for data og computerkraft ("compute") til at behandle al den information. På MIT, efterspørgslen efter compute skønnes at være fem gange større, end hvad instituttet kan tilbyde. For at hjælpe med at lette knasen, industrien er trådt ind. En supercomputer på 11,6 millioner dollars, der for nylig blev doneret af IBM, kommer online til efteråret, og i det forløbne år, både IBM og Google har givet cloud-kreditter til MIT Quest for Intelligence til distribution på tværs af campus. Fire projekter muliggjort af IBM og Google cloud donationer er fremhævet nedenfor.

Mindre, hurtigere, smartere neurale netværk

At genkende en kat på et billede, en deep learning-model skal muligvis se millioner af billeder, før dens kunstige neuroner "lærer" at identificere en kat. Processen er beregningsintensiv og medfører store miljøomkostninger, som ny forskning, der forsøger at måle kunstig intelligenss (AI's) CO2-fodaftryk, har fremhævet.

Men der kan være en mere effektiv måde. Ny MIT-forskning viser, at modeller kun er nødvendige for en brøkdel af størrelsen. "Når du træner et stort netværk, er der et lille netværk, der kunne have gjort alt, " siger Jonathan Frankle, en kandidatstuderende i MIT's Department of Electrical Engineering and Computer Science (EECS).

Med studiemedforfatter og EECS-professor Michael Carbin, Frankle vurderer, at et neuralt netværk kunne klare sig med en tiendedel af antallet af forbindelser, hvis det rigtige undernetværk findes i starten. Normalt, neurale netværk trimmes efter træningsprocessen, med irrelevante forbindelser fjernet derefter. Hvorfor ikke træne den lille model til at begynde med, undrede Frankle sig?

Eksperimenterer med et to-neuron netværk på sin bærbare computer, Frankle fik opmuntrende resultater og flyttede til større billeddatasæt som MNIST og CIFAR-10, at låne GPU'er, hvor han kunne. Endelig, gennem IBM Cloud, han sikrede sig nok computerkraft til at træne en rigtig ResNet-model. "Alt, hvad jeg havde gjort tidligere, var legetøjseksperimenter, " siger han. "Jeg var endelig i stand til at køre snesevis af forskellige indstillinger for at sikre, at jeg kunne fremsætte påstandene i vores papir."

Frankle talte fra Facebooks kontorer, hvor han arbejdede i sommer for at udforske ideer, der blev rejst af hans Lottery Ticket Hypothesis paper, en af ​​to udvalgte til en pris for bedste papir ved dette års internationale konference om læringsrepræsentationer. Potentielle anvendelser for værket går ud over billedklassificering, Frankle siger, og inkluderer forstærkende læring og naturlige sprogbehandlingsmodeller. Allerede, forskere hos Facebook AI Research, Princeton University, og Uber har offentliggjort opfølgende undersøgelser.

"Det, jeg elsker ved neurale netværk, er, at vi ikke engang har lagt grundlaget endnu, " siger Frankle, som for nylig skiftede fra at studere kryptografi og teknologipolitik til kunstig intelligens. "Vi forstår virkelig ikke, hvordan det lærer, hvor det er godt, og hvor det fejler. Dette er fysik 1, 000 år før Newton."

At skelne fakta fra falske nyheder

Netværksplatforme som Facebook og Twitter har gjort det nemmere end nogensinde før at finde kvalitetsnyheder. Men alt for ofte, rigtige nyheder overdøves af vildledende eller direkte falske oplysninger, der er lagt ud på nettet. Forvirring over en nylig video af den amerikanske hustaler, Nancy Pelosi, behandlet for at få hende til at lyde fuld, er blot det seneste eksempel på truslen om misinformation og falske nyheder mod demokratiet.

"Du kan lægge næsten alt op på internettet nu, og nogle mennesker vil tro det, " siger Moin Nadeem, senior og EECS-major ved MIT.

Hvis teknologien var med til at skabe problemet, det kan også hjælpe med at løse det. Det var Nadeems grund til at vælge et superUROP-projekt med fokus på at bygge et automatiseret system til at bekæmpe falske og vildledende nyheder. Arbejder i James Glass laboratorium, en forsker ved MIT's Computer Science and Artificial Intelligence Laboratory, og overvåget af Mitra Mohtarami, Nadeem hjalp med at træne en sprogmodel til at faktatjekke påstande ved at søge gennem Wikipedia og tre typer nyhedskilder vurderet af journalister som høj kvalitet, blandet kvalitet eller lav kvalitet.

Kredit:Massachusetts Institute of Technology

For at bekræfte et krav, modellen måler, hvor tæt kilderne er enige, med højere overensstemmelsesscore, hvilket indikerer, at påstanden sandsynligvis er sand. En høj uenighedsscore for en påstand som "ISIS infiltrerer USA, " er en stærk indikator for falske nyheder. En ulempe ved denne metode, han siger, er, at modellen ikke identificerer den uafhængige sandhed så meget som beskriver, hvad de fleste mennesker tror er sandt.

Med hjælp fra Google Cloud Platform, Nadeem kørte eksperimenter og byggede et interaktivt websted, der lader brugere øjeblikkeligt vurdere nøjagtigheden af ​​en påstand. Han og hans medforfattere præsenterede deres resultater på konferencen North American Association of Computational Linguistics (NAACL) i juni og fortsætter med at udvide arbejdet.

"Man plejede at sige, at det at se er at tro, " siger Nadeem, i denne video om hans arbejde. "Men vi går ind i en verden, hvor det ikke er sandt. Hvis folk ikke kan stole på deres øjne og ører, bliver det et spørgsmål om, hvad kan vi stole på?"

Visualisering af et opvarmende klima

Fra stigende hav til øget tørke, virkningerne af klimaændringer mærkes allerede. Et par årtier fra nu, verden bliver varmere, tørrere, og mere uforudsigeligt sted. Brandon Leshchinskiy, en kandidatstuderende i MIT's Department of Aeronautics and Astronautics (AeroAstro), eksperimenterer med generative kontradiktoriske netværk, eller GAN'er, at forestille sig, hvordan Jorden så vil se ud.

GAN'er producerer hyperrealistiske billeder ved at sætte et neuralt netværk op mod et andet. Det første netværk lærer den underliggende struktur af et sæt billeder og forsøger at gengive dem, mens den anden afgør, hvilke billeder der ser usandsynlige ud og beder det første netværk om at prøve igen.

Inspireret af forskere, der brugte GAN'er til at visualisere havniveaustigningsprojektioner fra gadebilleder, Leshchinskiy ønskede at se, om satellitbilleder på samme måde kunne personliggøre klimaprojektioner. Sammen med sin rådgiver, AeroAstro professor Dava Newman, Leshchinskiy bruger i øjeblikket gratis IBM Cloud-kreditter til at træne et par GAN'er på billeder af den østlige amerikanske kystlinje med deres tilsvarende højdepunkter. Målet er at visualisere, hvordan fremskrivninger af havniveaustigninger for 2050 vil omtegne kystlinjen. Hvis projektet virker, Leshinskiy håber at bruge andre NASA-datasæt til at forestille sig fremtidig havforsuring og ændringer i fytoplanktonoverflod.

"Vi er forbi punktet af afbødning, " siger han. "Visualisering af, hvordan verden vil se ud tre årtier fra nu, kan hjælpe os med at tilpasse os klimaændringer."

Identifikation af atleter ud fra nogle få bevægelser

Et par træk på banen eller banen er nok til, at en computervisionsmodel kan identificere individuelle atleter. Det viser foreløbige undersøgelser fra et hold ledet af Katherine Gallagher, en forsker ved MIT Quest for Intelligence.

Holdet trænede computersynsmodeller på videooptagelser af tenniskampe og fodbold- og basketballkampe og fandt ud af, at modellerne kunne genkende individuelle spillere i blot et par billeder fra nøglepunkter på deres krop, hvilket giver en grov oversigt over deres skelet.

Teamet brugte en Google Cloud API til at behandle videodataene, og sammenlignede deres modellers ydeevne med modeller trænet på Google Clouds AI-platform. "Denne positionsinformation er så karakteristisk, at vores modeller kan identificere spillere med nøjagtighed næsten lige så god som modeller forsynet med meget mere information, som hårfarve og tøj, " hun siger.

Deres resultater er relevante for automatiseret spilleridentifikation i sportsanalysesystemer, og de kunne danne grundlag for yderligere forskning i at udlede spillertræthed for at forudse, hvornår spillere skulle skiftes ud. Automatisk positionsdetektion kan også hjælpe atleter med at forfine deres teknik ved at give dem mulighed for at isolere de præcise bevægelser, der er forbundet med en golfspillers ekspertdrev eller en tennisspillers vindende sving.

Denne historie er genudgivet med tilladelse fra MIT News (web.mit.edu/newsoffice/), et populært websted, der dækker nyheder om MIT-forskning, innovation og undervisning.