Martin Schrimpf. Kredit:Kris Brewer
Når vi åbner vores øjne om morgenen og optager dagens første scene, vi tænker ikke så meget over, at vores hjerne behandler objekterne inden for vores synsfelt med stor effektivitet, og at den kompenserer for mangel på information om vores omgivelser – alt sammen for at give os mulighed for at gå i vores daglige funktioner. Det glas vand, du efterlod på natbordet, da du gjorde klar til at gå i seng, er nu delvist blokeret fra din synslinje af dit vækkeur, alligevel ved du, at det er et glas.
Denne tilsyneladende enkle evne for mennesker til at genkende delvist okkluderede objekter – defineret i denne situation som effekten af, at et objekt i et 3-D-rum blokerer et andet objekt fra syne – har været et kompliceret problem for computersynssamfundet. Martin Schrimpf, en kandidatstuderende i DiCarlo-laboratoriet i Department of Brain and Cognitive Sciences ved MIT, forklarer, at maskiner er blevet mere og mere dygtige til at genkende hele genstande hurtigt og sikkert, men når noget dækker en del af den genstand fra visning, denne opgave bliver stadig sværere for modellerne at genkende artiklen nøjagtigt.
"For modeller fra computervision til at fungere i hverdagen, de skal være i stand til at fordøje okkluderede objekter lige så godt som hele - trods alt, når du ser dig omkring, de fleste objekter er delvist skjult bag et andet objekt, " siger Schrimpf, medforfatter til en artikel om emnet, der for nylig blev offentliggjort i Proceedings of the National Academy of Sciences ( PNAS ).
I den nye undersøgelse, han siger, "vi gravede i de underliggende beregninger i hjernen og brugte derefter vores resultater til at bygge beregningsmodeller. Ved at rekapitulere visuel behandling i den menneskelige hjerne, vi håber derfor også at forbedre modeller inden for computersyn."
Hvordan er vi som mennesker i stand til gentagne gange at udføre denne daglige opgave uden at lægge megen tanke og energi i denne handling, identificere hele scener hurtigt og præcist efter kun at have set stykker? Forskere i undersøgelsen startede med den menneskelige visuelle cortex som en model for, hvordan man forbedrer maskiners ydeevne i denne indstilling, siger Gabriel Kreiman, en tilknyttet MIT Center for Brains, Sind, og Maskiner. Kreinman er professor i oftalmologi ved Boston Children's Hospital og Harvard Medical School og var hovedefterforsker for undersøgelsen.
I deres papir, "Gentagende beregninger for færdiggørelse af visuel mønster, "holdet viste, hvordan de udviklede en beregningsmodel, inspireret af fysiologiske og anatomiske begrænsninger, der var i stand til at fange de adfærdsmæssige og neurofysiologiske observationer under mønsterafslutning. Til sidst, modellen gav nyttig indsigt til at forstå, hvordan man kan drage slutninger ud fra minimal information.
Denne historie er genudgivet med tilladelse fra MIT News (web.mit.edu/newsoffice/), et populært websted, der dækker nyheder om MIT-forskning, innovation og undervisning.