Videnskab
 science >> Videnskab >  >> Elektronik

Forskere lærer computere at se optiske illusioner

Brown University computersynseksperter lærer computere at se kontekstafhængige optiske illusioner, i håbet om at hjælpe kunstige synsalgoritmer med at tage højde for kontekst og være mere robuste. Kredit:Serre Lab/Brown University

Er den cirkel grøn eller grå? Er midterlinjerne lige eller skråtstillede?

Optiske illusioner kan være sjove at opleve og debattere, men at forstå, hvordan menneskelige hjerner opfatter disse forskellige fænomener, er fortsat et aktivt område af videnskabelig forskning. For en klasse af optiske illusioner, kaldet kontekstuelle fænomener, disse opfattelser er kendt for at afhænge af kontekst. For eksempel, den farve, du tror, ​​en central cirkel er, afhænger af farven på den omgivende ring. Nogle gange får den ydre farve den indre farve til at se mere ens ud, såsom en grøn naboring, der får en blå ring til at se turkis ud - men nogle gange får den ydre farve den indre farve til at se mindre ens ud, såsom en lyserød ring, der får en grå cirkel til at se grønlig ud.

Et hold af Brown University computervisionseksperter gik tilbage til udgangspunktet for at forstå de neurale mekanismer af disse kontekstuelle fænomener. Deres undersøgelse blev offentliggjort den 20. september i Psykologisk gennemgang .

"Der er voksende konsensus om, at optiske illusioner ikke er en fejl, men en funktion, sagde Thomas Serre, en lektor i kognitiv, lingvistiske og psykologiske videnskaber hos Brown og avisens seniorforfatter. "Jeg tror, ​​de er en funktion. De kan repræsentere kanttilfælde for vores visuelle system, men vores vision er så kraftfuld i det daglige liv og til at genkende genstande."

Til studiet, holdet ledet af Serre, der er tilknyttet Browns Carney Institute for Brain Science, startede med en beregningsmodel begrænset af anatomiske og neurofysiologiske data fra den visuelle cortex. Modellen havde til formål at fange, hvordan nabokortikale neuroner sender beskeder til hinanden og justerer hinandens reaktioner, når de præsenteres for komplekse stimuli såsom kontekstuelle optiske illusioner.

En innovation, som holdet inkluderede i deres model, var et specifikt mønster af hypotese-feedback-forbindelser mellem neuroner, sagde Serre. Disse feedbackforbindelser er i stand til at øge eller mindske – excitere eller hæmme – responsen fra en central neuron, afhængig af den visuelle kontekst.

Disse feedbackforbindelser er ikke til stede i de fleste deep learning-algoritmer. Deep learning er en kraftfuld form for kunstig intelligens, der er i stand til at lære komplekse mønstre i data, såsom genkendelse af billeder og parsing af normal tale, og afhænger af flere lag af kunstige neurale netværk, der arbejder sammen. Imidlertid, de fleste deep learning-algoritmer inkluderer kun feedforward-forbindelser mellem lag, ikke Serres innovative feedbackforbindelser mellem neuroner i et lag.

Da modellen var bygget, holdet præsenterede det en række kontekstafhængige illusioner. Forskerne "tunede" styrken af ​​de feedback excitatoriske eller hæmmende forbindelser, så modelneuroner reagerede på en måde, der stemmer overens med neurofysiologiske data fra primatens visuelle cortex.

Derefter testede de modellen på en række kontekstuelle illusioner og fandt igen ud af, at modellen opfattede illusionerne som mennesker.

For at teste, om de gjorde modellen unødvendigt kompleks, de skadede modellen - selektivt fjernede nogle af forbindelserne. Da modellen manglede nogle af forbindelserne, dataene matchede ikke de menneskelige opfattelsesdata så nøjagtigt.

"Vores model er den enkleste model, der er både nødvendig og tilstrækkelig til at forklare synsbarkens adfærd i forhold til kontekstuelle illusioner, "Serre sagde. "Dette var virkelig lærebog computerbaseret neurovidenskab arbejde - vi startede med en model til at forklare neurofysiologiske data og sluttede med forudsigelser for menneskelige psykofysiske data."

Ud over at give en samlende forklaring på, hvordan mennesker ser en klasse af optiske illusioner, Serre bygger videre på denne model med det mål at forbedre det kunstige syn.

State-of-the-art algoritmer for kunstigt syn, som dem, der bruges til at mærke ansigter eller genkende stopskilte, har svært ved at se sammenhæng, bemærkede han. Ved at inkludere horisontale forbindelser tunet af kontekstafhængige optiske illusioner, han håber at løse denne svaghed.

Måske vil visuelle deep learning-programmer, der tager højde for kontekst, være sværere at narre. Et bestemt klistermærke, når det sidder fast på et stopskilt, kan det narre et kunstigt synssystem til at tro, at det er et hastighedsbegrænsningsskilt på 65 mil i timen, hvilket er farligt, sagde Serre.


Varme artikler