Kredit:CC0 Public Domain
Optiske illusioner, billeder, der bedrager det menneskelige øje, er et fascinerende forskningsemne, da studiet af dem kan give værdifuld indsigt i menneskelig erkendelse og perception. Forskere ved Flinders University, i Australien, har for nylig udført en meget interessant undersøgelse ved hjælp af en computervisionsmodel til at forudsige eksistensen af optiske illusioner og graden af deres virkning.
I løbet af det seneste årti, forskere har opnået en stadig mere detaljeret biologisk forståelse af, hvordan den menneskelige hjerne behandler visuelle stimuli. Mange eksisterende computervisionsmodeller henter inspiration fra vores nuværende forståelse af visuel behandling. Ikke desto mindre, nogle aspekter af visuel behandling er stadig dårligt forstået og meget omdiskuteret.
"Visuel behandling starter med fornemmelserne af de retinale receptive felter (RF'er) af det indkommende lys i øjnene, " forklarede forskerne i deres papir, som blev forudgivet på arXiv. "Retinale ganglieceller (RGC'er) er de retinale outputneuroner, der konverterer synaptisk input fra det indre plexiforme lag (IPL) og bærer det visuelle signal til hjernen. Mangfoldigheden af RGC-typer og størrelsesafhængigheden af hver specifik type til excentriciteten ( afstanden fra fovea) er fysiologiske beviser for multiskala-kodning af den visuelle scene i nethinden. lav-niveau beregningsmodeller af retinal vision er blevet foreslået baseret på den samtidige prøvetagning af den visuelle scene på flere skalaer."
Tidligere forskning har introduceret en model til at detektere illusoriske hældninger i Café Wall-illusionen, som opstår fra kontrasten mellem baggrunds- og tilt-signaler. I deres undersøgelse, forskerne ved Flinders University generaliserede denne tilgang, for at dække en bredere række af geometriske illusioner, samt mere komplekse flise-illusioner.
"Vi udforsker svaret af en simpel bioplausibel model af lavt syn på geometriske/fliser illusioner, reproducere den forkerte opfattelse af deres geometri, at vi rapporterede til Café-væggen og nogle flise-illusioner, " skrev forskerne i deres papir. "Modellen er indtil nu ikke blevet verificeret til at generalisere til disse andre illusioner, og det er det, vi viser i dette papir."
I deres undersøgelse, forskerne evaluerede en beregningsmæssig filtreringsmodel, der er designet til at modellere den laterale hæmning af retinale ganglieceller og deres reaktioner på forskellige geometriske illusioner. Ved at vedtage denne tilgang, forskerne håbede at opnå en bedre forståelse af disse illusioner, forudsige graden af deres effekt.
"Selvom den forkerte opfattelse af orientering i tilt-illusioner generelt kan foreslå fysiologiske forklaringer, der involverer orienteringsselektive celler i cortex, vores arbejde giver bevis for en teori om, at fremkomsten af tilt i disse mønstre initieres, før de når orienteringsselektive celler, som et resultat af kendt retinal/kortikal simpel cellekodningsmekanisme, " forklarede forskerne.
Samlet set, resultaterne indsamlet i denne undersøgelse tyder på, at forskelle i Gaussian (DoG), et filter, der registrerer kanter i billeder, på flere skalaer kunne hjælpe med at forklare den inducerede hældning i fliseillusioner og kunne også hjælpe med at afdække nogle af de illusoriske signaler, der opfattes, når man ser på geometriske illusioner. Ud over, forskerne var i stand til at koble bottom-up-processer til højere niveau perception og kognition, på en måde, der stemmer overens med David Marrs teori om syn og kantdetektion.
Nuværende computersynsmodeller til analyse af geometriske illusioner er ret komplekse, derfor kan de være sværere at anvende i forskningsstudier. Ifølge forskerne, fremtidige undersøgelser bør forsøge at udtænke mindre sofistikerede og mere biologisk plausible metoder til at opdage visuelle tegn.
"Vi mener, at yderligere udforskning af rollen af simple Gauss-lignende modeller i lavt niveau af retinal behandling, og Gaussiske kerner i tidlige fase DNN'er, og dens forudsigelse af tab af perceptuel illusion vil føre til mere nøjagtige computersynsteknikker og modeller og kan potentielt styre computersyn mod eller væk fra de funktioner, som mennesker opdager, " skrev forskerne. "Disse effekter kan, på tur, forventes at bidrage til modeller på højere niveau af dybde- og bevægelsesbehandling og generaliseret til computerforståelse af naturlige billeder."
© 2019 Science X Network
Sidste artikelHjerneinspireret kunstig intelligens i robotter
Næste artikelDronesyn standser flyvninger i Irelands Dublin Airport