Videnskab
 science >> Videnskab >  >> Elektronik

Ny computermodel automatisk, æstetisk beskærer fotos

Et originalt foto (til venstre); det samme foto beskåret af eksisterende teknologi, såsom softwaren i smartphones; og det samme foto beskåret af forskernes model for at indeholde den visuelt betydningsfulde del af billedet. Kredit:James Wang og Jia Li / Penn State

Computere kan nu automatisk beskære fotos for at fange den mest interessante del på en æstetisk tiltalende måde, tak til forskere ved Penn State.

"Når manuelt beskærer et billede, mennesker identificerer den mest interessante eller iøjnefaldende del af billedet-selvom det er uden for midten-og beskærer billedet for at indramme det, men eksisterende værktøjer beskærer fotos i midten af ​​billedet, uden overvejelse om, hvorvidt dette afsnit indeholder en visuelt vigtig del af billedet, "sagde Jia Li, professor i statistik, WHO, sammen med sin kollega James Wang, professor i informationsvidenskab og teknologi, modtog for nylig amerikansk patent nr. 10, 186, 040 for modellen. "Vi har løst dette problem ved at oprette en statistisk model, der hurtigt identificerer den visuelle betydning af hver segmenteret del af et foto og beskærer det samlede foto på en æstetisk tiltalende måde."

Ifølge forskerne, softwaren kan bruges i smartphones, på sociale medier og på internetbrowsere, hvor fotos traditionelt automatisk er blevet beskåret i midten, mangler ofte hovedemnet eller giver et æstetisk utilfredsstillende resultat.

Teamet modellerede den tid, et menneskeligt øje sandsynligvis vil blive hængende på et bestemt segment af et billede ved hjælp af en Markov -kæde, som er en statistisk model. Opmærksomheden på ethvert segment afhænger af dets individuelle attributter såsom farve, tekstur og lysstyrke, såvel som dets rumlige forhold til andre segmenter. Forskerne kodede alle disse forskellige typer information inden for parametrene i Markov -kæden. Den statistiske model rangerer derefter segmenterne, med den største betydning tildelt det segment, der holder øjet længst. Denne bestilling hjælper modellen med at bestemme den bedste placering til beskæring. Beslutningen tager også højde for den æstetiske kvalitet af det beskårne billede.

"Rumlig placering af segmenterne i et billede spiller en stor rolle i bestemmelsen af ​​betydning, "sagde Li." Modellen overvejer, hvordan segmenterne interagerer rumligt, uden at antage, at billedets geometriske centrum nødvendigvis er vigtigere. For eksempel, to segmenter med det samme udseende kan have temmelig forskellige betydningsresultater afhængigt af deres placering i forhold til resten af ​​billedet. "

Ifølge Li og Wang, modellen arbejder hurtigt med at beskære fotos og kræver meget lidt computerkraft.

"Vores kode tager omkring 50 millisekunder at behandle et billede på 400 x 300 pixels på en almindelig stationær computer eller bærbar computer, "sagde Wang." Som et resultat, vores metode er velegnet til enheder med begrænset hukommelse og computerkraft. "

Teamet håber at markedsføre sin metode til internetsøgemaskiner og mobiltelefonselskaber, blandt andre.

"Ved at beskære fotos på en mere æstetisk tiltalende måde, en række fotorelaterede applikationer kan forbedres, især når skærmstørrelsen er lille, såsom i telefoner, ure eller tablets, "sagde Wang." Desuden modellen kan hjælpe virksomheder med visuelle annoncer med at forbedre deres klikfrekvenser. "


Varme artikler