Videnskab
 science >> Videnskab >  >> Fysik

Maskinindlæringsteknik rekonstruerer billeder, der passerer gennem en multimode fiber

Kredit:CC0 Public Domain

Gennem innovativ brug af et neuralt netværk, der efterligner billedbehandling af den menneskelige hjerne, et forskerhold rapporterer nøjagtig rekonstruktion af billeder transmitteret over optiske fibre i afstande på op til en kilometer.

I Optical Society's journal for high-impact research, Optica , forskerne rapporterer, at de underviser i en type maskinlæringsalgoritme kendt som et dybt neuralt netværk til at genkende billeder af tal fra mønsteret af pletter, de skaber, når de overføres til den yderste ende af en fiber. Arbejdet kunne forbedre endoskopisk billeddannelse til medicinsk diagnose, øge mængden af ​​information, der overføres over fiberoptiske telekommunikationsnetværk, eller øge den optiske effekt, der leveres af fibre.

"Vi bruger moderne dybe neurale netværksarkitekturer til at hente inputbillederne fra fiberens krypterede output, "sagde Demetri Psaltis, Swiss Federal Institute of Technology, Lausanne, der ledede forskningen i samarbejde med kollega Christophe Moser. "Vi demonstrerer, at dette er muligt for fibre op til 1 kilometer lang," tilføjede han, kalder værket "en vigtig milepæl."

Dekryptering af sløret

Optiske fibre sender information med lys. Multimode-fibre har meget større informationskapacitet end single-mode fibre. Deres mange kanaler - kendt som rumlige tilstande, fordi de har forskellige rumlige former - kan transmittere forskellige informationsstrømme samtidigt.

Mens multimodefibre er velegnede til at transportere lysbaserede signaler, overførsel af billeder er problematisk. Lys fra billedet bevæger sig gennem alle kanalerne, og det, der kommer ud i den anden ende, er et mønster af pletter, som det menneskelige øje ikke kan afkode.

For at løse dette problem, Psaltis og hans team henvendte sig til et dybt neuralt netværk, en type maskinlæringsalgoritme, der fungerer meget som hjernen gør. Dybe neurale netværk kan give computere mulighed for at identificere objekter i fotografier og hjælpe med at forbedre talegenkendelsessystemer. Input behandles gennem flere lag kunstige neuroner, hver af dem udfører en lille beregning og sender resultatet videre til det næste lag. Maskinen lærer at identificere input ved at genkende de outputmønstre, der er forbundet med det.

"Hvis vi tænker på oprindelsen af ​​neurale netværk, som er vores helt egen hjerne, processen er enkel, "forklarer Eirini Kakkava, en doktorand, der arbejder på projektet. "Når en person stirrer på et objekt, neuroner i hjernen aktiveres, angiver genkendelse af et velkendt objekt. Vores hjerne kan dette, fordi den bliver trænet i hele vores liv med billeder eller signaler fra den samme kategori af objekter, som ændrer styrken af ​​forbindelserne mellem neuronerne. "At træne et kunstigt neuralt netværk, forskere følger i det væsentlige den samme proces, lære netværket at genkende bestemte billeder (i dette tilfælde håndskrevne cifre), indtil den er i stand til at genkende billeder i samme kategori som de træningsbilleder, den ikke har set før.

Læring efter tallene

For at træne deres system, forskerne vendte sig til en database indeholdende 20, 000 prøver af håndskrevne numre, 0 til 9. De valgte 16, 000, der skal bruges som træningsdata, og holdt til side 2, 000 til at validere uddannelsen og yderligere 2, 000 til test af det validerede system. De brugte en laser til at belyse hvert ciffer og sendte lysstrålen gennem en optisk fiber, der havde cirka 4, 500 kanaler, til et kamera i den yderste ende. En computer målte, hvordan intensiteten af ​​outputlyset varierede på tværs af det optagne billede, og de samlede en række eksempler for hvert ciffer.

Selvom de speckelmønstre, der blev indsamlet for hvert ciffer, lignede det menneskelige øje, det neurale netværk var i stand til at skelne forskelle og genkende intensitetsmønstre forbundet med hvert ciffer. Testning med de afsatte billeder viste, at algoritmen opnåede 97,6 procent nøjagtighed for billeder transmitteret gennem en 0,1 meter lang fiber og 90 procent nøjagtighed med en 1 kilometer fiberlængde.

En enklere metode

Navid Borhani, et forskerholdsmedlem, siger, at denne machine learning -tilgang er meget enklere end andre metoder til at rekonstruere billeder, der føres gennem optiske fibre, som kræver en holografisk måling af output. Det neurale netværk kunne også klare forvrængninger forårsaget af miljøforstyrrelser i fiberen, såsom temperatursvingninger eller bevægelser forårsaget af luftstrømme, der kan tilføre støj til billedet - en situation, der bliver værre med fiberlængden.

"Dyb neurale netværks bemærkelsesværdige evne til at hente information, der overføres via multimodefibre, forventes at gavne medicinske procedurer som endoskopi og kommunikationsapplikationer, "Sagde Psaltis. Telekommunikationssignaler skal ofte rejse gennem mange kilometer fiber og kan lide forvridninger, som denne metode kunne rette. Læger kunne bruge ultratynde fiberprober til at indsamle billeder af kanalerne og arterierne inde i menneskekroppen uden at skulle bruge komplekse holografiske optagere eller bekymre sig om bevægelse. "Lette bevægelser på grund af vejrtrækning eller cirkulation kan forvrænge de billeder, der transmitteres gennem en multimode fiber, "Sagde Psaltis. De dybe neurale netværk er en lovende løsning til at håndtere den støj.

Psaltis og hans team planlægger at prøve teknikken med biologiske prøver, for at se, om det fungerer så godt som at læse håndskrevne tal. De håber at gennemføre en række undersøgelser ved hjælp af forskellige kategorier af billeder for at undersøge mulighederne og grænserne for deres teknik.

Varme artikler