Forskere fra McKelvey School of Engineering har udviklet en beregningsmetode, der giver dem mulighed for ikke at afgøre, om et helt billedbillede er korrekt, men hvis et givet punkt på billedet er sandsynligt, baseret på de forudsætninger, der er indbygget i modellen. Her, et billede af en amyloidfibril før og efter anvendelse af metoden kendt som WIF. Kredit:Lew Lab
En ejendomsmægler sender en potentiel boligkøber et sløret fotografi af et hus taget på tværs af gaden. Huskøberen kan sammenligne det med den ægte vare - se på billedet, kig derefter på det rigtige hus - og se, at karnapet faktisk er to vinduer tæt sammen, blomsterne foran er plastik, og det der lignede en dør er faktisk et hul i væggen.
Hvad hvis du ikke ser på et billede af et hus, men noget meget lille - som et protein? Der er ingen måde at se det uden en specialiseret enhed, så der er ikke noget at bedømme billedet imod, ingen grundlæggende sandhed, 'som det hedder. Der er ikke meget at gøre, men stoler på, at billeddannelsesudstyret og computermodellen, der bruges til at oprette billeder, er nøjagtige.
Nu, imidlertid, forskning fra Matthew Lews laboratorium ved McKelvey School of Engineering ved Washington University i St. Louis har udviklet en beregningsmetode til at bestemme, hvor stor tillid en videnskabsmand skal have til deres målinger, på et givet tidspunkt, er præcise, givet modellen, der blev brugt til at producere dem.
Forskningen blev offentliggjort 11. december i Naturkommunikation .
"Grundlæggende dette er et retsmedicinsk værktøj til at fortælle dig, om noget er rigtigt eller ej, sagde Lew, adjunkt i Preston M. Green Department of Electrical &Systems Engineering. Det er ikke bare en måde at få et skarpere billede. "Dette er en helt ny måde at validere pålideligheden af hver detalje inden for et videnskabeligt billede.
"Det handler ikke om at levere bedre opløsning, "tilføjede han af beregningsmetoden, kaldet Wasserstein-induceret flux (WIF). "Det siger, 'Denne del af billedet kan være forkert eller forkert placeret.' "
Processen, der bruges af forskere til at "se" den meget små-enkeltmolekylær lokaliseringsmikroskopi (SMLM)-er afhængig af at fange enorme mængder information fra objektet, der skal afbildes. Disse oplysninger fortolkes derefter af en computermodel, der i sidste ende fjerner de fleste data, rekonstruere et tilsyneladende præcist billede - et sandt billede af en biologisk struktur, som et amyloidprotein eller en cellemembran.
Der er allerede et par metoder, der bruges til at bestemme, om et billede er, Generelt sagt, en god repræsentation af den ting, der bliver afbildet. Disse metoder, imidlertid, kan ikke afgøre, hvor sandsynligt det er, at et enkelt datapunkt i et billede er nøjagtigt.
Hesam Mazidi, en nyuddannet, der var ph.d. -studerende i Lews laboratorium til denne forskning, løst problemet.
"Vi ville se, om der var en måde, vi kunne gøre noget ved dette scenario uden sandhed, "sagde han." Hvis vi kunne bruge modellering og algoritmisk analyse til at kvantificere, om vores målinger er trofaste, eller præcis nok. "
Forskerne havde ikke sandhed - intet hus at sammenligne med ejendomsmæglerens billede - men de var ikke tomme hænder. De havde en række data, der normalt ignoreres. Mazidi udnyttede den enorme mængde information, der blev indsamlet af billeddannelsesenheden, der normalt bliver kasseret som støj. Fordelingen af støj er noget forskerne kan bruge som sand sandhed, fordi den er i overensstemmelse med bestemte fysiske love.
"Han var i stand til at sige, 'Jeg ved, hvordan billedets støj manifesterer sig, det er en grundlæggende fysisk lov, '"Sagde Lew om Mazidis indsigt.
Denne grafik illustrerer, hvordan WIF fjerner malplacerede datapunkter. Efter denoisering, grønne stykker "blad" fjernes fra frugtens røde krop. Kredit:Washington University i St. Louis
"Han gik tilbage til støjende, ufuldkommen domæne for den faktiske videnskabelige måling, "Sagde Lew. Alle datapunkter registreret af billeddannelsesenheden." Der er rigtige data der, som folk smider væk og ignorerer. "
I stedet for at ignorere det, Mazidi kiggede for at se, hvor godt modellen forudsagde støjen - givet det endelige billede og modellen, der skabte den.
At analysere så mange datapunkter ligner at køre billedbehandlingsenheden igen og igen, udføre flere testkørsler for at kalibrere det.
"Alle disse målinger giver os statistisk tillid, "Sagde Lew.
WIF giver dem mulighed for ikke at afgøre, om hele billedet er sandsynligt baseret på modellen, men, i betragtning af billedet, hvis et givet punkt på billedet er sandsynligt, baseret på de forudsætninger, der er indbygget i modellen.
Ultimativt, Mazidi udviklede en metode, der med stærk statistisk tillid kan sige, at et givet datapunkt i det endelige billede skal eller ikke bør være på et bestemt sted.
Det er som om algoritmen analyserede billedet af huset og - uden nogensinde at have set stedet - det rensede billedet, afslører hullet i væggen.
Til sidst, analysen giver et enkelt tal pr. datapunkt, mellem -1 og 1. Jo tættere på en, jo mere sikker en videnskabsmand kan være, at et punkt på et billede er, faktisk, repræsenterer nøjagtigt den ting, der skal afbildes.
Denne proces kan også hjælpe forskere med at forbedre deres modeller. "Hvis du kan kvantificere ydeevne, så kan du også forbedre din model ved at bruge scoren, "Sagde Mazidi. Uden adgang til sandheden, "det giver os mulighed for at evaluere ydeevnen under reelle eksperimentelle forhold snarere end en simulering."
De potentielle anvendelser til WIF er vidtgående. Lew sagde, at det næste trin er at bruge det til at validere maskinlæring, hvor partiske datasæt kan producere unøjagtige output.
Hvordan ville en forsker vide, i et sådant tilfælde, at deres data var forudindtaget? "Ved hjælp af denne model, du kunne teste data, der ikke har nogen sand sandhed, hvor du ikke ved, om det neurale netværk blev trænet med data, der ligner virkelige data.
"Der skal udvises forsigtighed i alle former for målinger, du foretager, "Sagde Lew." Nogle gange vil vi bare trykke på den store røde knap og se, hvad vi får, men vi skal huske, der sker meget, når du trykker på den knap. "