MIT-forskere beskriver en maskinlæringsalgoritme, der kan registrere hjernescanninger og andre 3D-billeder mere end 1, 000 gange hurtigere ved hjælp af nye læringsteknikker. Kredit:Massachusetts Institute of Technology
Medicinsk billedregistrering er en almindelig teknik, der involverer overlejring af to billeder, såsom magnetisk resonansbilleddannelse (MRI) scanninger, at sammenligne og analysere anatomiske forskelle i detaljer. Hvis en patient har en hjernesvulst, for eksempel, læger kan overlappe en hjernescanning fra flere måneder siden til en nyere scanning for at analysere små ændringer i tumorens fremskridt.
Denne proces, imidlertid, kan ofte tage to timer eller mere, som traditionelle systemer omhyggeligt justerer hver af potentielt en million pixels i de kombinerede scanninger. I et par kommende konferencepapirer, MIT-forskere beskriver en maskinlæringsalgoritme, der kan registrere hjernescanninger og andre 3D-billeder mere end 1, 000 gange hurtigere ved hjælp af nye læringsteknikker.
Algoritmen fungerer ved at "lære", mens der registreres tusindvis af par billeder. Derved, det indhenter oplysninger om, hvordan man justerer billeder og estimerer nogle optimale justeringsparametre. Efter træning, det bruger disse parametre til at kortlægge alle pixels af et billede til et andet, alt på en gang. Dette reducerer registreringstiden til et minut eller to ved hjælp af en normal computer, eller mindre end et sekund ved hjælp af en GPU med tilsvarende nøjagtighed til state-of-the-art systemer.
"Opgaverne med at tilpasse en hjerne -MR bør ikke være så forskellige, når du justerer et par hjernemRI'er eller en anden, "siger medforfatter på begge papirer Guha Balakrishnan, en kandidatstuderende i MIT's datalogi og kunstig intelligenslaboratorium (CSAIL) og Institut for teknik og datalogi (EECS). "Der er oplysninger, du burde kunne overføre i, hvordan du foretager justeringen. Hvis du er i stand til at lære noget af tidligere billedregistrering, du kan udføre en ny opgave meget hurtigere og med samme nøjagtighed. "
Papirerne præsenteres på Conference on Computer Vision and Pattern Recognition (CVPR), afholdt i denne uge, og på Medical Image Computing and Computer Assisted Interventions Conference (MICCAI), afholdt i september. Medforfattere er:Adrian Dalca, en postdoc på Massachusetts General Hospital og CSAIL; Amy Zhao, en kandidatstuderende i CSAIL; Mert R. Sabuncu, en tidligere CSAIL postdoc og nu professor ved Cornell University; og John Guttag, Dugald C. Jackson professor i elektroteknik ved MIT.
Opbevaring af oplysninger
MR-scanninger er dybest set hundredvis af stablede 2-D-billeder, der danner massive 3D-billeder, kaldet "bind, "indeholdende en million eller flere 3D-pixels, kaldet "voxels". Derfor, Det er meget tidskrævende at justere alle voxler i det første bind med dem i det andet. I øvrigt, scanninger kan komme fra forskellige maskiner og have forskellige rumlige orienteringer, hvilket betyder, at matchende voxels er endnu mere beregningsmæssigt kompleks.
"Du har to forskellige billeder af to forskellige hjerner, læg dem oven på hinanden, og du begynder at vrikke med den ene, indtil den ene passer til den anden. Matematisk, denne optimeringsprocedure tager lang tid, "siger Dalca, seniorforfatter på CVPR -papiret og hovedforfatter på MICCAI -papiret.
Denne proces bliver særlig langsom, når man analyserer scanninger fra store populationer. Neuroforskere analyserer variationer i hjernestrukturer på tværs af hundredvis af patienter med en bestemt sygdom eller tilstand, for eksempel, kan muligvis tage hundredvis af timer.
Det er fordi disse algoritmer har en stor fejl:De lærer aldrig. Efter hver registrering, de afviser alle data vedrørende voxel -placering. "Grundlæggende, de starter forfra givet et nyt par billeder, "Siger Balakrishnan." Efter 100 registreringer, du burde have lært noget af justeringen. Det er det, vi udnytter. "
Forskernes algoritme, kaldet "VoxelMorph, "drives af et konvolutionelt neuralt netværk (CNN), en maskinlæringsmetode, der almindeligvis bruges til billedbehandling. Disse netværk består af mange noder, der behandler billede og anden information på tværs af flere lag af beregning.
I CVPR -papiret forskerne trænede deres algoritme på 7, 000 offentligt tilgængelige MR -hjernescanninger og derefter testet det på 250 yderligere scanninger.
Under træning, hjernescanninger blev fodret ind i algoritmen i par. Ved hjælp af et CNN og modificeret beregningslag kaldet en rumlig transformer, metoden fanger ligheder mellem voxels i den ene MR -scanning med voxels i den anden scan. Derved, algoritmen lærer oplysninger om grupper af voxler - såsom anatomiske former, der er fælles for begge scanninger - som den bruger til at beregne optimerede parametre, der kan anvendes på ethvert scanningspar.
Når der blev fodret med to nye scanninger, en simpel matematisk "funktion" bruger de optimerede parametre til hurtigt at beregne den nøjagtige justering af hver voxel i begge scanninger. Kort sagt, algoritmens CNN -komponent får alle nødvendige oplysninger under træning, så, under hver ny registrering, hele registreringen kan udføres ved hjælp af en, let beregningsbar funktionsvurdering.
Forskerne fandt ud af, at deres algoritme nøjagtigt kunne registrere alle deres 250 testhjernescanninger - dem, der blev registreret efter træningssættet - inden for to minutter ved hjælp af en traditionel central behandlingsenhed, og på under et sekund ved hjælp af en grafisk behandlingsenhed.
Vigtigere, algoritmen er "uden opsyn, "hvilket betyder, at det ikke kræver yderligere oplysninger ud over billeddata. Nogle registreringsalgoritmer inkorporerer CNN -modeller, men kræver en" grundlæggende sandhed, "hvilket betyder, at en anden traditionel algoritme først køres for at beregne nøjagtige registreringer. Forskernes algoritme bevarer sin nøjagtighed uden disse data.
MICCAI -papiret udvikler en raffineret VoxelMorph -algoritme, der "siger, hvor sikre vi er på hver registrering, "Siger Balakrishnan. Det garanterer også registreringen" glathed, "hvilket betyder, at det ikke producerer folder, huller, eller generelle forvrængninger i det sammensatte billede. Papiret præsenterer en matematisk model, der validerer algoritmens nøjagtighed ved hjælp af noget, der kaldes en terningsscore, en standardmetrik for at evaluere nøjagtigheden af overlappede billeder. På tværs af 17 hjerneområder, den raffinerede VoxelMorph-algoritme scorede samme nøjagtighed som en almindeligt anvendt state-of-the-art registreringsalgoritme, samtidig levere runtime og metodiske forbedringer.
Beyond brain scans
The speedy algorithm has a wide range of potential applications in addition to analyzing brain scans, the researchers say. MIT colleagues, for eksempel, are currently running the algorithm on lung images.
The algorithm could also pave the way for image registration during operations. Various scans of different qualities and speeds are currently used before or during some surgeries. But those images are not registered until after the operation. When resecting a brain tumor, for eksempel, surgeons sometimes scan a patient's brain before and after surgery to see if they've removed all the tumor. If any bit remains, they're back in the operating room.
With the new algorithm, Dalca says, surgeons could potentially register scans in near real-time, getting a much clearer picture on their progress. "Today, they can't really overlap the images during surgery, because it will take two hours, and the surgery is ongoing" he says. "However, if it only takes a second, you can imagine that it could be feasible."
Denne historie er genudgivet med tilladelse fra MIT News (web.mit.edu/newsoffice/), et populært websted, der dækker nyheder om MIT -forskning, innovation og undervisning.