Videnskab
 science >> Videnskab >  >> Elektronik

Neuralt netværk assimilerer flere typer sundhedsdata for at hjælpe læger med at træffe beslutninger med ufuldstændige oplysninger

Ny forskning beskriver et enkelt neuralt netværk, der kan indsamle manglende data fra en patient og tilføje det til deres diagram. Kredit:MIT News

MIT-forskere har udviklet en model, der kan assimilere flere typer af en patients helbredsdata for at hjælpe læger med at træffe beslutninger med ufuldstændig information.

Feltet "forudsigende analyse" lover for mange sundhedsapplikationer. Maskinlæringsmodeller kan trænes i at lede efter mønstre i patientdata for at forudsige en patients risiko for sygdom eller dø på ICU, for at hjælpe med sepsisbehandling, eller for at designe sikrere kemoterapiregimer.

Processen indebærer at forudsige variabler af interesse, såsom sygdomsrisiko, fra kendte variable, såsom symptomer, biometriske data, laboratorieprøver, og kropsscanninger. Imidlertid, at patientdata kan komme fra flere forskellige kilder og ofte er ufuldstændige. For eksempel, det kan omfatte delvise oplysninger fra sundhedsundersøgelser om fysisk og psykisk velvære, blandet med meget komplekse data omfattende målinger af hjerte- eller hjernefunktion.

Brug af maskinlæring til at analysere alle tilgængelige data kan hjælpe læger med at diagnosticere og behandle patienter bedre. Men de fleste modeller kan ikke håndtere de meget komplekse data. Andre formår ikke at fange hele omfanget af relationerne mellem forskellige sundhedsvariabler, såsom hvordan vejrtrækningsmønstre hjælper med at forudsige søvntimer eller smerteniveauer.

I et papir, der præsenteres på AAAI-konferencen om kunstig intelligens i næste uge, MIT -forskere beskriver et enkelt neuralt netværk, der tager input som enkle og meget komplekse data. Ved at bruge de kendte variable, netværket kan så udfylde alle de manglende variabler. Givet data fra, sige, en patients elektrokardiografi (EKG) signal, som måler hjertefunktion, og selvrapporteret træthedsniveau, modellen kan forudsige en patients smerteniveau, som patienten måske ikke husker eller rapporterer korrekt.

Testet på et ægte søvnundersøgelsesdatasæt - som indeholdt sundhedsundersøgelser, og EKG og andre komplekse signaler - netværket opnåede 70 til 80 procent nøjagtighed ved at forudsige en af ​​de otte manglende variabler, baseret på de syv andre kendte variable.

Netværket fungerer ved at sy forskellige submodeller sammen, hver skræddersyet til at beskrive en specifik relation mellem variabler. Undermodellerne deler data, mens de laver forudsigelser, og i sidste ende udsende en forudsagt målvariabel. "Vi har et netværk af modeller, der kommunikerer med hinanden for at forudsige, hvad vi ikke ved, ved at bruge de oplysninger, vi kender fra disse forskellige typer data, "siger hovedforfatter Hao Wang, en postdoc ved MIT Computer Science and Artificial Intelligence Laboratory (CSAIL). "Hvis du har, sige, otte forskellige typer data, og jeg har fuld information om en patient fra syv, kommunikationen mellem modellerne vil hjælpe os med at udfylde de manglende huller i den ottende type data fra de andre syv typer."

Med Wang på avisen er Chengzhi Mao, en bachelorstuderende ved Tsinghua University; CSAIL Ph.D. studerende Hao He og Mingmin Zhao; Dina Katabi, Andrew og Erna Viterbi professor i elektroteknik og datalogi ved MIT og direktør for MIT Center for Wireless Networks and Mobile Computing; og Tommi S. Jaakkola, Thomas Siebel -professor ved Institut for Elektroteknik og Datalogi og Institut for Data, Systemer, og samfundet.

Tovejs forudsigelser

At bruge traditionelle maskinlæringsmodeller til at analysere antallet af variabler, forskernes netværk kan håndtere, er praktisk talt umuligt, fordi antallet af modeller skaleres eksponentielt med antallet af variable.

"Vi spurgte, 'Er det muligt at designe en enkelt model, der kan bruge alle disse grupper af data, på trods af, at vi i hver gruppe har forskellige oplysninger?'" siger Wang.

Den vigtigste innovation var at opdele netværket i individuelle undermodeller, der hver var skræddersyet til at passe til en anden type inputdata. Et neuralt netværk er et sammenkoblet netværk af noder, der arbejder sammen for at behandle komplekse data. Én node laver relativt simple beregninger, før outputtet sendes til den næste node. I netværk med undermodeller, imidlertid, hver node kan fungere som et separat netværk, der kan håndtere mere komplekse beregninger. Undermodeller kan være meget mere effektive, afhængig af applikationen.

I deres arbejde, forskerne skabte én probabilistisk undermodel for hver variabel output. De udviklede også en teknik til at lade undermodellerne kommunikere med hinanden, mens de laver forudsigelser, kaldet Bi-directional Inference Networks (BIN). Denne teknik udnytter en neural netværkstræningsteknik kendt som backpropagation. I træning, backpropagation sender computerfejl tilbage gennem noderne for at opdatere netværkets parameterværdier. Men denne teknik bruges aldrig i test, især når der er komplekse betingede afhængigheder involveret. I stedet, i traditionel test, indtastede data behandles fra node til node i en retning, indtil en sidste node i slutningen af ​​sekvensen udsender en forudsigelse.

Forskerne programmerede deres netværk til at bruge både den traditionelle metode og backpropagation under test. I denne sammenhæng, backpropagation tager dybest set en variabel output, derefter forudsige et input fra det output, og sende inputværdien tilbage til en tidligere node. Dette skaber et netværk, hvor alle submodeller arbejder sammen og er afhængige af hinanden, at udskrive en målsandsynlighed.

At udfylde de tomme felter

Forskerne uddannede deres netværk på det virkelige World Sleep Heart Health Study 2 (SHHS2) datasæt. Dataene omfatter elektroencefalografi (EEG) aflæsninger, som måler hjernens funktion; EKG; og vejrtrækningsmønstersignaler. Den indeholder også oplysninger fra en sundhedsundersøgelse til måling af otte sundhedsvariabler – herunder følelsesmæssigt velvære, social funktion, og energi/træthed – rangeret på en skala fra 0 til 100.

I træning, netværket lærer mønstre for, hvordan hver variabel kan påvirke en anden. For eksempel, hvis nogen holder vejret i lang tid, de kan være anspændte, hvilket kan indikere fysisk smerte. Ved testning, netværket er i stand til at analysere sammenhængene for at forudsige enhver af de otte variable, baseret på enhver anden information, med 70 til 80 procent nøjagtighed.

Netværket kunne hjælpe med at kvantificere til tider tvetydige sundhedsvariabler for patienter og læger, såsom smerter og træthedsniveauer. Når patienter sover efter operationen, for eksempel, de kan vågne midt om natten med smerter, men husker måske ikke et passende smerteniveau næste dag.

Næste, forskerne håber at implementere netværket som en softwarekomponent til en enhed, de har bygget, kaldet EQ Radio, som kan spore en persons vejrtrækning og hjertefrekvens kun ved hjælp af trådløse signaler. I øjeblikket, enheden analyserer disse oplysninger for at udlede, hvis nogen er glade, vred, eller trist. Med netværket, enheden potentielt kan foretage løbende opdaterede forudsigelser om en patients helbred, passivt, kun givet delvise oplysninger. "Dette kan være så nyttigt i faciliteter til handicappede, hvor læger kan overvåge både følelsesmæssige og fysiske dimensioner af en patients helbred hele dagen, hver dag, " siger Wang.

Denne historie er genudgivet med tilladelse fra MIT News (web.mit.edu/newsoffice/), et populært websted, der dækker nyheder om MIT-forskning, innovation og undervisning.