Videnskab
 science >> Videnskab >  >> Elektronik

Model forbedrer forudsigelse af dødelighedsrisiko hos ICU-patienter

MIT-forskere har udviklet en maskinlæringsmodel, der grupperer patienter i underpopulationer efter sundhedsstatus for bedre at forudsige en patients risiko for at dø under deres ophold på intensivafdelingen. Denne teknik udkonkurrerer "globale" dødelighedsforudsigelsesmodeller og afslører præstationsforskelle for disse modeller på tværs af specifikke patientunderpopulationer. Kredit:Massachusetts Institute of Technology

På intensivafdelinger, hvor patienter kommer ind med en bred vifte af helbredstilstande, triaging afhænger i høj grad af klinisk bedømmelse. ICU-personale udfører adskillige fysiologiske tests, såsom blodprøver og kontrol af vitale tegn, at afgøre, om patienter er i umiddelbar risiko for at dø, hvis de ikke behandles aggressivt.

Indtast:maskinlæring. Adskillige modeller er blevet udviklet i de senere år for at hjælpe med at forudsige patientdødelighed på intensivafdelingen, baseret på forskellige helbredsfaktorer under deres ophold. Disse modeller, imidlertid, har ydeevne ulemper. En almindelig type "global" model trænes på en enkelt stor patientpopulation. Disse kan i gennemsnit fungere godt, men dårligt på nogle patientsubpopulationer. På den anden side, en anden type model analyserer forskellige underpopulationer - f.eks. dem, der er grupperet efter lignende forhold, patientens alder, eller hospitalsafdelinger – men har ofte begrænsede data til træning og test.

I et papir, der for nylig blev præsenteret på konferencen Proceedings of Knowledge Discovery and Data Mining, MIT-forskere beskriver en maskinlæringsmodel, der fungerer som det bedste fra begge verdener:Den træner specifikt på patientunderpopulationer, men deler også data på tværs af alle underpopulationer for at få bedre forudsigelser. Derved, modellen kan bedre forudsige en patients risiko for dødelighed i løbet af deres første to dage på intensivafdelingen, sammenlignet med strengt globale og andre modeller.

Modellen knuser først fysiologiske data i elektroniske sundhedsjournaler for tidligere indlagte intensivpatienter, nogle, der var døde under deres ophold. Derved, den lærer høje forudsigelser for dødelighed, såsom lav puls, højt blodtryk, og forskellige laboratorietestresultater - høje glukoseniveauer og antal hvide blodlegemer, blandt andet - over de første par dage og opdeler patienterne i underpopulationer baseret på deres helbredstilstand. Givet en ny patient, modellen kan se på patientens fysiologiske data fra de første 24 timer og, ved at bruge det, det har lært gennem at analysere disse patientunderpopulationer, bedre vurdere sandsynligheden for, at den nye patient også dør i de følgende 48 timer.

I øvrigt, forskerne fandt ud af, at evaluering (afprøvning og validering) af modellen af ​​specifikke subpopulationer også fremhæver præstationsforskelle mellem globale modeller i forudsigelse af dødelighed på tværs af patientsubpopulationer. Dette er vigtig information til udvikling af modeller, der kan arbejde mere præcist med specifikke patienter.

"ICU'er har meget høj båndbredde, med mange patienter, " siger førsteforfatter Harini Suresh, en kandidatstuderende i Computer Science and Artificial Intelligence Laboratory (CSAIL). "Det er vigtigt at finde ud af i god tid, hvilke patienter der faktisk er i fare og har mere behov for øjeblikkelig opmærksomhed."

Medforfattere på papiret er CSAIL kandidatstuderende Jen Gong, og John Guttag, Dugald C. Jackson professor i elektroteknik.

Multitasking og patientunderpopulationer

En vigtig nyskabelse i arbejdet er, at under træning, modellen adskiller patienter i forskellige underpopulationer, som fanger aspekter af en patients overordnede sundhedstilstand og dødelighedsrisici. Det gør det ved at beregne en kombination af fysiologiske data, opdelt på timebasis. Fysiologiske data omfatter bl. for eksempel, niveauer af glukose, kalium, og nitrogen, samt puls, blod pH, iltmætning, og respirationsfrekvens. Forhøjelser i blodtryk og kaliumniveauer - et tegn på hjertesvigt - kan indikere sundhedsproblemer i forhold til andre underpopulationer.

Næste, modellen anvender en multitasking-metode til at lære at bygge prædiktive modeller. Når patienterne er opdelt i subpopulationer, forskelligt indstillede modeller er tildelt hver underpopulation. Hver variantmodel kan derefter mere præcist foretage forudsigelser for sin personlige gruppe af patienter. Denne tilgang giver også modellen mulighed for at dele data på tværs af alle underpopulationer, når den laver forudsigelser. Når man får en ny patient, det vil matche patientens fysiologiske data til alle underpopulationer, finde den bedste pasform, og så bedre estimere dødelighedsrisikoen derfra.

"Vi bruger alle patientdata og deler information på tværs af populationer, hvor det er relevant, " siger Suresh. "På denne måde, vi er i stand til at … ikke lide af problemer med dataknaphed, mens der tages højde for forskellene mellem de forskellige patientsubpopulationer."

"Patienter indlagt på intensivafdelingen er ofte forskellige i, hvorfor de er der, og hvordan deres helbredstilstand er. På grund af dette, de vil blive behandlet meget forskelligt, " Gong tilføjer. Kliniske beslutningstagningshjælpemidler "bør tage højde for heterogeniteten af ​​disse patientpopulationer ... og sikre, at der er nok data til præcise forudsigelser."

En nøgleindsigt fra denne metode, Gong siger, kom fra at bruge en multitasking-tilgang til også at evaluere en models ydeevne på specifikke underpopulationer. Globale modeller evalueres ofte i den samlede præstation, på tværs af hele patientpopulationer. Men forskernes eksperimenter viste, at disse modeller faktisk underpræsterer på subpopulationer. Den globale model, der blev testet i papiret, forudsagde overordnet set dødeligheden ret præcist, men faldt flere procentpoint i nøjagtighed, når de blev testet på individuelle underpopulationer.

Sådanne præstationsforskelle er vanskelige at måle uden at evaluere efter subpopulationer, Gong siger:"Vi ønsker at evaluere, hvor godt vores model klarer sig, ikke kun på en hel kohorte af patienter, men også når vi opdeler det for hver kohorte med forskellige medicinske karakteristika. Det kan hjælpe forskere i bedre forudsigende modeltræning og evaluering."

At få resultater

Forskerne testede deres model ved hjælp af data fra MIMIC Critical Care Database, som indeholder snesevis af data om heterogene patientpopulationer. Af omkring 32, 000 patienter i datasættet, mere end 2, 200 døde på hospitalet. De brugte 80 procent af datasættet til at træne, og 20 procent til at teste modellen.

Ved brug af data fra de første 24 timer, modellen grupperede patienterne i subpopulationer med vigtige kliniske forskelle. To delpopulationer, for eksempel, indeholdt patienter med forhøjet blodtryk i løbet af de første timer - men en faldt over tid, mens den anden beholdt højden hele dagen. Denne delpopulation havde den højeste dødelighed.

Ved at bruge disse underpopulationer, modellen forudsagde patienternes dødelighed over de følgende 48 timer med høj specificitet og sensitivitet, og forskellige andre målinger. Multitasking-modellen klarede sig markant bedre end en global model med flere procentpoint.

Næste, forskerne sigter mod at bruge flere data fra elektroniske sundhedsjournaler, såsom behandlinger, patienterne modtager. De håber også, i fremtiden, at træne modellen til at udtrække nøgleord fra digitaliserede kliniske notater og anden information.

Denne historie er genudgivet med tilladelse fra MIT News (web.mit.edu/newsoffice/), et populært websted, der dækker nyheder om MIT-forskning, innovation og undervisning.




Varme artikler