Kredit:CC0 Public Domain
Kroniske tilstande som hjertesygdomme og diabetes har været stigende i årtier. De er nummer én årsag til død og handicap i USA i dag og en grund til, at sundhedsudgifterne er ude af kontrol.
Så det giver god mening at identificere personer med risiko for kroniske lidelser, før de bliver syge. I det mindste, Tidlig indsats kan ofte bremse sygdomstempoet og forbedre patienternes livskvalitet – og dermed potentielt spare milliarder af dollars i medicinske omkostninger.
Det er derfor, mange arbejdsgivere – omkring 50 %, ifølge en RAND-rapport – sponsorer incitamenterede wellness-programmer for deres medarbejdere. Sammen med fitnessrabatter, disse programmer inkluderer typisk en sundhedsrisikovurdering i form af laboratorietests, der bruges til at beregne hver persons risikofaktorer for almindelige sygdomme. De udsatte tilbydes derefter ekstra forebyggende pleje og tilsyn.
Desværre, de forventede fordele viser sig ikke altid, siger Mohsen Bayati, en lektor i operationer, Information, og teknologi på Stanford Graduate School of Business. Flere undersøgelser har fundet ud af, at sådanne programmer kan ende med at koste flere penge, end de sparer. En sandsynlig årsag, han siger, er, at risikovurderingerne i sig selv ikke er så nøjagtige.
"Hvis du fejlagtigt identificerer nogen som højrisiko - en såkaldt 'falsk positiv' - betaler du for unødvendige tjenester, "Bayati siger." Og hvis du savner nogen, der virkelig er i fare - et falskt negativt - så bliver du stadig ramt af de enorme lægeregninger i fremtiden. "
En løsning, han siger, ville være at køre et mere omfattende panel af tests. Men det ville også øge omkostningerne. "Laboratorietest er dyre. Virksomheder gør dette for mange ansatte, så de ser på et ret lille sæt standard biomarkører. Og så er detektionsevnen ikke særlig stærk."
I stedet, Bayati siger, nøglen til at få disse forebyggende programmer til at fungere er at forbedre udvælgelsen af biomarkører. Men hvordan gør du det? For at sige det mere stringent:Hvordan vælger du et minimalt sæt markører, der maksimerer den diagnostiske effekt over en række sygdomme?
Det er det puslespil Bayati tog fat på i en nylig avis, som han skrev sammen med to Stanford-kolleger:Sonia Bhaskar, Ph.d., en tidligere Stanford forskningsassistent, der nu arbejder som data scientist hos Netflix, og Andrea Montanari, en professor i statistik og elektroteknik. Ved at bruge noget teknisk jujitsu fra maskinlæringsområdet, de udviklede en metode, der kan bruges til enhver gruppe af målsygdomme eller programbudgetniveau.
Da de testede det på lægejournaler for omkring 75, 000 patienter, de fandt ud af, at det kunne forudsige en gruppe på ni alvorlige sygdomme med uventet nøjagtighed. "Vi blev overraskede, "Siger Bayati. Sammenlignet med en hypotetisk vurdering af Cadillac-care uden begrænsning på antallet af biomarkører, deres ville koste langt mindre, men har næsten det samme niveau af forudsigelseskraft.
Og måske er der en generel lektion her, i denne æra med Big Data. "Du må undre dig, Bayati funderer. "I enhver branche, virksomheder investerer ressourcer for at indsamle flere og flere data. Vi sætter sensorer på alt, bare fordi vi kan og ærligt, det er ikke alt nødvendigt eller nyttigt."
For meget information
Traditionelt set sundhedsrisikovurderinger er designet ved at finde de bedste markører for hver sygdom isoleret og tilføje dem til en liste. "Hospitaler bliver mere sofistikerede i, hvordan de identificerer biomarkører, med avanceret statistik og nu AI, " siger Bayati. "Men det hele foregår en sygdom ad gangen."
Du kan potentielt bygge et effektivt testpanel på denne måde, han siger, men det ville kræve alt for mange biomarkører. Så i praksis, der indgås kompromiser, og nøjagtigheden falder. I stedet, Bayati og hans kolleger tilføjede et andet trin til analysen:"Vi sagde, lad os starte med den komplette liste og derefter se, om vi kan forenkle den på en bedre måde for at minimere tabet af diagnostisk strøm. "
At gøre det, de trak på nogle teknikker fra højdimensionelle statistikker, der bruges i maskinlæring. "Det grundlæggende spørgsmål er, hvis du har for mange oplysninger, hvordan kan du indsnævre det til det mest nyttige mindre sæt af oplysninger? Hvordan reducerer du datasættets dimensioner?"
Matematikken er involveret, men grundlæggende, nøglen til at løse det "TMI"-problem er i fællesskab at optimere udvælgelsen af biomarkører. I stedet for at finde de bedste for hver sygdom separat, bestem først, hvor mange biomarkører du vil have - forskerne besluttede sig for 30 - og maksimer derefter forudsigelseskraften, over alle mulige kombinationer, for hele sæt af sygdomme på én gang.
Modellen virker, fordi mange biomarkører signalerer mere end én sygdom. Højt blodsukker, for eksempel, kan være tegn på diabetes, men også nyresygdom, lever sygdom, eller hjertesygdomme. Unormale niveauer af alkalisk fosfatase er forbundet med hjertesygdomme, lever sygdom, og kræft. "Hvis din udvælgelsesproces ikke tager højde for disse overlapninger, du smider information væk, "Siger Bayati.
Ingen grænse for mål
Kraften ved metoden Bayati og hans kolleger skitserer er, at den kan bruges til at forfølge flere mål på én gang. Hvad er mere vigtigt i sundhedsrisikovurderinger:nøjagtighed eller omkostninger? Begge, selvfølgelig. Vil vi forudsige Alzheimers eller arteriel sygdom? Ja.
"Der er ingen grænse for antallet af mål, " siger Bayati. "Du kunne nævne 20, 30, 100 mål, som du ønsker at optimere over. Og så kan du indsnævre de oplysninger, du skal indsamle – fordi på et tidspunkt, tilføjelse af mål kræver ikke yderligere data."
Hvis det hjælper med at opfylde løftet om virksomhedens wellness-programmer, det er en stor sag for sundhedsvæsenet. Men denne tilgang kan også bruges til at forbedre en række forretningsmæssige og offentlige handlinger. Hvad er afgørende, Bayati siger, er at være klar over målene. Computere kan analysere, men mennesker er nødt til at fortælle dem, hvad de skal optimere.
Og det er et skridt, han tænker, virksomheder forsvinder for ofte. "Nogle gange ser det ud til, at virksomheder bare skynder sig at akkumulere data og stiller spørgsmål senere. Men mere information er ikke nødvendigvis bedre. Det, der betyder noget, er at vide, hvad de skal se på. Vores papir er et skridt i den retning."