Big data er et af de mest kraftfulde værktøjer, vi har i kampen mod sygdom. Jo flere data vi har i hånden, jo mere uddannede kan vi være i de sundhedsvalg vi træffer. Data kan give et landskab om et bestemt samfunds sundhed og lære os om patientfællesskaber, så vi kan estimere risikofaktorer. Det kan hjælpe os med at lære mere om sygdom og derfor finde en kur, eller lad os se, hvordan udbrud rejser for effektivt at indeholde dem.
Datavidenskab er et af de mest tværfaglige områder, der findes. Videnskabsfolk, læger, matematikere, computerprogrammerere og epidemiologer er blot nogle få af de erhverv, der er involveret i datavidenskab. Alle mennesker spiller en rolle i enten at indsamle data, analysere det, finde ud af, hvordan man bruger det eller handler på det.
Her er 10 måder, datavidenskab er blevet brugt med forskellige sygdomme og epidemier.
IndholdIkke alle kræftformer kan forebygges, men ville du ikke stoppe dem, der er? Screening for disposition og tidlig vækst findes for livmoderhalskræft, bryst, lunge, kræft i prostata og tyktarm. Men hvordan bestemmer læger retningslinjer for, hvem der skal screenes, hvor ofte og hvornår? Svaret ligger i big data.
U.S. Task Force for forebyggende service anvender store data af høj kvalitet fra store epidemiologiske undersøgelser til at fastlægge screeningsretningslinjer. For eksempel, fra at studere frekvensen af falsk-positive kræftdiagnoser hos kvinder i 40'erne, taskforcen fastslog, at det er unødvendigt at få mammografi før 50 år (medmindre der er en brystkræfthistorie i familien) [kilde:WebMD].
Træk så mange data som muligt fra kræftpatienter lærer også læger om, hvordan kræft vokser. Oregon Health and Science University gennemfører forsøg med gensekventering af tusinder af kræftpatienter for at lære mere om, hvordan kræftdannelse opstår hos forskellige mennesker, så de kan tilbyde hurtigere diagnoser. Universitetet forestiller sig endda at kunne diagnosticere kræft inden for 24 timer inden 2020, takket være det, de lærer [kilde:Oregon Health and Science University].
Myg har længe været spredere af sygdomme som malaria og denguefeber, så indsamling af oplysninger om de typer myg, der bærer disse sygdomme, og hvor de bor, kan hjælpe os i vores kamp mod disse forhold. Det nyere udbrud af den mygbårne virus Zika har vist os, hvor skræmmende det kan være at have mangel på data om, hvordan en sygdom spredes, og hvad den kan gøre for mennesker.
For at hjælpe med at bekæmpe disse myg-spredte sygdomme, forskere fra IBM, Johns Hopkins og University of California San Francisco har samarbejdet om at skabe open source -software, der gør det muligt for epidemiologer at lave forudsigelige sygdomsmodeller [kilde:Ungerleider]. Softwaren er designet, så epidemiologer med minimal kodningskendskab stadig kan bruge den til at køre dataanalyse, forudsige udbrudets bane og planlægge strategier til at begrænse sygdomsudbredelse.
Programmet anvender data fra Verdenssundhedsorganisationen, der viser en regions generelle følsomhed over for udbrud, populationsmodeller af både mennesker og myg, og klimadata, der identificerer potentielle udbrudslokationer. Taget sammen, disse data kan bremse spredningen af mygbårne vira.
Parkinsons sygdom, en neurologisk tilstand, der påvirker mere end 10 millioner mennesker verden over, giver et godt eksempel på, hvordan dataindsamling kombineret med teknologi kan gøre en forskel i sundhedsvæsenet [kilde:Parkinsons sygdomsstiftelse].
En person med Parkinsons har ofte meget alvorlige kropsrystelser. Disse er forårsaget, fordi hans eller hendes hjerne langsomt holder op med at producere en neurotransmitter kaldet dopamin. Jo mindre dopamin en person har, jo mindre er han i stand til at kontrollere sine bevægelser og følelser [kilde:National Parkinson Foundation].
Imidlertid, når han har synlige symptomer (som rysten) og får diagnosen Parkinsons, hele 80 procent af neuronerne i hans hjerne forbundet med dopamin er blevet ødelagt [kilde:Feber]. Selvom der i øjeblikket ikke er nogen kur mod Parkinson, der er behandlinger for at holde symptomerne under kontrol. Så, hvis læger kan opdage symptomer tidligere, så kan behandlingen starte hurtigere.
Til denne ende, flere virksomheder har undersøgt bærbar teknologi til at indsamle data om knap mærkbare rystelser, gangart og søvnkvalitet. Når dataene trækkes sammen, det kan give information til teknologibærerne om, hvorvidt de kan have en disposition for Parkinsons sygdom og hjælpe dem med at få behandling tidligt. Indsamling af denne enorme mængde data i en central hub giver også læger og forskere mulighed for at søge efter fælles tråde hos Parkinsons patienter, måske en dag, der fører til en kur.
Fra 2014-2015, et massivt udbrud af ebola opstod, mest i Vestafrika. Mere end 11, 000 mennesker døde af denne sygdom alene i regionen [kilde:Centers for Disease Control and Prevention (CDC)]. Med udbruddet af virussen i nogle af de fattigste lande i verden, det var svært at få medicinske oplysninger til borgerne, og der var lidt infrastruktur til at bekæmpe sygdommen. En stor bekymring i den globale kamp mod Ebola var at forstå, hvor virussen spredte sig for at bestemme de områder med de mest presserende behov for bistand. Og det er her, datavidenskab trådte til.
Ved hjælp af kortlægningssoftware i realtid, forskere og folkesundhedsarbejdere kan spore sygdommen i hele Afrika og forudsige de mest sårbare områder, der kan bukke under for et udbrud i fremtiden. Sammenlægning af datapunkter om flagermusarternes placering (den sandsynlige bærer af Ebola -viruset), befolkningstæthed, rejsetid fra den nærmeste større bosættelse, og en håndfuld andre faktorer, forskere kan komme foran sygdommen.
Kortlægningsværktøjet blev rullet ud på et værksted i februar 2016. "Jeg kan let gå gennem kortene og se specifikt distrikterne i Ghana, hvor ebolavirusens niche er, hvor er der sandsynligvis et udbrud, og derfra kan vi lave dyreovervågning, "sagde deltager Dr. Richard Suu-Ire, leder af dyrelivsdyrlægeenheden i Ghana, der er ansvarlig for at indsamle flagermusprøver til Ebola -overvågning i sit land [kilde:Fortunati].
En af de mest effektive måder, hvorpå data kan bruges i medicin, er at beregne risiko. Når der er indsamlet og analyseret nok datapunkter, læger og folkesundhedsarbejdere kan ikke kun afgøre, hvilke faktorer der kan spille en rolle i en sygdom, men også udløserpunktet, hvor nogen kan have stor risiko for at få det.
Hjertesygdomme er et glimrende eksempel på dette. Det er dødsårsag nr. 1 i USA, kan henføres til en ud af fire dødsfald [kilde:CDC]. Tidligere har læger bruges til at beregne risikoen for hjertesygdomme primært ved hjælp af kolesterolværdier. Hvis kolesterolet var højt, patienter blev ordineret medicin; hvis lav, de blev anset for ikke at være i fare.
Imidlertid, ved hjælp af en samling af data indsamlet fra flere kilder, American College of Cardiology og American Heart Association fandt fællestræk ved hjertesygdomspatienter, der strakte sig langt ud over blot at have højt kolesteroltal. Med massive datasæt om vægt, race, alder, historie, kolesterol og et par andre faktorer, grupperne har genereret en test, der fungerer som en meget mere omfattende og personlig risikoregner, kaldet ASCVD Risk Estimator [kilde:Gaglioti]. Som resultat, læger har ændret den måde, de praktiserer og beregner risiko for hjertesygdomme.
Stofmisbrug kan hærge samfund, ligesom mange sygdomme gør. Antallet af dødsfald som følge af overdosering i USA er svimlende - over 47, 000 alene i 2014 [kilde:American Society of Addiction Medicine]. Faktisk, overdosering af medicin er den største årsag til utilsigtet død i USA, og opioidafhængighed driver størstedelen af dødsfaldene.
Sporing af dødelighedsdata i forskellige samfund kan give sundhedsudbydere, regeringer og samfundsaktivister en solid fornemmelse af, hvordan narkotika kan påvirke en bestemt region. Baseret på disse data, de kunne vide, hvor især dødelige stammer af stoffer kan infiltrere byer og bruge regeringens handlinger til at stoppe spredningen. At finde ud af mere om, hvor folk dør af overdoser, kan ane regeringer for, hvilke samfund der har brug for interventioner, såsom rehabiliteringstjenester eller læger til at levere strategier til reduktion af skader.
Denne type strategi har hjulpet mange landdistrikter til at handle mod opioidepidemien, fører til meget positive resultater. Flere landdistrikter i USA har fulgt de rehabiliteringsstrategier, Gloucester har fremlagt, Massachusetts Police Department, der, på bare et år, førte til, at mere end 400 patienter blev henvist til behandling og omkostninger ved fængsling natten over faldt 75 procent. For eksempel, alle med en afhængighed kan gå ind i politiafdelingen, og personale til rådighed vil hjælpe med at få dem ind i et behandlingsprogram [kilde:Toliver].
Endelig, at have narkotikarelaterede dødelighedsdata i hånden har fået Centers for Disease Control and Prevention til at komme med retningslinjer for læger om opioidreceptpraksis [kilde:Gaglioti]. Ikke alene hjælper dataene med at bekæmpe epidemien, men det kommer også til roden af problemet og kan stoppe stofmisbrug, før det tager fat.
Nogle gange behøver dataene ikke at være "store" for at have stor indflydelse på bekæmpelse af sygdomme. En mindre, fokuseret sæt af data kan være øjenåbnende om et fællesskabs sundhed. Flint, Michigan, vandkrise er et perfekt eksempel.
En undersøgelse foretaget af en civilingeniør viste, at vandprøver fra Flint -hjem indeholdt store mængder bly; imidlertid, beviserne, han fandt frem til, var ikke nok til at overbevise regeringens ledere om, at vandet var forurenet. Efter at have hørt om ingeniørstudiet, en børnelæge i byen besluttede at samle sit eget datasæt.
Dr. Mona Hanna-Attisha indsamlede oplysninger fra hospitalsjournaler og fandt ekstraordinært høje blyniveauer i blodet hos børnepasienter. I stedet for at vente på at få sine resultater offentliggjort i et medicinsk tidsskrift, hun holdt et pressemøde, og byens embedsmænd blev tvunget til at lytte.
Blyforgiftning kan have langsigtede virkninger på et barns hjerneudvikling og adfærd, og i Flint, næsten 27, 000 børn blev udsat for bly i byens vand [kilde:D'Angelo]. Uden datasættet, der beviste, at der var noget galt, tusinder flere børn kunne have taget skade.
Puljer af big data er gode steder at fiske efter mønstre. Forskere og læger vil undertiden deltage i langsigtede undersøgelser af bestemte grupper af mennesker for at lære, om der er nogen ligheder i, hvordan deres helbred skrider frem. For eksempel, folkesundhedspersonale er i øjeblikket engageret i en undersøgelse af 9/11 første respondenter for at lære de langsigtede virkninger af deres eksponering ved Ground Zero. At være i stand til at tilskrive sjældne kræftformer og luftvejssygdomme, de kan udvikle, til denne eksponeringsvåbenlæger og regeringen med mere information om, hvordan man opretter pleje- og støttesystemer.
En af de mest effektive kohortstudier er Women's Health Initiative (WHI). Lanceret i 1993, dette langsigtede kliniske forsøg indsamlede data om 161, 000 postmenopausale kvinder til at lære strategier til forebyggelse af hjertesygdomme, bryst- og kolorektal kræft, og osteoporotiske brud [kilde:WHI].
De mønstre, forskerne bemærkede hos disse kvinder, har ændret den måde sundhedsudbydere forebygger og behandler disse sygdomme, medfører et stort investeringsafkast. Forskere anvendte en sygdomsimuleringsmodel over et niårigt interval (2003-2012) for at sammenligne forskellene i kvinders sundhed baseret på resultaterne fra WHI-forsøgene.
Modellen viste, at ved at følge retningslinjerne fra WHI, der var 76, 000 færre tilfælde af hjerte -kar -sygdomme, 126, 000 færre brystkræft -tilfælde og 4,3 millioner færre brugere af kombineret hormonbehandling. Yderligere, sygdomsmodelsimuleringen viste, at ved at anvende resultaterne fra WHI i løbet af den ni-årige strækning, Amerikanerne sparede anslået 35,2 milliarder dollar i direkte omkostninger til sundhedspleje [kilde:National Institutes of Health].
På trods af presset hvert år for at tilskynde folk til at blive vaccineret mod influenza, denne meget smitsomme luftvejssygdom formår stadig at ramme millioner af mennesker i USA hvert år og dræbe tusinder af dem, der bliver syge [kilde:CDC].
En person med influenza kan inficere andre en dag før symptomerne er til stede, og op til syv dage efter, at hun er blevet syg, så at vide, hvor og hvornår influenza rammer sit højdepunkt i et land, er virkelig værdifuld [kilde:CDC].
Webstedet FluNearYou.org giver amerikanerne mulighed for at lægge symptomer, de har, i ugentlige sundhedsrapporter. Tusinder af personer sender deres rapporter til webstedet, og forskere kortlægger de crowdsourcerede data for at finde ud af, hvilke symptomer der er til stede, og på hvilke steder i hele landet.
Datavidenskab, imidlertid, er ikke altid perfekt. Google dykkede ind i en verden af influenza forudsigelser med deres Google influenza trends (GFT). Baseret på folks søgninger efter symptomer, de hævdede, at de kunne indsamle nok data til at give nøjagtige skøn over forekomst af influenza op til to uger tidligere end CDC [kilde:Lazer]. Desværre, GFT undlod at forudsige en stor influenza -top i 2013 (algoritmen indeholdt for mange sæsonbetonede søgeudtryk, der ikke var relateret til influenza). Mens GFT mislykkedes, konceptet med crowdsourcing af data til at forudsige sygdomme er en, der ofte fungerer ganske godt.
Indsamling af data til et centralt knudepunkt er ikke den eneste måde, vi kan bruge crowdsourcing til at hjælpe sygdomme. Crowdsourcing af computere til at behandle oplysningerne er lige så vigtigt.
World Community Grid er en indsats i spidsen for IBM, der beder folk om at donere deres computere til at bekæmpe sygdomme. Når din enhed er inaktiv, det kan foretage forskningsberegninger for forskere, så resultater, der ville have taget årtier, kan fås i måneder. Crowdsourced computere har kørt simuleringer af mobilfunktioner for at forstå sygdomme som tuberkulose; screenet millioner af kemiske forbindelser mod de målproteiner, som Zika sandsynligvis bruger til at trives i menneskelige kroppe og identificerede genetiske markører for at hjælpe med at forudsige kræft.
Mere end 700, 000 frivillige har allerede logget på for at hjælpe med disse forskellige projekter [kilde:World Community Grid]. Med den mængde ledig tid, vores kollektive enheder kunne tilbyde disse årsager, dette er en måde, hvorpå big data kan gøre en stor forskel.
At læse om måder, hvorpå data kan crowdsourceres til det gode, gav mig virkelig lyst til at deltage i noget som FluNearYou. Det ville føles fantastisk at være en af de data, der hjælper med at forme billedet af sundhedslandskabet, derved påvirker den måde læger vælger behandlingsplaner. Alle kan gøre deres egen lille del!