AI lærer komplekse gensygdomsmønstre

En kunstig intelligens -applikation bruges af KAUST -forsker til at finde gener, der forårsager sygdomme. Kredit:Kiyoshi Takahase Segundo / Alamy Arkivfoto

Kunstig intelligens (AI) bliver udnyttet af forskere til at spore gener, der forårsager sygdom. Et KAUST -team tager en kreativ, kombineret dyb læringstilgang, der bruger data fra flere kilder til at lære algoritmer, hvordan man finder mønstre mellem gener og sygdomme.

Maskinlæring bruger algoritmer og statistiske modeller til at identificere mønstre og sammenhænge mellem data for at løse specifikke problemer. Ved at indtaste nok kendte data, like taggede billeder af "Jack, " Systemet kan med tiden lære at foreslå andre ikke-taggede billeder, der inkluderer Jack.

Forskere bruger denne applikation af AI til at finde gener, der forårsager sygdomme. Imidlertid, kun et begrænset antal gener er eksperimentelt blevet bekræftet at være forårsagende. Det betyder, at videnskabsmænd ikke har en masse data at indtaste i deres programmer for at hjælpe dem med at lære mønstrene, der afbilder gen-sygdomsassociationer. Dermed, de skal være kreative for at finde måder at lære maskinlæringsalgoritmer at lære på og derefter kigge efter disse mønstre.

Database- og informationsstyringsspecialist Panagiotis Kalnis, Beregningsbioforsker Xin Gao og kolleger har udviklet en dyb læringsmodel, som de siger, overgår de nuværende avancerede metoder.

Først, de tyede til kendte databaser for at udtrække oplysninger om genlokationer og funktioner og om, hvordan og hvornår de tænder og slukker. Disse data blev brugt til at lære algoritmer at finde gener, der arbejder sammen. Derefter, de indhentede data om træk ved genetiske sygdomme fra andre databaser. Dette lærte algoritmerne at identificere sygdomme med lignende manifestationer. De kombinerede disse datasæt med data om de kendte sammenhænge mellem 12, 231 gener og 3, 209 sygdomme.

KAUST-modellen uddrager mønstrene, der er lært af, hvordan generne netværker og om lighederne mellem genetiske sygdomme og overfører dem til en dyb læringsmodel kaldet et grafkonvolutionelt netværk. Dette leverer et andet sæt data, der er placeret i matricer, såsom dem, der bruges i anbefalingssystemer, at forudsige gen-sygdomssammenhæng.

Modellen var i stand til at identificere komplekse, ikke -lineære sammenhænge mellem gener og sygdomme, lader den fortsætte med at forudsige nye associationer. "Ved at gøre brug af mere information, vi opnåede bedre nøjagtighed end de state-of-the-art metoder, der i øjeblikket bruges, " siger Peng Han, undersøgelsens første forfatter. "Men, selvom vi klarede os bedre end andre metoder i vores eksperimenter, den er stadig ikke nøjagtig nok til at blive anvendt på industrien, " tilføjer han.

Holdet planlægger derefter at forbedre deres models nøjagtighed ved at inkorporere flere slags data. De vil også anvende metoden til at løse andre typer problemer, hvor der kun er begrænsede data tilgængelige, såsom at anbefale nye steder at besøge baseret på en brugers tidligere præferencer.

Sidste artikelHurtigere udvikling af integrerede systemer

Næste artikelVægklatrerobot inspireret af en igle