Videnskab
 science >> Videnskab >  >> Andet

Avanceret matematik fortætter COVID-19-kompleksiteten

I denne del af et eksempel på en hypergraf af et biologisk system, farvede linjer repræsenterer gener og omkranser eksperimentelle forhold (sorte cirkler), hvor genet var signifikant. Jo større den sorte cirkel, jo mere eksperimentelle forhold er i den gruppe. Kredit:Emilie Purvine | PNNL

Forskere ræser for at holde trit med COVID-19, skabe nye værktøjer til at finde ud af, hvordan den nye coronavirus virker.

For forskere ved Pacific Northwest National Laboratory (PNNL), at forstå virusinfektion er et spørgsmål om matematik snarere end en ren molekylær analyse. De bruger et avanceret matematisk værktøj kaldet hypergrafer til at identificere, hvordan menneskelige celler reagerer på virusinfektion, inklusive den nye coronavirus. Nøgleproteinerne, der deltager i denne reaktion, kan være mål for udvikling af lægemidler til behandling af COVID-19.

PNNL-matematiker Emilie Purvine og beregningsbiolog Jason McDermott præsenterede for nylig deres arbejde virtuelt på Association for Computing Machinery's SIGKDD (Special Interest Group on Knowledge Discovery and Data Mining). en årlig konference for data mining, datavidenskab, og analyser.

Hypergrafer for virusinfektion

I et nøgletrin, holdet testede den nye tilgang med data fra en lignende virus, coronavirus, der forårsager alvorligt akut respiratorisk syndrom, eller SARS. Denne virus inficerede mere end 8, 000 mennesker, da det fejede hen over kloden i 2003.

PNNL-holdet fandt ud af, at resultaterne fra den nye metode stemte overens med data, der tidligere var indsamlet om den virus. Brug af hypergrafer, holdet identificerede og rangerede aktiviteten af ​​flere gener, der nu vides at være vigtige for aktiviteten af ​​den virus, der forårsagede SARS-1-udbruddet.

"Vores arbejde identificerede uafhængigt de samme gener, der vides at være vigtige med SARS-aktivitet. Dette var et vigtigt skridt at tage, før vi anvender vores arbejde på den virus, der forårsager COVID-19, " sagde McDermott.

Nu anvender PNNL-teamet den nye teknologi til den aktuelle virus, ved at bruge hypergrafer til at sortere og rangere vigtigheden af ​​mange af de hundredvis af gener, der er aktive i COVID-19.

Purvine og McDermott har brugt hypergrafer til at udforske, hvordan menneskelige celler reagerer på virusinfektioner i de sidste to år. De har arbejdet med data indsamlet af PNNL-biolog Katrina Waters, som har sporet genekspression, protein ekspression, og molekylære ændringer i humane celler inficeret med vira, herunder influenza, Zika, Ebola, og coronavirus i omkring et årti.

For at anvende hypergrafer til dette store datasæt, forskerne skulle først finde ud af, hvordan man kunne identificere grupper af proteiner på en måde, der satte dem op til at bygge en meningsfuld hypergraf. Holdet tacklede den udfordring tidligere i år, samtidig ramte corona-pandemien.

Fra grafer til hypergrafer

Samarbejdet med Purvine tilbyder et nyt værktøj til McDermott, som har brugt grafbaserede matematiske teknikker til at analysere forbindelser mellem gener, proteiner, og signalmolekyler i celler i årevis.

Han og hans kolleger identificerer forhold mellem to molekyler ad gangen. Derefter kategoriserer de forbindelser mellem mange separate interaktioner. Disse forbindelser vikler sig hurtigt ind i komplekse grafer, der repræsenterer molekylære netværk, der holder celler i funktion.

Forskerne analyserer strukturen og formen af ​​disse grafer, leder efter meningsfulde mønstre, der indikerer molekylære komponenter med nøgleroller. Centralitet, eller når et molekyle har mange forbindelser til andre, er én type mønster.

Hele strukturen af ​​en graf er et andet meningsfuldt mønster. Nogle centrale forbindelser fungerer som broer for at holde informationen flydende mellem forskellige dele af netværket. Gener eller proteiner involveret i disse "mellem"-forbindelser holder sandsynligvis en hel celle i funktion.

Hypergrafer repræsenterer et potentielt spring fremad. I stedet for at repræsentere forbindelser mellem individuelle komponenter, hypergrafer viser sammenhænge mellem grupper af ting. Da biologiske netværk fungerer gennem molekylære grupper, videnskabsmænd mener, at hypergrafer kan repræsentere deres struktur mere realistisk end standardgrafer.

Forskere har brugt hypergrafer til at repræsentere sociale grupper og computernetværksinfrastruktur, men deres beregningsmæssige kompleksitet gør dem til en usædvanlig teknik til at studere biologiske netværk i stor skala, der opstår fra eksperimentelle data.

Et open source hypergrafsoftwareværktøj kaldet HyperNetX, udviklet hos PNNL, gør denne analyse mere tilgængelig for forskere inden for forskellige discipliner. Men at anvende teknikken på data fra en række forskellige felter kræver stadig noget fifleri.

"Der er så mange måder at bygge hypergrafer på fra biologiske data, biologer er sandsynligvis nødt til at involvere en beregningsmatematiker for at gøre dette, for nu, " sagde Purvine.


Varme artikler