Forudsigelse af mobil adfærd i silico:Trænet i data, der registrerer stimuleringseffekter for et sæt celletyper, scGen kan bruges til at modellere cellulære responser i en ny celletype. Kredit:Helmholtz Zentrum München
Store atlaser af organer i en sund tilstand vil snart være tilgængelige, i særdeleshed, menneskelig celleatlas. Dette er et vigtigt skridt i en bedre forståelse af celler, væv og organer i sund tilstand og giver en reference ved diagnosticering, overvågning og behandling af sygdomme. Imidlertid, på grund af det store antal mulige kombinationer af behandling og sygdomstilstande, at udvide disse data til at karakterisere sygdom og sygdomsbehandling i traditionelle life science-laboratorier er arbejdskrævende og dyrt, og derfor ikke skalerbar.
Nøjagtigt modellering af cellulær respons på forstyrrelser (f.eks. sygdom, forbindelser, genetiske interventioner) er et centralt mål for beregningsbiologi. Selvom der findes modeller baseret på statistiske og mekanistiske tilgange, ingen maskinlæringsbaseret løsning, der er levedygtig for ikke-observerede højdimensionelle fænomener, har endnu ikke været tilgængelig. Ud over, scGen er det første værktøj, der forudsiger cellulært respons uden for prøven. Det betyder, at scGen, hvis uddannet i data, der registrerer effekten af forstyrrelser for et givet system, er i stand til at lave pålidelige forudsigelser for et andet system. "For første gang, vi har mulighed for at bruge data genereret i ét modelsystem som f.eks. mus og bruge dataene til at forudsige sygdom eller terapiresvar hos mennesker, "sagde Mohammad Lotfollahi, Ph.d. studerende (Helmholtz Zentrum München og Technische Universität München).
scGen er en generativ model for dyb læring, der udnytter ideer fra image, sekvens og sprogbehandling, og, for første gang, anvender disse ideer til at modellere en celles adfærd i silico. Det næste trin for teamet vedrører forbedring af scGen til en fuldt datadrevet formulering, øge dets forudsigelseskraft for at muliggøre undersøgelse af kombinationer af forstyrrelser. "Vi kan nu begynde at optimere scGen til at besvare mere og mere komplekse spørgsmål om sygdomme, "sagde Alex Wolf, Team leder, og Fabian Theis, Direktør for Institute of Computational Biology og formand for matematisk modellering af biologiske systemer ved Technische Universität München.