Forskere fra Skoltech Center for Computational and Data-Intensive Science and Engineering (CDISE) og Helmholtz München Center for Environmental Health (HMGU, Tyskland) har skabt et neuralt netværk til visualisering af forbindelsernes kemiske rum, der kan have potentiel værdi for medicinalindustrien. Den nye metode vil hjælpe med at skabe nye kemiske forbindelser og navigere i rummet med de eksisterende kemikalier. Resultaterne af undersøgelsen blev offentliggjort i RSC Advances.
Kemikere er ofte nødt til at arbejde gennem enorme databaser, der indeholder titusinder eller endda hundredtusinder af kemiske strukturer for at vælge de bedste kandidater. For at gøre det, de skal vide, hvilke klasser af forbindelser databasen indeholder. Imidlertid, at gå gennem tusinder af molekyler er en besværlig opgave, hvilket ville være meget lettere, hvis molekylerne blev afbildet som prikker og placeret på et plan eller i rummet, med lignende molekyler, der trængte sig sammen. Dette ville gøre det muligt at studere det kemiske rum ved hjælp af et simpelt værktøj på omtrent samme måde som geografen bruger digitale kort over forskellige skalaer til at se et større billede eller zoome ind på et bestemt område. Men her er gnidningen:Hvordan ville algoritmen vide, hvor molekylerne skal placeres, hvis værktøjet ikke har kendskab til kemi?
En fælles gruppe forskere fra CDISE (Dmitry Karlov, Sergey Sosnin og Maxim Fedorov) og HMGU (Igor Tetko) anvendte AI -metoder til at udtrække oplysninger direkte fra data, og koblede det dybe neurale netværk med den populære t-SNE-dimensionsreduktionsmetode for at oprette et neuralt netværk, der er i stand til at generere et 2-D-billede af forbindelsen på et plan baseret på forbindelsens multidimensionelle struktur modtaget som input. Den nye metode placerer molekyler med lignende egenskaber tæt på hinanden, så forbindelserne kan grupperes i klasser i henhold til deres egenskaber. Forfatterne af undersøgelsen uddannede deres neurale netværk på millioner af forbindelser med kendt biologisk aktivitet.
"Vi tilpassede t-SNE-metoden til at visualisere det kemiske rum i forbindelser med farmaceutisk potentiale ved at træne det dybe neurale netværk og vælge enkle deskriptorer og en metrik til beregning af afstande i et multidimensionelt rum. Vi viste også, at denne tilgang gør det muligt at gemme mere information sammenlignet med andre dimensionsreduktionsmetoder, mens du er på niveau med PCA med hensyn til hastighed, "siger Skoltech -forsker og den første forfatter til undersøgelsen Dmitry Karlov.
I fremtiden, forskerne planlægger at udvikle en række værktøjer til kemikere og farmaceuter til at se arrangementet af nye, uudforskede forbindelser i forhold til dem, der allerede er undersøgt og beskrevet i litteraturen. Dette vil fremskynde F &U -fasen i søgen efter nye lægemidler.