Videnskab
 science >> Videnskab >  >> Kemi

Softwarebibliotek til at tjene til hurtigere kemisk reaktionsbehandling

Kredit:CC0 Public Domain

Big Data er blevet allestedsnærværende i de senere år, og især i discipliner med heterogene og komplekse datamønstre. Dette gælder især for kemi. På nogle måder, kemiske forbindelser kan sammenlignes med synonymer i lingvistik, fordi en bestemt forbindelse kan repræsenteres på forskellige måder. For at komplicere tingene yderligere, nogle af dem har ikke engang en specifik struktur og eksisterer kun som en sammensmeltning af former, der bliver til hinanden. Derfor er det vigtigt for forskere at vide, om de har at gøre med forskellige forbindelser eller med forskellige repræsentationer af den samme.

Sommetider, databaser har også fejl, der skyldes brugerens uopmærksomhed. Særlig software er nødvendig for at opdage og rette sådanne fejl. I tilfælde af organisk kemi, reaktioner er notorisk svære at analysere. Derfor er reaktionsdata i kemoinformatik meget mindre udviklet end oplysninger om enkeltmolekyler.

Laboratory of Chemoinformatics and Molecular Modeling (Kazan Federal University) har arbejdet på dette problem siden 2013. Forskere der har lært at forudsige reaktionskarakteristika, finde optimale reaktionsbetingelser, og opdage og rette datafejl. Som resultat, en unik database med reaktionskarakteristika er opstået. I øjeblikket, den omfatter 3,5 millioner poster. KFU er det eneste russiske medlem af Reaxys R&D Collaboration, et kollektiv, der arbejder på kemiske databaser.

I dette nye projekt, med titlen CGRværktøjer, KFU-forskere løste en række problemer for bedre at kunne håndtere reaktionsinformation. Softwarebiblioteket er væsentligt rigere på funktionalitet end alle de eksisterende værktøjer. CGRtools understøtter molekyler og reaktion som objekter. CGRtools behandler kemiske objekter på samme måde som standard Python-datatyper som heltal, strenge, osv. Alle kemiske genstande er hashbare på grund af atomnummereringskanonisering. Objekterne understøtter gennemsigtig klassearv, som forstærker eksisterende metoder og attributter uden at bryde eksisterende op.

Vigtigere, biblioteket er gratis tilgængeligt på https://github.com/cimmkzn/CGRtools.