Kredit:CC0 Public Domain
D. Tyler McQuade, Ph.D., professor ved Virginia Commonwealth University College of Engineering, er hovedefterforsker af et multi-universitetsprojekt, der søger at bruge kunstig intelligens til at hjælpe videnskabsmænd med at finde det perfekte molekyle til alt fra en bedre shampoo til belægninger på avancerede mikrochips.
Projektet er et af de første i USA til at blive udvalgt til $994, 433 i finansiering som en del af et nyt pilotprojekt fra National Science Foundation kaldet Convergence Accelerator (C-Accel). McQuade og hans samarbejdspartnere vil pitche deres prototype i marts 2020 i et bud på yderligere finansiering på op til $5 millioner over fem år.
Adam Luxon, en ph.d. studerende ved Institut for Kemi- og Biovidenskab, som har været med fra starten, forklarede det på denne måde:"Vi ønsker i det væsentlige at lave kemiens Alexa."
Ligesom Amazon, Google og Netflix bruger dataalgoritmer til at foreslå tilpassede forudsigelser, holdet planlægger at opbygge et åbent netværk, der kan kombinere og hjælpe brugere med at forstå molekylærvidenskabelige data hentet fra en række kilder, herunder den akademiske verden, industri og regering.
Idéen er i tråd med målet for NSF's Big Ideas-projekt, "Udnyttelse af datarevolutionen, "at engagere forskersamfundet i at udvikle en avanceret cyberinfrastruktur for at accelerere dataintensiv forskning.
Teamet afspejler ekspertise på tværs af flere specialer. James K. Ferri arbejder med McQuade, Ph.D., professor i VCU Institut for Kemi- og Biovidenskabsteknik; Carol A. Parish, Ph.D., professor i kemi og Floyd D. og Elisabeth S. Gottwald-stolen i afdelingen for kemi ved University of Richmond; og Adrian E. Roitberg, Ph.D., professor ved Institut for Kemi ved University of Florida. To virksomheder er også involveret:Two Six Labs, baseret i Arlington, Virginia, og Fathom Information Design, baseret i Boston.
I øjeblikket, der er ikke noget fælles netværk eller en central portal, hvor molekylærforskere og ingeniører kan udnytte kunstig intelligens og datavidenskabelige værktøjer til at bygge modeller, der understøtter deres behov. Og mens videnskabsmænd har været i stand til at skildre, hvilke grundstoffer der udgør et molekyle, hvordan atomerne er arrangeret og molekylets egenskaber (såsom dets smeltepunkt), der er ingen standard måde at repræsentere – eller forudsige – molekylær ydeevne på.
Holdet sigter mod at udfylde disse huller ved at fremme konceptet om et "molekylært aftryk." Samarbejdspartnerne vil skabe et nyt system, der repræsenterer molekyler ved at kombinere stregtegning, geometri og kvantekemiske beregninger i en enkelt, maskinlærbart format.
De vil udvikle en central platform til indsamling af data, skabe disse molekylære aftryk og udvikle algoritmer til minedrift af dataene, og vil udvikle maskinlæringsværktøjer til at skabe præstationsforudsigelsesmodeller.
"Evnen til at beregne molekylære egenskaber ved hjælp af beregningsteknikker, og at sammenkoble disse data med eksperimentelle målinger, vil generere databaser, der vil producere de mest omfattende resultater inden for de molekylære videnskaber, " sagde Parish.
"Der er mange laboratorier rundt om i verden, der arbejder i dette rum; dog, der er få organisatoriske strukturer til rådighed, der tilskynder til åben deling af disse data til gavn for fællesskabet og det fælles bedste, " tilføjede Parish. "Vi søger at samarbejde med andre for at tilvejebringe denne struktur; et åbent vidennetværk eller depot, hvor videnskabsmænd kan deponere deres eksperimentelle og beregningsmæssige data på molekylært niveau i bytte for brugervenlige værktøjer til at hjælpe med at administrere og forespørge dataene."
Den første reaktion på deres idé har været stærk fra potentielle partnere. Ferri og de andre har allerede indsamlet mere end et dusin breve fra store virksomheder som Dow og Merck, der udtrykker interesse for at deltage.
McQuade sagde kemiingeniører i større industrier, herunder forbrugerprodukter og olie- og gasproducenter, bruge en masse kræfter på at køre eksperimenter for at bestemme det molekyle, de vil bruge, såsom at finde det bedste shampoo-additiv, der ikke får babyer til at græde.
"Evnen til at designe de egenskaber, du ønsker, er stadig mere kunst end videnskab, " han sagde.
Teamet planlægger også at udvikle et værktøjssæt til behandling og visualisering af dataene.
Roitberg, hvis forskningsfokus omfatter avanceret visualisering, sagde, at dette kunne tage form af et virtual reality-rige, hvor en bruger kunne finde materialer, der er opløselige i vand, men ikke olie, for eksempel, og derefter være i stand til at søge efter lignende materialer i nærheden.
"Vi forestiller os en meget interaktiv platform, hvor brugeren kan udforske relationer mellem data og ønskede materialeegenskaber, " han sagde.