Videnskab
 Science >> Videnskab >  >> Kemi

Mød Coscientist, din AI-laboratoriepartner:Systemet lykkes med at planlægge og udføre kemieksperimenter i den virkelige verden

En kunstners konceptuelle repræsentation af kemiforskning udført af AI. Arbejdet blev ledet af Gabe Gomes ved Carnegie Mellon University og støttet af U.S. National Science Foundation Centers for Chemical Innovation. Kredit:U.S. National Science Foundation

På mindre tid, end det vil tage dig at læse denne artikel, var et kunstig intelligens-drevet system i stand til selvstændigt at lære om visse Nobelprisvindende kemiske reaktioner og designe en vellykket laboratorieprocedure til at fremstille dem. AI'en klarede alt det på få minutter – og klarede det i første forsøg.



"Dette er første gang, at en ikke-organisk intelligens planlagde, designede og udførte denne komplekse reaktion, som blev opfundet af mennesker," siger kemiker og kemiingeniør Gabe Gomes fra Carnegie Mellon University, der ledede forskerholdet, der samlede og testede AI- baseret system. De døbte deres skabelse "Coscientist."

De mest komplekse reaktioner Coscientist foretog er kendt i organisk kemi som palladium-katalyserede krydskoblinger, som gav sine menneskelige opfindere 2010 Nobelprisen i kemi som anerkendelse af den store rolle, disse reaktioner kom til at spille i den farmaceutiske udviklingsproces og andre industrier, som bruge kræsne, kulstofbaserede molekyler.

Udgivet i tidsskriftet Nature , de demonstrerede evner hos Coscientist viser potentialet for mennesker til produktivt at bruge AI til at øge tempoet og antallet af videnskabelige opdagelser, samt forbedre replikerbarheden og pålideligheden af ​​eksperimentelle resultater.

Forskerholdet på fire personer omfatter ph.d.-studerende Daniil Boiko og Robert MacKnight, som modtog støtte og træning fra henholdsvis U.S. National Science Foundation Center for Chemoenzymatic Synthesis ved Northwestern University og NSF Center for Computer-Assisted Synthesis ved University of Notre Dame. .

"Ud over de kemiske synteseopgaver, der er demonstreret af deres system, har Gomes og hans team med succes syntetiseret en slags hypereffektiv laboratoriepartner," siger NSF Chemistry Division Director David Berkowitz. "De sætter alle brikkerne sammen, og slutresultatet er langt mere end summen af ​​dets dele - det kan bruges til virkelig nyttige videnskabelige formål."

Et ikke-organisk intelligent system har for første gang designet, planlagt og eksekveret et kemieksperiment, rapporterer forskere fra Carnegie Mellon University i 21. december-udgaven af ​​tidsskriftet Nature . Kredit:Carnegie Mellon University

At sætte Coscientist sammen

Chefen blandt Coscientists software og siliciumbaserede dele er de store sprogmodeller, der omfatter dens kunstige "hjerne". En stor sprogmodel er en type kunstig intelligens, som kan udtrække betydning og mønstre fra enorme mængder data, herunder skrevet tekst indeholdt i dokumenter.

Gennem en række opgaver testede og sammenlignede teamet adskillige store sprogmodeller, inklusive GPT-4 og andre versioner af GPT store sprogmodeller lavet af virksomheden OpenAI.

Coscientist var også udstyret med flere forskellige softwaremoduler, som holdet testede først individuelt og derefter i fællesskab.

"Vi forsøgte at opdele alle mulige opgaver inden for naturvidenskab i små stykker og derefter stykke-for-stykke konstruere det større billede," siger Boiko, der har designet Coscientists generelle arkitektur og dens eksperimentelle opgaver. "Til sidst bragte vi alt sammen."

Softwaremodulerne gjorde det muligt for Coscientist at gøre ting, som alle forskningskemikere gør:søge offentlig information om kemiske forbindelser, finde og læse tekniske manualer om, hvordan man styrer robotlaboratorieudstyr, skrive computerkode for at udføre eksperimenter og analysere de resulterende data for at bestemme, hvad virkede og hvad der ikke gjorde.

En test undersøgte Coscientists evne til nøjagtigt at planlægge kemiske procedurer, der, hvis de blev udført, ville resultere i almindeligt anvendte stoffer som aspirin, acetaminophen og ibuprofen. De store sprogmodeller blev individuelt testet og sammenlignet, inklusive to versioner af GPT med et softwaremodul, der gør det muligt at bruge Google til at søge på internettet efter information, som en menneskelig kemiker kan.

De resulterende procedurer blev derefter undersøgt og scoret baseret på, om de ville have ført til det ønskede stof, hvor detaljerede trinene var og andre faktorer. Nogle af de højeste resultater blev noteret af det søgeaktiverede GPT-4-modul, som var det eneste, der skabte en procedure af acceptabel kvalitet til syntetisering af ibuprofen.

Boiko og MacKnight observerede Coscientist, der demonstrerede "kemisk ræsonnement", som Boiko beskriver som evnen til at bruge kemi-relateret information og tidligere erhvervet viden til at guide ens handlinger. Den brugte offentligt tilgængelig kemisk information kodet i formatet Simplified Molecular Input Line Entry System (SMILES) - en type maskinlæsbar notation, der repræsenterer den kemiske struktur af molekyler - og foretog ændringer i sine eksperimentelle planer baseret på specifikke dele af molekylerne, den var. granskning i SMILES-dataene.

"Dette er den bedst mulige version af kemisk ræsonnement," siger Boiko.

Yderligere tests inkorporerede softwaremoduler, der tillader Coscientist at søge og bruge tekniske dokumenter, der beskriver applikationsprogrammeringsgrænseflader, der styrer robotlaboratorieudstyr. Disse tests var vigtige for at afgøre, om Coscientist kunne oversætte sine teoretiske planer for syntetisering af kemiske forbindelser til computerkode, der ville guide laboratorierobotter i den fysiske verden.

Bring robotterne ind

Højteknologisk robotkemi-udstyr bruges almindeligvis i laboratorier til at suge op, sprøjte ud, varme, ryste og gøre andre ting til små væskeprøver med krævende præcision igen og igen. Sådanne robotter styres typisk gennem computerkode skrevet af menneskelige kemikere, som kunne være i det samme laboratorium eller på den anden side af landet.

Dette var første gang sådanne robotter ville blive styret af computerkode skrevet af AI.

Holdet startede Coscientist med enkle opgaver, der krævede, at den skulle få en robotvæskehåndteringsmaskine til at dispensere farvet væske i en plade, der indeholder 96 små brønde, der er justeret i et gitter. Det blev bedt om at "farve hver anden streg med en farve efter eget valg", "tegne en blå diagonal" og andre opgaver, der minder om børnehaven.

Efter eksamen fra væskehåndtering 101 introducerede holdet Coscientist til flere typer robotudstyr. De samarbejdede med Emerald Cloud Lab, en kommerciel facilitet fyldt med forskellige slags automatiserede instrumenter, herunder spektrofotometre, som måler bølgelængderne af lys absorberet af kemiske prøver. Coscientist blev derefter præsenteret for en tallerken med væsker i tre forskellige farver (rød, gul og blå) og bedt om at bestemme, hvilke farver der var til stede, og hvor de var på pladen.

Da Coscientist ingen øjne har, skrev den kode for at robotisk sende mysteriefarvepladen til spektrofotometeret og analysere bølgelængderne af lys absorberet af hver brønd, og dermed identificere hvilke farver der var til stede og deres placering på pladen. Til denne opgave skulle forskerne give Coscientist et lille skub i den rigtige retning og instruere den til at tænke over, hvordan forskellige farver absorberer lys. AI'en klarede resten.

Coscientists afsluttende eksamen var at sætte dets samlede moduler og træning sammen for at opfylde holdets kommando om at "udføre Suzuki og Sonogashira reaktioner," opkaldt efter deres opfindere Akira Suzuki og Kenkichi Sonogashira.

Opdaget i 1970'erne bruger reaktionerne metallet palladium til at katalysere bindinger mellem kulstofatomer i organiske molekyler. Reaktionerne har vist sig særdeles nyttige til at producere nye typer medicin til behandling af betændelse, astma og andre tilstande. De bruges også i organiske halvledere i OLED'er, der findes i mange smartphones og skærme. Gennembrudsreaktionerne og deres brede virkninger blev formelt anerkendt med en Nobelpris, der i 2010 blev tildelt i fællesskab til Sukuzi, Richard Heck og Ei-ichi Negishi.

Selvfølgelig havde Coscientist aldrig forsøgt disse reaktioner før. Så som denne forfatter gjorde for at skrive det foregående afsnit, gik den til Wikipedia og slog dem op.

Stor magt, stort ansvar

"For mig var 'eureka'-øjeblikket at se det stille alle de rigtige spørgsmål," siger MacKnight, der designede softwaremodulet, så Coscientist kunne søge i teknisk dokumentation.

Coscientist søgte overvejende svar på Wikipedia, sammen med en lang række andre websteder, herunder dem fra American Chemical Society, Royal Society of Chemistry og andre, der indeholdt akademiske artikler, der beskriver Suzuki og Sonogashira reaktioner.

På mindre end fire minutter havde Coscientist designet en nøjagtig procedure til at producere de nødvendige reaktioner ved hjælp af kemikalier leveret af holdet. Da den forsøgte at udføre sin procedure i den fysiske verden med robotter, lavede den en fejl i den kode, den skrev for at styre en enhed, der opvarmer og ryster væskeprøver. Uden tilskyndelse fra mennesker opdagede Coscientist problemet, henviste tilbage til den tekniske manual for enheden, rettede dens kode og prøvede igen.

Resultaterne var indeholdt i nogle få bittesmå prøver af klar væske. Boiko analyserede prøverne og fandt de spektrale kendetegn ved Suzuki- og Sonogashira-reaktioner.

Gomes var vantro, da Boiko og MacKnight fortalte ham, hvad Coscientist gjorde. "Jeg troede, de trak mit ben," husker han. "Men det var de ikke. Det var de absolut ikke. Og det var da det klikkede, okay, vi har noget her, der er meget nyt, meget kraftfuldt."

Med den potentielle magt følger behovet for at bruge det klogt og at beskytte sig mod misbrug. Gomes siger, at forståelsen af ​​AIs muligheder og grænser er det første skridt i at skabe informerede regler og politikker, der effektivt kan forhindre skadelig brug af AI, uanset om det er tilsigtet eller utilsigtet.

"Vi skal være ansvarlige og betænksomme over, hvordan disse teknologier implementeres," siger han.

Gomes er en af ​​flere forskere, der leverer ekspertråd og vejledning til den amerikanske regerings bestræbelser på at sikre, at AI bruges sikkert og sikkert, såsom Biden-administrationens bekendtgørelse fra oktober 2023 om AI-udvikling.

Accelerering af opdagelse, demokratisering af videnskab

Den naturlige verden er praktisk talt uendelig i sin størrelse og kompleksitet, og den indeholder utallige opdagelser, der bare venter på at blive fundet. Forestil dig nye superledende materialer, der dramatisk øger energieffektiviteten eller kemiske forbindelser, der kurerer ellers ikke-behandlelige sygdomme og forlænger menneskers liv. Og alligevel er det en lang og besværlig rejse at erhverve sig den nødvendige uddannelse og træning for at opnå disse gennembrud. Det er svært at blive videnskabsmand.

Gomes og hans team forestiller sig AI-assisterede systemer som Coscientist som en løsning, der kan bygge bro mellem naturens uudforskede vidder og det faktum, at uddannede forskere er en mangelvare – og sandsynligvis altid vil være det.

Menneskelige videnskabsmænd har også menneskelige behov, som at sove og lejlighedsvis komme uden for laboratoriet. Mens menneskestyret AI kan "tænke" døgnet rundt, metodisk vende hver eneste ordsprogede sten, kontrollere og gentjekke dens eksperimentelle resultater for replikerbarhed. "Vi kan have noget, der kan køre selvstændigt og prøve at opdage nye fænomener, nye reaktioner, nye ideer," siger Gomes.

"Du kan også reducere adgangsbarrieren markant for stort set ethvert felt," siger han. For eksempel, hvis en biolog, der ikke var uddannet i Suzuki-reaktioner, ville udforske deres anvendelse på en ny måde, kunne de bede Coscientist om at hjælpe dem med at planlægge eksperimenter.

"Du kan få denne massive demokratisering af ressourcer og forståelse," forklarer han.

Der er en iterativ proces i videnskaben med at prøve noget, fejle, lære og forbedre, som AI kan fremskynde væsentligt, siger Gomes. "Det i sig selv vil være en dramatisk ændring."

Flere oplysninger: Gabe Gomes, Autonome videnskabelige forskningskapaciteter af store sprogmodeller, Nature (2023). DOI:10.1038/s41586-023-06792-0. www.nature.com/articles/s41586-023-06792-0

Journaloplysninger: Natur

Leveret af National Science Foundation




Varme artikler