Videnskab
 science >> Videnskab >  >> Elektronik

AI til planteavl i et stadigt skiftende klima

Sorghum, en vigtig afgrøde, der bruges som mad og til produktion af biobrændstoffer. Kredit:Pixabay

Hvordan kan kunstig intelligens (AI) påvirke landbruget, fødevareindustrien, og inden for bioingeniør? Dan Jacobson, en forsknings- og udviklingsmedarbejder i Biosciences Division ved US Department of Energy's (DOE's) Oak Ridge National Laboratory (ORNL), har et par ideer.

I de sidste 5 år har Jacobson og hans team har undersøgt planter for at forstå de genetiske variabler og mønstre, der gør dem tilpasningsdygtige til skiftende miljøer og klimaer. Som beregningsbiolog, Jacobson bruger nogle af verdens mest kraftfulde supercomputere til sit arbejde - herunder den nyligt nedlagte Cray XK7 Titan og verdens mest kraftfulde og smarteste supercomputer til åben videnskab, IBM AC922 Summit supercomputer, begge placeret ved Oak Ridge Leadership Computing Facility (OLCF), en DOE Office of Science User Facility på ORNL.

Sidste år, Jacobson og hans team vandt en Association for Computing Machinery Gordon Bell Prize efter at have brugt en særlig computerteknik kendt som "blandet præcision" på Summit for at blive den første gruppe, der nåede exascale hastighed - cirka en kvart million beregninger i sekundet.

Jacobsons team arbejder i øjeblikket på adskillige projekter, der danner en integreret køreplan for AIs fremtid inden for planteavl og bioenergi. Holdets arbejde blev omtalt i Tendenser inden for bioteknologi i oktober.

I dette spørgsmål og svar, Jacobson fortæller om sit teams arbejde med en genomisk selektionsalgoritme, hans vision for fremtiden for miljøgenomik, og rummet, hvor simulering møder AI.

Hvad har dit team arbejdet med det sidste år?

Jacobson:Vi har arbejdet på et par ting. For nylig, vi har udviklet nye måder at gøre det, der kaldes "genomisk selektion, "eller designe en organisme til avlsformål. Vi har udviklet en ny genomisk selektionsalgoritme, der er drevet af nye maskinindlæringsmetoder, der samlet kaldes" forklarbar AI, "hvilket er et felt, der forbedrer black box -klassificerings -AI -metoder ved at forsøge at forstå, hvordan disse algoritmer træffer beslutninger.

Denne algoritme hjælper os med at bestemme, hvilke variationer i et genom vi skal kombinere for at producere planter, der kan tilpasse sig deres omgivelser. Dette informerer avlsindsatsen, genredigeringsindsats, eller kombinationer af disse, afhængigt af hvilken slags bioingeniørstrategi du vil tage.

Sidste år tjente du en Gordon Bell -pris efter at have brudt exascale -barrieren med en kode, der giver dig mulighed for at studere kombinatoriske interaktioner mellem organismer og deres omgivelser. Hvordan passer denne algoritme ind i den forskning?

Jacobson:Vi bruger stadig den model, vi brugte sidste år, men nu, vi har introduceret denne AI-drevne genomiske selektionsalgoritme til vores Combinatorial Metrics [CoMet] -kode, og vi fodrer den med miljøoplysninger på tværs af hver dag i et år, så vi kan lave genom-dækkende foreningsstudier på tværs af klima-tiden.

Derudover vi har udvidet vores indsats i global skala til det, vi kalder "klimatyper" - klima- og miljøoplysninger, som planterne tilpasser sig. Ved hjælp af ORNLs Peter Thornton og hans gruppes ekspertise inden for biogeografi og klima, vi byggede modeller af hver kvadratkilometer jord på planeten og kodede 50 års miljø- og klimadata i disse modeller, lige fra jorden, op gennem lys spektral kvalitet, og alt derimellem.

For at forstå alle forholdene mellem forskellige miljøer, vi sammenlignede disse miljøer med hinanden på Summit ved hjælp af en ny algoritme kaldet Duo, som vi tilføjede til vores CoMet -kodebase. Så vidt vi ved, dette er den største videnskabelige beregning, der nogensinde er foretaget.

Det lyder som en temmelig stor bedrift. Hvilken slags information kan disse sammenligninger give dig?

Jacobson:Disse sammenligninger kan hjælpe os med at bestemme præcis, hvor vi kan målrette mod bestemte miljøer, og hvilke genmutationer og alleler, vi skal medtage for at hjælpe disse planter med at tilpasse sig forskellige miljøer. Vi kan se på et miljø og sige, "For dette miljø, det er det, vi skal have i denne plantes genom, for at den kan trives så godt, som den kan. "

Er dette fremtiden for miljøgenomik?

Jacobson:Den integrerede vision, vi ser, er forbindelsen mellem alle de "-omiske" lag, fra genomik (genekspression), proteomik (proteinekspression), og metabolomics (metabolitekspression) helt op gennem fænotyper - observerbare træk; så, fra genom til fænomen og alt derimellem.

Ideelt set, vi vil gerne have en kombination af genotypedata med klima- og miljødata i en integreret model, fra enkelte nukleotider - de molekylære strukturer, der danner DNA - op til miljø og klima på planetarisk skala. Sådanne omfattende integrerede modeller er nu mulige, fordi vi faktisk har beregnet lysspektralskalaen for hvert punkt på planeten - det er en astrofysisk fænotype, der kommer fra vores nærmeste stjerne, solen.

Først, vi er nødt til at se på de kombinatoriske interaktioner i sådanne modeller for at se, hvordan de fører til de nye egenskaber, som vi forsøger at optimere i anlæg til fremtidig produktivitet og bæredygtighed. Derefter, vi kan forbinde det med, hvordan planter historisk har tilpasset sig miljøer for at designe nye ideelle genotyper til bioenergi eller fødevareproduktion, der er optimeret til at trives i bestemte miljøer.

Er dette noget, der vil blive krævet i landbruget i fremtiden?

Jacobson:Når verden ændrer sig, der er et stigende pres for at udnytte "marginal jord, "det er jord, der ofte ikke i øjeblikket bruges til landbrug eller ikke effektivt bruges til landbrug. Så, hvis vi designer genotyper, der trives i disse marginale miljøer, vi vil kunne øge vores fødevareproduktion ud over vores energiproduktion. Dette er en teknologi til dobbelt anvendelse.

Vi er også virkelig bekymrede over overgødskning af jorden, fordi det kan føre til afstrømning, der har store økologiske konsekvenser. Hvis vi kan optimere planter til at bruge de næringsstoffer, der er der med lidt ekstra gødning, det er også en stor fordel for bæredygtighed. Så, vi forsøger virkelig at se på dette holistisk og bygge så meget af disse tilpasninger, som vi overhovedet kan i modellen, så vi kender virkningerne i visse miljøer.

Hvad arbejder du videre med?

Jacobson:Det næste trin er at se på de historiske data og alle disse relationer og derefter projektere fremad, så vi faktisk kan designe genotyper, der ikke kun vil trives i de nuværende miljøzoner, men fortsat vil trives i fremtiden, efterhånden som det globale netværk ændres. Evnen til at projicere fremad, både for årlige afgrøder såvel som langsigtede flerårige afgrøder, er virkelig vigtigt.

Hvad er nogle af de resterende udfordringer?

Jacobson:Alt, hvad vi laver, er et tungt løft, men vi ser på, hvordan vi kan designe denne nye tilgang på Summit og OLCF's fremtidige exascale -system, Grænse, så vi virkelig kan forstå alle disse relationer. Også, nu hvor vi har disse data på alle disse "-omics" -lag, vi er nødt til at køre disse kombinationer af lag - kaldet polytoper - tusinder eller titusinder eller hundredtusinder af gange. Det næste sæt algoritmer, vi bygger, er at finde alle mulige relationer og associationer inden for og på tværs af alle polytoper. Det er den næste grænse.

Kryds dit arbejde overhovedet med traditionelle klimasimuleringsmodeller?

Jacobson:Dette er et data- og AI-drevet syn på klimainformation, som er forskellig fra en simuleringsmetode. Over tid, det bliver interessant at se, hvor de skærer hinanden, og der kan være ting, vi lærer her, som er meget informative for klimamodeller og omvendt. Vi ved også, at den samme slags forklarbare AI -teknologi kan hjælpe meget med simuleringsstudier. Ideelt set, vi kunne udvikle forklarbare AI-drevne modeller, der kan hjælpe simuleringsmodeller med nogle af deres flaskehalse. Hvis vi kan lære de mønstre, simuleringsmodeller bruger og erstatte nogle af deres flaskehalse med et indlært resultat, så kan de modeller mere kreative ting. Det er virkelig her, vi måske ser noget af dette rum krydse hinanden i fremtiden.