Et maskinlæringsprogram udviklet af et internationalt team af forskere kan hjælpe farmaceutiske virksomheder med at producere større mængder avancerede lægemidler, der er nødvendige til medicinske behandlinger.
I en undersøgelse, teamet udviklede en computeralgoritme ved hjælp af genekspressionsdata for ovarieceller fra kinesisk hamster - en cellelinje, der ofte bruges af biofarmaceutiske forskere til medicinsk forskning - for at optimere produktionen af proteiner i disse celler.
"Lægemiddelindustrien er typisk afhængig af ovarieceller fra en kinesisk hamster - CHO -celler - til forskning for at skabe effektive lægemidler, men, fordi cellerne ikke producerer meget protein pr. celle, det kræver storstilet produktion, "sagde Claudio Angione, lektor i datalogi, Teesside University. "Det vi viser er, at sammenlignet med andre metoder, at kombinere denne metaboliske modellering med datadrevne metoder kan være en kæmpe forbedring af automatiseringen af kulturdesign, ved nøjagtigt at identificere optimale vækstbetingelser for fremstilling af terapeutiske målforbindelser. "
Forskerne, der rapporterede deres resultater ved den anden internationale elektroniske konference om metabolisme, kombineret maskinlæring og en beregningsmodel, der rekonstruerer metabolismen af ovariecellerne i kinesisk hamster - CHO - for at maksimere cellens effektivitet.
"Dette er et nyt skridt, fordi, for første gang, vi kombinerer to metoder, der normalt bruges individuelt i bioforarbejdningsundersøgelser, "sagde Angione.
Forskerne var i stand til at forudsige produktionen af laktat - et giftigt affaldsprodukt - inde i cellerne, hvad angår både deres genetiske og metaboliske tilstande.
"Produktion af laktat er generelt uønsket, da det hindrer cellevækst og følgelig begrænser udbyttet af ønskede produkter, "sagde Macauley Coggins, forskningsassistent, Teesside University. "Ved at forudsige de cellulære forhold, hvor laktatakkumulering minimeres, er det muligt at reducere - eller muligvis undgå - lange rækker af eksperimentelle forsøg."
Terapeutiske proteiner, ligesom dem, der produceres i CHO -celler, har en bred vifte af anvendelser inden for medicin.
"Nogle af dem bruges i vacciner og beskytter mod infektiøse midler, såsom vira, "tilføjede Guido Zampieri, en doktorand i genomik og bioinformatik, CRIBI Biotechnology Center, University of Padua. "Andre proteiner med særlig målrettet aktivitet kan bruges til at behandle patienter, der mangler disse proteiner på grund af genetiske tilstande. Anticancerlægemidler er et andet eksempel."
Maskinlæring er et felt, der undersøger, hvordan computere kan lære at løse problemer og udføre bestemte opgaver uden at blive programmeret, ifølge Coggins. At gøre dette, forskere udvikler normalt en algoritme til at træne en computer til at genkende mønstre, en machine learning -teknik, der ofte omtales som superviseret læring.
"Det ligner meget, hvordan du lærer et barn at genkende forskellige former ved at vise dem, hvad hver figur er, og hvordan den ser ud"
I fremtiden, denne metode kan bruges til at optimere andre metabolitter eller proteiner, foreslår forskerne. Produktion af større mængder medicin kan også føre til billigere behandlinger.
"Vi ser flere interessante forskningsretninger, "sagde Angione." Primært, vi sigter mod at skubbe integrationen af forskellige beregningsmetoder frem, såsom maskinlæring og biologisk modellering. Dette er vigtigt, da de besidder forskellige stærke sider, som, hvis de kombineres, muliggør vedtagelse af mere præcise bioingeniørinterventioner.
Især, maskinlæring kan udtrække nyttig viden fra eksperimentelle data, mens metabolisk modellering giver indsigt i lokale og globale mekanismer i biokemiske netværk.
"Vi vil også undersøge andre trin inden for bioingeniørvirksomhed, der kan drage fordel af denne integrerede optimering. Det endelige mål er at opnå et sæt beregningsværktøjer, der kan guide industrielle processer på tværs af flere niveauer."
The researchers used data from a publicly available large-scale gene expression dataset from two different CHO cell lines with 295 microarray profiles with expression values for 3592 genes from 121 CHO cell cultures. For genome reconstruction, the researchers used a recently developed genome-scale metabolic model—GSMM—used to accurately predict growth phenotypes. The model is currently the largest reconstruction of CHO metabolism.
They then combined the model of CHO cell metabolism with the gene expression data to create condition and cell line-specific polyomics models.