Videnskab
 science >> Videnskab >  >> Kemi

Forskere finder måde at fjerne støj fra big data i metabolomics undersøgelse

Metabolisme er kompliceret. Den gode nyhed er, at det måske ikke er så kompliceret som tidligere antaget. Ny forskning fra forskere ved Washington University understøtter et billede mere som det til højre. Kredit:Gary Patti lab

Ikke længe siden, videnskabsmænd satsede på antallet af gener i det menneskelige genom. Nogle indsatser varierede op til 100, 000 gener er til stede. Når den menneskelige genomsekvens var afsluttet, et projekt ledet til dels af McDonnell Genome Institute ved Washington University School of Medicine i St. Louis, selv det laveste gæt på 25, 947 viste sig at være over det sande tal.

Nu, næsten 15 år senere, forskere ved Washington University ser en mindende tendens i den nyeste type big data kendt som metabolomics. De anslår, at antallet af metabolitter til stede i et datasæt kan være 90 procent mindre end tidligere anslået.

Undersøgelsen blev offentliggjort online 15. september in Analytisk kemi .

Ligesom sin genomiske forgænger, metabolomics søger at profilere alle de metabolitter, der er til stede i en prøve. I modsætning til gener, imidlertid, metabolitter er ikke lavet af almindelige byggesten og er meget mere kemisk forskellige. Kendte metabolitter omfatter molekyler som glucose og kolesterol, hvoraf mange er et produkt af kosten. Dermed, Det har været en hård udfordring at prøve at fastlægge det nøjagtige antal metabolitter hos mennesker. På grund af dens stærke ernæringsmæssige afhængighed, nogle videnskabsmænd har hævdet, at det ikke engang er det relevante spørgsmål at stille.

Der har været interesse for at måle metabolitter i næsten lige så lang tid, som der har været interesse for menneskers sundhed. Analyse af glukose i diabetes går sandsynligvis århundreder tilbage. Håndfulde andre metabolitter er blevet brugt til at diagnosticere sygdomme, der bredt omtales som "medfødte metabolismefejl" siden 1960'erne. Metabolomics forsøger at måle alle disse metabolitter, og mere. Spørgsmålet er:Hvor mange flere er der?

Scenen for metabolomics blev sat med fremkomsten af ​​sofistikerede enheder kaldet massespektrometre. Disse instrumenter er som små vægte, der kan måle vægten af ​​molekyler, såsom sukkerarter. Ved at bruge databaser og beregningsalgoritmer, videnskabsmænd kan konvertere målte vægte til sammensatte navne, som glukose.

For et årti siden, da metabolomics begyndte at blive mainstream, Forskere var overraskede over at opdage, at antallet af signaler i et typisk metabolomisk eksperiment i høj grad overstiger antallet af kendte metabolitter i biokemi lærebøger. sagde Gary Patti, lektor i kemi i Arts &Sciences og seniorforfatter til undersøgelsen:"Selvfølgelig, knæfaldsreaktionen er at antage, at de fleste af de signaler, der ikke returnerer matches i databaser, svarer til ukendte metabolitter, som aldrig er blevet rapporteret før."

Implikationerne af en sådan antagelse er store:titusindvis af metabolitter mangler at blive opdaget, en størrelsesorden mere end hvad der er inkluderet på dit fælles vægdiagram over omfattende stofskifte (se billedet nedenfor).

"Det er rutine at detektere titusindvis af signaler i metabolomics, men kun 1, 000 til 2, 000 er blevet identificeret i ethvert eksperiment til dato, " sagde Nathaniel Mahieu, en postdoc i Pattis laboratorium, der ledede undersøgelsen.

Sagde Patti:"Million dollar spørgsmålet er:Hvor mange metabolitter svarer alle disse metabolomiske signaler egentlig til?"

Mahieu og Patti, der blev annonceret i sidste uge som en prismodtager for en otte-årig, $5,85 millioner tilskud til miljøsundhed fra National Institutes of Health, udviklet nye eksperimentelle og beregningsmæssige tilgange til at udspørge metabolomiske datasæt. De nåede frem til en slående konklusion. De fandt ud af, at det faktiske antal metabolitter i en typisk metabolomisk analyse kan være en tiendedel så stort som tidligere foreslået, med meget af dataene fra "støj". Tusindvis af signaler opstår fra forurening, artefakter, og noget, der kaldes "degeneration" - sig, når én metabolit viser så mange forskellige signaler. Forskerholdet fandt ud af, at nogle metabolitter viser sig som mere end 150 signaler.

"Det viser sig, at mere end 90 procent af de signaler, vi ser i E. coli-data, i det væsentlige er støj, " sagde Mahieu. "Dette reducerer i høj grad antallet af ukendte metabolitter, som vi troede, vi opdagede."

"Jeg tror, ​​det her er en slags wake-up call, et realitetstjek om du vil, på hvad metabolomics antyder om størrelsen af ​​metabolomet, " sagde Patti. "Jeg tror, ​​det er en god ting. Det betyder, at vi er meget tættere på at forstå stofskiftet, end vi nok troede, vi var."

Med hensyn til næste trin, Pattis laboratorium har til hensigt at udvide deres teknikker til menneskelige prøver.

"Det ultimative mål er at lave analoge eksperimenter for mennesker, " sagde Patti. "Vores arbejde her er et vigtigt skridt fremad."

Så hvad betyder alle disse støjsignaler for andre forskere, der udfører metabolomics? Patti-laboratoriet er begyndt at kurere, hvad de kalder "referencedatasæt" i en database kaldet creDBle (creDBle.wustl.edu). De håber, at det vil lette eksperimenter for andre forskere, der udfører metabolomics.

"Måden metabolomics udføres i øjeblikket er frygtelig ineffektiv. Vi spilder en masse tid på at forsøge at fortolke signaler, der giver minimal biologisk indsigt, " sagde Mahieu. "Vi håber, at disse referencedatasæt i creDBle vil hjælpe med at forhindre videnskabsmænd i at skulle identificere de samme støjsignaler igen og igen, nu hvor vi har kommenteret dem."


Varme artikler