Kredit:University of California - San Diego
I maj -udgaven af PLOS Computational Biology , forskere fra UC San Diego og University of Notre Dame rapporterer om en undersøgelse, der kunne åbne feltet for nanopore-baseret proteinidentifikation - og i sidste ende proteomisk profilering af et stort antal proteiner i komplekse blandinger af forskellige typer molekyler.
Ifølge professor i datalogi og ingeniørvidenskab ved UC San Diego Pavel Pevzner, senior forfatter på papiret, den nye tilgang identificerer proteiner ved at analysere de forskellige elektriske signaler, der produceres, når molekylerne passerer gennem en nanopore (som fungerer som en si). I teorien, sagde Pevzner, nanoporer kunne give forskere mulighed for at karakterisere et stort antal proteiner i komplekse blandinger.
Mens nanoporer fungerer ekstremt godt til at analysere enkelte molekyler, de er mindre effektive, når man forsøger at karakterisere et stort antal proteiner i komplekse blandinger. Som resultat, den i øjeblikket foretrukne tilgang til screening af komplekse blandinger involverer anvendelse af andre teknikker, især massespektrometri. (Pevzner og professorerne i datalogi Vineet Bafna og Nuno Bandeira er hovedefterforskere af det NIH-finansierede Center for Computational Mass Spectrometry ved UC San Diego.)
Så sent som i 2016, førende nanopore-udviklere var pessimistiske med hensyn til at kunne anvende nanoporer til storstilet proteinprofilering på kort sigt. "Vi er ikke engang tæt på at gøre det i øjeblikket, "Oxford Nanopore medstifter Hagan Bayley fortalte GenomeWeb, tilføjer, at han "ikke ville sige, at det er et umuligt mål, men det er lidt af en strækning."
UC San Diegos Pevzner, imidlertid, mener, at et gennembrud er på vej. "Nøglen er at bruge maskinlæring til at analysere information genereret af proteiner, når de translokerer gennem en nanopore, " sagde Pevzner. "Ved at anvende maskinlæringsteknikker, vi var i stand til at identificere forskellige signaler, der kunne føre til storstilet nanopore-proteinanalyse. "
I et interview med GenomeWeb, Pevzner siger, at tidligt, forhindringerne virkede uoverskuelige. "Dataene var så støjende, at vi næsten troede, at vi skulle give op, " forklarede han. "Jeg har arbejdet i næsten 10 år nu med top-down massespektrometri, og i sammenligning med proteinidentifikation ved top-down massespektrometri, som efterhånden næsten er et modent område, det så ud til, at der ikke var noget håb om, at nanoporer kunne producere et sammenligneligt signal."
Derefter, da forskerne brugte et tilfældigt skovanalyseværktøj fra maskinlæring til problemet, alt ændrede sig. Genkaldte Mikhail Kolmogorov, en kandidatstuderende i Pevzners laboratorium:"Pludselig, signalets struktur dukkede op. "
Som anført i PLOS-papiret, forskerne hævder, at "den nuværende teknologi allerede er tilstrækkelig til at matche nanospectra mod små proteindatabaser, f.eks., proteinidentifikation i bakterielle proteomer. "