Videnskab
 science >> Videnskab >  >> Biologi

CMU-software samler RNA-transkriptioner mere præcist

En hårnålesløjfe fra et præ-mRNA. Fremhævet er nukleobaserne (grønne) og ribose-phosphat-rygraden (blå). Bemærk, at dette er en enkelt streng af RNA, der foldes tilbage på sig selv. Kredit:Vossman/ Wikipedia

Beregningsbiologer ved Carnegie Mellon University har udviklet en mere nøjagtig beregningsmetode til at rekonstruere nukleotidsekvenserne i fuld længde af RNA-produkterne i celler, kaldet afskrifter, der transformerer information fra et gen til proteiner eller andre genprodukter.

Deres software, kaldet kammusling, vil hjælpe videnskabsmænd med at opbygge et mere komplet bibliotek af RNA-transkripter og dermed hjælpe videnskabsmænd med bedre at forstå reguleringen af ​​genekspression.

En rapport om kammusling af Carl Kingsford, lektor i beregningsbiologi, og Mingfu Shao, Lane Fellow i School of Computer Science's Computational Biology Department, udgives online i dag af tidsskriftet Natur bioteknologi .

Kammusling er en såkaldt transcript assembler, tage fragmenter af RNA-sekvenser, kaldet læser, der er produceret af high-throughput RNA-sekventeringsteknologier (RNA-seq), og sætte dem sammen igen, som brikker af et puslespil, at rekonstruere komplette RNA-transkripter.

"Der er mange eksisterende samlere, "Shao sagde, "men disse eksisterende metoder er stadig ikke nøjagtige nok."

Sammenlignet med to førende samlere, StringTie og TransComb, Kammusling er 34,5 procent og 36,3 procent mere nøjagtig for transkripter bestående af flere exoner - underenheder af et gen, der koder for en del af genproduktet.

Ligesom andre referencebaserede samlere, Kammusling begynder med at konstruere en graf for at organisere læsninger, der er kortlagt til de tilsvarende steder på genets DNA. Der findes mange alternative veje til at forbinde læsningerne sammen, imidlertid, så fejl kan nemt laves. Scallop forbedrer sine odds ved at bruge en ny algoritme til at drage fuld fordel af informationen fra læsninger, der spænder over flere exoner for at guide den til de korrekte samlingsstier.

Kammusling viser sig at være særlig dygtig, når den samler mindre rigelige RNA-transkripter, forbedring af nøjagtigheden af ​​StringTie og TransComb med 67,5 procent og 52,3 procent.

Forskerne har allerede frigivet Scallop som åben software på GitHub-depotet.

"Vi har allerede haft mere end 100 downloads, og baseret på den feedback, vi har modtaget, folk bruger det virkelig, "Shao sagde. "Vi forventer flere brugere nu, hvor vores papir er ude."