Dette er en computergrafik af et RNA-molekyle. Kredit:Richard Feldmann/Wikipedia
Forskere ved Oregon State University har udviklet et computerprogram, der repræsenterer et vigtigt skridt mod bedre forståelse af sammenhængen mellem mutant genetisk materiale og sygdom.
Kendt som bpRNA, softwaren er et big-data annotationsværktøj til sekundære strukturer i ribonukleinsyrer.
"Det er i stand til at analysere RNA-strukturer, herunder komplekse pseudoknot-holdige RNA'er, så du ender med et mål, præcis, let fortolkelig beskrivelse af alle sløjfer, stilke og pseudoknoter, " sagde den tilsvarende forfatter David Hendrix. "Du får også stillingerne, sekvens og flankerende basepar af hvert strukturelt træk, som sætter os i stand til at studere RNA-struktur i massevis i stor skala."
RNA arbejder med DNA, den anden nukleinsyre - så navngivet, fordi de først blev opdaget i cellekerner af levende ting - for at producere de proteiner, der er nødvendige i hele kroppen. DNA indeholder en persons arvelige information, og RNA leverer informationens kodede instruktioner til proteinfremstillingsstederne i cellerne. Mange RNA-molekyler koder ikke for et protein, og disse er kendt som ikke-kodende RNA'er.
"Der er masser af eksempler på sygdomsassocierede mutationer i ikke-kodende RNA'er, der sandsynligvis påvirker deres struktur, og for statistisk at analysere, hvorfor disse mutationer er forbundet med sygdom, er vi nødt til at automatisere analysen af RNA-struktur, " sagde Hendrix, adjunkt i biokemi og biofysik på College of Science. "RNA er en af de grundlæggende, essentielle molekyler for livet, og vi er nødt til at forstå RNA's struktur for at forstå, hvordan de fungerer."
Sekundære strukturer er de baseparrende interaktioner inden for en enkelt nukleinsyrepolymer eller mellem to polymerer. DNA har hovedsageligt fuldt baseparrede dobbeltspiraler, men RNA er enkeltstrenget og kan danne komplicerede interaktioner.
Hendrix siger bpRNA, præsenteret denne måned i et papir i Nukleinsyreforskning , har den største og mest detaljerede database til dato med sekundære RNA-strukturer.
"For at være retfærdig er det en meta-database, men vores specielle sauce er værktøjet til at kommentere alt, " sagde Hendrix, som også er adjunkt i OSU College of Engineering. "Før var der ingen måde at sige, hvor alle de strukturelle funktioner var på en automatiseret måde. Vi leverer et farvekodet kort over, hvor alt er. Disse annoteringer vil gøre os i stand til at identificere statistiske tendenser, der kan kaste lys over RNA-strukturdannelse og evt. åbne døren for maskinlæringsalgoritmer til at forudsige sekundær RNA-struktur på måder, der ikke har været mulige."
Forskere har med succes testet værktøjet på mere end 100, 000 strukturer, "hvoraf mange er meget komplekse, med masser af komplekse pseudoknoter."
"Hver dag opdages nye RNA'er, og forskere gør store fremskridt med at forstå deres funktion, " sagde Hendrix. "Vi er begyndt at forstå, at genomet er fuld af ikke-kodende RNA'er ud over messenger RNA'er, og de er vigtige biologiske molekyler med store effekter på menneskers sundhed og sygdomme."