Lange ikke-kodende RNA'er (lncRNA'er) er allestedsnærværende transkripter med afgørende regulatoriske roller i forskellige biologiske processer, herunder kromatin-ombygning, post-transkriptionel regulering og epigenetiske modifikationer. Mens akkumulering af beviser belyser mekanismer, hvorved plante-lncRNA'er modulerer vækst, rodudvikling og frøhvile, er deres nøjagtige identifikation fortsat udfordrende på grund af mangel på plantespecifikke metoder.
I øjeblikket er de almindelige metoder til plante-lncRNA-identifikation stort set udviklet baseret på menneske- eller dyredatasæt. Følgelig er nøjagtigheden og effektiviteten af disse metoder til at forudsige plante-lncRNA'er ikke blevet fuldt ud evalueret.
For nylig blev en forskningsartikel med titlen "Plant-LncPipe:a computational pipeline providing significant improvement in plant lncRNA identification" af en gruppe ledet af Jian-Feng Mao fra Beijing Forestry University og Umeå University publiceret i Horticulture Research .
Denne undersøgelse indsamlede i vid udstrækning højkvalitets RNA-sekventeringsdata fra forskellige planter og brugte disse plantespecifikke data til at genoptræne modellerne af tre almindelige lncRNA-forudsigelsesværktøjer, nemlig CPAT, LncFinder og PLEK. Ydeevnen af de omskolede modeller blev sammenlignet og evalueret mod andre populære lncRNA-forudsigelsesværktøjer, såsom CPC2, CNCI, RNAplonc og LncADeep.
Resultaterne viste, at de omskolede modeller signifikant forbedrede forudsigelsesydelsen for plante-lncRNA'er. Blandt dem klarede to omskolede modeller, LncFinder-plante og CPAT-plant, sig bedre end andre på flere evalueringsmetrikker, hvilket gør dem til de bedst egnede værktøjer til plante-lncRNA-identifikation.
Denne forskning udviklede en beregningsmæssig pipeline ved navn Plant-LncPipe til identifikation og analyse af plante-lncRNA'er.
Denne pipeline integrerer to toppræsterende identifikationsmodeller, CPAT-anlæg og LncFinder-anlæg, hvilket muliggør en omfattende beregningsproces, der omfatter forbehandling af rådata, transskriptionssamling, lncRNA-identifikation, lncRNA-klassificering og lncRNA-oprindelse. Denne beregningsmæssige pipeline kan anvendes bredt til forskellige plantearter. Plant-LncPipe er offentligt tilgængelig.
Undersøgelsen viser, at genoptræning af lncRNA-forudsigelsesmodeller på plantetranskriptomiske data af høj kvalitet muliggjorde mere nøjagtig indfangning af plante-lncRNA-funktioner, hvilket væsentligt forbedrede forudsigelsespræcision og pålidelighed. Undersøgelsen understregede vigtigheden af artsspecifik genoptræning for at forbedre modellens nøjagtighed. Genoplæring af eksisterende modne modeller bibeholdt tidligere akkumuleret erfaring og metoder, samtidig med at modellens anvendelighed og nøjagtighed øgedes yderligere.
Flere oplysninger: Xue-Chan Tian et al., Plant-LncPipe:en beregningsmæssig pipeline, der giver betydelig forbedring i plante-lncRNA-identifikation, Harticulture Research (2024). DOI:10.1093/time/uhae041
Journaloplysninger: Gavebrugsforskning
Leveret af Chinese Academy of Sciences
Sidste artikelTexanere opfordrede til at slukke nattelys under fugletræk
Næste artikelForskere finder ud af, at calcium kan beskytte kartoffelplanter mod bakteriel visne