Videnskab
 Science >> Videnskab >  >> Biologi

Et nyt værktøj til plante-lang ikke-kodende RNA-identifikation

ROC-kurver af de omskolede og originale modeller på datasæt fra 20 plantearter. En ROC-kurver af den omskolede CPAT-plantemodel og dens sammenligning med de originale modeller for mennesker og mus. B ROC-kurver af den omskolede LncFinder-plantemodel og sammenligning med de originale modeller for mennesker, mus og hvede. C ROC-kurver af den omskolede PLEK-plantemodel og dens sammenligning med den originale model for mennesker. Kredit:Harticulture Research (2024). DOI:10.1093/hr/uhae041

Lange ikke-kodende RNA'er (lncRNA'er) er allestedsnærværende transkripter med afgørende regulatoriske roller i forskellige biologiske processer, herunder kromatin-ombygning, post-transkriptionel regulering og epigenetiske modifikationer. Mens akkumulering af beviser belyser mekanismer, hvorved plante-lncRNA'er modulerer vækst, rodudvikling og frøhvile, er deres nøjagtige identifikation fortsat udfordrende på grund af mangel på plantespecifikke metoder.



I øjeblikket er de almindelige metoder til plante-lncRNA-identifikation stort set udviklet baseret på menneske- eller dyredatasæt. Følgelig er nøjagtigheden og effektiviteten af ​​disse metoder til at forudsige plante-lncRNA'er ikke blevet fuldt ud evalueret.

For nylig blev en forskningsartikel med titlen "Plant-LncPipe:a computational pipeline providing significant improvement in plant lncRNA identification" af en gruppe ledet af Jian-Feng Mao fra Beijing Forestry University og Umeå University publiceret i Horticulture Research .

Denne undersøgelse indsamlede i vid udstrækning højkvalitets RNA-sekventeringsdata fra forskellige planter og brugte disse plantespecifikke data til at genoptræne modellerne af tre almindelige lncRNA-forudsigelsesværktøjer, nemlig CPAT, LncFinder og PLEK. Ydeevnen af ​​de omskolede modeller blev sammenlignet og evalueret mod andre populære lncRNA-forudsigelsesværktøjer, såsom CPC2, CNCI, RNAplonc og LncADeep.

Resultaterne viste, at de omskolede modeller signifikant forbedrede forudsigelsesydelsen for plante-lncRNA'er. Blandt dem klarede to omskolede modeller, LncFinder-plante og CPAT-plant, sig bedre end andre på flere evalueringsmetrikker, hvilket gør dem til de bedst egnede værktøjer til plante-lncRNA-identifikation.

Denne forskning udviklede en beregningsmæssig pipeline ved navn Plant-LncPipe til identifikation og analyse af plante-lncRNA'er.

Denne pipeline integrerer to toppræsterende identifikationsmodeller, CPAT-anlæg og LncFinder-anlæg, hvilket muliggør en omfattende beregningsproces, der omfatter forbehandling af rådata, transskriptionssamling, lncRNA-identifikation, lncRNA-klassificering og lncRNA-oprindelse. Denne beregningsmæssige pipeline kan anvendes bredt til forskellige plantearter. Plant-LncPipe er offentligt tilgængelig.

Undersøgelsen viser, at genoptræning af lncRNA-forudsigelsesmodeller på plantetranskriptomiske data af høj kvalitet muliggjorde mere nøjagtig indfangning af plante-lncRNA-funktioner, hvilket væsentligt forbedrede forudsigelsespræcision og pålidelighed. Undersøgelsen understregede vigtigheden af ​​artsspecifik genoptræning for at forbedre modellens nøjagtighed. Genoplæring af eksisterende modne modeller bibeholdt tidligere akkumuleret erfaring og metoder, samtidig med at modellens anvendelighed og nøjagtighed øgedes yderligere.

Flere oplysninger: Xue-Chan Tian et al., Plant-LncPipe:en beregningsmæssig pipeline, der giver betydelig forbedring i plante-lncRNA-identifikation, Harticulture Research (2024). DOI:10.1093/time/uhae041

Journaloplysninger: Gavebrugsforskning

Leveret af Chinese Academy of Sciences




Varme artikler