Ved hjælp af beregningsanalyse har forskere fundet ud af, at mange gentagne sekvenser deles på tværs af proteiner og ligner hinanden i arter fra bakterier til mennesker. Kredit:Byron Lee et al., eLife (2022). DOI:10.7554/eLife.77058
Omkring 70 % af alle humane proteiner omfatter mindst én sekvens bestående af en enkelt aminosyre, der gentages mange gange, med et par andre aminosyrer drysset ind. Disse "lavkompleksitetsregioner" findes også i de fleste andre organismer.
Proteinerne, der indeholder disse sekvenser, har mange forskellige funktioner, men MIT-biologer har nu fundet på en måde at identificere og studere dem som en samlet gruppe. Deres teknik giver dem mulighed for at analysere ligheder og forskelle mellem LCR'er fra forskellige arter og hjælper dem med at bestemme funktionerne af disse sekvenser og proteinerne, hvori de findes.
Ved hjælp af deres teknik har forskerne analyseret alle de proteiner, der findes i otte forskellige arter, fra bakterier til mennesker. De fandt ud af, at selvom LCR'er kan variere mellem proteiner og arter, deler de ofte en lignende rolle - og hjælper det protein, hvori de er fundet, at slutte sig til en større samling såsom nukleolus, en organel, der findes i næsten alle menneskelige celler.
"I stedet for at se på specifikke LCR'er og deres funktioner, som kan virke adskilte, fordi de er involveret i forskellige processer, giver vores bredere tilgang os mulighed for at se ligheder mellem deres egenskaber, hvilket tyder på, at LCR'ernes funktioner måske ikke er så forskellige alligevel ," siger Byron Lee, en MIT kandidatstuderende.
Forskerne fandt også nogle forskelle mellem LCR'er af forskellige arter og viste, at disse artsspecifikke LCR-sekvenser svarer til artsspecifikke funktioner, såsom at danne plantecellevægge.
Lee og kandidatstuderende Nima Jaberi-Lashkari er hovedforfatterne af undersøgelsen, som vises i dag i eLife . Eliezer Calo, en assisterende professor i biologi ved MIT, er seniorforfatter af papiret.
Storstilet undersøgelse
Tidligere forskning har afsløret, at LCR'er er involveret i en række cellulære processer, herunder celleadhæsion og DNA-binding. Disse LCR'er er ofte rige på en enkelt aminosyre såsom alanin, lysin eller glutaminsyre.
At finde disse sekvenser og derefter studere deres funktioner individuelt er en tidskrævende proces, så MIT-teamet besluttede at bruge bioinformatik – en tilgang, der bruger beregningsmetoder til at analysere store sæt biologiske data – for at evaluere dem som en større gruppe.
"Det, vi ønskede at gøre, er at tage et skridt tilbage og i stedet for at se på individuelle LCR'er, at prøve at se på dem alle og se, om vi kunne observere nogle mønstre i større skala, der kan hjælpe os med at finde ud af, hvad dem, der har tildelt funktioner, laver, og hjælper os også med at lære lidt om, hvad dem, der ikke har tildelte funktioner, laver," siger Jaberi-Lashkari.
For at gøre det brugte forskerne en teknik kaldet dotplot matrix, som er en måde at visuelt repræsentere aminosyresekvenser, til at generere billeder af hvert protein, der er under undersøgelse. De brugte derefter beregningsmetoder til billedbehandling til at sammenligne tusindvis af disse matricer på samme tid.
Ved hjælp af denne teknik var forskerne i stand til at kategorisere LCR'er baseret på hvilke aminosyrer, der oftest blev gentaget i LCR'en. De grupperede også LCR-holdige proteiner efter antallet af kopier af hver LCR-type fundet i proteinet. Analysen af disse egenskaber hjalp forskerne med at lære mere om funktionerne af disse LCR'er.
Som en demonstration valgte forskerne et humant protein, kendt som RPA43, der har tre lysinrige LCR'er. Dette protein er en af mange underenheder, der udgør et enzym kaldet RNA-polymerase 1, som syntetiserer ribosomalt RNA. Forskerne fandt ud af, at kopiantallet af lysinrige LCR'er er vigtigt for at hjælpe proteinet med at integrere sig i nukleolus, organellen, der er ansvarlig for syntetisering af ribosomer.
Biologiske samlinger
I en sammenligning af proteinerne fundet i otte forskellige arter fandt forskerne, at nogle LCR-typer er meget konserverede mellem arter, hvilket betyder, at sekvenserne har ændret sig meget lidt over evolutionære tidsskalaer. Disse sekvenser har en tendens til at blive fundet i proteiner og cellestrukturer, der også er meget konserverede, såsom nukleolus.
"Disse sekvenser ser ud til at være vigtige for samlingen af visse dele af nukleolus," siger Lee. "Nogle af de principper, der vides at være vigtige for samling af højere orden, ser ud til at være på spil, fordi kopiantallet, som kan kontrollere, hvor mange interaktioner et protein kan lave, er vigtigt for, at proteinet kan integreres i det rum."
Forskerne fandt også forskelle mellem LCR'er set i to forskellige typer proteiner, der er involveret i nukleolussamling. De opdagede, at et nukleolært protein kendt som TCOF indeholder mange glutaminrige LCR'er, der kan hjælpe med stilladsdannelsen af samlinger, mens nukleolære proteiner med kun få af disse glutaminsyrerige LCR'er kunne rekrutteres som klienter (proteiner, der interagerer med stilladset) ).
En anden struktur, der ser ud til at have mange bevarede LCR'er, er den nukleare pletter, som findes inde i cellekernen. Forskerne fandt også mange ligheder mellem LCR'er, der er involveret i at danne samlinger i større skala, såsom den ekstracellulære matrix, et netværk af molekyler, der giver strukturel støtte til celler i planter og dyr.
Forskerholdet fandt også eksempler på strukturer med LCR'er, der ser ud til at have divergeret mellem arter. For eksempel har planter karakteristiske LCR-sekvenser i proteinerne, som de bruger til at stilladsere deres cellevægge, og disse LCR'er ses ikke i andre typer organismer.
Forskerne planlægger nu at udvide deres LCR-analyse til yderligere arter.
"Der er så meget at udforske, fordi vi kan udvide dette kort til stort set enhver art," siger Lee. "Det giver os muligheden og rammerne for at identificere nye biologiske samlinger." + Udforsk yderligere
Denne historie er genudgivet med tilladelse fra MIT News (web.mit.edu/newsoffice/), et populært websted, der dækker nyheder om MIT-forskning, innovation og undervisning.