Videnskab
 science >> Videnskab >  >> Fysik

En offentlig database over makromolekylære diffraktionsforsøg

Hver prik dannes fra den konstruktive interferens af røntgenstråler, der passerer gennem en krystal. Dataene kan bruges til at undersøge krystallens struktur. Kredit:M. Grabowski et al.

Reproducerbarheden af ​​publicerede eksperimentelle resultater har for nylig tiltrukket opmærksomhed på mange forskellige videnskabelige områder. Manglen på tilgængelighed af originale primære videnskabelige data repræsenterer en vigtig faktor, der bidrager til problemer med reproducerbarhed, imidlertid, strukturbiologisamfundet har taget betydelige skridt i retning af at stille eksperimentelle data til rådighed.

Makromolekylær røntgenkrystallografi har ført vejen til at kræve offentlig formidling af atomkoordinater og et væld af eksperimentelle data via Protein Data Bank (PDB) og lignende projekter, hvilket gør feltet til et af de mest reproducerbare inden for de biologiske videnskaber.

IUCr bestilte Diffraction Data Deposition Working Group (DDDWG) i 2011 for at undersøge fordelene og gennemførligheden ved at arkivere rå diffraktionsbilleder i krystallografi. DDDWG-treårsrapporten 2011-2014 kom med flere vigtige anbefalinger vedrørende bevarelse af rådiffraktionsdata. Imidlertid, der er ikke noget mandat til offentliggørelse af de originale diffraktionsdata.

Den integrerede ressource for reproducerbarhed i makromolekylær krystallografi (IRRMC) er en del af Big Data to Knowledge -programmet fra National Institutes of Health og er udviklet til at arkivere rådata fra diffraktionsforsøg og, lige så vigtigt, at levere relaterede metadata. Databasen [Grabowski et al. (2016). Acta Cryst. D72, 1181-1193, DOI:10.1107/S2059798316014716], indeholder i skrivende stund 3070 makromolekylære diffraktionsforsøg (5983 datasæt) og deres tilsvarende delvist kuraterede metadata, tegner sig for omkring 3% af alle depositioner i Proteindatabanken. Ressourcen er tilgængelig på http://www.proteindiffraction.org og kan søges ved hjælp af forskellige kriterier via en simpel, strømlinet grænseflade. Alle data er tilgængelige for ubegrænset adgang og download. Ressourcen fungerer som et bevis på konceptet og demonstrerer muligheden for at arkivere rådiffraktionsdata og tilhørende metadata fra røntgenkrystallografiske undersøgelser af biologiske makromolekyler.

Taler med en reporter om projektet, teamleder Wladek Minor sagde, "Der er så meget forskning i gang, at det hele ikke kan offentliggøres, og ofte vises resultaterne af mislykkede undersøgelser ikke i litteraturen. Jeg tror, ​​at nøglen til succes er at vide om mislykkede eksperimenter, vi vil vide, hvorfor de fejler ".

Målet med projektet er at udvide IRRMC og inkludere datasæt, der ikke gav røntgenstrukturer. Dette kan lette samarbejdsindsatsen for at forbedre metoder til bestemmelse af proteinstrukturer og også sikre tilgængeligheden af ​​"forældreløse" data efterladt af individuelle efterforskere og/eller uddøde strukturelle genomiske projekter.

Varme artikler