Forskere har brugt Diamond Light Source til at udvikle en ny metode til at udtrække tidligere skjult information fra røntgendiffraktionsdata, der måles, når de tredimensionelle (3D) atomare strukturer af proteiner og andre biologiske molekyler opløses.
Når man forsøger at udvikle kemiske forbindelser til potente lægemiddelkandidater, forskere forsøger at studere de atomare detaljer af, hvordan forbindelser binder til deres målproteiner. For at gøre det, de sammenligner røntgendata målt i både tilstedeværelse og fravær af forbindelsen. Imidlertid, med eksisterende analysealgoritmer, dette forskelssignal kan ofte oversvømmes af støj fra eksperimentartefakter, hvilket gør det meget upålideligt at fortolke det observerede signal.
Den nye Pan-Dataset Density Analysis (PanDDA) metode ekstraherer billedet af den bundne forbindelse i usædvanlig klare og utvetydige detaljer. PanDDA identificerer først kilden til støjen, og fjerner det derefter fra dataene. Det udnytter Diamonds evne til at gentage snesevis til hundredvis af målinger hurtigt, som så karakteriseres for forskelle mellem dem, indikerer tilstedeværelsen af bundet forbindelse, hvorefter der anvendes en støjkorrektion i 3D. Resultaterne offentliggøres i dag i Naturkommunikation .
Makromolekylær krystallografi (MX), teknikken som PanDDA anvender til, er et af de mest kraftfulde værktøjer, der bruges af forskere, der er interesseret i at bestemme 3D-strukturerne af store biologiske molekyler, herunder proteiner, og er arbejdshestens eksperiment for rationelt lægemiddeldesign.
"Problemet med at identificere bindingshændelser i krystallografiske datasæt kan føles som at lede efter en nål i en høstak, " forklarer Dr Nicholas Pearce, hovedforfatter på papiret, der kommer fra hans ph.d.-projekt ved University of Oxford i Systems Approaches for Biomedical Science (SABS) Center for Doctoral Training, hvor han i fællesskab blev finansieret af UCB Pharma og Diamond. "I tilfælde af de data, vi analyserede, det var endnu værre, fordi vi havde hundredvis af høstakke, og vidste ikke, hvilken af dem der indeholdt nåle." Nick er nu baseret i Crystal &Structural Chemistry Group ved Universiteit Utrecht.
Forskerne kunne med fordel udnytte det faktum, at de fleste af målingerne var fra 'tomme' krystaller, der ikke indeholdt en bundet ligand, giver dem mulighed for at karakterisere den ubundne form og blot lede efter datasæt, der var anderledes.
"I krystallografi kan du ofte savne 'svage' bundne former, fordi hver måling er en superposition af de bundne og ubundne former, " fortsætter Dr. Pearce. "Dette er beslægtet med flere ark kalkerpapir, hver med et af mindst to billeder, alle overlejret oven på hinanden."
"Når du forsøger at identificere billedet på kun et af 'arkene', det bliver forvirret af, hvad der viser sig fra alle de andre ark, så billedet bliver modtageligt for fortolkningsfejl, " tilføjer Dr. Pearce. "For at overvinde dette, vi udviklede en metode til at udtrække det rigtige sæt 'ark' fra superpositionen; når vi havde gjort det, at fortolke den bundne form bliver meget lettere, og sætter os i stand til at fortolke dataene med sikkerhed, og opbygge modeller af de interessante tilstande i dataene."
"Grundideen er konceptuelt meget enkel, nemlig at behandle den forvirrende superposition som et baggrundskorrektionsproblem, " forklarer professor Frank von Delft, som i fællesskab er hovedforsker for Protein Crystallography-gruppen i Structural Genomics Consortium (SGC) ved University of Oxford, og Principal Beamline Scientist af I04-1 beamline hos Diamond. "Imidlertid, et nøjagtigt skøn over baggrunden er afgørende, og i praksis var dette utænkeligt indtil fremkomsten af den nye robotteknologi, der tilbydes af Diamond, hvilket gør det rutinemæssigt at foretage så store antal målinger."
"UCB er glad for at have arbejdet tæt sammen med Diamond om udviklingen af PanDDA og dets applikation til screening af krystallografiske fragmenter, " kommenterer Dr. Neil Weir, Senior Vice President for Discovery hos UCB Pharma. "Som et direkte resultat, vi har været i stand til at identificere fragmenter, som ellers ikke kunne skelnes fra baggrunden, bundet til et nøgleprotein-proteininteraktionslægemiddelmål."
Forskningen involverede produktion af omkring 860 datasæt, hvoraf kun 75 indeholder en bundet form for interesse for forskerne. "Selv om det er generelt gældende i MX, metoden er især transformativ for en version af MX-eksperimentet kaldet fragmentscreening, hvor de effekter, vi leder efter, er meget sjældne og endnu sværere at verificere med konventionelle algoritmer, " fortsætter von Delft.
En afgørende koda for arbejdet var upload af alle strukturer til Protein Data Bank (wwPDB), online-lageret af 3D-strukturer af proteiner og nukleinsyrer, hvor alle har fuldstændig fri adgang til alle strukturer, der nogensinde er offentliggjort. Et af wwPDB værtswebstederne, RCSB PDB, for nylig udviklet et nyt gruppeaflejringsværktøj for at tillade masseupload af strukturer, og dette var afgørende for at gennemføre dette samarbejde.
RCSB PDB Group Deposition-systemet giver forfattere mulighed for at drage fordel af lokale skabeloner og PDB_extract til batchbehandling, pakning, upload, anmeldelse, validering, og et-klik indsendelse af mange strukturer på én gang. Søgning efter gruppetitlen "PanDDA-analysegruppeaflejring" på rcsb.org vil returnere disse 860 aflejringer.
"Diamond- og PDB-grupperne har opnået noget ganske utroligt, og vi har været glade for at kunne hjælpe dem," siger Aled Edwards, Direktør for SGC. "I would also like to highlight the team's commitment to open science. By placing all the research output into the public domain, they have ensured that the data can be used by all."
Now celebrating its 10th year of research and innovation, Diamond is committed to working with our users to enable them to carry out world-leading research at the facility.
"We've come a long way in the last ten years, and collaborations like these are key to how we will maintain our place as a key facility for researchers working in the life sciences, " adds Professor Dave Stuart, Director of Life Sciences at Diamond. "The idea that we can clearly see weak binding events is particularly exciting and something we're looking forward to sharing with our crystallography community."
The researchers hope that this new method will provide a significant shift in how crystallographic models are generated; opening windows to explore more poorly ordered crystals.