I et papir for nylig offentliggjort i Nature Communications , HUN-REN-ELTE Protein Modeling Research Group (Institute of Chemistry) har lagt grundlaget for en matematisk metode, der muliggør en computerstøttet sammenligning af proteiners tredimensionelle strukturer. Metoden er unik ved, at mens de hidtil tilgængelige alternativer kun har taget højde for atomernes position, omfatter den nye teknik, kaldet LoCoHD (Local Composition Hellinger Distance), også atomernes kemiske information.
Proteiner er molekylære maskiner, der udfører processer, der er nødvendige for, at celler kan fungere, fungerer som molekylære omskiftere, transskriberer information fra DNA, transporterer små og store molekyler og regulerer metabolismerelaterede kemiske reaktioner. Men for at alt dette skal lykkes, skal det pågældende protein have den rette rumlige konformation, dvs. sit eget, korrekte 3D-arrangement.
Adskillige eksperimentelle metoder (røntgenkrystallografi, kernemagnetisk resonansspektroskopi, kryo-elektronmikroskopi) er tilgængelige til at bestemme arrangementet af atomer i et protein, og i løbet af de sidste par årtier har proteinforskere opdaget formen på næsten 220.000 proteiner. Disse resultater kræver i stigende grad udvikling af beregningsmetoder, der er i stand til at analysere disse arrangementer.
En sådan metode er algoritmen kaldet LoCoHD, udviklet af Zsolt Fazekas, en Ph.D. kandidat ved ELTE Hevesy György School of Chemistry og forsker i Dr. András Perczels forskningsgruppe. Algoritmen sammenligner lokale miljøer omkring aminosyrer i proteiner baseret på deres kemiske natur (f.eks. grundstofsammensætning, ladning, hydrofobicitet osv.).
Metoden afgør på en simpel skala fra 0 til 1, hvor forskellige de pågældende strukturer er fra hinanden. Værdier tæt på 0 tyder på en høj lighed mellem atomarrangementer og kemiske egenskaber, mens værdier tæt på 1 indikerer, at de proteiner, der sammenlignes, kan have meget forskellige egenskaber. Den resulterende numeriske værdi (en såkaldt metrik) kan således bruges til at få ny information om det undersøgte system.
Algoritmen bruger en flertrinsprotokol til at generere det tal, der repræsenterer de strukturelle forskelle. I det første trin omdanner den rigtige atomer i proteinet til såkaldte primitive atomer. Disse kan repræsenteres som virtuelt mærkede positioner, hvis mærker fortæller den kemiske natur af det oprindelige atom.