I en nylig Kemiske anmeldelser artikel, Spanske forskere har offentliggjort den første udtømmende revision af de state-of-the-art metoder, der ligger til grund for kemiske søgemaskiner, navngivne enhedsgenkendelse og tekstminedriftssystemer.
Det hurtigt voksende felt inden for big data -applikationer inden for biomedicinsk forskning, sammen med brugen af machine learning og kunstig intelligens teknologier til tekstdatamining, har resulteret i lovende værktøjer. Forfatterne skriver, "Denne gennemgang er tilrettelagt for at tjene som en praktisk vejledning til forskere, der går ind på dette område, men også for at hjælpe dem med at forestille sig de næste trin på dette nye datavidenskabelige område."
"Gennem frigivelsen af Gold Standard -datasæt og tilrettelæggelsen af flere benchmark -begivenheder for samfundsudfordringer, den biologiske tekstminedrift har spillet en kritisk rolle i udviklingen og evalueringen af nuværende kemiske tekstminedriftssystemer, som fremhævet i denne artikel, "forklarer Martin Krallinger, enhedschef og medforfatter af anmeldelsen.
En enorm mængde ustrukturerede data
En betydelig brøkdel af biomedicinsk relevante data er kun tilgængelig i form af ustrukturerede data. Denne type data omfatter hurtigt voksende videnskabelig litteratur, patenter til medicinsk kemi, elektroniske sundhedsjournaler og kliniske forsøgsdokumenter. Faktisk, hvert år, over 20, 000 nye forbindelser offentliggøres i medicinske og biologiske kemiske tidsskrifter.
At være i stand til at transformere ustrukturerede biomedicinske forskningsdata til strukturerede databaser, der kan behandles mere effektivt af maskiner eller forespørges af mennesker, er afgørende for en række heterogene applikationer. Disse omfatter identifikation af nye lægemiddelmål og kemiske sonder for at validere/kassere disse nye potentielle mål, omformulering af godkendte lægemidler, identifikation af uønskede lægemiddelhændelser eller hentning af systembiologi forbundet med kemisk sygdom eller kemisk-genetiske netværk.
Som en terapeutisk strategi til behandling af medicinske behov, kemiske forbindelser udgør en nøgletypetype af kritisk relevans for biomedicinsk forskning. "Opførelsen af store kemiske vidensbaser, integrering af kemisk information med biologiske og kliniske data, er afgørende for at identificere og validere nye terapeutiske mål for uopfyldte medicinske behov samt for at fremskynde processen med opdagelse af lægemidler, "siger Julen Oyarzabal, direktør for translationelle videnskaber ved CIMA og medleder af denne rapport.
Sidste artikelProteser med kontrolleret nedbrydningshastighed
Næste artikelAt finde ud af molekylernes 3D-form med et tryk på en knap