Med hver nyhedshistorie, begreberne data mining data sundhedsoplysninger bevæger sig stadig højere op på forsknings- og politisk dagsorden på dette område. Kliniske oplysninger og genetiske data indeholdt i elektroniske sundhedsjournaler (EHR'er) repræsenterer en vigtig kilde til nyttig information til biomedicinsk forskning, men det kan være svært at få adgang til dem på en nyttig måde.
Skrev i International Journal of Intelligent Engineering Informatics, Hassan Mahmoud og Enas Abbas fra Benha University og Ibrahim Fathy Ain Shams University, i Egypten, diskutere behovet for innovative og effektive metoder til at repræsentere denne enorme mængde data. De påpeger, at der findes data miningsteknikker samt ontologi-baserede teknikker, der kan spille en stor rolle i at opdage syndromer hos patienter effektivt og præcist. Et syndrom er defineret som et sæt af samtidige medicinske symptomer og indikatorer forbundet med en given sygdom eller lidelse.
Teamet har gennemgået den nyeste teknik og også fokuseret på at gennemgå de velkendte data mining teknikker såsom beslutningstræer (J48), Naive Bayes, flerlags perceptron (MLP), og tilfældige skov (RF) teknikker og sammenlignede, hvor godt de hver især klarer sig i klassificeringen af et bestemt syndrom, hjerte sygdom.
Teamet konkluderer, at i eksperimenter med et offentligt datasæt, RF -klassifikatoren giver den bedste ydelse med hensyn til nøjagtighed. I fremtiden, de foreslår, at datadrift vil gavne sundhedspleje og medicin, der er væsentlige for at opbygge et system, der er i stand til at opdage et specifikt syndrom.