En egentlig videnskabelig artikel (fra KDD Cup-datasættet) med kendte citater blev brugt til at demonstrere, hvordan algoritmen kunne generere anbefalinger til forskere, der søger efter information inden for et relateret felt. Figuren viser de 15 bedste citater anbefalet af metrikken. Ud af disse 15 forudsagte citater, fem af dem (markeret med asterisker) var faktiske citater af artiklen. Sammenlignet med, andre metoder formåede ikke at forudsige nogen af de faktiske citater. De farvede segmenter i "emneproportionerne" angiver sandsynligheden for, at en artikel tilhører et specifikt emne. Kredit:Annals of Applied Statistics
En NUS-statistiker har udviklet en metrik, der automatisk tager højde for citationsvariationer i forskellige discipliner til måling af videnskabelige artiklers forskningsmæssige værdi.
Forskningsværdien (impact) af videnskabelige artikler bruges ofte som en af parametrene til at bedømme kvaliteten af forskningsresultater. Dette er normalt opnået fra citater af forskningsarbejde, der allerede er offentliggjort i tidsskriftet. Imidlertid, forskellige akademiske discipliner har forskellig forskningsadfærd og citeringspraksis. For eksempel, artikler inden for visse discipliner (f.eks. matematik) har generelt lave citater, mens andre områder (f.eks. molekylærbiologi) i sammenligning havde flere citater i gennemsnit. Derfor, en sammenligning af forskningskvalitet på tværs af forskellige discipliner baseret på rå citationsantal ville ikke afspejle forskningsværdien nøjagtigt.
Prof Linda TAN fra Institut for Statistik og Anvendt Sandsynlighed, NUS har udviklet en metrik på artikelniveau, kaldet "emnejusteret synlighedsmetrik", som automatisk er i stand til at redegøre for variationen i citeringsaktiviteter mellem forskellige forskningsfelter. Den beregner dette uden at bruge eksisterende feltklassifikationer tagget til den enkelte artikel, men ved at bruge et komplekst netværk, der indeholder attributter, der hører til den valgte artikel. Hver artikel behøver ikke at tilhøre et enkelt felt, men kan tilhøre flere felter med varierende grader. Dette kan give en bedre målestok til at sammenligne individuelle videnskabelige publikationer på tværs af forskellige områder. Forskerholdet har også udviklet en effektiv beregningsalgoritme ved hjælp af denne metrik til at hjælpe akademiske forskere med artikelanbefalinger.
Prof Tan sagde, "Når vores metode anvendes på KDD Cup 2003 (videnopdagelse og data mining-konkurrence) benchmarking-datasæt, som har cirka 30, 000 højenergifysikartikler, det demonstrerede bedre ydeevne for artikelanbefalinger ved at være mere præcis i at forudsige de faktiske citater fra testartikler, sammenlignet med andre tilgængelige modeller."