Videnskab
 science >> Videnskab >  >> Andet

Maskinlæring forbedrer søgninger i verdens største biomedicinske litteraturdatabase

Resultater sorteret efter relevans, i stedet for dato, give en forbedret oplevelse for brugere af PubMed, verdens største biomedicinske litteraturdatabase, ifølge en undersøgelse, der blev offentliggjort den 28. august i open access-tidsskriftet PLOS biologi af Zhiyong Lu og kolleger ved National Library of Medicine (NLM)/National Center for Biotechnology Information (NCBI), som udvikler og vedligeholder PubMed.

PubMed indeholder over 28 millioner artikelabstrakter fra den biomedicinske litteratur, med et gennemsnit på yderligere to tilføjet hvert minut. Det er en uundværlig ressource, globalt i omfang, tilgås af millioner af brugere hver dag. Fra dens begyndelse, søgeresultater blev kun returneret i omvendt kronologisk rækkefølge, seneste først, et rangeringssystem, der lagde vægt på nyligt frem for relevans for søgeforespørgslen. I 2013 et relevansrangeringssystem blev indført, men det afhang af kunstige vægtningsfaktorer og krævede løbende manuel justering.

I juni 2017 NLM/NCBI-medarbejdere introducerede en maskinlæringsalgoritme, som trækker på snesevis af relevanssignaler, herunder brugersvar – specifikt, hyppigheden af ​​klik-throughs til de artikler, der returneres for en given søgning - for at forbedre relevansrangeringen. Dette rangordningssystem, kaldet bedste match, tilbydes som et alternativ til kronologisk rækkefølge. Holdet fandt ud af, at klikraten steg 20 % på de returnerede resultater af Best Match sammenlignet med de samme resultater, der blev præsenteret kronologisk. Den samlede brug af relevanssortering steg fra 7,5 % af alle søgninger før introduktionen af ​​Best Match til 12 % fra april 2018. Da maskinlæringssystemer er afhængige af brugerinput for at forbedre, stigningen i brugen skulle gøre det muligt for systemet at "lære sig selv" at blive mere værdifuldt for dets brugere over tid.

"Samlet set, den nye Best-Match-algoritme viser en betydelig forbedring i at finde relevant information i forhold til standardtidsrækkefølgen i PubMed, " sagde forfatterne. "Vi opfordrer PubMed-brugere til at prøve denne nye relevanssøgning og give input til at hjælpe os med at fortsætte med at forbedre rangeringsmetoden."


Varme artikler