Statusside for "End of Watch (Bill Hodges Trilogy #3) af Stephen King". Kredit:Maity, Panigrahi og Mukherjee.
Forskere ved Northwestern University, Microsoft Research Indien, og Indian Institute of Technology Kharagpur har for nylig udviklet en model til at forudsige, om en bog bliver en bestseller på Amazon inden for 15 dage efter udgivelsen. Deres model, skitseret i en undersøgelse, der er forudpubliceret på arXiv, fungerer ved at analysere læseadfærd på online platformen Goodreads.
"Vi har arbejdet på at analysere popularitetsdynamikken for forskellige sociale medier, såsom hashtags på Twitter, emner i Quora osv." Animesh Mukherjee, fortalte en af forskerne, der udførte undersøgelsen, til TechXplore. "Vi følte, at en lignende tilgang kunne anvendes til at analysere bøgernes popularitet, og vi fandt, at Goodreads var ideel til denne undersøgelse."
En bogs popularitet afhænger af en lang række faktorer og kan måles ved hjælp af flere parametre. I deres undersøgelse, forskerne fokuserede på, hvordan boglæsekarakteristika påvirker dens popularitet. De udførte en cross-platform analyse af Goodreads-enheder og forsøgte at forbinde disse med salgsvolumen for bøger på Amazon.
"Vi fulgte den intuition, at bøgernes popularitet for det meste er drevet af dets læsere, deraf motivationen til at uddrage boglæseadfærd for at forstå bøgernes fremtidige popularitet, " sagde Mukherjee. "En af de bedste måder at kvantificere bøgernes popularitet på er at se på dets salgsrekord. Dermed, vi forsøgte at kvantificere ideen om popularitet i forhold til Amazons bestsellere."
Til at starte med, forskerne analyserede brugernes kollektive læseadfærd på Goodreads. De kvantificerede derefter forskellige karakteristiske træk ved Goodreads-enheder, som kunne bruges til at identificere forskelle mellem Amazon bestsellere og andre mindre sælgende bøger. Endelig, de udviklede en maskinlæringsbaseret model, der bruger disse karakteristiske egenskaber til at forudsige, om en bog bliver en bestseller 15 dage efter dens udgivelse.
"Vi brugte avancerede maskinlæringsmodeller til at udføre vores forudsigelser, " Mukherjee forklarede. "Vi observerede, at vurderinger og anmeldelser modtaget af en bog om Goodreads ikke er så effektive til at forudsige bestsellerne som brugernes læsestatusindlægsmønstre. For eksempel, i Goodreads, en læser kan skrive, hvor meget af bogen der er blevet læst, hvilken side han/hun er på, kan kommentere om bogen osv. Vi finder disse funktioner meget effektive til at forudsige, om bogen bliver en bestseller i fremtiden."
Karakteristiske egenskaber for Goodreads-brugeres statusindlæg:fordeling af a) antal statusopdateringer pr. bruger b) antal unikke brugere, der opdaterer status c) antal brugere, der opdaterer flere gange d) ankomsttidspunkt mellem status e) gennemsnitlig maksimal læsningsstrækning f ) gennemsnitlig tid til at afslutte læsningen for ABS vs. andre bøger. Kredit:Maity, Panigrahi og Mukherjee.
Deres model opnåede en meget lovende gennemsnitlig nøjagtighed på 88,72 procent i at forudsige bøger, der ville blive Amazons bestsellere få uger efter deres udgivelse. Deres metode, som var baseret på funktioner afledt af brugerindlæg og genrerelaterede egenskaber, opnåede en forbedring på 16,4 procent sammenlignet med baseline-metoder, der kun bruger traditionelle popularitetsfaktorer, såsom bogbedømmelser eller anmeldelser.
"En af de vigtigste indsigter, som vi opnår fra denne undersøgelse, er, at Amazons bestsellerbøger måske ikke nødvendigvis er kvalificeret af højkvalitets anmeldelsestekster fra læserne eller en høj mængde vurderinger, " sagde Mukherjee. "I modsætning hertil, et stort flertal af dem har læserstatusindlægsmønstre, der adskiller dem stærkt fra resten af bøgerne."
Forskerne vurderede også, hvor godt deres metode kunne forudsige yderligere to typer bøger:højt vurderede bøger, der modtager et stort antal anmeldelser, men som ikke er bestsellere (HRHR), og Goodreads Choice Award-nominerede (GCAN) bøger, der ikke er bestsellere. De opnåede en høj gennemsnitlig nøjagtighed på 87,1 procent for GCAN og på 86,22 procent for HRHR-bøger.
"Vi mener, at dette arbejde er et vigtigt bidrag til den nuværende litteratur, da det ikke kun udfolder den kollektive læseadfærd på en social boglæseplatform gennem en streng måleundersøgelse, men også etablerer en stærk forbindelse mellem to ortogonale kanaler - Goodreads og Amazon, " sagde Mukherjee.
Modellen udviklet af Mukherjee og hans kolleger kunne fremme udviklingen af værktøjer, der bygger bro mellem Amazon og Goodreads via nye cross-platform policy designs. De mener, at sådanne interaktioner kan være en af årsagerne bag Amazons opkøb af Goodreads i marts 2013. Forskerne søger nu at udvide deres undersøgelse ved yderligere at analysere brugernes læseadfærd.
"Der er flere retninger, som vi planlægger at udforske i fremtiden, " sagde Mukherjee. "Den ene er at undersøge populariteten af forskellige genrer af bøger - f.eks. hvad er statuspostmønstrene på tværs af forskellige genrer af bøger? En anden er at studere genre- og læserdemografiens indbyrdes dynamik. For eksempel, hvordan adskiller læseadfærd hos mænd sig fra kvinder, eller hvordan adskiller de sig fra forskellige kontinenter?"
© 2018 Tech Xplore