Generering af nye underholdningsdata. Kredit:MinDof/shutterstock.com
Enhver, der har set "Bridget Jones's Diary", ved, at et af hendes nytårsforsæt er "Gå ikke ud hver aften, men bliv inde og læs bøger og lyt til klassisk musik."
Virkeligheden, imidlertid, er væsentligt anderledes. Hvad folk rent faktisk gør i deres fritid stemmer ofte ikke overens med det, de siger, de vil gøre.
Økonomer har kaldt dette fænomen for "hyperbolisk diskontering". I en berømt undersøgelse med titlen "At betale for ikke at gå i gymnastiksalen, "et par økonomer fandt ud af, at når folk blev tilbudt valget mellem en pay-per-besøg kontrakt og et månedligt gebyr, de var mere tilbøjelige til at vælge det månedlige gebyr og endte faktisk med at betale mere pr. besøg. Det er fordi de overvurderede deres motivation til at træne.
Hyperbolsk rabat er blot én udfordring ved at operere i en kreativ industri. Smagen er meget subjektiv, og de elementer af plot og fortælling, der gør en film til et enormt hit, kan nemt gøre en anden til en kritisk og kommerciel fiasko.
I årtier, annoncører og marketingfolk kæmpede for at forudsige forbruget af fritidsprodukter såsom film og bøger. Det er lige så udfordrende at bestemme timingen. Hvilken weekend skal et studie udgive en ny film? Når et forlag udgiver en papirkopi af en bog, hvordan beslutter de, hvornår de vil udgive e-bogsversionen?
I dag, big data giver ny synlighed i, hvordan folk oplever underholdning. Som en forsker, der studerer virkningen af kunstig intelligens og sociale medier, der er tre kræfter, der for mig skiller sig ud som særligt stærke til at forudsige menneskelig adfærd.
1. Økonomi af den lange hale
Internettet gør det muligt at distribuere underholdningsprodukter, der er mindre populære end almindelige succeser. Streaming-shows kan få et større publikum, end hvad der er økonomisk muligt for distribution gennem prime-time tv. Dette økonomiske fænomen omtales som den lange hale-effekt,
Da streamingmedievirksomheder som Netflix ikke skal betale for at distribuere indhold i biografer, de kan producere flere shows, der henvender sig til nichepublikum. Netflix brugte data fra deres individuelle kunders seervaner til at beslutte at bakke op om "House of Cards, " som blev afvist af tv-netværk. Netflix-data viste, at der var en fanskare til film instrueret af Fincher og film med Spacey i hovedrollen, og at et stort antal kunder havde lejet dvd'er af den originale BBC-serie.
2. Social indflydelse i tiden med kunstig intelligens
Med sociale medier, folk kan dele, hvad de ser, med deres venner, få ellers selvstændige underholdningsoplevelser til at blive mere sociale.
Ved at udvinde data fra sociale sider som Twitter og Instagram, virksomheder kan spore i realtid, hvad biografgængere synes om en given film, show eller sang. Filmstudier kan bruge en skattekiste af digitale data til at beslutte, hvordan de skal promovere shows og udgivelsesdatoer for film. For eksempel, mængden af Google-søgninger på en films trailer i løbet af måneden før dens premiere er en førende forudsigelse for Oscar-vindere såvel som billetkontorindtægter. Filmstudier kan kombinere historiske data om filmudgivelsesdatoer og billetkontorydelse med søgetendenser for at forudsige ideelle udgivelsesdatoer for nye film.
Mining af sociale mediedata hjælper også virksomheder med at identificere negative følelser, før det går ud i en krise. Et enkelt tweet fra en ulykkelig indflydelsesrig kunde kan gå viralt, forme den offentlige mening.
I en undersøgelse, jeg udførte med Yong Tan fra University of Washington og Cath Oh fra Georgia State University, vi viste, hvordan en sådan social indflydelse ikke kun bestemmer, hvilke YouTube-videoer der bliver mere populære, men også at videoer delt af indflydelsesrige brugere bliver endnu mere udbredt.
En undersøgelse viser, at når studierne er opmærksomme på sociale mediers buzz før en film udkommer, forskellen mellem den forventede omsætning og den faktiske omsætning, kendt som prognosefejlen, reduceret med 31 pct.
3. Forbrugsanalyse
Big data giver bedre overblik over, hvilke bøger og viser folk rent faktisk bruger deres tid på at nyde.
Matematikeren Jordan Ellenberg var banebrydende for brugen af Hawking-indekset, et mål for det gennemsnitlige sidetal af de fem mest fremhævede passager i en Kindle-bog som en andel af bogens samlede længde. Hawking-indekset viser, hvornår folk giver op på en bog. Hvis en 250-siders bogs gennemsnitlige Kindle-fremhævning vises på side 250, det ville give det et Hawking-indeks på 100 procent.
Teorien har fået sit navn fra Stephen Hawkings "A Brief History in Time". Selvom denne bog stadig sælger millioner af eksemplarer om året, den læses også sjældent, med et dystre Hawking-indeks på 6,6 pct.
Når en virksomhed som Amazon beslutter sig for, hvilke bøger der skal anbefales til potentielle læsere, eller hvilke Prime-shows der skal produceres, de ser på detaljerede digitale spor af, hvilke plotpunkter der engagerede publikum, og hvilke der ikke gjorde. Dette kan hjælpe dem med at promovere en kommende udgivelse eller komme med bedre anbefalinger til individuelle brugere.
Hvad mere er, nye typer kunstig intelligens kan undersøge, hvad der får folk til at engagere sig i kreativt indhold. For eksempel, et firma ved navn Epagogix var banebrydende for en tilgang ved hjælp af et neuralt netværk - et kunstig intelligensværktøj, der leder efter mønstre i meget store mængder data - på et sæt manuskripter vurderet af eksperter i underholdningsindustrien. Computeren kunne så forudsige den økonomiske succes for en film. Ifølge nogle rapporter, sådan kunstig intelligens kan forudsige op til 75 procent af filmens faktiske åbningsudgifter.
Givet ny big data-indsigt som disse, underholdningsvirksomheder ved måske snart, hvad Bridget Jones præcist vil gøre med sin fritid, bedre end Bridget selv gør.
Denne artikel er genudgivet fra The Conversation under en Creative Commons-licens. Læs den originale artikel.