Forestil dig uendelige læsninger af de bøger, vi allerede har. Kredit:Unsplash, CC BY
Bøger er altid i forandring. Bogen vi har i dag er ankommet gennem en række materialer (ler, papyrus, pergament, papir, pixels) og formularer (tablet, rulle, kodeks, tænde).
Bogen kan være et redskab til kommunikation, læsning, underholdning, eller læring; et objekt og et statussymbol.
Det seneste skift, fra trykte medier til digital teknologi, begyndte omkring midten af det 20. århundrede. Det kulminerede i to af de mest ambitiøse projekter i bogens historie (i hvert fald hvis vi tror på firmahypen):massedigitalisering af bøger fra Google og massedistribution af elektroniske bøger fra Amazon.
Boghandlernes overlevelse og bibliotekernes opblomstring (i det virkelige liv) trodser forudsigelser om, at "bogens afslutning" er nær. Men selv den mest militante bibliofil vil anerkende, hvordan digital teknologi har sat spørgsmålstegn ved "ideen" med bogen, endnu engang.
At udforske potentialet for menneske-maskine samarbejde inden for læsning og skrivning, vi byggede en maskine, der laver poesi fra siderne i enhver trykt bog. Ultimativt, dette projekt forsøger at forestille sig selve bogens fremtid.
En maskine til at læse bøger
Vores specialkodede læsemaskine læser og fortolker rigtige bogsider, at skabe en ny "belyst" digtbog.
Læsemaskinen bruger Computer Vision og Optical Character Recognition til at identificere teksten på enhver åben bog placeret under dens dobbeltkameraer. Den bruger derefter Machine Learning og Natural Language Processing-teknologi til at "læse" teksten for at få betydning, for at vælge en kort poetisk kombination af ord på siden, som den gemmer ved digitalt at slette alle andre ord på siden.
Bevæbnet med dette frembragte vers, læsemaskinen søger på internettet efter et billede - ofte en doodle eller meme, som nogen har delt, og som er blevet gemt i Google Billeder - for at illustrere digtet.
Når hver side i bogen er læst, fortolket, og illustreret, systemet udgiver resultaterne ved hjælp af en online udskrivningstjeneste. Det resulterende bind føjes derefter til et voksende arkiv, vi kalder The Library of Nonhuman Books.
Fra det øjeblik, vores maskine afslutter sin læsning, til leveringen af bogen, vores automatiserede kunstsystem fortsætter algoritmisk - fra at fortolke og belyse digtene, til paginering, coverdesign og til sidst tilføjelse af slutstoffet. Alt dette sker uden menneskelig indblanding. Algoritmen kan generere et tilsyneladende uendeligt antal læsninger af enhver bog.
Poesien
Følgende digte blev produceret af læsemaskinen fra populære tekster:
"inderst inde prøver mænd der
han er stor nøgen hun er lige
mens du står over for noget."
fra E.L. James' "Fifty Shades of Grey"
"hvordan fester popcorn
jukebox badeværelser deprimeret
skuldertræk, ja? alle."
fra Bret Easton Ellis' "The Rules of Attraction"
"Åh og hendes soveværelse
badeværelsesbørstning sender det
strømpebånd også ansigt helvede."
fra Truman Capote's <"a href="https://www.goodreads.com/book/show/251688.Breakfast_at_Tiffany_s"> Morgenmad på Tiffany's"
Min algoritme, min muse
Så hvad har alt dette at gøre med massedigitalisering af bøger?
Stillet over for stigende modstand fra forfattere og udgivere, der er beskæftiget med Googles håndtering af ophavsret, infoglomeratet drejede væk fra dets primære mål om at give et gratis korpus af bøger (en slags moderne bibliotek i Alexandria) og hen imod et mere beskedent indekssystem, der blev brugt til at søge i de bøger, Google havde scannet. Google ville nu kun vise korte "uddrag" af ord fremhævet på den originale side.
Bag scenen, Google havde identificeret en anden anvendelse af teksterne. Millioner af scannede bøger kunne bruges i et felt kaldet Natural Language Processing. NLP giver computere mulighed for at kommunikere med mennesker ved hjælp af dagligdags sprog frem for kode. De bøger, der oprindeligt blev scannet for mennesker, blev gjort tilgængelige for maskiner til læring, og senere efterligne, menneskeligt sprog.
Algoritmiske processer som NLP og Machine Learning har løftet (eller truslen) om at udskyde meget af vores daglige læsning til maskiner. Historien har vist, at når maskiner ved, hvordan man gør noget, generelt overlader vi dem til det. I hvilket omfang vi gør dette, afhænger af, hvor meget vi værdsætter læsning.
Hvis vi fortsætter med at udskyde vores læsning (og skrivning) til maskiner, vi laver måske litteratur med vores kunstigt intelligente modstykker. Hvad bliver poesi til, med en algoritme som vores muse?
Vi har allerede ledetråde til dette:fra den næsten obligatoriske brug af emojis eller japanske Kaomoji (顔文字) som visuel stenografi for den følelsesmæssige hensigt med vores digitale kommunikation, til de lagdelte betydninger af internetmemes, til autogenerering af "falske nyheder" historier. Det er de billed-ord-hybrider, vi finder i post-litterate sociale medier.
For at skjule et blad
Tag bogen, min ven, og læs dine øjne ud, du vil aldrig finde dér, hvad jeg finder.
Ralph Waldo Emersons åndelige love
Emersons udfordring fremhæver den subjektivitet, vi tilfører læsning. When we started working on the reading-machine we focused on discovering patterns of words within larger bodies of texts that have always been there, but have remained "hidden in plain sight." Every attempt by the reading-machine generated new poems, all of them made from words that remained in their original positions on the pages of books.
The notion of a single book consisting of infinite readings is not new. We originally conceived our reading-machine as a way of making a mythical Book of Sand, described by Jorge Luis Borges in his 1975 parable.
Borges' story is about the narrator's encounter with an endless book which continuously recombines its words and images. Many have compared this impossible book to the internet of today. Our reading-machine, with the turn of each page of any physical book, calculates combinations of words on that page which, until that moment, have been seen, but not consciously perceived by the reader.
The title of our early version of the work was To Hide a Leaf. It was generated by chance when a prototype of the reading-machine was presented with a page from a book of Borges' stories. The complete sentence from which the words were taken is:
"Somewhere I recalled reading that the best place to hide a leaf is in a forest."
The latent verse our machine attempts to reveal in books also hides in plain sight, like a leaf in a forest; and the idea is also a play on a page being generally referred to as a "leaf of a book."
Like the Book of Sand, perhaps all books can be seen as combinatorial machines. We believed we could write an algorithm that could unlock new meanings in existing books, using only the text within that book as the key.
Philosopher Boris Groys described the result of the mass-digitization of the book as Words Without Grammar, suggesting clouds of disconnected words.
Our reading-machine, and the Library of Nonhuman Books it is generating, is an attempt to imagine the book to come after these clouds of "words without grammar." We have found the results are sometimes comical, often nonsensical, occasionally infuriating and, every now and then, even poetic.
Denne artikel er genudgivet fra The Conversation under en Creative Commons-licens. Læs den originale artikel.