Kredit:IBM
Konkurrencen gik i gang, da computerens kvindestemme, en blanding af Amazons Alexa og Stephen Hawkings kommunikator, talte til sin menneskelige modstander:"Hej Noa. Vi mødes igen."
Jeg var den eneste akademiker, der var inviteret ind i det overfyldte lokale med omkring 50 journalister for at overvære den nylige konkurrence mellem den kunstige intelligens fra IBM's Project Debater og de israelske debatmestre Noa Ovadia og Dan Zafrir. Åbningsspillet frembragte grin og øjenruller fra publikum. Jeg var mere en øjenruller – jeg er ikke overbevist om, at åbenlyst præscripteret materiale virkelig hjælper årsagen til at fremvise AI-teknologier. Det, der dog fulgte, var unægtelig en imponerende ingeniørmæssig bedrift - men det er måske for let at tro, at sci-fi AI nu er lige rundt om hjørnet.
Project Debater følger meddelelsen om, at Google har udviklet en AI-teknologi kendt som Duplex, der kan føre naturligt klingende telefonsamtaler for at booke aftaler og udføre andre opgaver. Begge projekter ser ud til, at de involverer AI, der nærmer sig kompetence på menneskeligt niveau, der kunne bestå Turing-testen, og umiddelbart dominere verden, måske. Men dette er en illusion båret af den omhyggelige markedsføring af disse enorme virksomheder. Virkeligheden er, at vi stadig er i de tidligste dage med at forstå AI.
Efter den indledende tiltalende taktik, IBM's computer producerede en fire minutters tale, i farten, om et emne valgt tilfældigt fra en liste med 40, som det ikke allerede var blevet trænet til at debattere om. Det gjorde det ved at identificere, klassificering, at vælge og derefter sammensætte uddrag fra et bibliotek med 300 millioner nyhedsartikler. Resultatet var stort set grammatisk korrekt, semantisk på budskab og mere eller mindre sammenhængende. Systemet var derefter i stand til at lytte og reagere på en lignende udtalelse fra sin menneskelige modstander.
Det er måske værd at reflektere over, hvor svære disse opgaver er. At holde en samtale er enormt udfordrende, når du går ud over meget struktureret, stramt kontrollerede domæner. Deep learning systemer, inspireret af den menneskelige hjerne, forsøger at kortlægge, hvad end mennesket siger til et relativt lille antal mulige bevægelser med et lille antal mulige værdier. Google Duplex fungerer stadig inden for et bestemt domæne, som at bestille middag, og kan derfor være meget robust.
At have et skænderi er endnu mere krævende. Det er bemærkelsesværdigt svært at bygge en algoritme til pålideligt at afgøre, om en given sætning understøtter din holdning eller ej. På ét niveau, IBM-teamet klarede det, med Project Debater, der producerede sin sammenhængende og overbevisende erklæring på fire minutter. Jeg var også meget imponeret over, at computerens grammatiske struktur var så god, især da hver sætning kan være hentet fra flere artikler i biblioteket.
Teknologien er stadig begrænset
Men mens talen fortsatte, Jeg fik den tydelige fornemmelse af, at den tematiske struktur var ved at bryde sammen, med strømmen der veksler mellem emnerne. Maskinen afsluttede banket på fire minutter med en flot retorisk opblomstring af at forudse og angribe modstanderens argument (kendt som procatalepsis). Men senere, computerens to-minutters gendrivelse til sin menneskelige modstander lød mere og mere som en ren gentagelse.
Project Debater har opnået betydelige nye fremskridt inden for områder som at søge tekster efter argumenter (argument mining) kombineret med tekniske løsninger såsom grammatisk reparation, der involverer limning af sætningsdele sammen. Men, som taler, computeren laver stadig sine første små knirk.
Systemet har kun den mest rudimentære forestilling om argumentstruktur og afviger derfor ofte fra hovedtemaet. Den tager ikke hensyn til sit publikum, heller ikke dens modstander, og har ingen mulighed for at tilpasse sit sprog eller udnytte nogen af de hundredvis af smarte retoriske teknikker, der hjælper med at vinde publikum
Hverken IBM eller Google hævder, eller endda intimiderende, at de har løst alle AI-problemer, eller byggede maskiner med ydeevne på menneskeligt niveau. I begge tilfælde programmørerne har specifikke mål for øje, som mere eller mindre fører direkte til kommerciel teknologi.
Den reelle værdi af argumentteknologi som helhed vil ikke blive leveret i debatkammeret, men i applikationer, hvor AI-systemer kan bidrage til menneskelige beslutningstagere. Om det er i politiets hændelsesrum, intelligensanalysebunkeren eller klasseværelset, det kan kun være en god ting at øge robustheden af evidensbaseret beslutningstagning ved at introducere AI-systemer, der kan bidrage til samtalen. De vil være i stand til at tilføje ny information eller kritisere menneskelige ræsonnementer.
Project Debater er et værdifuldt skridt fremad mod dette mål, og det bredere mål med at opbygge AI, der virkelig kan forstå og reagere på os. Men vi er bestemt ikke på nippet til at se AI-systemer uddiskutere deres menneskelige modstykker. Nutidens kunstig intelligens-teknologi er lige så langt fra disse scenarier, som romernes eksperimenter med dampkraft var fra den industrielle revolution.
Denne artikel blev oprindeligt publiceret på The Conversation. Læs den originale artikel.