Videnskab
 science >> Videnskab >  >> Elektronik

Hvordan poker og andre spil hjælper kunstig intelligens med at udvikle sig

Bedste menneskelige mestre ved komplekse spil som brikker, poker og Go er en ideel udfordring for kunstig intelligens-og et springbræt til vidtrækkende applikationer ud over spillerummet, siger UAlberta -eksperter. Kredit:University of Alberta

Da han voksede op i Ohio, hans forældre var ivrige kortspillere, dele hænderne ud fra alt fra euchre til gin rummy. I mellemtiden, han og hans venner ville rive brætspil op, der lå rundt i familiens hjem og kombinere brikkerne til at lave deres egne spil, med nye udfordringer og nye markører for sejr.

Bowling er kommet langt fra hans dage med at lege med farverige kort og plastikterninger. Han har tre grader i computervidenskab og er nu professor ved University of Alberta.

Men, i hans hjerte, Bowling elsker stadig at spille spil. Hans forskning i kunstig intelligens - og hvordan den krydser spil og maskinlæring - har sat ham i spidsen for det hurtigt udviklede felt.

"Spil er sådan et smukt mikrokosmos af interessante beslutningsproblemer, " han siger.

"I et øjeblik), du kan beholde det som en selvstændig ting, hvor dine kunstige intelligensagenter ser på spillets verden og forsøger at løse det. På samme måde, det er sjovt for mennesker at spille det spil i et minut og forenkle deres verden til det. "

Bowling leder universitetets Computer Poker Research Group, hvor han og et hold sidste år løste et problem engang troede uløselige:gruppen udviklede en algoritme, der slår professionelle pokerspillere i no-limit Texas hold 'em poker.

Det hedder DeepStack. Dens succes betragtes som en anden milepæl inden for kunstig intelligensforskning, hvor komplekse algoritmer ofte starter med forskere, der bruger kortspil, brætspil og videospil som deres testområder.

Fra brikker til det menneskelige genom

I 1989, computervidenskabsmand Jonathan Schaeffer havde ideen om at skrive et computerprogram, Chinook, at vinde World Checkers/Drafts Championship.

Mens folk i brikker-spil-samfundet blev fascineret af nyheden i en computer, der konkurrerede i deres turneringer, de blev overraskede, da i bare sin anden turnering, Chinook fik retten til at spille til verdensmesterskabet.

Verdens brikkeres styrende organer modstod først tanken om en computer, der spiller til verdensmesterskabet, men spillets øverste forbund nøjedes til sidst - noget - og dannede en ny begivenhed:Man vs. Machine World Championship.

I 1992, Chinook tabte til Marion Tinsley, der var gået på pension det foregående år som verdensmester i brikker. Men i en omkamp i 1994, programmet sejrede. Chinook blev det første program til at vinde et menneskeligt verdensmesterskab i ethvert spil, en bedrift anerkendt af Guinness Book of World Records.

Denne kamp mellem mennesket og maskinen har spillet igen og igen i årtierne siden:i 1997, IBM's Deep Blue-som var medforfatter af U af A alumnus Murray Campbell og to andre-slog verdens skakmester Garry Kasparov; i 2011, IBM's Watson tog en Jeopardy på $ 1 million med hjem! mesterskab; og sidste år, AlphaGo blev det første computerprogram til at slå et menneske i det komplekse brætspil, Gå.

Schaeffer, nu dekan for U ved A's Naturvidenskabelige Fakultet, har forsket i kunstig intelligens siden 1979.

"Jeg laver AI -research. Og en af ​​de tests, jeg bruger, den mest populære blandt studerende, tilfældigvis er spil. Og hvis ideerne er gode, de kan anvendes på andre applikationer. "

Schaeffer nyder klart det sjove ved et spil, konkurrencen og den brede appel ved at arbejde med noget, som så mange kan relatere til. Men han er også klar over, at spilforskning kan have konsekvenser langt ud over et kortspil eller et spillebræt.

Han peger på noget allestedsnærværende i nutidens liv:GPS-systemet. Og han forbinder teknologien bag den til Rubiks kube.

"Rubiks kube er blandet sammen. Det er din 'start', og du forsøger at komme til en position, hvor alt er på plads. Hvad er ruten at gå fra et punkt til et andet? Tænk på hvert træk (i spillet) som en del af din rejse, og du ønsker at komme fra start til slut så hurtigt som muligt - hvilket er præcis, hvad GPS’en gør.

"Jeg vil gerne tro, at nogle af de ideer, vi har genereret her, bruges i GPS -systemer. Det ved vi ikke med sikkerhed. Vores arbejde er offentligt, og virksomhederne behøver ikke at oplyse, hvad de putter i deres produkter."

Jonathan Schaeffer udviklede Chinook, et brik-spil-program, der besejrede den tidligere verdensmester Marion Tinsley i 1994-det første program, der vandt et menneskeligt verdensmesterskab i ethvert spil. Kredit:Richard Siemens

Schaeffers arbejde med Chinook involverede en enorm mængde computerkraft, der skulle organisere data og komprimere dem til noget meget lille. Programmet skulle også hurtigt finde oplysninger, blandt de billioner af datapunkter, der blev komprimeret.

Kort efter Chinooks verdensmesterskab, en biolog kom ind på Schaeffers kontor. Han arbejdede på det menneskelige genomprojekt, som også involverede en enorm mængde data. Han havde også brug for at komprimere disse data, og hurtigt identificere elementer.

Et år senere, et firma ved navn BioTools dannet for at støtte det menneskelige genomprojekt. Nogle af de ideer, der blev brugt i deres produkter, stammede fra brikkerundersøgelsen.

"Det var en af ​​de behagelige overraskelser, helt uventet, kommer ud af venstre felt. "

Bygger den 'intuitive' maskine

Det seneste arbejde fra U of A for at mestre no-limit Texas hold 'em poker landede i marts 2017-udgaven af ​​det prestigefyldte tidsskrift Videnskab . Det, der gjorde bedriften banebrydende, er, at spillet er et scenario med "ufuldkommen information" - i modsætning til skak eller brikker, hvor begge spillere kan se alt på bordet, spillere i poker beholder nogle kort for sig selv.

Udfordringen for Bowling og hans team var at udvikle en "intuition" til DeepStack.

"Vores algoritmer skal tænke dybt over, hvad KUNDE den anden agent vide om mine kort lige nu, og hvad jeg kunne vide om deres kort. Begrundelsen skal omfatte overbevisninger og ikke kun, hvad du kan se på bordet."

For at udvikle det tarminstinkt, den "intuition, "Bowling og hans team måtte køre DeepStack gennem titusinder af pokerscenarier. Programmet begyndte at genkende nogle situationer som gode og nogle som dårlige, nogle som mindre gode eller mindre dårlige.

Dette opbyggede DeepStacks generelle erfaring, og det begyndte at genkende nye situationer som forskellige grader af godt eller ondt - og lod det komme med de bedste skuespil baseret på det.

Holdet beviste DeepStacks kompetence ved at få det til at spille mod nogle af de bedste pokerspillere i verden. De spillede så mange hænder, at resultaterne var statistisk signifikante.

På spørgsmålet om, hvorvidt DeepStack i det væsentlige vil dræbe poker - trods alt, hvem vil spille mod en maskine, hvis det er garanteret, at maskinen vinder? - Bowling peger på skak.

"Det blev sagt om skak, og nu er der måske flere stormestre end på noget andet tidspunkt ... det ser ud til at have accelereret færdighedsniveauet, " han siger, bemærker, at amatører kan spille mod de bedste computere for at finpudse deres færdigheder, og der er konkurrencer, hvor skakspillere slår sig sammen med computere for at forbedre konkurrencen.

Men han erkender også, at poker er lidt anderledes. Folk spiller poker for penge. Det er en spilaktivitet, og det giver ingen mening at spille mod en enhed, der statistisk sandsynligvis vil vinde.

"Måske betyder det, at poker begynder at handle om noget andet end bare en ren spilleaktivitet ... Jeg håber, at det måske vil flytte spillet væk fra spilstykket. Lad os prøve at finde ud af, hvem de bedste spillere i verden er, og måske kunne vi begynde at fremhæve dette for hvad det er, en færdighedsbaseret aktivitet. "

Bowling startede først sit arbejde med DeepStack med den tilgang, at de fleste "virkelige" problemer er, faktisk, ufuldkomne informationsscenarier.

Men hans arbejde er ikke kun drevet af, hvordan hans AI -gennembrud kan anvendes ud over spilområdet.

"Hvis vi vil skubbe fremad for at se mere dygtig kunstig intelligens, det kan være en distraktion at sige, 'Her er en applikation, som du kan tjene mange penge på.' Er det virkelig vejen til at få os til at blive bedre, mere dygtig kunstig intelligens?

"Der burde være mennesker, der skubber på den langsigtede vej, der skubber den frem til den næste ting uden at være sikker på, hvordan det bliver en pengeindbringende aktivitet. "


Varme artikler