Hanabi:Facebook AI går op i samarbejdende gameplay

Kredit:CC0 Public Domain

Kortspillet Hanabi er blevet taget som en udfordring af Facebooks AI, og det er noget af en udfordring i betragtning af, at de er på vej ind i et rige, hvor spil ikke kun er et spørgsmål om, at en modstander slår en anden, men et "samarbejdsvilligt" kortspil, hvor et konkurrerende hold hjælper hinanden.

Jonathan Vanian, Formue , gik læserne gennem spillet som et middel til introduktion:

"...:hold på to til fem spillere får tilfældige kort i forskellige farver og tal, der repræsenterer point. Målet for holdene er at lægge kortene på et bord, grupperet efter farve, i den rigtige numeriske rækkefølge. Problemet, imidlertid, er, at spillere ikke kan se deres egne kort, mens deres holdkammerater kan. En spiller kan give hints til en anden, som at komme med en bemærkning om en bestemt farve, der ville tippe den anden til at gøre noget som at spille eller kassere et kort. Dilemmaet er, at spilleren skal udlede, hvad deres holdkammerats ledetråd betyder."

Virksomhedsledere har vist en tilbøjelighed til Hanabi som en team-building læringsoplevelse; det har nu vundet opmærksomhed fra AI-forskere, der tænker på at bygge fremragende AI-systemer.

"At komme tæt på perfekt score på et obskurt fransk kortspil er fantastisk, og alt undtagen Facebook har større planer for sin kooperative AI, " sagde Engadget .

Facebook-forsker, Tom Lerer, blev citeret i Engadget :"Det, vi kigger på, er kunstige agenter, der kan ræsonnere bedre om samarbejdsinteraktioner med mennesker og chatbots, der kan begrunde, hvorfor den person, de chatter med, sagde det, de gjorde ... Chatbots, der kan ræsonnere bedre om, hvorfor folk sige, at de ting, de gør, uden at skulle opregne alle detaljer i det, de beder om, er en meget ligetil anvendelse af denne type søgeteknik. "

Hvilke AI -strategier satte forskerne i gang?

Vanian identificerede en søgeteknik tidligere brugt af DeepMind; det lader flere Hanabi-bots evaluere flere spillemuligheder, mens de deler information med hinanden. Kombineret med forstærkende læring, Facebook-botterne lærte at spille Hanabi med hinanden.

Forfatterne bag denne undersøgelse skrev et papir, der diskuterede deres arbejde, og papiret er på arXiv (offentliggjort i Kunstig intelligens tidsskrift). "The Hanabi Challenge:A New Frontier for AI Research" er avisens titel, og forfattere sagde, at de tog Hanabi til sig som et "udfordringsdomæne med nye problemer, der stammer fra dets kombination af rent samarbejdende gameplay og ufuldkommen information i en indstilling på to til fem spillere."

Forfatterne bemærkede, at det bedst beskrives som en type holdkabale, og spillets ufuldkomne information opstår ved, at hver spiller ikke er i stand til at se deres egne kort (dem, de har og kan handle på), som hver har en farve og rang.

For reproducerbare forskningsresultater, forfatterne udgav et open source Hanabi RL-miljø kaldet Hanabi Learning Environment skrevet i Python og C++.

Andre steder, men relevante for deres mål inden for reproducerbar forskning, Jerome Pesenti, vicepræsident AI på Facebook, var i en nylig Q&A med Will Knight i Kablet .

Knight spurgte Pesenti om at genskabe banebrydende forskning.

"Det er noget, som Facebook AI er meget passioneret omkring, " sagde Pesenti. "Når folk gør ting, der ikke er reproducerbare, det skaber en masse udfordringer. Hvis du ikke kan gengive det, det er mange tabte investeringer... Det smukke ved AI er, at det i sidste ende er systemer, der drives af computere. Så det er en førende kandidat, som et underområde af videnskaben, at være reproducerbar. Vi tror på, at fremtiden for kunstig intelligens vil være noget, hvor den er reproducerbar næsten som standard. Vi forsøger at open source det meste af den kode, vi producerer i AI, så andre mennesker kan bygge ovenpå det."

Forfatterne, i deres papir, har et afsnit med krydshovedet "Hanabi:The Benchmark".

Denne forskningsindsats handler om at bruge Hanabi som et udfordrende benchmarkproblem for AI. Unikke egenskaber adskiller den fra andre benchmarks. "Det er et multi-agent læringsproblem, I modsætning til, for eksempel, Arcade -læringsmiljøet. Det er også et uperfekt informationsspil, hvor spillerne har asymmetrisk viden om miljøtilstanden, hvilket gør spillet mere som poker end skak, backgammon, eller gå."

Andrew Tarantola ind Engadget taget op på dette punkt. Livet i den virkelige verden er ikke et nulsumsspil som poker eller Starcraft, han sagde, "og vi har brug for AI for at arbejde med os, ikke imod os. "

To Engadget læsernes kommentarer viste ikke ærefrygt for, hvad der er opnået indtil videre. "Temmelig sikker på at have viden om hvordan mennesker normalt spiller et enkelt kortspil og generel viden om menneskelige hensigter er to meget forskellige ting, " sagde en. En anden sagde, at "at identificere handlingsmønstre er langt fra teorien om sindet... Man kan argumentere, hvis de forsøger at tilskrive sindets teori, deres nøjagtighed kræver arbejde."

Sidste artikelAmerikansk debat om internetansvar spildes over på globale handelsaftaler

Næste artikelDet er måske ikke HQ2, men AOC erklærer sejr og troller Amazon over New York-udvidelsen