Komplet pipeline til træning af evalueringsmodellen. Kredit:arXiv:1907.08321 [cs.LG]
Skak og kunstig intelligens er i nyhederne igen, denne gang i rapporter om et hold, der udforsker en model for skak via naturlig sprogbehandling (NLP). Læringsmekanismen var skaksnak - velvalgt snak. De fortrænede på kommentarfølelser, der var forbundet med skaktræk. Følelserne styrede agentens beslutningstagning.
Deres resulterende skakalgoritme blev designet til at evaluere kvaliteten af skaktræk ved at analysere reaktionen fra ekspertkommentatorer.
De tre forskere fra University College London skrev et papir, der beskrev deres metoder og resultater. Isaac Kamlish, Isaac Chocron og Nicholas McCarthy skrev "SentiMATE:Learning to play Chess through Natural Language Processing, " og det er oppe på arXiv. Papiret blev indsendt i sidste måned.
"Vi præsenterer SentiMATE, en ny end-to-end Deep Learning model for skak, anvender Natural Language Processing, der har til formål at lære en effektiv evalueringsfunktion, der vurderer flyttekvalitet. Denne funktion er fortrænet på følelsen af kommentarer forbundet med træningsbevægelserne, og bruges til at vejlede og optimere agentens beslutningstagning i spillet."
Inviter ikke AlphaZero og denne NLP-model til den samme fest; de ville blive i hver sin side af rummet. Forskerne skrev, at Deep Minds AlphaZero var lykkedes "efter millioner af iterationer af selvspil og brug af tusindvis af Tensor Processing Units (TPU'er)." Det var ikke tilfældet i den nye forskning.
I stedet, de sagde, de havde til formål "at tackle vurderingen af kvaliteten af individuelle bevægelser gennem brug af Natural Language Processing... Data fra forskellige skak-websteder blev skrabet, som omfattede oplysninger om de bevægelser, der blev foretaget, og en kvalitativ vurdering af selve bevægelserne i form af kommentarer, skrevet af en bred vifte af skakspillere; resulterer i en stor database af bevægelser med kommenterede kommentarer."
"Det evaluerer kvaliteten af skaktræk ved at analysere reaktionen fra ekspertkommentatorer, " sagde Will Knight, MIT Technology Review .
Forskerne beskærede kommentarer, der ikke vedrørte træk af høj kvalitet og eksempler, der var for tvetydige, han tilføjede. "Så brugte de en speciel type tilbagevendende neurale netværk og ordindlejringer (en matematisk teknik, der forbinder ord på grundlag af deres betydninger), trænet på en anden state-of-the-art model til at analysere sprog."
Algoritmen, kaldet SentiMATE, udarbejdet af sig selv de grundlæggende regler for skak såvel som adskillige nøglestrategier – herunder forking og kastning.
Holdet fandt ud af, at SentiMATE var i stand til at evaluere skaktræk "baseret på en forudtrænet følelsesevalueringsfunktion." De konkluderede, at der var stærke beviser for at understøtte, at naturlig sprogbehandling bruges til at træne en evalueringsfunktion i skakmotorer.
Ydeevnen af deres løsning var mindre end spektakulær. Knight sagde, "det lykkedes ikke at slå nogle konventionelle skakbots konsekvent." At, imidlertid, bør ikke distrahere fra det faktum, at SentiMATE virkede, og måden det fungerede på:
"SentiMATE overraskede forskerne med sin evne til at udarbejde nogle af de grundlæggende principper i skak såvel som flere nøglestrategier, såsom forking (når to eller flere brikker er truet samtidigt) og castling (når kongen og slottet begge flytter til en mere defensiv position på bagsiden af brættet, " sagde forfatterne.
Den vigtige takeaway er i bestræbelserne på at designe et sådant program:kan sproget tjene til at lære at spille skak med mindre øvelsesdata, der kræves end i konventionelle tilgange?
Tibi Puiu ind ZME Videnskab tænkte over det:
"Kun denne gang, deres maskinlæringsprogram øvede ikke millioner af spil for at mestre skak, men analyserede snarere sproget hos ekspertkommentatorer. En skønne dag, forskerne siger, at en lignende tilgang kunne give maskiner mulighed for at dechifrere følelsessprog og tilegne sig færdigheder, som ellers ville have været utilgængelige gennem 'brute force'."
Hvad angår modellen, der ikke er en super skakmester, han sagde, "Ydeevne på højt niveau var ikke dens mål, selvom. Hvor SentiMATE skinner, er i dets evne til at bruge sproget til at tilegne sig en færdighed i stedet for at øve den."
I deres papir, forfatterne talte om det altafgørende datasæt til støtte for deres forskning. "Ved rengøring og klassificering af datasættet baseret på kommentarer, bitificere skaktræk, og anvendelse af sentimentanalyse på kommentaren, vi præsenterer SentiChess et datasæt på 15, 000 skaktræk repræsenteret i bitformat, sammen med deres kommentarer og følelsesvurdering. Dette datasæt tilbydes i håbet om yderligere udvikling af arbejdet omkring sentiment-baserede skakmodeller, og statistisk bevægelsesanalyse."
Bevæger sig fremad, Will Knight sagde, at spilrelevant chatter kunne hjælpe AI-programmer med at lære at spille spillet på en ny måde. Og, ud over skak, "den samme teknik kunne tillade maskiner at bruge det følelsesmæssige indhold af vores sprog til at mestre forskellige praktiske opgaver."
(Som MIT Technology Review 's underoverskrift sagde det, "Maskiner, der værdsætter 'strålende' og 'dumme' skaktræk, kunne lære at spille spillet - og gøre andre ting - mere effektivt."
© 2019 Science X Network