Kunstig intelligens:ARC -testfokus går ud over faktuelle spørgsmål

Kredit:CC0 Public Domain

"Sund fornuft" er en sætning, alle hører på et eller andet tidspunkt, normalt fra en vred tilskuer, der tror, at du ikke har nogen. Hvad er "sund fornuft?"

"Mennesker bruger sund fornuft til at udfylde hullerne i ethvert spørgsmål, de stilles, levere svar inden for en forstået, men ikke-eksplicit kontekst, "Swapna Krishna skrev ind Engadget .

Tilføj et par års udviklingsmæssig vækst hos det lille barn, og han eller hun får sund fornuft, men AI har problemer. Oren Etzioni kalder udfordringen inden for AI -forskning forsker og professor, der leder Allen Institute for Artificial Intelligence, eller AI2, i Seattle, Washington.

For at komme til den flydende, som mennesker har, deres naturlige evne til at bevæge sig fra den ene ting til den anden, programmerne har brug for, hvad hver tiende år har i spar, han sagde, og det kaldes sund fornuft-et sæt fakta, heuristik, observationer, alle de ting, vi kan bringe til bordet, men computeren gør det ikke. "Her på Allen Institute for Artificial Intelligence, Paul Allen har givet os det mål at gå efter dette problem. "

Det er de virkelig. Det rapporteres nu, at de er kommet med en ny test som en del af deres skub til at gennemstrømme AI -systemer med en sådan forståelse af verden.

Den nye test hedder ARC, som står for AI2 Reasoning Challenge. Forskerne skrev et papir om deres test. "Tror du, at du har løst spørgsmålssvar? Prøv ARC, AI2 Reasoning Challenge, "af Peter Clark, Isaac Cowhey, Oren Etzioni, Tushar Khot, Ashish Sabharwal, Carissa Schoenick, og Oyvind Tafjord.

Vil ridder ind MIT Technology Review forklarede, at testen "vil stille videnskabsspørgsmål på grundskoleniveau på grundskoleniveau. Hvert spørgsmål kræver en vis forståelse for, hvordan verden fungerer."

AI2-webstedet sagde, at spørgsmålene var samlet for at opmuntre til forskning i avanceret spørgsmålssvar.

Knight citerede Gary Marcus, professor ved NYU. "Jeg synes, at dette er en stor modgift mod den slags overfladiske benchmarks, der er blevet så almindelige inden for maskinlæring, "sagde han." Det burde virkelig tvinge AI -forskere til at spille mere op. "

Forfatterne i avisen sagde, "Kan din model fungere bedre? Vi udgør ARC som en udfordring for samfundet."

Almindelig fornuft betragtes generelt som den hellige gral for kunstig intelligens.

Forfatterne i deres papir skrev, at "Datasæt er blevet meget indflydelsesrige i retning af forskningsretningen. Nylige datasæt til QA har ført til imponerende fremskridt, men har fokuseret på factoid spørgsmål, hvor tegn på overfladeniveau alene er tilstrækkelige til at finde et svar, modvirke fremskridt med spørgsmål, der kræver begrundelse eller andre avancerede metoder. "

Det er her deres ARC kommer ind, at hjælpe feltet til at gå over til vanskeligere opgaver.

"Vi præsenterer et nyt spørgsmålssæt, tekstkorpus, og grundlinjer samlet for at tilskynde til AI -forskning i avanceret besvarelse af spørgsmål, "sagde forfatterne i deres papir, som er på arXiv.

Der er flere valgspørgsmål. Her er et spørgsmål:"Hvilket emne herunder er ikke lavet af et materiale, der er dyrket i naturen?" De mulige svar er en bomuldsskjorte, en træstol, en plastske og en græskurv. Svaret slår ind i et fornuftigt billede af verden og, sagde Knight, "Det er denne sunde fornuft, at AI bag stemmeassistenter, chatbots, og oversættelsessoftware mangler. Og det er en af grundene til, at de er så let forvirrede. "

Hvilket bidrag kan denne test give til kunstig intelligens? "Hvis maskinlæring med succes kan klare Arc Reasoning Challenge, det ville betyde, at systemet har styr på den sunde fornuft, som ingen AI i øjeblikket besidder, "skrev Krishna." Det ville være et stort skridt fremad. "

Sidste artikelEn maskinlæringsmetode til beholdningsbegrænsede dynamiske priser

Næste artikel1 ud af 3 Michigan -medarbejdere testede åbnet falsk phishing -e -mail