Dette udaterede billede leveret af OpenAI viser en robothånd, der holder en terning i virksomhedens forskningslaboratorium i San Francisco. Hånden, kaldet Dactyl, har et enkelt job, og det er at rotere en terning, indtil bogstavet opad matcher et tilfældigt udvalg. (Eric Louis Haines/OpenAI via AP)
Hvor lang tid tager det en robothånd at lære at jonglere med en terning?
Omkring 100 år, Giv eller tag.
Så meget virtuel computertid tog det forskere ved OpenAI, non-profit kunstig intelligens laboratorium finansieret af Elon Musk og andre, at træne sin legemlige hånd. Holdet betalte Google $3, 500 for at køre sin software på tusindvis af computere samtidigt, knaser den faktiske tid til 48 timer. Efter træning af robotten i et virtuelt miljø, holdet satte det på prøve i den virkelige verden.
Hånden, kaldet Dactyl, lært at bevæge sig selv, holdet på to dusin forskere afslørede i denne uge. Dens opgave er simpelthen at justere terningen, så et af dens bogstaver - "O, "''P, "''E, "''N, "''A" eller "I''—vender opad for at matche et tilfældigt valg.
Ken Goldberg, et University of California, Berkeley robotik professor, der ikke er tilknyttet projektet, sagde OpenAI's præstation er en stor sag, fordi den viser, hvordan robotter trænet i et virtuelt miljø kan fungere i den virkelige verden. Hans laboratorium prøver noget lignende med en robot kaldet Dex-Net, selvom dens hånd er enklere, og de genstande, den manipulerer, er mere komplekse.
Dette udaterede billede leveret af OpenAI viser en robothånd, der roterer en terning i virksomhedens forskningslaboratorium i San Francisco. Hånden, kaldet Dactyl, har et enkelt job, og det er at rotere en terning, indtil bogstavet opad matcher et tilfældigt udvalg. (Eric Louis Haines/OpenAI via AP)
"Nøglen er ideen om, at du kan gøre så store fremskridt i simulering, " sagde han. "Dette er en plausibel vej frem, det er meget svært at lave fysiske eksperimenter."
Dactyls fingre i den virkelige verden spores af infrarøde prikker og kameraer. I træning, hver simuleret bevægelse, der bragte kuben tættere på målet, gav Dactyl en lille belønning. At tabe kuben fik den til at føle en straf 20 gange så stor.
Processen kaldes forstærkende læring. Robotsoftwaren gentager forsøgene millioner af gange i et simuleret miljø, forsøger igen og igen for at få den højeste belønning. OpenAI brugte nogenlunde den samme algoritme, som den brugte til at slå menneskelige spillere i et videospil, "Dota 2."
I det virkelige liv, et team af forskere arbejdede omkring et år for at få den mekaniske hånd til dette punkt.
Hvorfor?
I denne torsdag, 26. juli, 2018, Foto, OpenAI-forsker Jonas Schneider undersøger forskningslaboratoriets robothånd i San Francisco. Hånden, kaldet Dactyl, har et enkelt job, og det er at rotere en terning, indtil bogstavet opad matcher et tilfældigt udvalg. (AP Photo/Ryan Nakashima)
For en, hånden i et simuleret miljø forstår ikke friktion. Så selvom dens rigtige fingre er gummiagtige, Dactyl mangler menneskelig forståelse for de bedste greb.
Forskere injicerede deres simulerede miljø med ændringer i tyngdekraften, håndvinkel og andre variabler, så softwaren lærer at fungere på en måde, der kan tilpasses. Det hjalp med at indsnævre kløften mellem resultater fra den virkelige verden og simulerede resultater, som var meget bedre.
Variationerne hjalp hånden med at sætte det rigtige bogstav med forsiden opad mere end et dusin gange i træk, før den tabte terningen. I simulering, hånden lykkedes typisk 50 gange i træk, før testen blev stoppet.
OpenAI's mål er at udvikle kunstig generel intelligens, eller maskiner, der tænker og lærer som mennesker, på en måde, der er sikker for mennesker og udbredt.
Musk har advaret om, at hvis AI-systemer kun udvikles af for-profit virksomheder eller magtfulde regeringer, de kunne en dag overgå menneskelig klogskab og være farligere end atomkrig med Nordkorea.
© 2018 The Associated Press. Alle rettigheder forbeholdes.