Vores virtuelle genskabelse af Harlow-eksperimentet -- agenten skal flytte sit blik mod det objekt, som den tror er forbundet med en belønning. Kredit:DeepMind
Et team af forskere ledet af en gruppe hos Googles datterselskab DeepMind har udviklet en teori om, hvordan menneskelig meta-læring fungerer ved at sammenligne det med en bestemt type deep learning-netværk på computere. I deres papir offentliggjort i tidsskriftet Naturens neurovidenskab , gruppen foreslår, at nøgleelementer i specialiserede computeriserede neurale netværk kan ligne dopamins funktion i hjernen under meta-læring.
Deep learning netværk, mens det er ret imponerende, når du løber, kommer stadig til kort på ét område – de tager meget tid og kræfter på at komme op i fart. Et nyligt eksempel ville være neurale netværk programmeret til at spille gamle computerspil såsom Pong. Et menneske kan mestre det grundlæggende og blive ret dygtigt efter at have spillet en eftermiddag. Et neuralt netværk, på den anden side, kræver hundredvis af timers træning. Neurovidenskabsmænd har foreslået, at denne forskel skyldes det, der kaldes meta-læring - hvor en person (eller et dyr) lærer at gøre noget nyt baseret på det, de har lært i fortiden. aber, for eksempel, kan lære at vælge mellem forskellige objekter efter først at have lært at vælge via tilfældig udvælgelse - noget, der blev opdaget som en del af Harlow-eksperimentet.
Forskere, som dem hos DeepMind, har på det seneste gjort fremskridt med at få computere til at engagere sig i meta-læring. Den proces, hvorved de gør det, er meget velforstået, selvfølgelig, da det er dem, der får det til. Hvordan det sker hos mennesker, selvom, er stadig ikke klar. I denne nye indsats, teamet hos DeepMind foreslår, at en af nøglefaktorerne for at få computere til at engagere sig i meta-læring, kan ligne noget, der findes i menneskelige neurale netværk.
For at komme til denne konklusion, holdet udviklede seks computerbaserede meta-læringseksperimenter, der oprindeligt var en del af neurovidenskabelige eksperimenter på dyr, et af dem var Harlow-eksperimentet. Forskerne fandt ud af, at deres dybe neurale netværksreaktioner svarede til dyrene i de oprindelige eksperimenter. Desuden, de bemærkede, at den almindelige ingrediens, der blev brugt til hvert af eksperimenterne, var noget, de kaldte et middel - det var påkrævet for at få metatype-læring til at opstå. Det her, de bemærker, kan indikere, at dyrenes neurale netværk har et lignende biologisk middel, der er ansvarligt for at få meta-læring til at opstå. Og de foreslår, at midlet kan være neurotransmitteren dopamin.
© 2018 Tech Xplore