Videnskab
 science >> Videnskab >  >> Elektronik

Ny metode foreslået for at opnå bedre robot-selvlæring

Forskere udfører eksperiment på mobil robot. Kredit:HU Yanming

Mennesker viser fantastisk tilpasningsevne, når de håndterer komplekse opgaver i det daglige liv. Denne tilpasningsevne er den direkte legemliggørelse af individuelle indlæringsevner, som sætter mennesker i stand til at forbedre deres egen adfærdsevne uafhængigt og trinvist.

Derfor, hvis robotter kan have denne evne, de kan automatisk generere nye adfærdsmønstre i henhold til real-time erhvervelse af data og cases. Denne evne viser tydelig intelligens, som kaldes adfærdsmæssig intelligens.

For nylig, forskeren ved Shenyang Institute of Automation ved det kinesiske videnskabsakademi udviklede en ny metode udviklet en ny metode til at forbedre robotters adfærdsmæssige intelligens, relaterede resultater blev offentliggjort den IEEE-transaktioner på kognitive og udviklingsmæssige systemer .

Forskeren foreslog en ny ramme for inkrementel læringsmetode baseret på Q-Learning og adaptiv kernel lineær (AKL) model. Rammen giver robotten mulighed for at lære ny adfærd uden at glemme de tidligere. Under den nye metode, robotadfærd kan evalueres ved hjælp af autonom læring og imitationslæring, og modelstrukturen og parametrene kan ændres i realtid ved hjælp af en ny L2-norm kerne rekursive mindste kvadraters (L2-KRLS) algoritme.

Udover, de udførte to eksperimenter for at validere den nye metodes ydeevne. Resultaterne viste, at den foreslåede ramme gradvist kan lære adfærd i forskellige miljøer. Lokal-grådig politik-baseret Q-learning er hurtigere end eksisterende Q-learning-algoritmer. På nuværende tidspunkt denne præstation er blevet anvendt i robot autonom navigation.


Varme artikler