JAV Bostono universiteto ir Masačusetso technologijų instituto Kompiuterių mokslų ir dirbtinio intelekto laboratorijos (CSAIL) technologijų kūrėjų komandai tai – didžiausias siekis ir uždavinys. Kuriama technologija suteiktų galimybę, atpažįstant žmogaus smegenų siunčiamus signalus, automatiškai koreguoti roboto daromas klaidas.
Jau kurį laiką bendrauti su robotais naudojama vadinamoji neurokompiuterinė – smegenų ir kompiuterio – sąsaja (BCI), tačiau, kaip nurodo tyrėjai, taikant daugumą metodų, šios technologijos naudotojai turi specialiai pasirengti darbui su BCI, o tam tikrais atvejais net išmokti moduliuoti savo mintis, idant mašinos geriau suprastų informaciją.
Neseniai atlikto tyrimo medžiagoje nurodoma, kad naujasis metodas net ir visiškiems šios srities naujokams leidžia mintimis kontroliuoti roboto veiksmus. Metodas pagrįstas smegenų siunčiamais signalais – tam tikromis klaidų sukeltomis reakcijomis (angl. error-related potentials, ErrPs), kurios kyla automatiškai, vos žmogus padaro klaidą arba pastebi suklydus kitą žmogų. Tyrėjų teigimu, tai įvyksta paprasčiausiai sutinkant arba nesutinkant su roboto pasirinkimais.
Darbas su mašinomis
Straipsnyje nurodoma, kad ši technologija suteiktų galimybę su mašinomis bendrauti intuityviai ir tiesiogiai, o jos taikymo sritis būtų labai plati – nuo gamyboje naudojamų robotų stebėsenos iki robotizuotų protezų kontrolės.
„Galima sakyti, kad žmonėms ir robotams dirbant kartu, reikia išmokti robotų kalbą, išmokti su jais bendrauti, prie jų prisitaikyti, – teigia prie kuriamo projekto prisidėjęs CSAIL tyrėjas Josephas DelPreto. – Dirbant šį darbą, mums buvo svarbu suprasti, kaip priversti robotą prisitaikyti prie mūsų, o ne atvirkščiai.“
Šių metų kovo 6 d. paskelbti naujo tyrimo duomenys (gegužės mėnesį šis tyrimas bus pristatytas Singapūre vyksiančioje tarptautinėje Elektros ir elektronikos inžinierių instituto rengiamoje konferencijoje robotikos ir automatikos tema).
Tyrimo ataskaitoje tyrėjai paaiškino, kaip buvo renkami elektroencefalografijos (EEG) duomenys: savanoriai tyrimo dalyviai turėjo stebėti įprasto tipo robotą humanoidą, pavadintą „Baxter“, šiam sprendžiant, kurį iš dviejų objektų paimti.
Gautieji duomenys išanalizuoti naudojant mašinų savarankiško mokymosi (vadinamojo sistemų mokymosi) algoritmus, kurie gali atpažinti klaidų sukeltas reakcijas vos per 10–30 milisekundžių. Kaip paaiškina straipsnio autorius E. Gentas, tai reiškia, kad rezultatus galima robotui „grąžinti“ tą pačią akimirką – vadinasi, savo ketinimus veiksmo atžvilgiu robotas gali pakoreguoti dar jų neįgyvendinęs.
Sistema turi būti tobulinama
Technologijos kūrėjai neslepia, kad sistemą dar būtina gerokai patobulinti. Jų teigimu, atliekant realiojo laiko eksperimentus, teisingai suklasifikuoti klaidų sukeltas reakcijas, taigi ir pakoreguoti savo veiksmus, robotas sugebėjo tik maždaug 50 proc. atvejų. Vadinasi, pusę visų atvejų jis nesugebėjo suprasti, kad stebėtojas nori jam pranešti apie klaidą.
Kaip aiškina CSAIL mokslo tyrėja Stephanie Gil, jei mašina neužfiksuodavo klaidos sukeltų reakcijų signalo ir atitinkamai nesugebėdavo pakoreguoti savo ketinimo (arba pakeisti ketinimo, kai nebūdavo siunčiamas signalas), eksperimento dalyvis paprastai siųsdavo antrą, stipresnį, signalą.
„Pastebėjome, kad, eksperimentus atlikdami ne tikruoju laiku, pasiekiame kur kas geresnių rezultatų – net iki 86 proc., tačiau ateityje tikimės ir visų 90, – teigia S. Gil. – Taigi kitas mūsų žingsnis – tokių pat gerų rezultatų pasiekti eksperimentuojant tikruoju laiku ir kuo greičiau pajėgti faktiškai – tiksliai ir užtikrintai – kontroliuoti robotų veiksmus.“
Kas toliau?
Pasak Berlyno technikos universiteto profesoriaus Klauso-Roberto Muellerio, kuris minėtame tyrime nedalyvavo, tačiau taip pat yra dirbęs prie BCI ir klaidos sukeltų reakcijų signalų panaudojimo, minėto tyrimo medžiaga išdėstyta gerai. Jo teigimu, šių signalų panaudojimas siekiant kontroliuoti mašinų darbą – nėra didelė naujovė. Jam, kaip ir kitiems specialistams, esą apmaudu, kad eksperimentus vykdžiusiai tyrėjų grupei nepavyko pasiekti geresnių rezultatų.
Kaip teigia Lozanos federalinės politechnikos mokyklos profesorius Jose del R. Millanas, tyrėjų gautas klaidos sukeltų reakcijų atpažinimo rodiklis iš tiesų yra žemas. Tačiau, jo nuomone, jų pasirinktas metodas vis tiek yra labai perspektyvus.
Profesoriaus suburta tyrėjų grupė šiuos signalus naudojo tam, kad išmokytų robotizuotą ranką kuo tiksliau judėti reikiama kryptimi. Žurnale „Scientific Reports“ 2015 m. paskelbtoje tyrimo ataskaitoje paaiškinama, kad jų atliktame eksperimente robotizuota ranka imdavo judėti atsitiktine kryptimi, o eksperimente dalyvavusieji stebėtojai turėjo nuspręsti, ar ji juda tinkama, ar netinkama kryptimi.
Taikant sistemų mokymosi metodą, vadinamąjį mokymąsi su pastiprinimu (angl. reinforcement learning), klaidų signalai naudojami roboto ketinimų reguliavimui, taip sudarant sąlygas robotui įvaldyti geriausią judėjimo strategiją siekiant konkretaus tikslo. Profesoriaus J. del R. Millano teigimu, ateityje klaidos sukeltų reakcijų signalai galėtų būti pritaikomi daugelyje sričių.
„Jie [signalai] galėtų būti panaudojami taikant bet kokią sudėtingą žmogaus ir mašinos sąsają, kuomet didžioji naštos dalis perkeliama mašinai, kadangi daugelį užduočių ji geba atlikti autonomiškai, – sako profesorius. – Žmonėms teliktų tik prižiūrėti.“