Kai mąstau apie DI ir pirmiausia apie žmonių kalbą apskritai, o toliau – apie lietuvių kalbos ir dirbtinio pasaulinio proto santykius, matau devynias, mano supratimu, svarbiausias tezes. Leisiu sau pajuokauti: baltiškojoje, senojoje lietuvių pasaulėžiūroje devyni – labai svarbus simbolinis skaičius.
Pirmoji tezė – bendrasis arba antro lygio DI moka kalbėti. Čia reiktų paiškinti, kad DI kūrimas yra skirstomas į tris etapus: pirmiausia buvo sukurtas dirbtinis siaurasis intelektas (angl. Artificial Narrow Intelligence – ANI), dabar yra kuriamas dirbtinis bendrasis intelektas (angl. Artificial General Intelligence – AGI) ir pradedamas kurti dirbtinis superintelektas (angl. Artificial Super Intelligence – ASI). Pirmojo lygio – siaurasis – dirbtinis intelektas, kaip rodo pavadinimas, yra ribotas ir veikia tik vienoje srityje. DI kūrėjai mėgsta sakyti, kad ANI prilygsta kūdikiui. Antro lygio, arba bendrasis, dirbtinis intelektas yra aukštesnio lygio. AGI apima daugiau nei vieną sritį, geba abstrakčiai mąstyti, moka samprotauti ir spręsti problemas. Perėjimas iš pirmojo į antrąjį etapą užtruko santykinai ilgai (jo kūrėjų teigimu) – nuo 2016 iki 2020 metų. DI kūrėjai mano, kad AGI, kuomet mašina jau gali prilygti suaugusiems žmonėms, yra baigiamojoje stadijoje. Superintelektas ASI bus paskutinis intelekto sprogimo etapas, nes pranoks žmogaus intelektą. Neurolingvistika, tarpdalykinė kalbotyros, kognityvinių mokslų, neuromokslų, komunikacijos ir neuropsichologijos sritis tapo viena iš svarbiausių, kuriant antro lygio, arba bendrąjį, dirbtinį intelektą. Kodėl? Dėl labai paprastos priežasties – mašiną reikėjo išmokyti mąstyti ir savo mintis reikšti kalba. Taip pat reikėjo mašiną išmokyti susikalbėti. Vadinasi, suprasti, ko iš jos nori žmogus, kuris savo norus išreiškia daugiausia žodine kalba. Mokslininkams ir inžinieriams buvo suformuluotas uždavinys suimituoti žmogaus smegenis, gebančias suprasti ir generuoti kalbą. Atsirado kompiuterinė neurolingvistika. Mašinas pavyko išmokyti mąstyti, suprasti mūsų norus, išreikštus kalba, ir savo mintis mums pateikti taip pat mūsų, žmonių, kalba. Turbūt mažai rasime žmonių, kurie nesinaudoja „ChatGPT“. Mes džiaugiamės, kad jis (o gal ji?) neblogai kalba lietuviškai. Bet ar viskas čia gerai? Man atrodo, toli gražu ne.
Antra tezė – kalba smegenyse veikia kaip nuolat judantys sąvokų ir vaizdinių ryšių tinklai. Paprastai sakant, kalbą suprantame, nes mūsų smegenys aktyvuoja sąvokų ryšius. Kas yra ranka, žinome tik dėl ryšio su kūnu, ką reiškia tipenti, suprantame, nes vaizdingas žodis turi ryšį su ėjimo sąvoka, o kas yra gyvenimas galime paaiškinti tik per ryšį su žodžiu mirtis. Baziniai ryšiai yra nekintantys (ranka ir kūnas visada susiję), bet socialiniai ir kultūriniai ryšiai tarp sąvokų nuolat kinta. Pavyzdžiui, pasikeitė sąvokos karas ryšiai su kitomis sąvokomis tada, kai prasidėjo Ukrainos tragedija. Rašistai ir orkai, himarsai ir bairaktarai, šlovė Ukrainai ir vokiečių divizija – viskas įeina į karo sampratą čia ir dabar išgyvenamu tragišku laiku. Juos suaktyvina mūsų smegenys.
Trečia tezė – DI yra kalbinės žmogaus smegenų veiklos modelis. DI, gaudamas informaciją iš tikrovės, pagal sudėtingus algoritmus aktualizuoja konkrečius ryšius ir sukuria konkrečios informacijos pluoštą. Informaciją sugeneruoja ir iškoduoja semantiniai ryšiai, sujungti į semantinius tinklus, ir vadinamieji žinių grafai – tikrovės faktų sąsajos, atsiradusios iš istorijos, kultūros ir gyvenimo būdo. Pavyzdžiui, Holivudas visada turės ryšį su kinu, o lamborginis – su prabanga, lietuvis su šaltibarščiais ir krepšiniu, o senosios Europos istorija – su Marijos Gimbutienės Deive Motina. Va čia jau prasideda lietuvių kalbai ir lietuviškam mąstymui svarbūs dalykai.
Ketvirta tezė – semantiniai tinklai ir žinių grafai yra unikalūs, susiję su konkrečios kalbos ir konkrečios kultūros patirtimi. Tai įrodė mokslas. Nepavyko semantinių tinklų kūrėjams imti ir mechaniškai „išsiversti“ kalbinių ryšių.
Penkta tezė – ir kalbos, ir kultūros ryšių DI mokomas (ir mokosi pats) kaip vaikas. Apibrėžto baigtinio tikrovės modelio DI negalima instaliuoti, bet, informatikų žargonu kalbant, DI galima „maitinti“ tokia „kalbiena“, kuri jo programoje generuos naujas sąsajas. Panašiai mokykloje vaiko mąstymą ugdome – nors ir kritinį, bet susietą su bendruomenei svarbiomis žiniomis ir vertybėmis. Kas ugdo dabartinį dirbtinį žmonijos protą? Kokie ideologai ir vizionieriai? Žinome tik tiek, kad ne mes. Vadinasi, DI mokymo procesų kol kas nekontroliuojame ar beveik nekontroliuojame (kai kuriuos užsakymus, kiek man žinoma, DI kūrėjams daro privačios Lietuvos kompanijos). Girdėta apie lietuvišką DI, vardu Vaiva, bet informacijos apie tai, kokia tai technologija ir kuo Vaiva skiriasi nuo paprasto pokalbių roboto, nepavyko rasti.
Klausimas, ar norime kaip unikali politinė ir kultūrinė bendruomenė įsilieti į pasaulinio dirbtinio proto kūrimo procesus su savo pačių sukurtais žinių grafais ir semantiniais tinklais, man atrodo, yra vienas karščiausių kalbant apie valstybės ir politinės bei tautinės bendruomenės – Lietuvos – ateitį. Tai ir politinio saugumo, ir skaitmeninės kultūrinės įtakos globaliems procesams, ir savo pačių ateities kūrimo reikalai. Pasaulio valstybės klausimą kelia taip: koks DI atitinka jų nacionalinius interesus. Pavyzdžiui, Švedija įstegė nacionalinį DI centrą, į kurį jungiasi per 100 stipriausių šios srities kompanijų, geriausi mokslininkai ir kiečiausi profesionalai. Centro tinklalapyje sakoma: „(visi) kartu investuojame į įrankių ir išteklių kūrimą, kad paspartintume DI naudojimą mūsų visuomenės, mūsų konkurencingumo ir visų žmonių, kurie gyvena Švedijoje, labui.“ Kaip DI vystymo prioritetus švedai išskiria informacija grįstą sveikatos apsaugą, DI decentralizaciją, pažangų mokymąsi ir švedų kalbos (kitaip tariant, švediškų ryšių) modelio kūrimą.
Šešta tezė – turime „klonuoti Basanavičių“, t. y. kurti mūsų nacionaliniams interesams atliepiantį DI. DI mokytųsi lietuviškos teisėkūros, sveikatos priežiūros, kitų nacionalinės svarbos dalykų. Dalyvautų Lietuvos bendrojo gėrio kūrimo procesuose.
Septinta tezė – nacionaliniam DI žaliavos turime, bet bazinius išteklius ir įrankius reikia sukurti. Sukurti lietuvišką semantinį tinklą bandyta tris kartus, bet kol kas bandymus dar reikia smarkiai tobulinti. Puiki „kalbiena“ yra didysis „Lietuvių kalbos žodynas“, kurio reikšmės vieno projekto metu buvo suindeksuotos ir turi unikalius ID, yra gerai struktūruotų tekstynų. Yra ir „žinienos“. Tai suskaitmeninta Visuotinė lietuvių enciklopedija – bazinių lietuviškų žinių grafų žaliava. Yra įvairių terminų žodynų, Terminų bankas.
Aštunta tezė – žmogiškųjų išteklių potencialą galima pritraukti. Net ir asmeniškai pažįstu žmonių, kurie dirba su DI pasaulinėse globaliose kompanijose. Galbūt juos galėtume pritraukti į Lietuvą, kaip dabar pritraukiame nutekėjusius biotechnologinius protus.
Devinta tezė – mokame, kai reikia, susitelkti. XX amžiuje politinė Lietuvos bendruomenė susitelkė kurdama didįjį „Lietuvių kalbos žodyną“. 1918 metais, atgavus Nepriklausomybę, reikėjo įlietuvinti jauną valstybę. Žodžius didžiajam „Lietuvių kalbos žodynui“ rinko visi: mokytojai ir moksleiviai, prezidentai ir vyskupai, rašytojai, mokslininkai, leidėjai, žurnalistai, valstiečiai ir karininkai, net palaimintasis Jurgis Matulaitis. Rezultatas – pagrįstai didžiuojamės vienu didžiausių žodynų pasaulyje. Esame aštuntoje vietoje pagal žodžių skaičių žodyne iš 7106 šiuo metu gyvų kalbų. Net jei manytume, kad ne visos kalbos turi savo žodynus, rezultatas yra labai geras. Vadinamės maža tauta su dideliu žodynu. O kaip Jums – maža tauta su dideliu DI? Man patiktų.
***
Komentaras parengtas pranešimo, skaityto Seimo Ateities komiteto kartu su Martyno Mažvydo biblioteka surengtoje diskusijoje „Intelektualinis Lietuvos savarankiškumas. Neuromokslai Lietuvoje. Ką galime pasiekti ir su kokiomis problemomis susiduriame?“
Nuomonė
Šioje publikacijoje skelbiama asmeninė autoriaus nuomonė. Portalo Delfi redakcijos pozicija negali būti tapatinama su autoriaus nuomone.