Didžiųjų lietuvių kalbos klaidų sąrašas nugulė į archyvą kartu su aistromis dėl kalbainių ir kitų riestainių. Sviestai sviestuoti su špakliais nublanko prieš lokalizavimus, lemavimus, segmentavimus, kalbinius išteklius, lietuviškai kalbantį dirbtinį intelektą.
Išmaniausi kalbininkai drauge su informacinių technologijų kūrėjais susitelkė į lietuvių kalbos struktūros analizę, tekstynus, kad įvykdytų mums, kaip tautai ir valstybei, gyvybiškai svarbią misiją – visas viešąsias skaitmenines paslaugas prašnekintų lietuviškai.
Kodėl tai yra būtina, kas būtų, jei taip nebūtų, ir kaip sekasi šią užduotį atlikti, pasakoja VLKK pirmininkas Audrys Antanaitis, Lietuvių kalbos instituto Bendrinės kalbos tyrimų centro vyriausioji mokslo darbuotoja dr. Rita Miliūnaitė, VDU Kompiuterinės lingvistikos centro ir CLARIN-LT centro vadovas doc. dr. Andrius Utka ir kalbos technologijų bendrovės „Tilde informacinės technologijos“ („Tilde IT“) vadovė Renata Špukienė.
Kam tos lietuviškos skaitmeninės technologijos – gal paprasčiau ir pigiau naudoti angliškas?
„Žinoma, paprasčiau ir pigiau naudoti anglų kalbai pritaikytas technologijas, – sutinka A. Utka. – Iš dalies tai ir darome – kurdami lietuviškus sprendimus, prisitaikome ir adaptuojame mokslinius pasiekimus bei išradimus, sukurtus didžiosioms kalboms. Vis dėlto turėtume suprasti, kad kalbos technologijos (net ir moderniausios neuroninių tinklų technologijos) nėra universalios, t. y. jos nėra tinkamos bet kuriai kalbai.“ Pasak mokslininko, kalbų struktūra ir sandara labai skirtingos, todėl kalbos technologijos kokybiškai veikia tik tada, kai sprendimai pritaikyti konkrečiai kalbai. Tokiu atveju galima pasiekti, kad frazės ir sakiniai skambėtų natūraliai, nebūtų iškraipoma jų prasmė, būtų maksimaliai išvengiama gramatinių klaidų. „Lietuviškų skaitmeninių technologijų kurti tikrai neapsimokėtų, jeigu artimiausiu metu planuotume atsisakyti savo kalbos ir pradėti kalbėti angliškai“, – sako A. Utka.
„Mūsų visuomenė nėra tolygiai vienodai skaitmeniškai raštinga ir toli gražu ne visa lietuviškai-angliškai dvikalbė“, – toliau gimtosios kalbos technologijų svarbos priežastis analizuoja R. Miliūnaitė. Jos teigimu, iki šiol nemažai žmonių vargsta norėdami pasinaudoti paprasčiausiomis elektroninės bankininkystės, automobilių registravimo paslaugomis arba per elektroninę sistemą užsiregistruoti pas gydytoją, tad kas būtų, jei visa tai jiems dar tektų atlikti nelietuviškoje skaitmeninių paslaugų aplinkoje?
Pabrėžusi, kaip svarbu nuo elektroninių paslaugų neatriboti ir neįgaliųjų, kalbininkė pasidžiaugia, kad elektroninės paslaugos vis labiau pritaikomos ir jiems – pavyzdžiui, kai kurie interneto naujienų portalai jau įsidiegę kompiuterinį sintezatorių, kuris gali regėjimo negalią turintiems žmonėms lietuviškai balsu skaityti skaitmeninį tekstą. Vyresnio amžiaus žmonės, pasak R. Miliūnaitės, nors ir pamažu, taip pat vis labiau prisitaiko prie skaitmeninio pasaulio.
„Elektroninių paslaugų naudotojų tik daugės, pereisime prie daiktų interneto ir vis platesnės robotizacijos. Bet kodėl mes Lietuvoje tai turėtume daryti angliškai, kiniškai ar dar kokia kita, o ne valstybine kalba?“ – svarsto mokslininkė. Jai labai liūdna matant, kaip tėvai vaikui įduoda angliškai kalbantį žaislą ir palieka juodu vienus „bendrauti“. „Taip, anglų kalbos išmokstama anksti, bet kada gerai beišmokti lietuvių kalbą?“ – klausia R. Miliūnaitė.
„Angliškas produktas ar lietuviškas – ką įpranti naudoti, tą ir naudoji. Jei technologijos būtų lietuviškos, jas ir naudotume, nes mes esame natūraliai lietuviai. Dabar naudojame angliškas programas, nes dauguma technologijų yra angliškos. Tai yra įpročiai. Man labai rūpi, kad tuo, ką mes, „Tilde IT“, sukuriame, visi naudotųsi ir būtų patenkinti. Mūsų vizija – lietuvių kalba turi atsirasti kiekvieno Lietuvos žmogaus kompiuteryje, kiekvieno žmogaus telefone ir kad tai būtų taip pat natūralu, kaip mes dabar naudojamės angliškomis programėlėmis“, – sako R. Špukienė.
„Mums anglų kalba pasidarė artima, be to, ir jos raidynas beveik toks pat, todėl mums nesunku išsimušti iš kelio. „Ai, tiek to, čia gal angliškai padarykim. Ai, ir čia. Ir čia. O paskui žiūri – rėtis tai jau visai skylėtas. Tai kam tada išvis tos lietuvių kalbos informacinėse technologijose reikia? Kalbėkime lietuviškai virtuvėje. Arba dar parašykime vieną kitą romaną. Bet ir tai gal geriau iškart angliškai, nes nereikės versti į anglų kalbą. Taigi ambicija būti savimi ir turėti savo valstybę kai kam gali atrodyti per brangi. Deja, kartais ir atrodo“, – ironizuoja VLKK pirmininkas.
Kodėl taip svarbu išsaugoti lietuvių kalbą?
„XV–XVI a. tarptautinė kalba buvo lotynų kalba, bet kažkodėl ir anglai, ir prancūzai, ir vokiečiai, ir ispanai, ir italai matė reikalą kurti savo bendrines nacionalines rašto kalbas. Jie suprato, kad kitaip neatlaikys konkurencijos. O nuo gebėjimo konkuruoti priklauso valstybingumas, gyvenimo būdas, tautos saugumas, kultūra ir t. t.
Mūsų tautos patirtis ypač skaudi. Kodėl mes praradome Lietuvos Didžiąją Kunigaikštystę, kuri, galima sakyti, jau net buvo betampanti imperija? Praradome dėl to, kad nekūrėme valstybės su savo kalba. Natūralu – nekalbėdamas savo tautos kalba, tu perimi tos tautos, kuri turi savo valstybinę kalbą, savo rašto kalbą, savimonę. XVII a. Jonušas Radvila rašė savo pusbroliui: „Lietuviu gimiau, lietuviu ir mirsiu, bet savo Tėvynėje turime vartoti lenkų kalbą.“ Ir štai XX a. pradžioje, kai atsikuria Lietuva, su kuo nueina mūsų aristokratijos likučiai? Su lenkais. Natūralu. Nes svetima kalba pakeitė jų tautinę savimonę. Kalba yra savimonės pagrindas. Kalba apsako pasaulį. Kalba yra gyvenimo būdas. Ir mes šiandien esame sukūrę valstybę kalbos pagrindu“, – sako A. Antanaitis ir apgailestauja, kad mokykloje neakcentuojama, kodėl svarbu išsaugoti kalbą.
„Tai iš tiesų labai opi problema, – susirūpinęs VLKK vadovas. – Mes mokome lietuvių kalbos, bet nepaaiškiname, ką lietuvių kalba mums duoda ir kokį mūsų bendrą gyvenimą ji kuria. Man yra nemažai tekę susitikti su jaunimu, visada sulaukiu klausimo: „Kam mums ta lietuvių kalba? Mes puikiai susikalbėsime angliškai.“ Be abejo, mes galime puikiai susikalbėti angliškai, bet tokiu atveju neišsaugosime savo valstybės, nes natūraliai perimsime kitą gyvenimo būdą, kitą mąstyseną, o jei nebegalėsime rašyti savo įstatymų, kadangi nebeturėsime išplėtotos savo kalbos, neišvengiamai tapsime kieno nors kolonija. Ar mes to norime?“ – klausia A. Antanaitis.
Vis dėlto jis nepasiduoda pesimizmui. Jo manymu, kalba vystosi švytuoklės principu. „Kiek metų lietuvių kalbai? Mano paskaičiavimais, maždaug 1700. Kiek rašto kalbai? 474 metai. Kiek bendrinei kalbai? 120 metų. O kiek metų valstybinei kalbai? 50 metų. Vos 20 metų prieš Antrąjį pasaulinį karą ir 30 metų dabar. Pažiūrėkite – kokia sena archajiška kalba ir kokie dar nauji, kūdikiški jos drabužiai. Visiškai natūralu, kad po 50 metų okupacijos atsivėrus sienoms kaip pamišę puolėme į tuos išsvajotus Vakarus, neskirdami, kur šiukšlynas, kur popkultūra, kur kas. Angliška – vadinasi, gerai. Iš inercijos tai tęsiasi ir dabar, bet nemanau, kad dar ilgai truks, nes ir mes turime suprasti, man atrodo, dalis visuomenės jau ir pradeda suprasti, kad vis dėlto vertybė yra savastis. Kur mes esame šeimininkai? Tik savo šalyje. Kur mes gerai jaučiamės? Tik savo šalyje. Kad kurtume civilizuotą valstybę, turime rašyti puikius įstatymus, turime kurti literatūrą, turime kurti mokslo darbus savo kalba, kad formuotųsi terminija. Taigi kalba yra valstybinio gyvenimo pagrindas, nes mes turime suprasti vienas kitą. Privačiai galime kalbėti kaip norime, tarmiškai ar kitaip, bet dėl to ir yra bendrinė kalba, kad žmogus iš Skuodo suprastų Dieveniškių žmogų ir kad įstatymai būtų parašyti vienprasmiškai. Ten svarbus kiekvienas garsas“, – sako VLKK vadovas.
Jei šiuolaikine kalba nekuriama skaitmeninių viešųjų paslaugų, ji yra pasmerkta?
Pasak A. Antanaičio, kalbos, kurių nėra skaitmeninių paslaugų erdvėje, neturi jokių šansų, jokių perspektyvų globalizacijos laikotarpiu. „Tik kurdami savo technologijas mes galime įsėsti į tą civilizuotų kalbų traukinį, kuris nuveš į ateitį. Nemanau, kad tokių kalbų liks labai daug. Mano galva, ateitį turi tik valstybinės kalbos. Ir tik tos, kurios aprėpia visas informacines technologijas, elektronines viešąsias paslaugas“, – mano jis.
Jam pritaria A. Utka: „Drąsiai galiu teigti, kad pasmerkta ta kalba, kurios nėra skaitmeninėje erdvėje arba kurios ten yra labai mažai.“
R. Miliūnaitės teigimu, viešosios elektroninės paslaugos apskritai neįsivaizduojamos be kalbos, nes ji yra pagrindinis visuomenės bendravimo, ryšių palaikymo įrankis ir įvairių politinių, teisinių, socialinių, ekonominių, kultūrinių sistemų gyvavimo variklis. „Lietuvių kalba Lietuvoje yra valstybinė, viena iš jos funkcijų – integracinė, taigi suprantama, kad valstybinė kalba skaitmeninėje terpėje atlieka ir svarbų politinį vaidmenį, siedama čia Lietuvos gyventojus, – sako mokslininkė. – Viešosios elektroninės paslaugos ir joms kurti reikalingi skaitmeniniai ištekliai vis labiau tampa sėkmingo valstybės ir ją puoselėjančios visuomenės gyvavimo dalimi.“
Ar valstybė skiria pakankamai dėmesio lietuviškų technologijų plėtotei?
„Žinoma, mes negalime kažkiek neatsilikti, visada turėsime vytis. Bet tas atsilikimas nėra toks drastiškas kaip XVI a., kai italai ir kitos tautos jau turėjo literatūrą savo kalbomis, o mes pirmąjį katekizmą šiaip ne taip išspaudėme. Dabar valstybė dėmesio skiria tikrai nemažai. Bet negalima atsipalaiduoti. Vienas žymiausių šiuolaikinių kalbotyrininkų Davidas Crystalas cituoja McKay: „Kuo stipresnė kalba, tuo mažesnė tikimybė, kad kalbėtojai pastebės, jog reikia imtis veiksmų, arba supras, kas mirs su kalba, kol nepasidarys per vėlu.“ Tada nepastebi, kaip nuslysti į dvikalbystę. Į dvikalbystę nuslysti labai lengva. O juk aišku, kad neatlaikytume konkurencijos nei su anglų, nei su lenkų, nei su rusų, nei su kitomis didelėmis kalbomis. Todėl mums reikia visada turėti omeny: mes negalim sustoti. Pirma, informacinės technologijos kasdien tobulintinos, nes jei atsiras geresnis produktas, žmonės ims jį nė nežiūrėję, lietuviškas jis ar ne. Dabartinė karta vis tiek jau anglų kalbą moka taip pat gerai, kaip senesnė mokėjo rusų. Vadinasi, mes turime sukurti tokius pat patogius lietuviškus produktus.
Tas procesas brangus, todėl praėjusių metų spalį Seimas priėmė Valstybinės lietuvių kalbos komisijos inicijuotas „Lietuvių kalbos plėtros skaitmeninėje terpėje ir kalbos technologijų pažangos 2021–2027 metų gaires“. Valstybė patvirtino suprantanti būtinybę plėtoti informacines technologijas. Taip pat Ekonomikos ir inovacijų ministerija rengia tam tikras skaitmenines programas, numatytas ES paramos fondų planas. Tuos dalykus, apie kuriuos kalbama gairėse, reikia kurti kiekvieną dieną. Juk nesustoja automobilių tobulinimas. Arba kompiuterių, mobiliųjų telefonų. Ta pati situacija, tik čia verslininkas yra visa tauta“, – sako A. Antanaitis.
„Jei lyginčiau, kas buvo prieš kokius penkerius dešimt metų, dėmesio kalbos technologijoms tikrai yra daugiau. Mes irgi prisidėjome prie šių gairių rengimo. Viskas ten yra gerai, viskas gražu, bet mes esame praktikai, mums reikia veikiančių sprendimų. Mano lūkestis – kad visa tai, kas parašyta, virstų realybe.
Mes, lietuviai, visada norime pirmauti. Ypač mes, verslas, siekiame, kad projektas kuo greičiau taptų daiktu. Valstybė, palyginti su verslu, apskritai lėčiau veikia. Ir čia ta lūkesčio takoskyra. Mums norisi greičiau, o stabdo visi tie biurokratiniai dalykai: jei, pavyzdžiui, konkursas turi vykti 60 dienų, tokios trukmės jis ir turi būti rengiamas. Dienos tiksi, ir taip ištįsta visas projektas laike. O kadangi technologijos plėtojamos išties labai sparčiai, kartais per tą laiką pasaulis jau būna pažengęs į priekį. Aš orientuota į rezultatą, tad man norisi pamatyti, kaip tos gražios gairių idėjos virs rezultatu. Nors per nesėkmes mes užaugame, vis tiek norėtųsi, kad valstybei pasisektų“, – sako R. Špukienė, vadovaujanti „Tilde IT“, kuri buvo įkurta 2000-aisiais ir tais pačiais metais ėmė bendradarbiauti su „Microsoft“ lokalizuojant jų gaminamą programinę įrangą.
Ar mums ne per brangu konkuruoti su komercinėmis kalbomis?
„Mes turime spėti su technologine pažanga, užtikrinti visas skaitmenines paslaugas, tad labai svarbu, kad mūsų valstybė ir valdžia suprastų, kad tai tikrai yra brangu. Nes, pirma, ne mes sukūrėme informacines technologijas – interneto ir daugelio programų bazė yra nelietuviška, todėl mums reikia vytis. Antra, lietuvių kalba yra nekomercinė kalba, nepakanka verslo išteklių, kad būtų kuriamos galingos originalios programos, tikrai galingos viešosios paslaugos. Vadinasi, valstybė turi skirti dėmesio ir lėšų, kad mūsų informacinės technologijos žengtų koja kojon su laiku kaip ir visų kitų valstybių informacinės technologijos. Balso sintezatoriai, šnekos atpažintuvai, mašininis vertimas, virtualusis asistentas, kalbos ištekliai – viskas turi būti finansuojama, ir mums, mažai valstybei, tai yra tikrai didesnis krūvis nei didelėms šalims“, – sako A. Antanaitis.
„Ne viskas matuojama pinigais. Ir ne visada pagalvojame, kad niekas kitas, tik mes patys esame atsakingi pasauliui už lietuvių kalbos gyvavimą ir jos išlaikymą. Jeigu norime, kad lietuvių kalba gyvuotų skaitmeninėje erdvėje, neužtenka tiesiogiai perimti populiariausias anglų kalbos technologijas. Lietuvių ir anglų kalbos gramatiškai yra gana skirtingos, todėl matome, į ką pavirsta lietuvių kalba, įsprausta į anglų kalbai pritaikytą skaitmeninę aplinką. Kad ir socialiniuose tinkluose – automatizuotas vardų ir pavardžių rašymas neleidžia jų linksniuoti, kai kurios frazės ar komandos verčiamos bendratimis ir vardininkais. Žmonės priversti visaip sukaliotis, kad išvengtų lietuvių kalbos iškraipymų“, – grindžia lietuvių kalbos technologijų būtinybę R. Miliūnaitė.
Kokie skaitmeniniai produktai lietuvių kalba jau sukurti ar kuriami?
„Šiandienės lietuvių kalbos technologijos iš esmės aprėpia svarbiausias pasaulyje plėtojamų kalbos technologijų sritis: skaitmeninių kalbos išteklių kaupimą ir apdorojimą, mašininį vertimą ir programų lokalizavimą [lietuvinimą], šnekos atpažinimą ir sintezę, informacijos iš duomenų visumos ištraukimą, natūraliosios kalbos generavimą, tekstų klasifikaciją pagal kalbos ir stiliaus požymius, kalbos tikrintuvus ir kt.
Informacinės technologijos nuolat tobulėja, tad ir kalbos technologijų kūrimas nėra baigtinis procesas. Iki tobulumo dar labai toli, apskritai manau, kad mašininio vertimo programos niekada nepasieks tokio lygio, kokį geba pasiekti meninį tekstą versdamas žmogus. Tačiau administraciniams (teisės aktų ir pan.) tekstams mašininis vertimas teikia akivaizdžios naudos: kai kurios operacijos, apdorojant milžiniškus duomenų kiekius ir atrenkant reikiamus variantus, atliekamos nepalyginti sparčiau, nei atliktų žmogus. Žmogaus proto tada reikia tik išverstam tekstui peržvelgti ir „sužmoginti“ ten, kur kompiuterinė programa dar palieka kliuvinių“, – aptaria savo ir kolegų nuveiktus darbus R. Miliūnaitė.
„Šiandien galima užtikrinti daugumą bazinių lietuvių kalbos apdorojimo uždavinių , t. y. segmentavimą, lemavimą [žodžių ar žodžių junginių vertimą į bendrinę formą], morfologinį analizavimą, rašybos tikrinimą, be to, jau neblogai veikia ir kai kurios sudėtingesnės technologijos, tokios kaip mašininis vertimas į tam tikras kalbas, kirčiavimas, šnekos atpažinimas, automatinis transkribavimas, šnekos sintezavimas, išmanioji paieška. Tiesa, visos egzistuojančios kalbos technologijos vis dar daro klaidų ir dėl to turėtų būti tobulinamos, kad būtų naudingesnės visuomenei ir verslui. Vis dar daug reikėtų dirbti prie kalbos supratimo, kalbos generavimo, sintaksinės ir semantinės analizės, mašininio vertimo įvairioms kalbų poroms ir kt.“, – vardija A. Utka.
„Ir toliau viena iš mūsų verslo krypčių lieka programų lokalizavimas. Esame sukūrę pasaulinio lygio mašininio vertimo sistemą. Mes visada mąstome, kokių dar naujesnių kalbos technologijų galėtų būti. Taip atsirado šnekos atpažinimo, balso sintezės technologijos.
Jau palyginti seniai esame sukūrę į individualų vartotoją orientuotą „Tildės Biurą“ su gramatikos ir rašybos tikrintuvu. Ten pat galima išbandyti ir kitas mūsų sukurtas technologijas – šnekos atpažinimo, mašininio vertimo, yra ir įvairių kalbų, taip pat sinonimų žodynų. Teikiame kalbos technologijas kaip paslaugas ir verslo įmonėms, ir valstybinėms įmonėms, taip pat individualiems vartotojams.
Jau kelerius metus mes kuriame dirbtiniu intelektu grįstas kalbines technologijas, kurios yra lengvai pritaikomos ir gali būti integruojamos į bet kurią valstybinę ar verslo informacinę sistemą. Jų paskirtis – palengvinti, automatizuoti darbuotojų kasdienes užduotis, pavyzdžiui, atsakyti į klientų klausimus, surasti informaciją ir t. t., kitaip tariant, efektyvinti bet kurios įmonės – valstybinės ar verslo – veikimą“, – „Tilde IT“ veiklą apžvelgia R. Špukienė.
Lietuviškas dirbtinis intelektas – realu?
A. Utkos teigimu, vadinamasis siaurasis lietuviškas dirbtinis intelektas jau keleri metai yra realybė – egzistuoja ir kuriami šimtai sprendimų, grįstų neuroninių tinklų technologijomis. Siaurasis dirbtinis intelektas gerai atlieka specifines funkcijas, pavyzdžiui, geba anglų kalbos sakinius išversti į lietuvių kalbą, surūšiuoti tekstus ir sakinius. Pasinaudodamos neuroninių tinklų technologijomis, sistemos geba iš duomenų išmokti jų savybes ir tada jas pritaikyti naujiems duomenims analizuoti.
„Šių technologijų rezultatų kokybė priklauso nuo to, kiek ir kokių duomenų toks dirbintis intelektas „matė“, kiek kartų „matė“ ir kokie mokymosi algoritmai buvo pritaikyti. Pavyzdžiui, mašininio vertimo, šnekos atpažinimo ar šnekos sintezavimo paslaugos yra grįstos neuroninių tinklų technologijomis“, – aiškina A. Utka.
Bendrasis dirbtinis intelektas, pasak mokslininko, – tai jau filosofinio lygmens klausimas. Jį būtų galima užduoti visai žmonijai, ne tik lietuviui. Pirmiausia reikėtų apsibrėžti, ką laikytume tuo dirbtiniu intelektu. Ar tai sistema, galinti atlikti žmogaus juslines funkcijas – regėti, lytėti, uosti, girdėti, jausti skonį? Ar tai sistema, kuri gerai supranta žmogaus kalbas, gali jomis šnekėti, gali judėti ir savarankiškai priimti sprendimus?
„Visos šitos dirbtinio intelekto savybės jau yra beveik realybė, robotai gali visus šituos dalykus geriau ar blogiau daryti. Tačiau yra ir sudėtingesnių klausimų, kurie turėtų būti išspręsti kuriant dirbtinį intelektą: savęs suvokimas, motyvacija, sąmonė, religija, etinės ir moralinės nuostatos. Kokį bendrąjį dirbtinį intelektą sukurtų skirtingų tautų, pasaulėžiūrų ar religijų atstovai? Atsakyčiau taip: tikiu, kad jeigu bendrasis dirbtinis intelektas bus sukurtas ir tuo metu egzistuos lietuviškai kalbanti tauta, tai ta tauta, bendrai dirbdama, ir pasirūpins, kad dirbtinis intelektas kalbėtų lietuviškai“, – mano A. Utka.
„Mes dalyvaujame įvairiuose Lietuvos institucijų organizuojamuose projektuose. Galėtų būti ir daugiau projektų, programų. Jeigu institucijos ar pati valstybė mąstytų žvelgdama į ateitį, tai galvotų, kaip kalbos technologijas įdiegti į savo sistemas, kad gyventojams būtų lengviau susigaudyti, o tarnautojams – efektyviau dirbti.
Valstybinė mokesčių inspekcija (VMI) buvo pirmoji, kuri, išanalizavusi kitų Europos Sąjungos šalių patirtį, suprato, kad nepakeliamą darbo krūvį, dažnai lydimą ir psichologinės įtampos, jos darbuotojams galėtų padėti sumažinti pokalbių robotai. VMI tokį jau sėkmingai naudoja ir džiaugiasi. Robotas nepavargsta paprastai, gražiai, be emocijų atsakinėti į dažniausiai pasikartojančius klausimus, kuriems reikia paprastų trumpų atsakymų, o darbuotojai tuo tarpu susitelkia į sudėtingesnes užklausas, kur jau reikia žmogaus įsikišimo, detalesnio paaiškinimo, kokios nors specifinės informacijos“, – sako R. Špukienė.
Kaip naujausios lietuviškos skaitmeninės technologijos diegiamos į viešąjį sektorių?
„Subrandintos ir gerai veikiančios kalbos technologijos labai greitai yra pastebimos ir diegiamos į viešąjį sektorių. Pavyzdžiui, „e-Translation“ sistema, skirta administracinių tekstų automatiniam vertimui. Taip pat į lrt.lt puslapį ir į Seimo tinklalapį įdiegtas šnekos sintezavimas, automatinės kalbos transkripcijos sistema“, – vardija A. Utka.
R. Špukienė sako, kad „iš valstybės, vyriausybės trūksta platesnio požiūrio, kaip tas kalbos technologijas, kurios jau yra sukurtos, įdarbinti. Reikėtų tokią viziją sukurti, mes galėtume padėti, parodyti tas galimybes. Bet valstybė turi norėti tai daryti ir skirti žmonių, kurie tuo rūpintųsi. Taip galų gale turėtume rezultatą, kuriuo būtume visi patenkinti.“
„Mes nemažai produktų esame sukūrę, bet dar neintegravę. Neabejoju, kad ir Vyriausybės dokumentų paieškos sistema, kuriai tiesiog pritaikyta anglų kalbos sistema, tikrai jau galėtų būti integruota. „Rytoj rytoj, ne tuoj“, – šaukė pelėdžiukai, ir taip nei skaityti, nei rašyti neišmoko. Čia dažna mūsų bėdelė, bet tai ne tragedija, – optimistiškai nusiteikęs A. Antanaitis. – Vis tiek mes einam į priekį. Tik turime neatsipalaiduoti. Turime suprasti, kad lietuvių kalbos šitoje valstybėje niekas nepakeis. Kad viską galima kurti tik lietuviškai, bendrine lietuvių kalba, jeigu norime turėti valstybę.“
Kokių naujų viešųjų paslaugų jau greitai turėtų atsirasti?
„Lietuvių kalbos institute ką tik baigėme daugiau kaip trejus metus trukusį projektą „Lietuvių kalbos išteklių informacinės sistemos plėtra (E. kalba)“. Rudenį ketiname visuomenei pristatyti lietuvių kalbos skaitmeninių išteklių portalą „E. kalba“.
Buvusi lietuvių kalbos išteklių informacinė sistema LKIIS perkelta į naują kompiuterinę platformą, papildyta trimis populiariausiais žodynais, kad būtų galima paieška visuose šios sistemos vienakalbiuose ir dvikalbiuose žodynuose vieno langelio principu.
Ši „E. kalbos“ dalis dabar apima 9 vienakalbius ir 10 dvikalbių žodynų. Prie LKIIS sistemoje jau buvusių vienakalbių žodynų („Dabartinės lietuvių kalbos žodyno“, sinonimų, antonimų, frazeologijos, palyginimų ir sisteminio lietuvių kalbos žodyno) pridėti dar 3 itin svarbūs žodynai, kuriuos iki šiol internete buvo galima rasti tik atskirose svetainėse: „Didysis lietuvių kalbos žodynas“, rengiamas „Bendrinės lietuvių kalbos žodynas“ ir Lietuvių kalbos naujažodžių duomenynas.
Taip pat sukūrėme septynias naujas paslaugas, kurios gali būti naudingos vertėjams, redaktoriams, verslui, pavyzdžiui, ieškančiam naujų idėjų, kaip pavadinti kokią prekę ar paslaugą, norinčiam greitai atlikti interneto svetainėje surašytų lankytojų nuomonių analizę (kiek esama palankių ir nepalankių atsiliepimų) ir kt.“, – vardija R. Miliūnaitė.
„Karantinas perkėlė mus į virtualią erdvę, tačiau ne visi turi galimybių organizuoti tiek susitikimų, kiek reikia. Mūsų tikslas – padėti tiek valstybinėms, tiek verslo, net ir mažoms, įmonėms kuo patogiau organizuoti susitikimus ir apdoroti bei kaupti jų informaciją, todėl mes kuriame virtualių susitikimų asistento prototipą, kuris per susitikimus įrašytų garsą, tą garsą paverstų tekstiniu dokumentu, kurio pagrindu būtų galima parengti straipsnį, apžvalgą, žinutę socialiniuose tinkluose, taip pat susitikimo dalyviams išsiųstų protokolą ir jį suarchyvuotų, kad tą informaciją būtų galima bet kada per paiešką pagal raktinį žodį surasti“, – dalijasi artimiausiais planais R. Špukienė.
Paklausta, ar ketina kurti virtualiuosius asistentus, kaip „Alexa“, „Siri“, „Tilde IT“ vadovė sako: „Nekuriame, bet manome, kad visi jau esami kada nors kalbės lietuviškai. Aišku, čia reikėtų resursų – ir piniginių lėšų, ir žmogiškųjų išteklių, ir kalbos tyrimų, nes mes dar neturime daug kalbinių išteklių. Kita vertus, visada yra galimybė pasinaudoti jau veikiančiais virtualiųjų asistentų sprendimais. Jeigu toks poreikis mūsų rinkoje iškiltų, manau, būtume pasirengę jų pasiūlyti.“
Ar mes pajėgūs varžytis su didžiosiomis kalbomis?
„Lietuvoje viešųjų skaitmeninių paslaugų rinka, palyginti su kitomis informacines technologijas sparčiai plėtojančiomis šalimis, nėra didelė, niekada negebėtume sukurti tokios tų paslaugų įvairovės ir dažnai – kokybės, kokias matome kitur“, – mano R. Miliūnaitė. Pasak jos, kalbos technologijos, kuriomis grindžiamos elektroninės paslaugos, kuriamos ne iš kokių nors teorinių paskatų ar vien tik iš noro neatsilikti nuo pasaulio. Pati visuomenė mato tokių paslaugų poreikį, ir jis ypač sustiprėjo per pandemiją, kai atsivėrė didelės nuotolinio darbo, mokymosi ir kitos veiklos galimybės.
A. Utka linkęs pasivaržyti: „Jeigu tam skirsime išskirtinį dėmesį, tai būsime pajėgūs. Tas išskirtinis dėmesys – tai ne vien investicijos į technologijas ir duomenis, ne vien investicijos į mokslą ir švietimą ir ne vien investicijos į kalbos prestižą. Tai turėtų būti investicijos į visus šiuos dalykus.“
„Palyginti su anglų kalbos resursais (kiek prirašyta straipsnių, dokumentų ir t. t.), lietuvių kalbos ištekliai yra šimtus, tūkstančius kartų mažesni. Tad mes ieškome, kaip kitais būdais pagerinti mažų resursų kalbų modelius.
Visos tos technologijos yra mūsų kūdikiai ir visomis jomis mes didžiuojamės, tačiau mašininis vertimas jau yra brandi technologija, ganėtinai plačiai naudojama. Mes džiaugiamės, kad mūsų mašininis vertimas, sukurtas taikant giliųjų neuroninių tinklų mokymo metodą, niekuo nenusileidžia pasaulinio lygio technologijų gamintojų – „Google“, „Amazon“, „Microsoft“ – produktams. Kaip mes lyginamės? Yra organizuojami pasauliniai mašininio vertimo maratonai: visi gamintojai, ir dideli, ir maži, gauna vienodą užduotį, atlieka namų darbus ir pateikia tą sukurtą technologiją vertinti tos srities ekspertams. Galiu pasigirti, kad mūsų latvių, estų ir lietuvių kalbų mašininių vertimų varikliai yra vieni iš geriausių pasaulyje. Tai reiškia, kad mes, maža tauta, nė kiek nenusileidžiame didiesiems gamintojams“, – sako R. Špukienė.
Jai pritaria ir VLKK pirmininkas A. Antanaitis: „Žinoma, mes pajėgūs. Nes, pirma, viską turime toms varžyboms – valstybę, valstybinę kalbą, išsilavinusią visuomenę, informacinių technologijų specialistų, valstybinę politiką. Kuo mes blogesni už kitas pasaulio šalis ir kalbas? Niekuo. Tik didžiosios šalys eina labiau verslo keliu, o mes turime kliautis ir valstybės parama, nes mums tie komerciniai dėsniai ne visada galioja. Žinoma, nedidelei valstybei brangu šioje konkurencinėje kovoje dalyvauti, bet kol dar galime gauti paramos iš tarptautinių fondų, tol naudokimės, o ateityje turime subręsti tiek, kad patys vieni taptume stiprūs. Ne valstybės dydis lemia. Mūsų teritorija didesnė nei Nyderlandų, Estijos, Latvijos, tik prisitraukime į Lietuvą protų, gerai panaudokime savuosius ir galėsime varžytis lygiais pagrindais su kitais. Mes kol kas tuo keliu ir stengiamės eiti.“
Straipsnis parengtas iš VLKK vykdomos Lietuvių kalbos prestižo stiprinimo programos lėšų
Užsakymo nr.: PT_87828995