Apie intelektualiųjų sistemų pritaikymą kasdieniame gyvenime, jų plėtrą teisės srityje Lietuvoje ir užsienyje, esamus ir būsimus pokyčius skaitmeninant teisinę kalbą kalbamės su Vytauto Didžiojo universiteto Informatikos fakulteto docentu bei Skaitmeninių išteklių ir tarpdisciplininių tyrimų instituto mokslininku dr. Dariumi Amilevičiumi.
– Apie dirbtinio intelekto technologijas kalbama daug ir plačiai. Vis dėlto pagrindinių informacinių technologijų žinių ne visada pakanka norint paaiškinti, kaip veikia dirbtinis intelektas, kokią įtaką dabarties ir ateities kasdieniam gyvenimui jis turi ir kokios grėsmės kyla jį taikant. Ką apie dirbtinį intelektą turėtų žinoti skaitytojai?
– Pritariu amerikiečių mokslininko Michaelo I. Jordano nuomonei, kad terminas dirbtinis intelektas yra klaidinantis ir ydingas. Nors šis terminas jau tapo būtinu „mokslinio“ diskurso, o dažniau popkultūros ir miesto legendų elementu, sakraline rinkodaros fraze, vis dėlto iki šiol nėra tokio dalyko kaip dirbtinis intelektas ir nėra bendro sutarimo, kokį turinį apima ši formuluotė. Jei nenorime gilintis į dirbtinio intelekto teoriją ir filosofiją, siūlyčiau vartoti Europos Komisijos Dirbtinio intelekto akto projekte teikiamą apibrėžimą: „Dirbtinis intelektas – tai greitai vystoma technologijų grupė. Šios technologijos gali duoti visokeriopą ekonominę ir visuomeninę naudą pačiose įvairiausiose pramonės šakose ir socialinės veiklos srityse.“ Žmonija pirmą kartą sukūrė universalias technologijas, kurios sėkmingai taikomos daugelyje sričių. Internete gausu sėkmės istorijų. Norėčiau paminėti Vilniuje neseniai atidarytą pirmąją dirbtinio intelekto technologijų valdomą parduotuvę, kurioje klientai aptarnaujami 98–99 proc. tikslumu. Vienintelės skaitmeninės technologijos, priskirtinos intelektualiosioms technologijoms, yra gilusis mokymas, naudojant giliuosius dirbtinių neuronų tinklus. Esu ne tik tyrėjas, bet ir technologijų entuziastas, todėl mašinos gebėjimą pačiai apsimokyti iš pavyzdžių ir susiprogramuoti laikau dirbtinės intelektikos užuomazgomis. Vienas iš dirbtinio intelekto krikštatėvių anglų mokslininkas Džiofris Hintonas teigia, kad modernios giliojo mokymosi technologijos ateityje galės padaryti viską, bet dar turi įvykti bent keli konceptualūs proveržiai.
Apibendrintai kalbant apie grėsmes, dabartinę situaciją geriausiai atspindi banali paukščio-lėktuvo analogija. Kopijuodamas paukščio skrydį, žmogus sukūrė lėktuvą. Abu skraido, bet lėktuvas skraido kitaip nei paukštis. Paukštis niekada nenukrenta, o lėktuvas, deja, retkarčiais taip, nors pastarasis labai naudingas žmonijai. Neįmanoma trumpai apibūdinti visų grėsmių. Paminėčiau garsųjį COMPASS programinės įrangos panaudojimo teismų sistemoje atvejį. COMPASS yra bylų valdymo ir sprendimų palaikymo įrankis, kuris padėjo Jungtinių Amerikos Valstijų teismams įvertinti tikimybę, ar atsakovas pakartotinai taps recidyvistu. Įrankis buvo plačiai kritikuojamas dėl diskriminuojančių prognozių. Kartu šis atvejis atskleidžia kompleksinę intelektualiųjų technologijų panaudojimo problematiką. Sistema priklauso privačiai bendrovei, todėl jos algoritmų viešai negalima analizuoti, nes juos saugo komercinė paslaptis. Kita vertus, intelektualiosios sistemos tiesiogiai priklauso nuo duomenų, kurie naudojami mokymo metu. Todėl jei duomenų rengėjai sistemai apmokyti pateikė tinkamai neapdorotus duomenis, jos prognozės natūraliai tapo diskriminuojančios.
– Kokią naudą gausime intelektualiąsias technologijas pritaikę teisės srityje?
– Pasaulinė teisinių paslaugų rinka yra milžiniška, bet teisės sritis iki šiol vis dar mažiausiai paliesta skaitmeninių inovacijų. Intelektualiosios technologijos jau sėkmingai taikomos bankų, rizikų valdymo, draudimo, logistikos, medicinos ir kitose srityse. Europos etikos chartijoje dėl dirbtinio intelekto naudojimo teismų sistemose ir jų aplinkoje Europos Komisija ragina intelektualiųjų technologijų komercinį diskursą aiškiai atskirti nuo šių technologijų naudojimo ir diegimo realijų.
Nagrinėdamas intelektualiųjų technologijų taikymo teisinėse sistemose perspektyvas, britų ekspertas Richardas Susskindas teigia, kad, visų pirma, būtina atsakyti į penkis esminius klausimus:
1) ar technologijos jau pakankamai brandžios, kad galėtų pakeisti teisininkus;
2) ar moraliai jau priimtina, kad mašinos perimtų bent kai kurias teisėjų ir teisininkų funkcijas;
3) ar tokios sistemos jau komerciškai perspektyvios, ar jų ekonominė nauda bus didesnė už jų kūrimo išlaidas;
4) ar tai bus tvaru (nepaskatins atmetimo reakcijos), atsižvelgiant į kultūrinį kontekstą;
5) ar yra teisinis pagrindas kurti tokias sistemas, t. y. ar tam tikroje nacionalinėje teisinėje sistemoje teismo sprendimų priėmimo procedūra nesusijusi su kokia nors specifika, dėl ko teismo sprendimo priėmimas iš dalies ar visiškai negali būti patikėtas mašinai.
Kol neturime atsakymų į esminius klausimus, pažvelkime į praktiškesnę intelektualiųjų technologijų panaudojimo teisinėje sistemoje pusę. Galime išskirti kelias sritis, kuriose šios technologijos padidintų teisės srities procesų efektyvumą. Visų pirma, tai dokumentų rengimo automatizavimas. Intelektualiosios technologijos gali išanalizuoti žmogaus rengtus dokumentus ir išmokti juos generuoti automatiškai. Generavimo metu iš šių dokumentų gali išgauti naudingą informaciją pagal iš anksto nustatytą logiką. Automatinis kalbos atpažintuvas gali per kelias minutes garso ir vaizdo įrašus paversti elektroniniu tekstu, atpažinimo metu iš tekstų išgaudamas naudingą informaciją.
Kita svarbi sritis – išmani teisinė paieška ir automatinė dokumentų analizė. Intelektualios priemonės gali pagreitinti darbą, dideliuose duomenynuose greitai surasdamos reikalingus teisės aktus arba tinkamiausias bylas. Taip pat gali atlikti sutarčių ir kitų teisinių dokumentų analizę, patikrinti dokumentų integralumą ir išsamumą, šitaip sumažindamos rutininio darbo naštą žmogui.
Paminėtinas ir predikcinis teisingumas, kai intelektualiųjų technologijų sistemos, besinaudojančios dideliais jau išnagrinėtų bylų kalbiniais ištekliais, susieja pateiktus duomenis ir dokumentus su galima rutininių bylų sprendimo prognoze, pasiūlydamos svarbių bylų prioritetus ir šitaip padėdamos teisėjams sutelkti dėmesį, visų pirma, į sudėtingas bylas.
– Ekonomikos gaivinimo ir atsparumo didinimo plane „Naujos kartos Lietuva“ daug dėmesio skiriama inovatyvioms priemonėms ir ištekliams, kurių pritaikymas Lietuvoje leis intelektualiosioms technologijoms suprasti lietuvių kalbą. Koks įdirbis lietuvių kalbos skaitmenizavimo srityje jau yra padarytas? Kokie lietuvių kalbos skaitmenizavimo tikslai ir perspektyvos?
– Nė vienos paslaugos, susijusios su žmogaus kalba, neįmanoma visiškai skaitmenizuoti ir automatizuoti be natūralios kalbos technologijų (angl. natural language technologies) pažangos. Natūralios kalbos technologijos yra intelektualiųjų technologijų šaka, kuri leidžia mašinai suprasti, interpretuoti ir manipuliuoti žmogaus kalba. Natūralios kalbos technologijos skirstomos į natūralios kalbos apdorojimą (angl. natural language processing), supratimą, generavimą ir mašininį vertimą. Savo ištakose natūralios kalbos technologijos buvo siejamos tik su lingvistikos sritimi, kur jos pirmiausia įsitvirtino tam, kad kompiuteriai galėtų apdoroti didelius natūralios kalbos išteklius ir šitaip padėtų lingvistams analizuoti kalbą. Laikui bėgant, natūralios kalbos technologijose, greta taisyklėmis grįstų ir statistinių metodų, buvo pradėti taikyti mašininio ir giliojo mokymosi metodai. Tokiu būdu natūralios kalbos apdorojimo technologijos įsiliejo į intelektualiųjų technologijų šeimą ir tapo neatskiriama jų dalimi. Vertinant bendrai, žmogaus kalba mašinai yra sunkiausiai įveikiamas barjeras, nes skaitmeninė mašina „supranta“ tik skaičių kalbą.
Intelektualiosios technologijos teikia kokybiškus rezultatus tik tada, kai joms apmokyti naudojami labai dideli kokybiškų duomenų ištekliai. Šiuo metu pasaulyje vokiečių kalbą vartoja apie 130 mln., o lietuvių – tik apie 3,5 mln. žmonių. Savaime aišku, kad lietuviški bendriniai kalbos ištekliai yra gerokai mažesni, jau nekalbant apie specializuotas sritis, kaip teisinė, kuri visomis pasaulio kalbomis stokoja gausių kalbos išteklių. Šie lietuvių kalbos ištekliai turi būti dirbtinai, bet kokybiškai gausinami, o tai reikalauja papildomo darbo ir didina kūrimo išlaidas. Paminėtina ir tai, kad lietuvių kalba yra ne tik „maža“, bet ir viena sudėtingiausių pasaulyje. Lietuvių kalbos dažniausiai vartojamų žodžių žodyną sudaro apie 180 tūkst. žodžių pagrindinių formų (vienaskaitos vardininko linksnis). Pagal lietuvių kalbos kaitybos taisykles iš jų sudaroma apie 20 mln. morfologinių formų. Dar reikia turėti omeny ir sudėtingą, lanksčią lietuvių kalbos sintaksę. Todėl kokybiški intelektualiųjų technologijų sprendimai, pritaikyti analitinei anglų kalbai, ne visada tinkami sintetinei lietuvių kalbai. 2012–2015 m. įgyvendinus valstybinę programą „Lietuvių kalba informacinei visuomenei“, pagal taisykliniais ir statistiniais metodais grįstų natūralios kalbos technologijų ir jiems skirtų kalbos išteklių lygį pavyko pralenkti Europos Sąjungos vidurkį. Intelektualiųjų technologijų proveržis ir kintantys rinkos poreikiai iškėlė naujų iššūkių ir lietuvių kalbos technologijų tobulinimo srityje. 2018–2020 m., įgyvendindami valstybinės programos „Lietuvių kalba informacinėse technologijose“ projektus, pradėjome giliojo mokymo metodus taikyti natūralios kalbos technologijų sprendimuose lietuvių kalbai.
Vilniaus universiteto kolegos reikšmingai pagerino mašininio vertimo sprendimus. Vytauto Didžiojo universitetas, vykdydamas projektą „Semantika-2“, sukūrė efektyvius raštvedybos automatizavimo sprendimus bendrinei, teisinei ir medicinos sritims: lietuvių kalbos atpažintuvą, garso įrašą, perrašantį elektroniniu tekstu, automatinį dokumentų santraukų sudarytuvą, pagerinome automatinio rašybos klaidų taisymo sistemą, sukūrėme kitus sprendimus, kuriais laisvai ir nemokamai galima pasinaudoti projekto interneto svetainėje. Didžiausia problema, su kuria susidūrėme įgyvendindami minėtus projektus, – didelių lietuvių kalbos išteklių stygius, ypač tokiose specializuotose srityse kaip teisė ir medicina. Šiose srityse formuoti kalbos išteklius sudėtinga ir dėl duomenų apsaugos normų, kurios Europos Sąjungoje daug griežtesnės nei Jungtinėse Amerikos Valstijose. Tai savo ruožtu papildomai lemia, kad intelektualiųjų technologijų sprendimai teisės srityje anglų kalba plėtojami sparčiau nei lietuvių. Darytina išvada, kad intelektualiųjų ir natūralios kalbos technologijų pažanga ir jų taikymas Lietuvos teisinėje sistemoje tiesiogiai priklauso nuo laiku įgyvendinamos atvirų duomenų politikos, efektyviai vykdomos Lietuvos teisingumo sistemos plėtros programos ir kokybiškai įgyvendintų „Naujos kartos Lietuvos“ plane numatytų projektų.
– Ar teisingumo vykdymas kalbos skaitmenizacijos aspektu taps natūralia mūsų valstybės pažangos dalimi?
– Kaip rodo užsienyje vykdytų tyrimų rezultatai, prieigos prie teisingumo situacija sparčiai blogėja. Gyvename perteklinio reguliavimo laikais. Padėtį dar sunkina pasaulinė pandemija, karantinai ir t. t. Užsienyje vykdytų apklausų dalyviai pažangių technologijų taikymą pripažįsta viena iš veiksmingų priemonių, gerinančių prieigą prie teisingumo. Deja, man nepavyko rasti panašių tyrimų Lietuvoje. Todėl į klausimą atsakysiu žvelgdamas iš kitos pusės. Vis daugiau veiklų žmogus atlieka naudodamasis kompiuteriu, todėl tų veiklų rezultatai yra skaitmeniniai. Pasaulyje nemažai šalių teismų veikla perkeliama į elektroninę erdvę. Skaitmenizacija mažina veiklos kaštus ir kainas vartotojams, leidžia efektyviau organizuoti procesus. Vienas iš pagrindinių barjerų – natūralios kalbos technologijų barjeras. Lietuvos pažangos strategijoje „Lietuva 2030“ modernios informacinės technologijos ir skaitmeninė infrastruktūra jau yra pažangos dalis. Kaip jau minėjau, lietuvių kalba nėra komerciškai patraukli. Teisingumo vykdymas kalbos skaitmenizacijos aspektu tikrai vyks. Kitas klausimas – kurios kalbos? Teisės srities skaitmenizacija anglų kalba jau reikšmingai pažengusi į priekį ir yra komerciškai patraukli. Kaip pilietis, nenorėčiau, kad mano gimtoji lietuvių kalba liktų tik kultūrinio paveldo skaitmeninimo objektu. Kaip verslininkui, anglų kalba atvertų platesnes galimybes ir greitesnį kuriamų sprendimų rentabilumą. Kaip tyrėjui, tyrimų imtis nepakistų, nes jau dabar vykdome tyrimus keliomis kalbomis, kuriame daugiakalbes sistemas. Todėl šis klausimas turėtų būti skirtas politikos formuotojams ir visuomenės nuomonės tyrimams.
– Teisinėje sistemoje viskas grįsta pasitikėjimu, kad teisėjas priims teisingą sprendimą. Kaip ir medicinoje, taip ir teisinėje sistemoje visuomenė turi įgyti pasitikėjimą intelektualiosiomis technologijomis ir gauti įrodymus, kad jos yra veiksmingos įgyvendinant teisingumą, nekelia rizikos visuomenei. Europos Komisija, vykdydama Europos Sąjungai būdingą proaktyvų technologijų reguliavimą, Dirbtinio intelekto akto projekte laikosi rizika grįsto metodo. Nors teigia, kad „šis reglamentas neturėtų trukdyti kurti ir naudoti naujoviškus viešojo administravimo metodus, kuriuos būtų galima pritaikyti platesniu mastu naudojant reikalavimus atitinkančias ir saugias dirbtinio intelekto sistemas, jeigu jos nekelia didelės rizikos juridiniams ir fiziniams asmenims“, nustato, jog kai kurios intelektualiųjų technologijų sistemos „turėtų būti klasifikuojamos kaip keliančios didelę riziką, nes jos sprendimus priima ypač kritinėse situacijose, susijusiose su asmenų gyvybe ir sveikata bei jų turtu“. Šiame dokumente nustatomi griežti reikalavimai didelės rizikos sistemoms ir joms numatoma privaloma žmogaus priežiūra.
Pastebėtina, kad dokumente teisinė sritis neminima, nors nuolat minima fizinių asmenų pagrindinių teisių ir laisvių apsauga. Nesvarstysiu klausimo, ar įmanoma sparčiai plėtoti technologijas, esant tokioms griežtoms reguliavimo normoms, bet tuo atveju, jei teisinės sistemos bus priskirtos didelės rizikos sistemoms, žmogiškasis faktorius išliks ilgam. Ilgojo laikotarpio perspektyvoje žvelgdami bent iš teorinio taško negalime neužduoti provokuojančio klausimo: o gal bešališka skaitmeninė mašina yra tinkama kandidatė tapti Temidės teisingumo svarstyklėmis?
– Su kokiais iššūkiais susidursime dirbtinį intelektą pritaikydami dalykinei teisės kalbai? Ar teisininkams teks persikvalifikuoti, kai ši technologija ims veikti kaip savaime suprantamas dalykas?
– Tradicinis posakis „palikime IT skyriui spręsti su skaitmena susijusius klausimus“ jau yra praeities reliktas. 2012 m. Jungtinėse Amerikos Valstijose buvo priimtos nuostatos, reikalaujančios aukšto advokatų technologijų raštingumo lygio. Netrukus tai tapo privalomu advokatų profesinės etikos reikalavimu, užtikrinančiu, kad būtų teikiamos kokybiškos paslaugos ir kompetentingai atstovaujama klientams. Ketvirtosios ir penktosios pramonės revoliucijų kontekste reikalaujama vis didesnio visų profesijų atstovų technologijų raštingumo lygio. Tai neišvengiamybė. Kitas klausimas – dalykinė teisinė kalba. Galiu pateikti ilgiausią sąrašą mokslinių studijų, kuriose nagrinėjama teisinė anglų kalba ir su ja susijusi intelektualiųjų technologijų taikymo problematika. Deja, Lietuvoje tokių tyrimų trūksta. Dalykinė teisinė kalba smarkiai skiriasi nuo bendrinės. Tai viena iš priežasčių, kodėl užsienyje gausėja publikacijų, kuriose svarstomas poreikis supaprastinti dalykinę teisinę kalbą. Šiuo metu nė vienas bendrinei kalbai parengtas skaitmeninis sprendimas nepajėgus kokybiškai tvarkyti ir analizuoti teisinius dokumentus. Todėl, ypač esant kalbos išteklių stygiui, turime kurti specializuotus teisinei sričiai tinkamus mišrius sprendimus, kuriuose giliojo mokymo metodus papildo taisykliniai metodai, pareikalaujantys papildomo darbo ir geros tarpdisciplininės komandos, sudarytos iš informatikos, lingvistikos ir teisės specialistų.
– Paminėčiau keletą mūsų komandos vykdomų projektų. Kuriame intelektualiųjų technologijų pagrindu veikiančią dezinformacijos atpažinimo sistemą, kuri nustatys tikimybės lygį dėl tekste galimai esančios dezinformacijos, galutinį sprendimą priimti palikdama kvalifikuotam žurnalistui. Toliau geriname lietuvių kalbos atpažintuvo, garso įrašą automatiškai paverčiančio tekstu, kokybę. Šiais laikais, kai vis daugiau susirinkimų, susitikimų su klientais, teismų posėdžių perkeliama į virtualius kambarius su galimybe juos įrašyti, šis įrankis yra elementari būtinybė, taupanti darbo laiką ir lėšas. Paminėtini ir vis gausėjantys skambučių centrų, žurnalistų interviu, socialinių apklausų ir kiti garso įrašai. Vienos valandos įrašas rankomis perrašinėjamas beveik tris valandas, o mašina tai atlieka per kelias minutes, pateikdama gramatiškai tvarkingą transkripciją, suskaidytą pagal kalbėtojus. Šiuo metu pasaulyje tai vienas populiariausių natūralios kalbos technologijų sprendimų, plačiai taikomų teisėje ir medicinoje. Juk jaunuolis tampa gydytoju tam, kad gelbėtų pacientų gyvybes, o ne tam, kad valandų valandas praleistų suvesdamas duomenis į informacinę sistemą. Panaudodami giliojo mokymo metodus plėtojame lietuvių šnekos sintezės sprendimus, kurie balso natūralumu prilygsta žmogaus balsui. Tai leidžia žmogui bendrauti su mašina jam patogiu būdu. Glaudžiai bendradarbiaudami su startuolių įmonėmis, tobuliname automatinės sutarčių analizės priemones. Pasitelkę į pagalbą lingvistus ir teisininkus, eksperimentuojame su teisminių bylų baigties prognozavimo sprendimais, bet dėl kalbinių išteklių stygiaus tai labai sunki, kartu ir įdomi užduotis.
Intelektualiųjų technologijų ir kalbos technologijų pagrindu veikiančios viešosios elektroninės paslaugos Lietuvoje jau teikiamos. Tai mano jau minėtos Vilniaus universiteto kolegų mašininio vertimo ir mūsų projekto „Semantika-2“ metu sukurtos paslaugos, kuriomis kasdien pasinaudojama vidutiniškai per 700 kartų. Paminėtina ir Lietuvos Respublikos teisingumo ministerijos iniciatyva skaitmenizuoti teisės aktų rengimo procesą. Bet ar Lietuvos teisės sistema pasirengusi įsileisti intelektualiųjų technologijų ir natūralios kalbos technologijų sprendimus bent jau rutininiam darbui automatizuoti?