Milijardai turinio vienetų

Socialiniai tinklai yra ir galingas visuomenės struktūros ir dinamikos atspindys, nes jie užtikrina grupių funkcionavimą ir bendruomeniškumą virtualioje erdvėje. Todėl viena iš perspektyviausių sričių šiandien yra socialinių tinklų turinio bei komentarų analizė, padedanti atskleisti visuomenės problemas, procesus, raidą, dėsningumus ir veiksnius, kurie lemia besikeičiančias nuotaikas įvairiose bendruomenėse.

Deja, neautomatizuota socialinių tinklų analizė yra be galo brangi, sudėtinga, tikėtina, su daugybe klaidų, ir dėl to, ko gero, beveik neįmanoma. Didžiuliai duomenų masyvai, nesuskaičiuojama vartotojų aibė, nuotaikų ir temų kaita reikalautų milžiniškų resursų. Kita vertus, modernios technologijos ir dirbtinio intelekto sprendimai padeda tokią analizę paversti realybe.

Nenuvertinkime – socialiniai tinklai šiandien yra atskiras pasaulis. Skaičiuojama, kad „Facebook“ socialiniame tinkle kas mėnesį fiksuojama apie 2,9 mlrd. aktyvių vartotojų, „Youtube“ – 2,3 mlrd., „Instagram“, „Twitter“, „WhatsApp“ turi daugiau kaip po 1 mlrd. vartotojų.

Natūralu, kad virtualiame pasaulyje vartotojai kasdien dalijasi milijardais turinio vienetų – žinutėmis, nuotraukomis, būsenos atnaujinimais, istorijomis, pokalbiais – taip kuriamas milžiniškas duomenų srautas. Juk socialiniuose tinkluose žmonės išsako savo nuomonę, emocijas, patirtis, jausmus, džiaugsmus ir nusiskundimus – praktiškai viską, kas tik yra po saule.

Tokia informacijos įvairovė gali suteikti unikalias socialines įžvalgas ir turėti daugybę pritaikymo metodų. Pavyzdžiui, šis duomenų srautas gali padėti prekės ženklams suprasti savo auditoriją, perspektyvas ir klientų problemas, pagal tai kurti ir tobulinti naujus produktus bei sprendimus.

Praktinis pavyzdys

Pamenate pasaulį pralinksminusią istoriją apie „GameStop“? Nedidelės įmonės akcijų kursas raketa šovė į viršų 2020 metų pradžioje. Vos po kelių dienų jos dar kartą šovė į viršų. Tokią dinamiką lėmė sąlyginai nedidelės grupės vadinamųjų „redditorių“, t.y. „Reddit“ forumo dalyvių, diskusijos ir susitarimai, kurių JAV biržoje kotiruojamų bendrovių akcijas verta įsigyti.

„GameStop“ istorija nėra vienintelė, vėliau buvo AMC, „Koss“, „Macy‘s“ ir t.t. Žvelgiant į šias modernias tendencijas, dirbtinio intelekto sprendimus teikiančiai įmonei „Neurotechnology“ ir kilo mintis, kad galima surinkti tekstinius duomenis iš socialinių tinklų, juos apdoroti ir pateikti realias įžvalgas, kurios gali padėti investuotojams priimti sprendimą – pirkti kurios nors bendrovės akcijas ar ne. Taip buvo sukurtas modernus dirbtiniu intelektu paremtas įrankis „StockGeist“, kuris leidžia realiu laiku stebėti, ką vartotojai kalba apie populiariausias akcijas ir kriptovaliutas.

„GameStop“ ir „Reddit“

Lietuvos metų dirbtinio intelekto įmonės apdovanojimą 2021 metais gavusios „Neurotechnology“ specialistų sukurtas produktas „StockGeist.ai“ yra interaktyvi platforma, kuri stebi apie 2,2 tūkst. akcijų ir kriptovaliutų, taip pat pateikia vertinimą, ar apie jas socialiniuose tinkluose atsiliepiama pozityviai, negatyviai ar neutraliai.

Dirbtinis intelektas renka duomenis pagal konkrečius raktažodžius iš „Reddit“, „Twitter“ bei tarp investuotojų populiarios „Stocktwits“ platformų. Be to, vartotojas gali sužinoti, kas apie jį dominančią akciją ar kriptovaliutą buvo kalbama nuo 2011 metų. Ką tai reiškia? Kad vartotojui nereikia pačiam „gūglinti“ ir skaityti 10 tūkst. žinučių, kad susidarytų savo nuomonę. Visos šios žinutės yra surinktos, išanalizuotos, kartu – pateiktos įžvalgos. Taip dirbtinis intelektas padeda žinoti, kas vyksta akcijų rinkoje, ir sutaupyti galybę laiko.

Sentimentų analizė

Išsami teksto analizė gali padėti atskleisti teksto duomenų reikšmę, žodžių ir gramatikos bei sintaksės ryšį, tačiau dirbtinio intelekto sprendimai padeda žengti dar vieną žingsnį į priekį – įvertinti nuotaikas, emocijas, arba, kitaip vadinamą, sentimentą.

Proveržis dirbtinio intelekto srityje, dirbančioje su natūralia kalba, prasidėjo 2017 metais, kai komanda iš „Google Brain“ pristatė savo neuroninio tinklo architektūrą, pavadintą „Transformer“. Šios architektūros pagrindu 2019 metais buvo sukurtas BERT modelis, kuris drastiškai kilstelėjo kokybės kartelę visose automatinės natūralios kalbos apdorojimo srityse.

BERT modelis buvo apmokytas panaudojant visą anglakalbę „Wikipedia“ kaip tekstinių treniravimo duomenų šaltinį. Pats modelio mokymo procesas buvo sudarytas iš dviejų dalių. Visų pirma, dalis žodžių sakiniuose buvo užmaskuoti ir modelio buvo prašoma atspėti, kokie žodžiai ten paslėpti. Antrojoje užduotyje modeliui buvo duodama sakinių pora ir neuroninio tinklo prašoma nustatyti, koks turėtų būti sekantis sakinys. Abi šias užduotis modelis stengėsi išspręsti tuo pačiu metu, kas nulėmė gerą tiek atskiro sakinio konteksto, tiek platesnio ryšio tarp sakinių supratimą.

Viso to pagrindu sukurta sentimentų analizės sistema, naudojanti neurolingvistinius tinklus ir kitus algoritmus tam, kad padėtų suprasti emocijas, išreikštas skirtingais turinio vienetais, ir nustatyti žinutės toną. Tam tikslui surinkti tekstiniai duomenys iš socialinių platformų turi būti išvalyti ir iš anksto apdoroti. Vėliau žinutės kategorizuojamos ir sužymima, kurias iš jų galime laikyti teigiamomis, neigiamomis, o kurias – neutraliomis. Toks žymėjimas integruojamas į dirbtinio intelekto sprendimą, kuris pradeda savarankiškai atpažinti sentimento, kurį skleidžia vartotojai, toną ir emociją.

Neapykantos kalba ir kitos taikymo galimybės

Šiuolaikiniai socialiniai tinklai – „Facebook“, „Instagram“, „Twitter“, – nuolat kuria naujas technologijas, kurios galėtų atpažinti neapykantos kalbą, tokių bandymų esą ir Lietuvoje. Vis tik, reikia pripažinti, kad dirbtinis intelektas turi savo iššūkių, apie kuriuos dažnas net nepagalvoja.

Twitter, Facebook, Google

Iš vienos pusės, atrodo, lengva atpažinti keiksmažodžius arba tiesiogine neapykanta persunktus sakinius. Iš kitos pusės – dirbtiniam intelektui vis dar kyla iššūkių atpažįstant humorą, ironiją ar sarkazmą, o juos, beje, itin dažnai mėgsta interneto diskusijų dalyviai. Atskiro paminėjimo verti – „emoji“, kurie gali ir padėti paryškinti pagrindinę mintį, ir radikaliai ją pakeisti. Dėl šių priežasčių naujausius dirbtinio intelekto sprendimus jau bandoma mokyti atpažinti ir vertinti ne tik teksto turinį, bet ir jo santykį su „emoji“, nuotraukomis, pasaulyje vis populiarėjančiais „meme“ bei vaizdo įrašais.

„Neurotechnology“ jau daugiau negu 30 metų tyrinėja dirbtinio intelekto sprendimus ir turi sukaupusi patirtį, kuri leidžia kurti strategijas, padedančias analizuoti socialiniuose tinkluose kuriamą triukšmą, taikyti kalbos analizės modelius ir gauti iš to veiksmingų įžvalgų ir išvadų.

Modernūs teksto analizės modeliai, pagrįsti dirbtiniu intelektu ir neurolingvistiniais tinklais, jau dabar gali nustatyti socialinių tinklų komentarų toną ir emocijas – pyktį, baimę, džiaugsmą, neviltį, liūdesį ir euforiją. Kartu galima numatyti vyraujančias temas, vartotojų kalbos modelius, įpročius, kas padeda nustatyti vartotojų elgesį internete ir numatyti ateities tendencijas.

Į sentimentų analizę taip gali būti įtrauktos produktų apžvalgos, gautos iš klientų apie prekės ženklą internete, sekant jų pasitenkinimą ir produkto tinkamumą vartoti. Pavyzdžiui, tokia analizė gali atskleisti, ar klientai patenkinti kaina, naudojimo paprastumu, ar apskritai vartotojai patenkinti prekės ženklo pažadu, ir taip įgyti konkurencinį pranašumą.

Maža to, dirbtinio intelekto sprendimai šiandien jau ir patys gali generuoti tekstą, pagrįstą iš vartotojų surinktais duomenimis, vykdyti santraukas, jį galima apmokyti atsakyti į klientų klausimus ir t.t. Klausimas mums: kiek būsime atviri inovacijoms ir kiek norėsime pasinaudoti dirbtinio intelekto sprendimų teikiamomis galimybėmis?

Vytas Mulevičius ir Vytautas Abramavičius yra „Neurotechnology“ dirbtinio intelekto sprendimų vystytojai.