2023.06.15 11:59

Melagienų pažabojimas: kaip didieji duomenys gali padėti kovoti su dezinformacija?

M360

Didieji duomenys

FOTO: Shutterstock

Pranešimas spaudai

Netikros ar šališkos naujienos skaitmeninėje erdvėje žmonijai kelia vis didesnę grėsmę, o tobulėjant įvairioms su dirbtiniu intelektu susijusioms technologijoms, generuoti melagienas netrukus taps dar paprasčiau. Kaip prie jų pažabojimo prisidėti gali didieji duomenys (angl. big data), pranešime žiniasklaidai pasakoja interneto duomenų rinkimo platformos „Oxylabs“ produkto vadovas Aleksandras Šulženko.

Dezinformacijos internete mastams augant pasaulinės pandemijos bei Rusijos pradėto karo Ukrainoje akivaizdoje, dar didesnės problemos slypi už tobulėjančių didžiųjų kalbos modelių (pvz. „Auto-GPT“). Ekspertai pastebi, kad pasitelkus juos, laikas, reikalingas sukurti melagienoms, gerokai sutrumpės.

A. Šulženko teigia, kad atsižvelgiant į tai, jog didžioji gyventojų dalis neturi reikalingų įgūdžių, galinčių padėti suprasti, ar skaitmeninėje erdvėje yra skleidžiamas melas, dezinformacijos keliami iššūkiai tik ūmės.

„Neįmanoma būti visko ekspertais – galbūt galime gerai išmanyti geopolitiką ir suprasti su karu susijusią informaciją, tačiau vargu, ar tas pats žmogus vienodai gerai gaudysis medicinos srityje“, – teigia „Oxylabs“ produkto vadovas.

Jis akcentuoja, kad nors dėl melagienų apibrėžimo sutariama retai, šiuo atveju ekspertas kalba apie pranešimus, kuriuose pateikiama informacija yra vaizduojama kaip tikra, tačiau faktų tokiose naujienose beveik nėra. Be to, jas kuriantieji pasižymi aiškiu ketinimu apgauti skaitytojus.

„Tiesa, naujienos gali būti ne tik melagingos, bet ir šališkos. Pavyzdžiui, jose gali būti pateikiama labai specifinė faktų interpretacija, kuri yra arti faktinio netikslumo. Nors tai nekelia tokio didelio pavojaus kaip gryna dezinformacija, ilgą laiko tarpą skleidžiant tokią neobjektyvią informaciją rizikuojama iškreipti visuomenės suvokimą ar tendencingai formuoti vieną nuomonę“, – pažymi pašnekovas.

Melagienų kūrėjus išduoda perdėtos emocijos

A. Šulženko pratęsia, kad melagienas bei šališkas naujienas pažaboti dalinai galima pasitelkiant viešai prieinamus duomenų rinkimo įrankius ir mašininį mokymąsi, pirmąjį naudojant milžiniškų informacijos kiekių internete rinkimui iš skirtingų naujienų šaltinių, o antrąjį – vertinant turinio tikrumą ir šališkumą.

Tiesa, kuriant tokius įrankius, svarbu atkreipti dėmesį į keletą reikšmingų aspektų: „Sprendžiant ar naujiena yra tikra, ar ne, labai svarbu yra atsižvelgti į tekste reiškiamas emocijas ir jo nuotaiką. Natūralu, kad visi naujienų šaltiniai nuolat naudoja įvairius epitetus, hiperbolizacijas ar kitas kalbos raiškos priemones – juk pateikiant vien sausus faktus, pritraukti skaitytojų būtų sudėtinga. Tačiau tiek netikros naujienos, tiek tie, kurie siekia nušviesti specifinę įvykių interpretaciją, dažniausiai naudoja gerokai daugiau emocingos kalbos.

Tai ypač aktualu kalbant apie neobjektyvią informaciją. Pavyzdžiui, jei pažvelgsime į tam tikrų pažiūrų žiniasklaidos priemones, jos labai dažnai praneša naujienas, neigiamai apibūdinančias ideologinius oponentus, o visa tai yra aplipdoma stipriu emociniu krūviu. Net nekalbant apie kitą šališkumo rūšį, kuomet kitos pusės pozicijos naujienose išvis nėra aprašomos.“

Emocijas galintys analizuoti įrankiai prieinami lengvai

A. Šulženko teigimu, kad padėti atpažinti melagingas ar šališkas naujienas gali nuotaikų arba emocijų analizė.

„Prieš pradedant tokią analizę reikėtų surinkti didelį patikimų straipsnių kiekį, kad būtų galima nustatyti optimalų, įprastuose ir faktiškai teisinguose tekstuose reiškiamų emocijų lygį. Tai veiktų kaip savotiškas atskaitos taškas, kurį peržengiantys straipsniai turėtų būti vertinami pro padidinamąjį stiklą. Šiuo atveju galima pasitelkti daugybę viešai prieinamų duomenų rinkinių – „EmoBank“, „WASSA-2017“ ar kitų. Tiesa, pastarieji dažniausiai yra naudojami trumpesnių tekstų, pavyzdžiui, „Twitter“ žinučių, analizei.

Įdomu tai, kad jeigu tam tikras naujienų portalas norėtų užsiimti tokia veikla, kurti visko nuo nulio nebūtina – jau dabar egzistuoja daugybė priemonių, pavyzdžiui, „Google Cloud Natural Language API“, galinčių užsiimti tekstų emocijų analize“, – sako pašnekovas.

Šališkumo būtina vengti visada

Visgi „Oxylabs“ produkto vadovas priduria, jog nepakanka vien tik nuotaikų analizės, norint atskirti šališkas ar melagingas naujienas nuo tikrų. Pasak jo, būtina įvertinti ir daugiau teksto bei jo šaltinių aspektų, o šiuo atveju itin pravartus tampa mašininis mokymasis ir juo paremti įrankiai.

„Mašininis mokymasis yra labai naudingas, kuomet norima rasti atsakymą sudėtingame, tarpusavyje susijusiame duomenų tinkle, kadangi naudojantis juo mums nereikia apibrėžti konkrečių veiksnių, kurie atskirtų tikras naujienas nuo melagingų. Šie įrankiai paprasčiausiai gauna duomenis ir išmoksta juose esančius dėsningumus. O pasitelkus viešųjų duomenų rinkimo įrankius tereikia išgauti milžiniškus kiekius informacijos iš skirtingų šaltinių, atitinkamai juos pažymėti, pasidalyti jais su mašininio mokymosi modeliu ir leisti jam ieškoti melagingų naujienų.

Tiesa, norint objektyviai suženklinti informaciją, svarbu, kad tai darantis žmogus būtų nešališkas, o šie duomenų rinkiniai būtų ypatingai kruopščiai pertikrinti kitų asmenų. Kitu atveju rizikuojame būti neobjektyviais“, – sako A. Šulženko.

Prisijungti prie diskusijos Rodyti diskusiją