Anot interneto duomenų rinkimo platformos „Oxylabs“, duomenų rinkimo etikos klausimai svarstomi vis garsiau ir pasiekia net teismus, tad ateinantys metai gali atnešti svarbių pokyčių, kaip organizacijos ir asmenys ateityje elgsis su duomenimis internete, rašoma pranešime žiniasklaidai.
„Dirbtinio intelekto galimybių augimas pranoko daugumos ekspertų lūkesčius, o teismų salėse ir politinėse institucijose vėl užvirė diskusijos duomenų rinkimo etikos tema. Bent jau Europoje kurį laiką buvo manoma, kad GDPR išsprendė aktualiausias privačių duomenų apsaugos problemas. Tačiau dirbtinio intelekto apmokymui reikalingas milžiniškų duomenų kiekių rinkimas atnaujino diskusijas apie duomenų nuosavybę, privatumą bei sąžiningą jų naudojimą“, – sako „Oxylabs“ generalinis direktorius Julius Černiauskas.
J. Černiausko teigimu, būtina nustatyti bendrus standartus ir skatinti etišką duomenų rinkimo praktiką.
„Interneto duomenų rinkos įsipareigojimas laikytis etinių reikalavimų yra vienintelis būdas padidinti visuomenės pasitikėjimą rinkos žaidėjais po pasipylusių ieškinių dėl DI mokymui naudojamų duomenų. Todėl kartu su keliomis mūsų rinkoje esančiomis įmonėmis, įkūrėme „Ethical Web Data Collection“ iniciatyvą, prie kurios ateityje, tikime, kad prisijungs ir daugiau interneto duomenų rinkos žaidėjų“, – teigia jis.
Tikisi atsakymų į klausimus, paliktus teisinėje „pilkojoje zonoje“
Anot J. Černiausko, vykstantys teisminiai procesai, nukreipti į dirbtinio intelekto įmones bei interneto duomenų rinkimo platformas, gali reikšmingai pakeisti duomenų rinkimo praktiką ir netgi paveikti technologijų plėtrą ateityje.
„Iš tebevykstančių teisinių bylų matome, kad aktualiausi klausimai gali būti suskirstyti į dvi kategorijas. Pirma susijusi su intelektine nuosavybe ir jos naudojimu dirbtinio intelekto mokymo procesuose. Antroji – su privačių duomenų apsauga. Susiduriame su fundamentaliais klausimais, pavyzdžiui, kas yra viešieji duomenys ir kaip galėtume apibrėžti teisingą (ar neteisingą) viešai prieinamų duomenų naudojimą?
Kai kurios žinomos dirbtinio intelekto įmonės sulaukė pasipiktinimo, nes surinko didžiulį kiekį viešai pasiekiamos informacijos, kurią sukūrė milijonai interneto vartotojų visame pasaulyje. Neseniai priimtas „OpenAI“ sprendimas leisti svetainėms atsisakyti iš jų rinkti duomenis yra priemonė, kuri artimiausiu metu gali tapti dažnesne“, – sako J. Černiauskas.
„Oxylabs“ vadovo teigimu, kol kas nėra aišku, kokią įtaką tokie sprendimai turės tolesnei AI plėtrai. Dauguma AI sistemų šiandien remiasi ML technologija, kuriai reikalingas nuolatinis duomenų srautas, galintis užtikrinti algoritmų mokymąsi ir padedantis išlaikyti kokybiškus rezultatus. Tad viešųjų duomenų rinkimo apribojimai gali tapti trikdžiu kuriant dirbtinio intelekto naujoves.
Šiandien vartotojai kreipia vis daugiau dėmesio, kaip yra tvarkomi jų duomenys ir reikalauja daugiau skaidrumo. Todėl galime matyti vis ryškesnes net tik privačių rinkos žaidėjų, bet ir politikos formuotojų pastangas spręsti šiuos klausimus.
„Manau, kad duomenų privatumo klausimai 2024 m. išliks pagrindine diskusijų apie duomenų rinkimo internete teisėtumą tema, ir tai yra teigiamas pokytis, suteiksiantis daugiau aiškumo visiems rinkos žaidėjams“, – pabrėžia J. Černiauskas.
Augs individualių sprendimų ir duomenų rinkinių paklausa
„Oxylabs“ generalinis direktorius prognozuoja, kad vis daugiau įmonių, siekiančių sumažinti konkurenciją ir padidinti efektyvumą, sutelks dėmesį į duomenimis pagrįstų sprendimų priėmimą.
„Vis didesnį iššūkį interneto duomenimis besiremiančiai analizei kelia milžiniškas duomenų kiekis ir formatų bei kalbų, kuriomis duomenys renkami, įvairovė. Norint užtikrinti duomenų tikslumą ir patikimumą, ateityje teks labiau pasikliauti AI ir ML technologijomis, kad turėtume lengvai adaptuojamus ir priežiūros nereikalaujančius duomenų rinkimo bei analizės įrankius“, – sako J. Černiauskas.
Jo teigimu, siekiant sutaupyti laiko, vidinių resursų ir sąnaudų, vis daugiau įmonių pereis nuo duomenų rinkimo įmonėje prie individualių duomenų rinkinių įsigijimo. Tokie rinkiniai yra „paruošti“ – išvalyti, struktūrizuoti ir tinkami analizei.
„Pagrindinė 2024 m. tendencija išlieka ta pati: siekdamos gauti realių įžvalgų, sumažinti verslo rizikas ir valdyti reputaciją, įmonės turės pasitelkti interneto duomenimis pagrįstą konkurencinę žvalgybą (competitive intelligence – CI). Tai yra dar pilnai neišnaudojamas išteklius, galintis turėti stiprų poveikį tiek privataus, tiek viešojo sektoriaus organizacijoms“, – priduria „Oxylabs“ vadovas.