Šių vaizdų buvimas mokomuosiuose duomenyse gali palengvinti dirbtinio intelekto modeliams kurti naujus ir tikroviškus dirbtinio intelekto generuojamus prievartos prieš vaikus turinio vaizdus.

Dėl šių išvadų taip pat kyla daug naujų problemų, susijusių su neskaidriu mokymo duomenų, kurie yra naujų galingų generatyvinių dirbtinio intelekto įrankių pagrindas, pobūdžiu, rašo CNN.

Stanfordo tyrėjų išnagrinėtame didžiuliame duomenų rinkinyje, vadinamame LAION 5B, yra milijardai vaizdų, surinktų iš interneto, įskaitant socialinę žiniasklaidą ir suaugusiųjų pramogų svetaines.

Iš daugiau nei penkių milijardų duomenų rinkinyje esančių vaizdų Stanfordo tyrėjai teigė nustatę mažiausiai 1008 seksualinės prievartos prieš vaikus atvejus.

Duomenų rinkinį sukūrusi Vokietijos ne pelno siekianti organizacija LAION savo interneto svetainėje paskelbtame pareiškime teigė, kad ji taiko „nulinės tolerancijos neteisėtam turiniui politiką“.

Organizacija teigė, kad gavo Stanfordo ataskaitos kopiją ir šiuo metu vertina jos išvadas. Ji taip pat pažymėjo, kad duomenų rinkiniai pereina „intensyvaus filtravimo priemones“, kad būtų užtikrinta, jog jie yra saugūs ir atitinka įstatymus.

Asociatyvi nuotrauka

„Atsargumo sumetimais LAION 5B pašalinome iš interneto“, – pridūrė organizacija ir nurodė, kad bendradarbiauja su Jungtinėje Karalystėje įsikūrusiu „Internet Watch Foundation“, kad „rastų ir pašalintų nuorodas, kurios vis dar gali nukreipti į įtartiną, galimai neteisėtą turinį viešajame internete“.

LAION teigė, kad iki sausio antrosios pusės planuoja užbaigti išsamią LAION 5B saugos peržiūrą ir tuo metu vėl paskelbti duomenų rinkinį.

Tuo tarpu Stanfordo komanda sakė, kad šiuo metu vyksta nustatytų vaizdų šalinimas po to, kai tyrėjai apie vaizdų URL pranešė Nacionaliniam dingusių ir išnaudojamų vaikų centrui ir Kanados vaikų apsaugos centrui.

Apskritai Stanfordo ataskaitoje teigiama, kad didžiuliai interneto masto duomenų rinkiniai yra labai problemiški dėl daugelio priežasčių, net ir bandant taikyti saugumo filtravimo priemones, nes į juos gali būti įtraukta ne tik seksualinės prievartos prieš vaikus medžiaga, bet ir dėl kitų su privatumu ir autorių teisėmis susijusių problemų, kylančių dėl jų naudojimo.