2024.04.02 10:48

„ChatGPT“ kūrėja pristato naują įrankį – dirbtinis intelektas jau imituoja žmonių balsus

www.login.lt

Asociatyvi nuotrauka

FOTO: Shutterstock

„OpenAI“ pristatė naują dirbtinio intelekto įrankį, galintį stulbinamai tiksliai imituoti žmonių balsus.

Praėjusią savaitę „OpenAI“ pasidalijo pirmųjų įrankio, vadinamo „Voice Engine“, bandymų pavyzdžiais, kuriuose naudojamas 15 sekundžių trukmės žmogaus kalbėjimo pavyzdys, kad būtų sukurta įtikinama jo balso kopija. Vėliau vartotojai gali pateikti teksto pastraipą ir įrankis ją perskaitys dirbtinio intelekto sukurtu balsu.

Bendrovės teigimu, naujasis dirbtinio intelekto įrankis galėtų padėti versti, skaityti vaikams arba pagelbėti žmonėms, praradusiems gebėjimą kalbėti. Tačiau kai kurie skeptikai nerimauja, kad tai taip pat gali paskatinti dezinformacijos kūrimą arba palengvinti sukčiavimą, rašo CNN.

„OpenAI“ teigia, kad šiuo metu „Voice Engine“ naudoja tik „nedidelė patikimų partnerių grupė“, įskaitant švietimo ir sveikatos technologijų įmones, ir ji pasinaudos jų bandymais, kad nustatytų, ar ir kaip leisti plačiau naudoti šį įrankį. Pasak bendrovės, šie bandytojai sutiko nekurti žmonių balsų be jų aiškaus sutikimo ir aiškiai nurodyti klausytojams, kad tai, ką jie girdi, yra sukurta dirbtinio intelekto.

„Pripažįstame, kad į žmonių balsus panašios kalbos generavimas kelia rimtą riziką, kuri ypač didelė rinkimų metais“, – teigiama „OpenAI“ tinklaraštyje. Bendrovė pripažino, kad dirbtinio intelekto generuojamam garsui tampant vis labiau prieinamam reikia didelių pokyčių.

„Bet koks platus sintetinio balso technologijos diegimas turėtų būti lydimas balso autentifikavimo patirties, kuri patvirtintų, kad originalus kalbėtojas sąmoningai prideda savo balsą į paslaugą, ir neleistinų balsų sąrašo, kuris aptiktų ir neleistų kurti balsų, pernelyg panašių į žymių veikėjų balsus“, – teigė „OpenAI“.

„Voice Engine“ pasirodo naudotojams laukiant, kol bus viešai išleista „Sora“ – dirbtinio intelekto generuojamo vaizdo įrankis, apie kurį „OpenAI“ pranešė praėjusį mėnesį.

Kaip anksčiau rašė LOGIN, kol kas „Sora“ leis generuoti iki minutės trukmės vaizdo įrašus ir bus prieinama tik saujelei žmonių. Jos testavimo metu bus siekiama išsiaiškinti, kokios galimos šio įrankio naudojimo grėsmės – ar jis negali būti naudojamas misinformacijai, neapykantos turiniui, pateikti šališkų rezultatų.

Nors „OpenAI“ įrankis išsiskiria techniniu paprastumu ir nedideliu originalaus garso kiekiu, reikalingu įtikinamam klonui sukurti, konkurentų dirbtinio intelekto įrankiai jau yra prieinami visuomenei, rašo „The Guardian“.

Tokios įmonės kaip „ElevenLabs“ gali sukurti balso kloną, turėdamos tik „kelių minučių garso įrašą“. Siekdama sumažinti žalą, bendrovė įdiegė apsaugos priemonę „balsai, kurių negalima naudoti“, skirtą aptikti ir užkirsti kelią balso klonų, „imituojančių JAV ir Jungtinės Karalystės politinius kandidatus, aktyviai dalyvaujančius prezidento ar ministro pirmininko rinkimuose“, kūrimui.

Prisijungti prie diskusijos Rodyti diskusiją