Interneto duomenų rinkimo platformos „Oxylabs“ analitikų komandos vadovas Rytis Ulys pastebi, kad pastaruoju metu visuomenė vis geriau susipažįsta su didžiųjų duomenų sektoriumi bei su juo glaudžiai susijusiais dirbtinio intelekto įrankiais, tokiais kaip „ChatGPT“. Tai įvairių šioje srityje dirbančių specialistų – duomenų inžinierių, analitikų, duomenų mokslininkų ar mašininio mokymosi bei duomenų platformų inžinierių, darbo vaisius.
„Pastaraisiais metais šis sektorius išsiplėtė ir vis daugiau įmonių supranta jo naudą. Šiandien didžiųjų duomenų sritis leidžia rinkti, apdoroti, analizuoti bei kurti produktus pagrįstus dideliais kiekiais duomenų, dažniausiai naudojant debesijos technologijas. Tokie įrankiai įmonėms suteikia galimybę geriau suprasti vidinius verslo procesus, kelti darbuotojų pasitenkinimą, stebėti konkurentus bei būti greitesniems priimant sprendimus – visa tai padeda didinti pelną – optimizuojant išlaidas ar didinant pajamas“, – pasakoja Rytis Ulys.
Specialistų paklausa nuolat auga
Augant įmonių susidomėjimui didžiųjų duomenų įrankių pritaikomumui, didėja ir reikalingų specialistų, suprantančių didžiuosius duomenis ir kuriančių jais pagrįstus produktus, poreikis.
„Paklausą ypač didina ypatingo visuomenės dėmesio sulaukę dirbtiniu intelektu paremti įrankiai, kurie įmonėms sutaupo laiko, didina produktyvumą, ar pakeičia ištisas komandas. Šie įrankiai skatina tiek susidomėjimą didžiaisiais duomenimis, tiek naujų profesijų atsiradimą. Pavyzdžiui nauja, šiemet atsiradusi rolė yra „prompt engineer“ (liet. užklausų inžinierių). Šie specialistai puikiai išmano dirbtinio intelekto modelius; geba optimizuoti modelių generuojamą rezultatą, keisdami įvairius jų parametrus bei teikia pasiūlymus modelių kūrėjams; padeda efektyviausiai panaudoti modelius įvairioms komandoms organizacijoje“, – sako analitikų komandos vadovas.
Anot jo, viena svarbiausių specialybių didžiųjų duomenų sektoriuje yra duomenų inžinieriai – būtent jie yra atsakingi už duomenų gavimą bei pradinį apdorojimą, todėl jų dėka galima kurti naujus modelius. Be to, viena sparčiausiai augančių specialybių yra „MLOps“ inžinieriai (mašininio mokymosi operacijų inžinieriai). Be šios specialybės žmonių, įmonės ar jų duomenų komandos, dažnai nėra pajėgios išleisti ar prižiūrėti mašininio mokymosi modelių, kuriuos kuria duomenų mokslininkai.
„Taip pat pastebiu, jog vis daugiau marketingo bei produktų komandoms tenka analitinių atsakomybių. Nemažai darbų, susijusių su duomenų analize, kurie istoriškai priklausydavo duomenų komandoms, dabar yra verslo komandų veiklos dalis. Mano nuomone, ateityje didės poreikis specialistų, kurie puikiai išmano tiek vieną iš verslo sričių, tiek duomenų analitiką“, – sako Rytis Ulys.
Didžiųjų duomenų sritis sparčiai tobulės
Pastarieji metai didžiųjų duomenų sektorius patyrė proveržį – daugybė sudėtingų mašininio mokymosi modelių tapo lengviau prieinami, įranga reikalinga mašininio mokymosi algoritmams treniruoti tapo pigesnė bei labiau specializuota, o įrankiai, kuriais galima kurti ar optimizuoti modelius, tapo paprasčiau pasiekiami dėl debesijos technologijų.
„Tiek dideli, tiek maži verslai supranta, kad didieji duomenys ir jais pagrįsti algoritmai artimiausiais metais bus viena labiausiai augančių ar augimą skatinančių sričių pasaulyje. Tai įrodo ir paskutiniais mėnesiais įvykę neįtikėtino dydžio labai jaunų įmonių pardavimai – pavyzdžiui, „Databricks“ sumokėjo 1,3 milijardo dolerių už vos prieš porą metų įkurtą „MosaicML“, kurioje dirba tik 60 darbuotojų, tačiau pasiūliusią patogų būdą treniruoti dirbtinių intelektu paremtus modelius“, – atkreipia dėmesį analitikų komandos vadovas.
Jis spėja, kad ateityje įmonėms reikės ieškoti naujų būtų gauti ar susigeneruoti duomenų, daugės reguliacijos – tokių iniciatyvų, kaip „Artificial Intelligence Act“ (AIA). Taip pat tobulės modeliai, gebantys generuoti tekstą ar vizualus, bei įrankiai, fokusuoti į užduotis, susijusiomis su bendravimu.
Dėl šių pokyčių atsiras ir kitų naujų specialybių – kai kurios jų bus tiesiogiai susijusios su dirbtinio intelekto pranašumais, kitos – su keliamomis problemomis. Didžiaisiais duomenimis pagrįsti dirbtinio intelekto sprendimai šiuo metu neabejotinai dar nėra tobuli – nemažai jų yra labai šališki, neetiški bei negali priimti sprendimų be žmonių įsikišimo, todėl augs poreikis specialistų, kurie užsiims dirbtinio intelekto reguliavimu.
Ko reikia, norint dirbti didžiųjų duomenų sektoriuje
Ateityje norintiems įsidarbinti šioje srityje, ekspertas pataria nuolat domėtis naujovėmis. Anot jo, vieni geriausių informacijos šaltinių pastaruoju metu yra „Substack“ esantys tinklaraščiai, surenkantys informaciją apie naujus dirbtinio intelekto įrankius, modelius ar juos kuriančias įmones.
Žinoma, taip pat reikėtų domėtis verslo veikimo principais bei sugebėti ieškoti būdų, kaip verslo problemas perkelti į duomenų apdorojimą, analizę ar netgi duomenų modelius. Duomenų srityje viskas prasideda nuo matematikos ir statistikos, duomenų bazių bei programavimo kalbų, tokių kaip, SQL ar Python, skirtų apdoroti juose esančių duomenis, išmanymo.
„Būsimiems studentams rekomenduočiau rinktis statistikos ar matematikos mokslus arba tokius, kuriuose šių modulių netrūksta – tarkim, psichologijos, filosofijos. Iš asmeninės patirties pastebiu, kad vieni geriausių sutiktų duomenų specialistų buvo arba baigę statistikos, arba psichologijos mokslus. Taip pat siūlyčiau išbandyti jėgas „Turing College“ – ši privati mokslo įstaiga ruošia puikius specialistus“, – pataria Rytis Ulys.