Norint fiziškai perkelti tokį kiekį duomenų, nepakaktų net dešimčių milijonų sunkvežimio dydžio talpyklų, o jeigu kiekvieną baitą prilygintume euro monetai, statydami jas vieną ant kitos greičiausiai pasiektume dar neatrastas galaktikas. Natūraliai kyla klausimas – iš kur atkeliauja šie duomenys ir ką su jais veikiame?
„Nors šiuo metu duomenis skaičiuojame zetabaitais, prieš dešimtmetį tokio matavimo vieneto dažnas IT specialistas nebuvo net girdėjęs. Pirmą zetabaitą pasiekėme tik 2012 m., o didžioji dalis dabartinių duomenų pasaulyje buvo sugeneruota per pastaruosius dvejus-trejus metus. Akivaizdu, kad tokie informacijos kiekiai kaupiami ne be reikalo. Jų analizė šiandien nulemia, kokią muziką girdime per ausines, kokį maistą užsisakysime restorane bei netgi tai, kur įsikurs mūsų pamėgti prekybos ir paslaugų centrai. Kita vertus, visam tam būtini ir naujųjų laikų išminčiai – duomenų analitikai“, – teigia „Telia Global Services Lithuania“ duomenų analitikos padalinio vadovė Daina Rutkauskienė.
Šiais laikais duomenys yra viskas
Pasak Dainos, daugelis žmonių, kalbėdami apie duomenis, juos įsivaizduoja kaip tam tikrą akivaizdžiai vertingą informaciją – nuotraukas, vaizdo įrašus, dokumentus ar garso takelius. Tačiau iš tiesų šiandien duomenys yra viskas, įskaitant kiekvieną mūsų prisilietimą prie telefono, judesį ir apskritai – egzistavimą.
„Pavyzdžiui, „Telia Global Services Lithuania“ duomenų analizės centre vien anonimizuoti klientų duomenys sudarytų milijonus simbolių eilučių, jau nekalbant apie tiesiogiai su paslaugų teikimu susijusią informaciją – skambučius, televizijos žiūrimumą ir mobiliojo interneto vartojimą. Šiais laikais registruojamas kiekvienas televizoriaus pultelio paspaudimas, kiekvieno skambučio trukmė ir lokacijos ryšio bokšto atžvilgiu pasikeitimas. Jei visa tai padaugintume ne tik iš klientų, bet ir valandų ar mėnesių skaičiaus, gautųsi tiek duomenų, kiek apdoroti pajėgtų ne kiekvienas kompiuteris“, – pasakoja pašnekovė.
Vis dėlto ši informacija iškart nėra panaudojama ir pirmiausia nugula į vadinamuosius „duomenų ežerus“ – taip vadinamos talpyklos, kuriose saugomi nestruktūrizuoti didelės apimties duomenys. „Duomenų ežerai“ gali būti įkuriami tiek lokaliuose pačios įmonės fiziškai valdomuose serveriuose, tiek „Amazon Web Services“, „Microsoft Azure“ ir kitų pasaulinių debesijos paslaugų teikėjų infrastruktūroje. Didžiuliai ir nuolat plečiami pastarųjų pajėgumai užtikrina, kad vietos duomenims nepritrūksime nei dabar, nei tada, kai pasauliniuose duomenų skaičiavimuose zetabaitus pakeis dar didesni jotabaitai.
Duomenų vertė priklauso nuo mūsų fantazijos
Deja, patys iš savęs duomenys nėra didelis turtas, kadangi atvėrus kokį nors „duomenų ežero“ failą greičiausiai nesuprastume ne tik nuo kur pradėti skaityti, bet ir apskritai – į ką žiūrime. Norint iš tų raidžių ir simbolių kratinių išgauti kokią nors vertę, pirmiausia juos turi apdoroti specialias žinias ir įrankius turintys duomenų inžinieriai bei analitikai.
„Inžinieriai užtikrina, kad duomenys atsidurtų reikiamose duomenų bazėse, būtų reguliariai atnaujinami, tinkamos kokybės ir iki analitiko nukeliautų kaip įmanoma tiesesniu bei trumpesniu keliu. Tuo metu analitikai yra savotiški duomenų menininkai, surandantys būdą iš šios informacijos išgauti tam tikras įžvalgas, kurias vėliau galima panaudoti praktiškai, gerinant kliento patirtį, vidinius įmonės procesus ar ieškant įvairių problemų sprendimo“, – skirtumą paaiškina ekspertė.
Natūralu, kad pasaulyje daugėjant duomenų, didėja ir su duomenų analize susijusių specialistų poreikis. Tačiau „Telia“ kompetencijų centro atstovė abejoja, kad po dvejų metų beveik dvigubai išaugus pasaulio „datasferai“ prireiks ir du kartus didesnio duomenų inžinierių ir analitikų būrio. Beveik 80 proc. duomenų analizės darbo sudaro tinkamas informacijos paruošimas, todėl vis dažniau šis darbas patikimas pažangesniems dirbtinio intelekto (DI) įrankiams. Duomenų specialistai pamažu tampa savotiškais vadybininkais, skirstančiais užduotis DI ir tikrinančiais atlikto darbo kokybę.
Su didžiaisiais duomenimis susiduriame kasdien
Nepaisant to, kad didelės apimties duomenų analizė vis dar skamba kaip sudėtinga ir nuobodi veikla, jos vaisius „ragaujame“ kiekvieną dieną. Didžiaisiais duomenimis paremti algoritmai šiandien nusprendžia, kokia muzika pasigirs ausinėse „Spotify“ programėlėje paspaudus „Play“ mygtuką, kada „Waze“ mums pasiūlys pajudėti iš namų, kad nepavėluotume į darbą, ir netgi tai, kokį pasiūlymą išvysime ekrane privažiavę „McDonald’s“ užsakymo langelio – kai oras šiltas, mums bus rekomenduojami ledai, o esant dideliam klientų skaičiui – tai, kas gali būti pagaminama greičiausiai.
„Matydami klientų TV žiūrėjimo duomenimis, galime suformuoti patrauklesnius televizijos kanalų paketus, o stebėdami išaugusią mobiliojo ryšio bokštų apkrovą tam tikroje vietovėje galime planuoti infrastruktūros atnaujinimą bei pajėgumų didinimą. Duomenys taip pat padeda gerinti mūsų vidinius procesus – laikas, per kiek atsiliepiame į skambinančių klientų skambučius, mums leidžia pasisamdyti būtent tiek darbuotojų, kad būtų užtikrintas geras aptarnavimas ir paskambinus pagalbos telefonu nereikėtų ilgai klausytis laukimo muzikinio takelio“, – realius pavyzdžius pateikia Daina Rutkauskienė.
Specialistė prideda, kad tam tikra prasme duomenų mokslininkai šiandien pakeitė senovėje egzistavusius išminčius. Pastaruoju metu, norėdami sužinoti, ar pasiteisins nauja verslo idėja bei kiek sėkminga yra dabartinė, verslininkai kreipiasi būtent į duomenų analitikus. Skandinavijos šalyse netgi tapo įprasta, kad naujų parduotuvių, degalinių bei gatvės reklamų vietas parenka nebe už tai atsakingi žmonės, o nuasmeninta ir kur kas tikslesnė ryšio operatoriaus informacija apie žmonių srautus skirtingose vietovėse.