„Facebook“ socialiniame tinkle pasidalinta lentele, kurioje pateikiami 20 dienų laikotarpio duomenys. Vienoje lentelės grafoje nurodomas naujų teigiamų PGR testo rodmenų skaičius tarp galimybių paso neturinčių 20+ amžiaus grupės asmenų, kitoje – teigiamų rodmenų skaičius tarp galimybių pasą turinčių 20+ amžiaus grupės asmenų.

Lentele pasidalinęs asmuo pateikia komentarą: „Kokia įdomi lentelė. Tai teigiami PGR tyrimo rezultatai amžiaus grupėje virš 20 metų. Imkim vakar dienos rezultatus 878 atvejai tarp neturinčių GP ir 1056 tarp turinčių GP. O jei dar žinant , kad turintys GP priverstinai netestuojami, rezultatai būtų dar įspūdingesni. Išvadas darykitės patys. O aš jau įsitikinau, kad visa tai daroma specialiai”.

Iš tiesų, į lentelėje pateiktus duomenis nereikia žiūrėti rimtai – joje pateikiami skaičiai, remiantis statistikos mokslu, nieko nereiškia dėl kelių priežasčių, kurias „Melo detektoriui“ pateikė Lietuvos statistikos departamento atstovas.

Pateikiame elektroniniu paštu pateiktą Lietuvos statistikos departamento atsakymą į užklausą:

„Tai yra puikus pavyzdys, kaip nereikėtų analizuoti Statistikos departamento atvertų duomenų.

Pagrindinės pastabos:

1. Nekorektiška pateikti absoliučius skaičius, nepateikiant grupės dydžiui normalizuotų skaičių;
2. Sujungti skirtingas amžiaus grupes kartu nėra korektiška, dėl jų skirtingų skiepijimo datų. Vyresni asmenys buvo skiepyti anksčiau, tad jų sergamumas gali būti aukštesnis dėl su laiku mažėjančio vakcinos efektyvumo (dėl to dabar vykdoma revakcinacija trečia doze);
3. Iš šių duomenų negalima spręsti apie tai, kas turi Galimybių pasą ir kas neturi;
4. Matematinė formulė nėra teisinga;
5. Norint korektiškai įvertinti rizikas reikėtų atsižvelgti į vidutinį dienų skaičių, praėjusį nuo skiepo datos. Tokie duomenys yra atverti, bet čia yra ignoruojami.

Iš šių pastabų pati svarbiausia yra pirmoji, nes šiuo metu nepaskiepytų žmonių 20+ žmonių grupėje yra kelis kartus mažiau nei paskiepytų, tad panašus užsikrėtimų skaičius yra generuojamas labai skirtingo dydžio grupių.

Korektiškas skaičiavimo būdas yra pradėti nuo asmenų, kurie dar niekada nebuvo užsikrėtę, skaičiaus šių metų pirmąją dieną (taip pateikta atvertuose duomenyse). Tada nuosekliai padieniui perskaičiuoti šios galinčios užsikrėsti asmenų grupės dydį, atsižvelgiant į visus duomenyse aprašytus įvykius: užsikrėtimus, pasiskiepijimus, iškritimą iš registrų. Tokiu būdu analitikas sužinos kiekvieną dieną rizikuojančių užsikrėsti pirmą kartą (angl. „at risk“) žmonių skaičių. Šis skaičius yra ieškomo normalizuoto rodiklio vardiklis.

Normalizuotas rodiklis apskaičiuojamas padalinus konkrečios dienos užsikrėtimų skaičių neskiepytųjų grupėje (skaitiklis) iš vakar dar niekada neužsikrėtusių neskiepytųjų skaičiaus (vardiklis). Tas pat turėtų būti padaroma ir kitoms grupėms (skiepytiems viena doze, dviem dozėmis, trimis dozėmis). Tokiu būdu normalizuotus rodiklius jau galima palyginti tarpusavyje.

Kad būtų suprantamiau statistikos vartotojui, skaičius kartais padauginamas iš 100 tūkst., tarsi visos grupės būtų būtent tokio dydžio atskiros „valstybės“. Pastebėsime, kad duomenų mokslininko Vaidoto Zemlio-Balevičiaus skaičiavimai ir palyginimai naudojant šiuos duomenis yra padaryti korektiškai:

Taip pat pateikiame mūsų analitikų darytą iliustraciją, kuri taip pat parodo, kaip labai skiriasi normalizuotas užsikrėtimų rodiklis tarp skiepytų (pvz. dviem dozėmis) ir neskiepytų asmenų konkrečioje amžiaus grupėje:

Panašūs Pavyzdžiai iš kitų sričių: A) daugiausia nuo COVID-19 mirė (savaime suprantama) vilniečių, tačiau normalizavus savivaldybės dydžiui, didžiausias mirštamumas nuo COVID-19 buvo tarp Kelmės savivaldybės gyventojų (net dvigubai didesnis nei tarp vilniečių). B) Autoavarijose žūsta daug daugiau žmonių nei žūsta skrendant raketomis, tačiau atsižvelgus į tai, kad automobiliais važinėja beveik visi, o raketomis skraido tik nedaugelis, reikia padaryti išvadą, kad skrydžiai į kosmosą yra kur kas pavojingesni nei važiavimas automobiliu.“

Išvados

Remiantis pateikta informacija, „Melo detektorius“ vertina socialiniuose tinkluose pasirodžiusius duomenis, kaip klaidinančius. Lentelėje pateikti duomenys nėra korektiški, matematinė formulė nėra teisinga. Klaidingai interpretuojant statistiką siekiama suklaidinti žmones.

Šaltinis
Temos
Griežtai draudžiama Delfi paskelbtą informaciją panaudoti kitose interneto svetainėse, žiniasklaidos priemonėse ar kitur arba platinti mūsų medžiagą kuriuo nors pavidalu be sutikimo, o jei sutikimas gautas, būtina nurodyti Delfi kaip šaltinį.
Dalintis
Nuomonės