Kilus įtarimui, kad socialiniame tinkle „Facebook“ platinama tikrovės neatitinkanti informacija, siekiant manipuliuoti skaitytojų nuomone vakcinų nuo naujojo koronaviruso tema, „Melo detektorius“ susisiekė su Lietuvos statistikos departamentu. Departamento atstovai sutiko išanalizuoti minėtus duomenis ir paaiškino, kodėl tiek naudojami skaičiavimo metodai, tiek autoriaus prieitos išvados yra neteisingi.
„Autorius naudojasi Statistikos departamento 2021-10-24 d. skelbtais duomenimis apie 2021-10-23 parą. Autorius tiria koreliaciją tarp kiekvienai savivaldybei apskaičiuotų dviejų rodiklių: 1) sergamumo, arba suminio keturiolikos dienų naujų atvejų rodiklio, normalizuoto savivaldybės gyventojų skaičiui; 2) bent viena doze skiepytų asmenų kumuliatyvaus procento savivaldybėje. Bendra autoriaus žinutė netiesiogiai perša nuomonę, kad vakcinos nėra efektyvios apsaugant nuo užsikrėtimo,“ – rašoma Statistikos departamento komandos atsakyme, kuriame pateikiamos trumpos išvados apie tai, kodėl nereikėtų tikėti minėtoje Sveikatos teisės instituto vadovo žinutėje pateikta informacija:
1. Paskelbtos klaidinančios išvados, ignoruotos jau žinomos korektiškos išvados
2. Skaičiuojant padaryta daug klaidų arba manipuliacijų
3. Pasirinktas netinkamas metodas ir netinkami duomenys vakcinų efektyvumui tirti
Toliau pateikiame detalesnius Statistikos departamento komandos paaiškinimus:
1. Paskelbtos klaidinančios išvados
Bendra autoriaus žinutė netiesiogiai perša nuomonę, kad vakcinos nėra efektyvios apsaugant nuo užsikrėtimo: „Vakcinuotų nuo Covid-19 žmonių skaičius Lietuvos savivaldybėse neturi ryšio su Covid-19 plitimu“. Tai yra klaidinanti išvada, nes prie jos buvo prieita netinkamai naudojantis netinkamais metodais ir netinkamais duomenimis. Svarbiausia, buvo ignoruotas jau seniai Lietuvos statistikos departamento atliktas korektiškas tyrimas, kuriame buvo pademonstruotas didelis vakcinų efektyvumas. Priminsime, kad visi gali įsitikinti vakcinų efektyvumu, naudodamiesi Lietuvos statistikos departamento skelbiamais kasdien atnaujinamais duomenų rinkiniais: osp.stat.gov.lt/covid-dashboards -> „Pasirink švieslentę” -> „Atviri duomenys” -> „COVID-19 užsikrėtimų ir vakcinacijų įvykiai”.
2. Skaičiuojant padaryta daug klaidų arba manipuliacijų
(A) Autorius turėtų interpretuoti koreliacijos p vertę, o ne koreliacijos koeficientą. P vertė aprašo tyrimo statistinį reikšmingumą: jei ši vertė yra didesnė nei 0.05 (standartiškai) – tai reiškia, kad negalima daryti jokių išvadų, t.y. „rezultatas yra nevertintinamas“, „nepakanka duomenų“. Autoriaus tyrime p vertė yra lygi 0.3, todėl stebima koreliacija yra atsitiktinė, o jos dydis apskritai neturėtų būti interpretuojamas. (B) Autorius tyrimui manipuliatyviai pasirinko būtent tą dieną, kai koreliacijos koeficientas buvo statistiškai nereikšmingas. Jeigu autorius būtų pasirinkęs kokią nors kitą dieną (pvz., kovo 17, liepos 21, spalio 2), koreliacija būtų statistiškai labai reikšminga ir stipriai neigiama: t.y., pirštų išvadą, kad labiau paplitusi vakcinacija nulemia mažesnį sergamumą (žr. didelės kokybės iliustraciją), priešingai nei bandė parodyti autorius.
(C) Koreliacijai vertinti autorius naudoja ne Spearmano, o Pearsono metodą, kuris yra netinkamas tokiems duomenims. (D) Savivaldybėms nepritaikyti svertiniai koeficientai, neatsižvelgta į tai, kad mažose savivaldybėse normalizuotas naujų atvejų rodiklis yra mažiau tikslus (labiau svyruoja), nei didelėse savivaldybėse. (E) Neatsižvelgiama į kiekvienos savivaldybės vidutinį vakcinacijos „naujumą“. (F) Neatsižvelgiama į kiekvienos savivaldybės demografinę sudėtį. (G) Neatsižvelgiama į tai, kad vakcinos apsauginis efektas pasireiškia ne iš karto, o praėjus kelioms savaitėms. (H) Sergamumas yra normalizuotas savivaldybės gyventojų skaičiui, o ne joje esančiai dar neprasirgusiai ir užsikrėsti galinčiai populiacijos daliai. Taip pat sergamumas nenormalizuotas gyventojų tankiui.
3. Netinkamas metodas ir netinkami duomenys vakcinų efektyvumui pademonstruoti
Užuot tyręs, kaip dažnai užsikrečia skiepyti ir neskiepyti asmenys, autorius pasirenka tirti ne žmones, o savivaldybes. Toks metodas yra labai problematiškas, nes (A) visiškai neturi statistinės galios. Mažiau statistinės galios turėtų tik 10-ies apskričių ar 5-ių regionų tyrimas. (B) Tokio tyrimo rezultatai priklauso nuo neišmatuojamų aplinkybių, pvz., kada konkrečioje savivaldybėje prasidėjo ketvirtoji banga, t. y., kurioje bangos fazėje šiuo metu yra kiekviena savivaldybė. (C) Stebimą reiškinį valdo sudėtingi grįžtamieji ryšiai, pvz., jei savivaldybėje dauguma jau persirgo praeityje – tiriamuoju periodu bus mažai susirgimų, o jos gyventojai vangiai skiepysis; arba jei savivaldybėje šiuo metu yra labai daug susirgimų – jos gyventojai gali būti labai motyvuoti skiepytis; arba jei savivaldybėje gyventojai pasitiki sveikatos apsaugos sistema ir noriai skiepijasi – jie taip pat pasitikės testais ir noriai tirsis po kontakto su užsikrėtusiuoju ar pajutę simptomus.
(D) Abiejuose rodikliuose yra mažai variacijos. (E) Asmens deklaruota gyvenamoji vieta nebūtinai sutaps su užsikrėtimo, testavimosi, sirgimo ar skiepijimosi vieta. Savivaldybės nuolatinių gyventojų skaičius, naudojamas sergamumo rodiklio normalizavimui, nebus toks pats, kaip joje gyvenamąją vietą deklaravusių asmenų skaičius, ypač kurortinėse savivaldybėse. (F) Savivaldybės aukštas faktinis kumuliatyvus vakcinacijos įvertis galėjo būti pasiektas dar metų pradžioje, tad vakcinacijos poveikis stebimu laikotarpiu jau gali būti nusilpęs (ypač jei nėra aktyvios revakcinacijos). (G) Naudojamas bent viena doze pasiskiepijusių asmenų procentas, o ne pilnai / pakartotinai vakcinuotų asmenų procentas. Įtraukiami dalinai paskiepyti asmenys, kuriems pagal vakcinos specifikaciją dar nėra susidaręs specifinis imunitetas. (H) Visos amžiaus grupės sujungtos į vieną, kai tuo tarpu amžiaus skirstinys tarp savivaldybių skiriasi, o kumuliatyvus paskiepijimo procentas ir sergamumas tarp amžiaus grupių taip pat yra labai skirtingas.
Išvados
Sveikatos teisės instituto vadovo paskelbta informacija nėra teisinga, nes joje skelbiamos klaidinančios išvados, ignoruotos jau žinomos korektiškos išvados, skaičiuojant padaryta daug klaidų arba manipuliacijų bei pasirinktas netinkamas metodas ir netinkami duomenys vakcinų efektyvumui tirti.
- Šaltiniai
- Lietuvos statistikos departamento komandos pateikta analizė, pateikta elektroniniu paštu
- Power of a test; en.wikipedia.org
- Spearman's rank correlation coefficient; en.wikipedia.org
- Pearson correlation coefficient; en.wikipedia.org
- p-value; en.wikipedia.org
- Koreliacija; en.wikipedia.org