2021 04 22

Vainius Indilas

bernardinai.lt

Vidutinis skaitymo laikas:

6 min.

Kada iš koreliacijos galime spręsti apie priežastingumą?

Autoriaus asmeninio archyvo nuotrauka

Autorius dirba duomenų analitiku kompanijoje „Facebook“, prieš tai dirbo Vilniaus universiteto Tarptautinių santykių ir politikos mokslų institute (VU TSPMI), kur dėstė kursą „Priežastinių ryšių analizė: kiekybiniai metodai“, o visai neseniai pradėjo rašyti tekstus, siekiančius paprastai paaiškinti esmines duomenų analizės sąvokas:

„Vienokia ar kitokia forma visi mes kas dieną interpretuojam duomenis ir šių sąvokų supratimas gali padėti kritiškai įvertinti mus supančią informaciją“, – sako Vainius Indilas.

Siūlome susipažinti su esminėmis duomenų analizės sąvokomis tam, kad būtų lengviau susigaudyti bandant suprasti įvairius viešojoje erdvėje pasirodančius argumentus.

***

Kalbėsime apie koreliaciją ir priežastingumą.

Įrašas ilgas ir susideda iš šių dalių:

  1. Priežastiniai teiginiai.
  2. Klausimas, kurį reikėtų užduoti pamačius priežastinį teiginį.
  3. Metodai ir jų pagrįstumas.
  4. Norintiems paskaityti plačiau.

Priežastiniai teiginiai

Teiginiai apie priežastingumą skiriasi nuo tiesiog „aprašomųjų“ teiginių (angl. causal vs. descriptive statement).

Dažniausiai iš duomenų norime gauti priežastines įžvalgas, nes pagal jas galime imtis kažkokių veiksmų. Tačiau tokie teiginiai reikalauja gerokai daugiau prielaidų.

Palyginkime šiuos teiginius:

  1. Vaikai, kurių namuose daugiau knygų, turi geresnius mokslo pasiekimus.
  2. Pasikeitė kompanijos vadovas ir pagerėjo rodikliai.
  3. Įmonės, kurios sprendimus priima besiremdamos duomenimis, turi geresnius rodiklius.
  4. Dienomis, kai geriu daugiau kavos, būnu geresnės nuotaikos.

Su šiais teiginiais:

  1. Jeigu nupirksim daugiau knygų, vaiko mokslo pasiekimai pagerės.
  2. Rodikliai pagerėjo, dėl to, kad pasikeitė kompanijos vadovas.
  3. Jeigu sprendimus priimsime remdamiesi duomenimis, įmonės rezultatai pagerės.
  4. Kava pagerina nuotaiką.

Pirmos grupės teiginiai yra tiesiog „aprašomieji“. Jiems didelių prielaidų nereikia: ar vidurkiai skiriasi, ar ne, tiesiog galima palyginti iš duomenų. Tiesa, prieš darant net ir „aprašomąjį“ teiginį, reikėtų patikrinti, ar skirtumai yra didesni nei imties matavimo paklaida, tai yra – ar jie statistiškai reikšmingi (žr. praeitą straipsnį).

Antros grupės teiginiai yra daug „stipresni“. Juos vadiname „priežastiniais teiginiais“. Priežastiniai teiginiai visada turi „kas būtų, jei kažką darytume kitaip“ elementą.

Priežastinis teiginys „rodikliai pagerėjo DĖL vadovo pakeitimo“ yra tapatus teiginiui „jei vadovas nebūtų pasikeitęs, nebūtų pagerėję“. Tai yra, kad būtent vadovo pakeitimas buvo lemiantis veiksnys, o ne kažkokie išoriniai faktoriai.

Praktikoje priežastiniai teiginiai (jeigu jie pagrįsti!) yra daug vertingesni, nes jie gali atsakyti, ką turime daryti, kad kažkas pasikeistų į norimą pusę. Tačiau vien iš duomenų savaime priežastinių išvadų daryti negalime.

Duomenys visada yra aprašomieji, o priežastinėms išvadoms reikia papildomų prielaidų. Toliau kalbėsime, kada tokios išvados daugiau arba mažiau pagrįstos.

Klausimas prieš darant priežastinę išvadą

Prieš darant priežastinę išvadą, tai yra iš teiginio:

    Vaikai, kurių namuose daugiau knygų, turi geresnius mokslo pasiekimus.

Pereinant prie teiginio:

    Jeigu nupirksim daugiau knygų, vaiko mokslo pasiekimai pagerės.

Universalus klausimas, kurį visada reikėtų užduoti yra:

    Ar yra kitų veiksnių, kurie gali paaiškinti stebimą koreliaciją?

Šiam pavyzdyje knygų turėjimas gali būti susijęs su kitais veiksniais, pavyzdžiui, tėvų išsilavinimu. Labiau išsilavinę tėvai turi daugiau knygų. Jeigu iš tiesų tėvų išsilavinimas (o ne knygos) yra geresnių vaiko rezultatų priežastis, tai tiesiog „nupirkus daugiau knygų“ rezultatai nepagerės (nesvarbu, kad buvo koreliacija).

Kuo lengviau sugalvoti kitus koreliaciją paaiškinančius veiksnius, tuo mažiau tikėtinas „priežastinis teiginys“. Koreliacija gal ir yra, bet priežastinio ryšio tarp kintamųjų gali ir nebūti.

Vien iš to, kad yra koreliacija, negalime atsakyti, kuris veiksnys lemia kurį, ir ar išvis yra priežastinis ryšys (galbūt abu kintamuosius lemia kiti susiję veiksniai).

Autoriaus vizualiacija

Metodai ir jų pagrįstumas

Metodų pagrįstumas susijęs su prieš tai minėtu klausimu. Kuo labiau metodas užtikrina, kad nėra kitų skirtumų, kurie paaiškintų sąryšį, tuo jis pagrįstesnis.

Aptarsime:

  1. Kontroliuojamus eksperimentus
  2. „Natūralius“ eksperimentus
  3. Neeksperimentinius metodus

Randomizuoti kontroliuojami eksperimentai

Pradėkime nuo mokslinio „aukso standarto“, t. y. randomizuotų kontroliuojamų eksperimentų. Šiuo atveju, turėdami grupę žmonių, ją atsitiktinai padaliname į dvi dalis ir priskiriame skirtingas kintamojo, kurio efektą norime išmatuoti, reikšmes.

Šis metodas plačiai taikomas medicinoje. Jeigu norime nustatyti vaisto įtaką sveikatai, grupę žmonių atsitiktinai padaliname į dvi – vienai duodame vaistą su veikliąja medžiaga, kitai – be. Jeigu grupėje su veikliąja medžiaga sergamumas mažesnis (daugiau nei matavimo paklaida!) – žinom, kad vaistas veikia.

Kadangi žmones į grupes suskirstėm atsitiktinai, atsakymas į klausimą „ar yra kiti veiksniai, kurie gali paaiškinti skirtumus tarp grupių?“ visada yra „ne, nėra“. Tiesa, šiokių tokių prielaidų vis tiek yra.

Randomizuoti eksperimentai yra itin plačiai taikomi interneto platformų. Kai naudojamės „Facebook“ ar „Google“, kiekvienas iš mūsų gaunam truputį skirtingą produkto versiją, nes nuolat vykdomi eksperimentai. Skirtingi žmonės patenka į skirtingas eksperimentines grupes. Prieš darant produkto pakeitimus kompanijos taip patikrina, kokia pakeitimų įtaka verslo metrikoms.

Idealiu atveju į visus klausimus atsakytume darydami eksperimentus, tačiau praktikoje dažnai tai padaryti yra brangu, ne visada etiška, o kartais ir neįmanoma. Tarkim, klimato kaitos klausimams toks metodas netinkamas, nes turim vieną Žemę (su viena susijusia klimato sistema), ir negalim jos suskaidyti į „tiriamą“ ir „kontrolinę“ grupę.

Natūralūs ir kvazieksperimentai

Kaip minėjome, kontroliuojamus eksperimentus atlikti dažnai yra brangu ir ne visada etiška. Tačiau moksle siekti priežastinių teiginių vis tiek norime – nes tai gali padėti mums priimant sprendimus ar tiesiog geriau suprantant pasaulį.

Jeigu negalime atlikti kontroliuojamo eksperimento, kartais galime pasinaudoti vadinamais „natūraliais eksperimentais“. „Natūralus eksperimentas“ įvyksta tada, kai dėl kažkokių išorinių (ir tam tikra prasme atsitiktinių) veiksnių gaunam skirtingas kintamojo, kurį tiriam, reikšmes.

Kartais „natūralus eksperimentas“ įvyksta, nes iš tikrųjų vyksta loterija. Pavyzdžiui, valstybė atsitiktinai išrenka, kam teks eiti į kariuomenę, o kam ne – tokiu atveju galima nustatyti „tarnavimo“ įtaką vėlesniems gyvenimo veiksniams. Kartais „loterija“ vyksta tik iš dalies, bet tai irgi gali padėti įvertinti tam tikrų veiksnių įtaką. Pavyzdžiui, jeigu valstybė atsitiktinai skiria, pas kokį teisėją keliaus byla, ir vieni teisėjai yra griežtesni už kitus, galima bandyti nustatyti bausmės griežtumo įtaką vėlesniam įsitvirtinimui visuomenėje.

Jeigu tiesiog lygintume žmones, kurie gavo griežtas bausmes, su tais, kurie ne tokias griežtas, ir rastume, kad gavę griežtesnes bausmes po 10 metų sunkiau įsitvirtina visuomenėje – negalim daryti išvados, kad „griežtesnių bausmių skyrimas neigiamai veikia įsitvirtinimą visuomenėje“. Galbūt neigiamą įtaką įsitvirtinimui turėjo ne bausmė, bet gilesnės priežastys, dėl kurių žmogus gavo griežtesnę bausmę. Tačiau, jeigu lyginam, kaip sekasi įsitvirtinti patekusiems pas „griežtą teisėją“ ir „mažiau griežtą“, – kitų veiksnių, paaiškinančių koreliaciją, sugalvoti sunkiau, jeigu teisėjai priskirti atsitiktinai.

Atsitiktinis kintamasis („koks teisėjas buvo priskirtas“), kuris padeda įvertinti kito kintamojo įtaką (šiuo atveju, „bausmės griežtumo“), dar vadinamas „instrumentiniu kintamuoju“.

Praktikoje tyrėjas turi įtikinti, kad nėra kitų „natūralaus eksperimento“ ar „instrumentinio kintamojo“ paveiktų veiksnių, kurie gali paveikti rezultatą. Taip pat dažna problema, kad „instrumentas“ silpnai koreliuoja su kintamuoju, kurio įtaką norim išmatuoti. Nors teoriškai „teisėjų griežtumas“ padeda įvertinti „bausmės griežtumo“ įtaką, bet jeigu „griežtumo“ skirtumai tarp teisėjų labai maži, bus sunku gauti reikšmingus rezultatus.

Plačiau apie natūralius eksperimentus ir instrumentinius kintamuosius galite paskaityti čia.

Neeksperimentiniai metodai

Atmetus „kontroliuojamus eksperimentus“ (aukso standartą) ir „natūralius eksperimentus“ (patikimus, bet reikalaujančius prielaidų), lieka „neeksperimentiniai“ metodai. Jie reikalauja daug stipresnių prielaidų, ir daugelis mokslininkų mano, kad taikant juos priežastiniai teiginiai retai kada yra pagrįsti.

Į šią kategoriją įeina regresinės analizės arba „panašių atvejų atrinkimo“ (angl. matching) metodai. Metodų principas yra toks:

Lygindami grupes, bandome atsižvelgti į vis daugiau „kitų veiksnių“, kurie gali paaiškinti koreliaciją. Jeigu atsižvelgus į visus kitus veiksnius „sąryšis“ dar lieka – labiau tikėtina, kad jis priežastinis.

Grįžkime prie knygų skaičiaus namie ir vaiko pasiekimų pavyzdžio. Jeigu įtariame, kad knygų skaičius susijęs ir su tėvų išsilavinimu, galim lyginti vaikus, kurių tėvų išsilavinimas vienodas, ir patikrinti, ar vis dar lieka koreliacija tarp knygų skaičiaus ir pasiekimų.

Problema, kad neeksperimentinių metodų atveju galime atsižvelgti tik į „išmatuojamus“ veiksnius. O dažnai skirtumai tarp grupių gali būti sukelti ir lengvai neišmatuojamų veiksnių, pavyzdžiui, „vaiko smalsumo“.

Į „neišmatuojamus“ veiksnius gerai atsižvelgia tik eksperimentiniai (įskaitant kai kuriuos natūralius eksperimentus) metodai. Dažniausiai tik jie laikomi pakankamai „pagrįstais“, jei kalbame apie priežastinio ryšio parodymą. Tuo tarpu „neeskperimentiniai“ (kaip tiesinė regresija), labiau tinka daryti „aprašomosioms įžvalgoms“, bet ne priežastinėms.

Geras šių metodų taikymo pavyzdys yra naujos britiškos koronaviruso atmainos plitimo greičio matavimas. Prie išvados, kad „nauja atmaina lengviau užkrečiama“, buvo prieita taikant neeksperimentinius metodus. Lyginta, kad „tame pačiame regione“ ir „tą pačią savaitę“, naujos atmainos augimo greitis iš esmės visuose regionuose ir visomis savaitėmis yra didesnis. Nors pats straipsnis pabrėžė, kad spartesnį atmainos plitimą gali lemti ir kiti veiksniai, nebūtinai didesnis užkrečiamumas.

Apibendrinimas

Šiek tiek supaprastinta diagrama, apibendrinanti, ką aptarėme:

Autoriaus vizualizacija

Norintiems paskaityti plačiau

Ši tema yra mažiau apibrėžta, negu prieš tai buvusi apie „statistinį reikšmingumą“. „Statistinio reikšmingumo“ atveju yra aiškus sąvokos apibrėžimas ir visada yra objektyvus atsakymas, ar rezultatai jį tenkina, ar ne. 

Tuo tarpu tam, kad iš duomenų spręstume apie priežastingumą, visais atvejais (išskyrus atliekant kontroliuojamą eksperimentą) reikia daryti prielaidas, kurių negalime patikrinti duomenimis. Ar prielaidos pagrįstos, ar ne, yra subjektyvumo elemento – kada jau „įtikinama“, kad nėra „kitų veiksnių, kurie gali paaiškinti koreliaciją“.

Skirtingose mokslo srityse nusistovi šiek tiek skirtingos praktikos, kiek priimtina naudoti neeksperimentinius metodus – ir tai susiję su tuo, kaip lengva toje srityje atlikti eksperimentą.

Pateikiame kelias ištraukas iš Kolumbijos universiteto Niujorke statistikos profesoriaus A. Gelmano trijų knygų apie priežastingumą recenzijos:

  1. Jis išdėlioja skirtingas mokslo sritis pagal tai, kaip „griežtai“ jos žiūri į priežastingumo įrodymo kartelę, ir pabrėžia, kad nors ir yra sutarimas dėl „eksperimentų“ kaip aukso standarto, bet nėra sutarimo, kiek (ir ar) galima daryti priežastines išvadas tik iš stebimų duomenų (naudojant „kvazieksperimentinius“ ir neeksperimentinius metodus). Žr. Attitudes towards causal inference skyrių.
  2. Gelmanas taip pat pabrėžia, kad jam pačiam aktualesnis atrodo „ryšio stiprumo išmatavimo“ klausimas, o ne tik „ar ryšys yra“. Ypač socialiniuose moksluose beveik visi veiksniai turi kažkokią įtaką vienas kitam, tik klausimas – kada „efektas“ yra pakankamai didelis, kad rūpėtų praktikoje.

Iš kitos perspektyvos, NUS verslo mokyklos profesoriaus ir NBER tyrėjo straipsnis apie tai, kad mąstydami apie priežastingumą ekonomistai gali nemažai pasimokyti iš istorijos disciplinos:

  1. Autoriai kalba apie „konkuruojančius naratyvus“, ir kad iškylant naujiem faktams ar vykstant naujiems įvykiams, geri naratyvai vis dar sugeba „sujungti taškus“ ir juos paaiškinti, o blogi – išnyksta.
  2. Autoriai siūlo ekonomistams išmokti vertinti „konkuruojančius naratyvus“ naudojant panašius standartus kaip istorijos moksle.

Pabaiga

Mintys, kurias pateikiau, yra labiau iš statistiko perspektyvos. Jeigu tinklaraštį skaito kitų mokslo sričių atstovai, būtų įdomu išgirsti ar rezonavo, kokie standartai priežastingumo įrodymui taikomi pas jus?

Facebook įrašas, jei norite palikti komentarą