Prastas rezultatas…

Mano brolis yra dvyliktokas, o dabar kaip tik egzaminų laikas. Jeigu nueičiau pas jį į kambarį ir jam pasiūlyčiau pakalbėti apie statistiką – jis mane išvytų ir iškoneveiktų. Na, o čia galiu kalbėti apie ką tik noriu ir manęs niekas niekur neveja.

Tikrai ne dėl savęs, bet dėl aiškumo ir tikslumo noriu padiskutuoti apie statistiką. Kadangi žmogaus prigimtis reikalauja įrodymų apie mus supančius reiškinius, vienas iš plačiausiai artikuliuotų ir lengviausiai suprantamų metodų yra statistiniai duomenys. Neišvengiamai, su jais susiduriame visur – žiniasklaida remiasi visokiais skaičiukais ir aiškina mūsų ekonominę situaciją, mokslininkai bando nuspėti visuomenės elgsenos tendencijas pagal tiriamos žmonių grupės rezultatus ir paprastas, tūlas lietuvis išgirdęs, kad infliacija kyla skuba pas darbdavį reikalauti didesnio atlygio. Bet ar mes iš tiesų suprantame apie ką visi tie skaičiai?

Siekdamas paprastumo norėčiau aptarti keletą statistikai svarbių parametrų. Kad būtų paprasčiau, pasirinkime vieną pavyzdį – paplitusi mintis, kad kavos vartojimas apsaugo nuo kažkurios vėžio formos. Nenoriu nagrinėti tokios minties teisingumo pasitelkiant duomenis, bet noriu pasiūlyti pažvelgti, kas slypi už duomenų rinkimo ir analizės.

Duomenų rinkimą ir statistinius rezultatus visada apibūdina tam tikri parametrai. Visų pirma analizuojamas imties (tiriamų žmonių skaičiaus) dydis. Logiška, kad kuo mažiau žmonių išanalizuosime, tuo labiau bereikšmius rezultatus gausime. Pasirinkime skaičių – tarkim buvo ištirta 25 000 žmonių. Retorinis klausimas: kiek tiksliai 25 000 žmonių rezultatai gali numatyti kas gresia visiems? O jei buvo ištirta tik 5 000, ar 1 000? Dažniausiai spauda šitą parametrą praleidžia – mainais pasakoma, kad buvo ištirti 20 šalių gyventojai, kas vėl gi nenurodo kiek tyrime dalyvavo žmonių.

Kitas nemažiau svarbus parametras yra keliamo klausimo prielaidos. Tarkime, kad esminis klausimas yra apie kavą ir vėžį, bet kaip mes galime eliminuoti kitų produktų įtaką vėžio atsiradimui? Įsivaizduokime, kad pusė tiriamųjų vartojo kavą, bet taip pat valgė keptas bulves ir kartais gėrė alkoholį – kaip šitie produktai “žaidžia“ komandoje su kava? Prielaidos yra labai painus momentas ir dažnai jos yra visiškai neaptariamos žiniasklaidoje pateikiant kažkokius tyrimo duomenis. “Visi vyrai yra kiaulės, remiantis paskutinio vyrų elgsenos tyrimo duomenimis teigia mokslininkai iš Didžiosios Britanijos“ – visų pirma tai britai [gal] yra kiaulės, bet kitą vertus kyla klausimas ar būtinai jų lytis padaro juos kiaulėmis, o gal tai gyvenimo būdas lemia, arba laikas, kurį jie praleidžia žiūrėdami futbolą.

Statistika yra tikslumo siekiantis mokslas. Būtent todėl kitas parametras yra duomenų reikšmingumo lygis – kartais, dėl įvairių aplinkybių, yra gaunami netikslūs rezultatai, o tai statistika įvertina paklaidos procentu. Tarkime, kad tiriant kavos įtaka apsisaugojant nuo vėžio standartinis paklaidos dydis yra 1% – reiškia, kad 1 iš 100 rezultatas yra netikslus ir gali būti neteisingai interpretuotas. 1% yra skaičius ir netgi labai reikšmingas – vertinant pasaulio kontekste tai būtų dvidešimties šalių, dydžio su lyg Lietuva, gyventojai (jei Lietuvoje gyvena 3.5 mln žmonių, o pasaulyje 6.8 mlrd). Kadangi dažniausiai yra daromos visuminės išvados (apie bendrą elgseną), todėl jas vertiname viso pasaulio kontekste, o esant 1% paklaidai tai jau būtų šis tas.

Dabar pasvarstykime dar vieną parametrą – atlikto statistinio tyrimo metodas (kaip, po galais, tas tyrimas buvo atliktas?). Yra labai daug būdų, kuriuos pasitelkiant galima atlikti tyrimą, bet ar buvo pasirinktas geras būdas? Kaip išsiaiškinsim ar kava apsaugo nuo vėžio, kiek laiko truks kol gausim tikslius rezultatus? Nebegaliu daugiau…

Kai aš pradedu galvoti apie statistiką, man pasidaro koktu. Iš vienos pusės, mes gauname ant lėkštutės supaprastintus visuomenės elgsenos rezultatus – jei darysim šitaip, tada bus taip ir panašiai. Iš kitos pusės, jei norime suvokti, ką tie rezultatai iš tiesų pasako, turime išanalizuoti krūvą prielaidų ir parametrų. Ta ką po galais daryti, jei norime išsiaiškinti kaip gyventi? Manau geriausias sprendimas yra tiesiog gyventi ir remtis sveiku protu.

Neišmeskime statistinių rezultatų į šiukšlių dėžę, bet tiek kiek leidžia kantrybė pamėginkime kartais suvokti, ką statistika mums nori pasakyti (kokiu mąstu buvo atliktas tyrimas, kokio sudėtingumo klausimas buvo tirtas ir ar galėjo kas nors suklysti), jeigu pasirodys per painu – pasikliaukime sveiku protu. Jei tai yra kavos klausimas, aš neturiu tiek kantrybės, kad galėčiau išsiaiškinti kaip ten yra su visais parametrais, bet suvokiu, kad negerdamas kavos dar niekas nemirė:)

Gražaus savaitgalio!

Nuotraukos šaltinis: web.orange.co.uk