Atsiliepimai

Koreliacija ir priežastys statistikoje

Koreliacija ir priežastys statistikoje


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Vienos dienos pietų metu jauna moteris suvalgė didelį dubenį ledų, o kolegės dėstytoja nuėjo prie jos ir pasakė: „Geriau būk atsargus, tarp ledų ir snaudimo yra didelis statistinis ryšys“. Ji privalo pažvelgė į jį painiavai, nes jis dar keletą detalizavo. „Dienos, kuriose parduodama daugiausia ledų, nuskęsta daugiausia žmonių“.

Kai ji baigė gaminti mano ledus, du kolegos aptarė faktą, kad vien todėl, kad vienas kintamasis yra statistiškai susijęs su kitu, dar nereiškia, kad vienas yra kito priežastis. Kartais fone slepiasi kintamasis. Šiuo atveju duomenyse slepiasi metų diena. Karščiomis vasaros dienomis parduodama daugiau ledų nei žiemą snieguotų. Daugiau žmonių maudosi vasarą, taigi vasarą labiau nuskęsta nei žiemą.

Saugokitės paslėptų kintamųjų

Aukščiau pateiktas anekdotas yra puikus to, kas vadinama klastingu kintamuoju, pavyzdys. Kaip rodo jo pavadinimas, paslėptas kintamasis gali būti nemandagus ir sunkiai aptinkamas. Kai pastebime, kad du skaitmeniniai duomenų rinkiniai yra stipriai koreliuojami, visada turėtume paklausti: „Ar gali būti kažkas kito, kas sukelia šiuos ryšius?“

Šie pavyzdžiai rodo stiprią koreliaciją, kurią sukelia paslėptas kintamasis:

  • Vidutinis kompiuteris, tenkantis vienam asmeniui šalyje, ir vidutinė gyvenimo trukmė toje šalyje.
  • Gaisrininkų skaičius gaisro metu ir gaisro padaryta žala.
  • Pradinių klasių mokinio ūgis ir jo skaitymo lygis.

Visais šiais atvejais ryšys tarp kintamųjų yra labai stiprus. Paprastai tai rodo koreliacijos koeficientas, kurio vertė artima 1 arba –1. Nesvarbu, koks artimas šis koreliacijos koeficientas yra 1 ar -1, ši statistika negali parodyti, kad vienas kintamasis yra kito kintamojo priežastis.

Paslėptų kintamųjų aptikimas

Dėl savo pobūdžio apgaulingus kintamuosius sunku nustatyti. Viena iš strategijų, jei tokių yra, yra ištirti, kas atsitinka su duomenimis per tam tikrą laiką. Tai gali atskleisti sezonines tendencijas, tokias kaip ledų pavyzdys, kurios tampa neaiškios, kai kaupiami duomenys. Kitas metodas yra ieškoti pašalinių dydžių ir pabandyti nustatyti, kuo jie skiriasi nuo kitų duomenų. Kartais tai pateikia užuominą į tai, kas vyksta užkulisiuose. Geriausias būdas yra būti iniciatyviam; klauskite prielaidų ir atidžiai eksperimentuokite.

Kodėl tai svarbu?

Atidarymo scenarijuje tarkime, kad geranoriška, tačiau statistiškai neinformuota kongresmenė pasiūlė uždrausti visus ledus, kad būtų išvengta nuskendimo. Toks įstatymas sukeltų nepatogumų dideliems gyventojų sluoksniams, priverstų keletą bendrovių bankrutuoti ir panaikintų tūkstančius darbo vietų, nes šalies ledų pramonė būtų uždaryta. Nepaisant geriausių ketinimų, šis įstatymo projektas nesumažins skęstančių mirčių skaičiaus.

Jei šis pavyzdys atrodo šiek tiek per daug patrauklus, pagalvokite apie tai, kas nutiko. Šeštojo dešimtmečio pradžioje gydytojai pastebėjo, kad kai kurie kūdikiai mįslingai miršta miegant nuo suvokiamų kvėpavimo problemų. Tai buvo vadinama lopšio mirtimi ir dabar žinoma kaip SIDS. Nuo SIDS mirusių asmenų skrodimų nepaisė padidėjęs užkrūčio liauka, krūtinėje esanti liauka. Remdamiesi SIDS kūdikių padidėjusių užkrūčio liaukų koreliacija, gydytojai padarė prielaidą, kad neįprastai didelis užkrūčio liauka sukėlė netinkamą kvėpavimą ir mirtį.

Siūlomas sprendimas buvo sutraukti užkrūčio ląstą dideliu radiacijos laipsniu arba visiškai pašalinti liauką. Šios procedūros turėjo aukštą mirtingumą ir lėmė dar daugiau mirčių. Liūdna tik tai, kad šios operacijos neturėjo būti atliekamos. Vėlesni tyrimai parodė, kad šie gydytojai klydo savo prielaidose ir kad užkrūčio liauka neatsako už SIDS.

Koreliacija nereiškia priežasties

Tai, kas išdėstyta pirmiau, turėtų priversti mus padaryti pertrauką, kai manome, kad statistiniai įrodymai naudojami tokiems dalykams kaip medicinos režimai, įstatymai ir švietimo pasiūlymai pateisinti. Svarbu, kad interpretuojant duomenis būtų padaryta daug pastangų, ypač jei rezultatai, susiję su koreliacija, paveiks kitų gyvenimus.

Kai kas nors teigia: „Tyrimai rodo, kad A yra B priežastis, o kai kurie statistiniai duomenys tai dubliuoja“, būkite pasirengę atsakyti, „koreliacija nereiškia priežastinio ryšio“. Visada stebėkite, kas slepiasi po duomenimis.


Žiūrėti video įrašą: alkoholizmas (Birželis 2022).


Komentarai:

  1. Jaiden

    Įtrauksiu šį straipsnį į jūsų žymes.

  2. Shaktilar

    Mano nuomone, jis klysta. Aš esu tikras. Turime aptarti. Parašyk man pm.

  3. Medus

    This is not at all what is necessary for me.

  4. Cisco

    I think it's a good idea.



Parašykite pranešimą