Etusivu>Opinnäytetyöpakki>Tukimateriaali>Määrällisen analyysi

Muuttujien välisten yhteyksien / riippuvuuksien testaaminen

 

1. Kaksiulotteinen taulukko, ristiintaulukointi ja sen testaus
(χ2 –riippumattomuustesti, Khiin neliö –testi)

  • tutkitaan, onko rivi- ja sarakemuuttujien välillä riippuvuutta
  • voidaan käyttää jokaisen mitta-asteikon muuttujille
  • käyttö edellyttää: korkeintaan 20 % teoreettisista frekvensseistä (odotetuista frekvensseistä) saa olla pienempiä kuin 5 ja jokaisen odotetun frekvenssin on oltava suurempi kuin 1 (SPSS –ohjelma ilmoittaa kyseisen prosenttiluvun että pienimmän odotetun frekvenssin)

H0: muuttujat riippumattomia, x ei vaikuta muuttujaan y
H1: muuttujien välillä on riippuvuutta, y riippuu x:stä, x vaikuttaa muuttujaan y

Esimerkki: Testataan, vaikuttaako sukupuoli matematiikan numeroon. 

H0: ei ole eroa tyttöjen ja poikien välillä matematiikan numeroissa, toisin sanoen sukupuoli ei vaikuta matematiikan numeroon
H1: sukupuoli vaikuttaa matematiikan numeroon

SPSS-tuloste:




Pienin odotettu frekvenssi on 15,52, joten testin molemmat kriteerit ovat  kunnossa ( 0 % < 20 % ja 15,52 > 1).
Voidaan siis käyttää χ2 –testiä.

Sig.-arvo = 0,086 > 0,05, joten H0 hyväksytään (Sig.-arvo kohdasta Pearson Chi-Square).
Sig.-arvo = 0,086 tarkoittaa, että jos H0 hylätään ja H1 hyväksytään, niin virhepäätelmän todennäköisyys on likimain 8,6 % eli on 8,6 % :n riski, että riippuvuus johtuu sattumasta. Riski on suurempi kuin sallittu (5%). Näin ollen H0 jää voimaan.
Tulosta tukee myös pieni kontingenssikerroin C = 0,157.

Tulkintaa:
Tutkituista noin 55%:lla oli matematiikan numero 7 tai 8. Kiitettäviä numeroita oli reilulla viidesosalla tutkituista ja saman verran oli myös heikkoja numeroita. Sukupuolen ja matematiikan numeron välillä ei esiinny tilastollista riippuvuutta (p=0,086).

 

2. Korrelaatiokertoimet ja niiden testaus

Muuttujien välistä yhteyttä, riippuvuutta sanotaan korrelaatioksi. Sitä mitataan korrelaatiokertoimella, joka kertoo muuttujien välisen riippuvuuden suuruuden ja suunnan.


Pearsonin korrelaatiokerroin r

Pearsonin korrelaatiokerroin r mittaa lineaarista riippuvuutta. Tämän korrelaation laskeminen edellyttää, että molemmat muuttujat ovat vähintään välimatka-asteikollisia. Tätä riippuvuutta voidaan tutkia myös hajontakuvion avulla. y on selitettävä muuttuja ja x on selittävä muuttuja.

Korrelaatiokerroin saa arvoja -1:n ja +1:n väliltä. Mitä voimakkaammasta riippuvuudesta on kyse, sitä lähempänä r on arvoa +1 tai –1. Mitä lähempänä korrelaatiokerroin on lukua nolla, sitä heikommaksi riippuvuus tulee tai sitä ei ole ollenkaan.

100*r2 on selitysaste, joka kertoo, kuinka suuri osa selitettävän muuttujan y vaihtelusta voidaan selittää selittävän muuttujan x avulla.

Testaus:

  • tutkitaan välimatka-asteikon ja suhdeasteikon tasoisien muuttujien välistä yhteyttä/riippuvuutta
  • edellyttää, että muuttujat noudattavat likimain normaalijakaumaa

Korrelaation testaus voidaan tehdä yksi- tai kaksisuuntaisena. Myös SPSS –ohjelmassa voidaan tehdä näistä valinta.

Kaksisuuntainen testi:
H0: muuttujat ovat riippumattomia, korrelaatiokerroin ≈ 0
H1: muuttujat riippuvat toisistaan, korrelaatiokerroin ≠ 0

Yksisuuntainen testi:
H0: muuttujat ovat riippumattomia, korrelaatiokerroin ≈ 0
H1: muuttujat riippuvat toisistaan, korrelaatiokerroin < 0

TAI

H0: muuttujat ovat riippumattomia, korrelaatiokerroin ≈ 0
H1: muuttujat riippuvat toisistaan, korrelaatiokerroin > 0

SPSS-ohjelman oletusasetuksilla korrelaatiokertoimen testaus suoritetaan kaksisuuntaisena. Yksisuuntainen testi voidaan valita, jos on perusteltua olettaa riippuvuuden suunta.

Esimerkki: Tutkitaan, vaikuttaako ikä asuntovelan suuruuteen.

H0: iän ja asuntovelan suuruuden välillä ei ole riippuvuutta
H1: iän ja asuntovelan suuruuden välillä on riippuvuutta

SPSS-tuloste:


Iän ja asuntovelan väliseksi korrelaatiokertoimeksi r saatiin - 0,782. Sig.-arvoksi saatiin 0,000 ja 94 tutkitulta saatiin tietää sekä ikä että asuntovelka.

Koska Sig.-arvo = 0,000 < 0,001, niin H1 hyväksytään riskitasolla 0,001. Riski, että riippuvuus johtuisi sattumasta, on siis tosi pieni, joten H1 hyväksytään. Korrelaatiokertoimen arvosta - 0,782 havaitaan, että muuttujien välillä on voimakas negatiivinen riippuvuus.
Selitysaste on 100*(-0,7822) ≈ 61%.

Tulkinta: Iän ja asuntovelan suuruuden välillä on tilastollisesti erittäin merkitsevä riippuvuus (p=0,000). Mitä iäkkäämmästä ihmisestä on kysymys, sitä pienempi on yleensä asuntolainan suuruus. Ikä selittää noin 61% asuntovelan suuruuden vaihtelusta.

HUOM! Pieni p-arvo (Sig.-arvo) kertoo tilastollisen riippuvuuden olemassaolosta, mutta korrelaatiokerroin kertoo sitten riippuvuuden suuruuden!


Spearmanin järjestyskorrelaatiokerroin rs

Mikäli x ja y ovat vähintään järjestysasteikon muuttujia eli muuttujien arvot voidaan järjestää suuruus-, paremmuus- tai tärkeysjärjestykseen, niin tällöin voidaan käyttää järjestyskorrelaatiokerrointa. Korrelaatiota ei lasketa muuttujien arvoilla, vaan niiden järjestysnumeroilla.

Järjestyskorrelaatiokerroin saa myös arvoja -1:n ja +1:n väliltä.
Tämä korrelaatio ilmoittaa, miten samanlaisia ovat kahden muuttujan arvojen keskinäiset järjestykset. Jos järjestykset ovat samat molemmilla muuttujilla, tulee kertoimen arvoksi +1. Jos järjestykset mitatuissa muuttujissa ovat täysin vastakkaisia, tulee kertoimen arvoksi –1.

Esimerkki: Tutkittavilta kysyttiin 5-portaisella asteikolla, kuinka paljon (usein) he käyttävät sähköpostia ja kuinka usein he seuraavat työpaikan sähköistä ilmoitustaulua. Tutkitaan, onko näillä jotain yhteyttä toisiinsa.

H0: muuttujien välillä ei ole yhteyttä
H1: muuttujien välillä on yhteyttä

SPSS-tuloste:


Järjestyskorrelaatiokertoimeksi saatiin 0,132 ja Sig.-arvoksi 0,066.
Koska Sig.-arvo 0,066 > 0,05, niin H0 hyväksytään.

Tulkinta: Sähköpostin käyttämisellä ja sähköisen ilmoitustaulun seuraamisella ei ollut tilastollisesti merkitsevää yhteyttä (p=0,066) eli vaikka sähköpostia käytettäisiin useasti, niin se ei vaikuta sähköisen ilmoitustaulun seuraamiseen.



3. Regressio

Jos muuttujat ovat vähintään välimatka-asteikon muuttujia ja jos muuttuja y riippuu lineaarisesti muuttujasta x, niin muuttujien välille voidaan muodostaa matemaattinen yhteys (suoran yhtälö).

Yhden selittävän muuttujan lineaarisessa mallissa selitetään muuttujaa y (selitettävä muuttuja) yhdellä selittävällä muuttujalla x. Suora on muotoa:

y = a + bx

missä kerroin b on regressiokerroin ja kertoo, kuinka paljon y muuttuu, kun x kasvaa yhden oman yksikkönsä verran.

Selittäviä muuttujia x voi olla useitakin ja silloin kyseessä on useamman selittävän muuttujan malli. Kahden selittävän muuttujan suora on muotoa:

y = a + b1x1 + b2x2.

Esimerkki:

SPSS-tuloste:




Anova-taulukossa Sig.-arvo = 0,000, mikä merkitsee sitä, että malli sopii aineistoon (H1: malli sopii aineistoon).
Myös selitysaste on hyvä 61 % (100*0,7822 = 61,2 %).
Näin ollen muodostetaan asuntovelan y ja iän x välille regressiosuoran yhtälö.
Taulukosta saadaan kertoimet a = 114023,2 ja b = - 1954,405 ja yhtälöksi tulee

y = 114023,2 - 1954,405x

Coefficients-taulukossa Sig.-arvot ovat myös 0,000, joten kertoimet poikkeavat tilastollisesti merkitsevästi nollasta.

Regressiosuoran avulla voidaan arvioida esimerkiksi 40-vuotiaan henkilön asuntovelka:

y* (40) = 114023,2 - 1954,405*40 ≈ 36 000 €