Articles

Viisi tapaa analysoida Ordinaalisia muuttujia (jotkut parempia kuin toiset)

ei ole paljon tilastollisia menetelmiä, jotka on suunniteltu vain ordinaalimuuttujille.

mutta se ei tarkoita, että jäisi vähiin vaihtoehtoihin. Niitä on enemmän kuin luulisi.

jotkut ovat parempia kuin toiset, mutta se riippuu tilanteesta ja tutkimuskysymyksistä.

tässä on viisi vaihtoehtoa, kun riippuvainen muuttuja on ordinaalinen.

Ordinaaliset muuttujat ovat nimellisiä

Ordinaaliset muuttujat ovat pohjimmiltaan kategorisia. Yksi yksinkertainen vaihtoehto on jättää muuttujan luokissa oleva järjestys huomiotta ja käsitellä sitä nimellisenä. On monia vaihtoehtoja analysoida kategorisia muuttujia, joilla ei ole järjestystä.

tässä voi olla paljon järkeä joidenkin muuttujien kohdalla. Esimerkiksi silloin, kun luokkia on vähän eikä järjestys ole tutkimuskysymyksen kannalta keskeinen.

tämän lähestymistavan suurin etu on se, ettet riko mitään oletuksia.

käsittelevät järjestysmuuttujia numeerisina

koska kategorioiden järjestys on usein keskeinen tutkimuskysymyksen kannalta, monet data-analyytikot tekevät päinvastoin: jätä huomiotta se, että ordinaalinen muuttuja ei todellakaan ole numeerinen, ja käsittele niitä numeroita, jotka nimeävät kunkin luokan todellisiksi luvuiksi.

tämä lähestymistapa edellyttää oletusta siitä, että kunkin myöhempien luokkien joukon välinen etäisyys on yhtä suuri. Sitä voi olla hyvin vaikea perustella.

mieti siis pitkään ja hartaasti, pystytkö perustelemaan tämän oletuksen.

ei-parametriset testit

hyviä uutisia: muitakin vaihtoehtoja on.

monet ei-parametriset kuvailevat tilastot perustuvat järjestyslukuihin. Rivit ovat itse ordinaalisia-ne kertovat tietoa järjestyksestä, mutta arvojen välillä ei ole etäisyyttä.

aivan kuten muutkin ordinaaliset muuttujat.

joten vaikka pidämme näitä testejä hyödyllisinä numeerisille tiedoille, jotka eivät ole normaaleja tai joilla on poikkeavia arvoja, ne toimivat myös ordinaalisille muuttujille, varsinkin kun järjestettyjä luokkia on enemmän kuin vain muutama.

yleisiä rank-pohjaisia ei-parametrisia testejä ovat muun muassa Kruskal-Wallis, Spearmanin korrelaatio, Wilcoxon-Mann-Whitney ja Friedman.

jokaisella testillä on tietty testitilasto, joka perustuu näihin riveihin riippuen siitä, vertaileeko testi ryhmiä vai mittaako se assosiaatiota.

näiden testien rajoitus on kuitenkin se, että ne ovat aika perusasioita. Toki ryhmiä voi verrata yksisuuntaiseen ANOVA-tyyliin tai mitata korrelaatiota, mutta sitä pidemmälle ei voi mennä. Et voi esimerkiksi sisällyttää kahden itsenäisen muuttujan välisiä vuorovaikutuksia tai sisällyttää kovariaatteja.

siihen tarvitaan todellinen malli.

Ordinaalilogistic & probit-regressio

pelkästään ordinaalisia muuttujia varten ei ole montaa koetta, mutta muutamia on. Yksi yleisimmin käytetyistä on ordinaaliset mallit logistiseen (tai probit) regressioon.

logit-linkkifunktio voidaan määritellä muutamalla eri tavalla siten, että se säilyttää järjestyksen riippuvaisessa muuttujassa. Yleisimmin ohjelmistoissa on käytössä kumulatiivinen linkkifunktio, jonka avulla voidaan mitata ennustajien vaikutusta mahdollisuuksiin siirtyä seuraavaksi korkeimpaan kategoriaan.

nämä mallit ovat monimutkaisia, niillä on omat oletuksensa ja niiden tulkitseminen voi vaatia jonkin verran harjoitusta. Mutta ne ovat myös joskus juuri sitä, mitä tarvitset.

ne ovat erittäin hyvä työkalu tilastolliseen työkalupakkiin.

Rank transformations

toisessa mallipohjaisessa lähestymistavassa yhdistyvät ordinaalisen logistisen regression edut ja rank-pohjaisen ei-parametriikan yksinkertaisuus.

perusidea on rank-muunnos: muuta jokainen ordinaalinen tulospistemäärä kyseisen pistemäärän arvoiseksi ja aja regressio, kaksisuuntainen ANOVA tai muu malli noille riveille.

kannattaa kuitenkin muistaa, että kaikki tulokset pitää tulkita rivien mukaan. Aivan kuten log transformation on riippuvainen muuttuja tuo kaikki keinot ja kertoimet log(DV) mittakaavassa, rank transformation tuo kaiken listalla asteikolla. Tulkintasi koskevat ilkeitä rivejä, eivät keinoja.

Binary, Ordinal, and Multinomial Logistic Regression for Categorical Outcomes
get beyond the frustration of learning Odds rations, logit link functions, and proportional Odds oletukset on your own. Katso logistisen regression ja kategorisen data-analyysin uskomaton hyödyllisyys tässä tunnin mittaisessa koulutuksessa.