Articles

Fem måder at analysere ordinære variabler (nogle bedre end andre)

der er ikke mange statistiske metoder designet kun til ordinære variabler.

men det betyder ikke, at du sidder fast med få muligheder. Der er mere, end man skulle tro.

nogle er bedre end andre, men det afhænger af situationen og forskningsspørgsmålene.

Her er fem muligheder, når din afhængige variabel er ordinær.

behandle ordinære variabler som nominelle

ordinære variabler er grundlæggende kategoriske. En simpel mulighed er at ignorere rækkefølgen i variabelens kategorier og behandle den som nominel. Der er mange muligheder for at analysere kategoriske variabler, der ikke har nogen ordre.

dette kan give meget mening for nogle variabler. For eksempel, når der er få kategorier, og ordren ikke er central for forskningsspørgsmålet.

den største fordel ved denne tilgang er, at du ikke overtræder nogen antagelser.

behandle ordinære variabler som numeriske

fordi rækkefølgen af kategorierne ofte er central for forskningsspørgsmålet, gør mange dataanalytikere det modsatte: ignorer det faktum, at ordinalvariablen virkelig ikke er numerisk, og behandl de tal, der betegner hver kategori som faktiske tal.

denne tilgang kræver antagelsen om, at afstanden mellem hvert sæt efterfølgende kategorier er ens. Og det kan være meget svært at retfærdiggøre.

så tænk længe og hårdt på, om du er i stand til at retfærdiggøre denne antagelse.

ikke-parametriske tests

nogle gode nyheder: der er andre muligheder.

mange ikke-parametriske beskrivende statistikker er baseret på rangering af numeriske værdier. Ranger er selv ordinære-de fortæller dig oplysninger om ordren, men ingen afstand mellem værdier.

ligesom andre ordinære variabler.

så mens vi tænker på disse tests som nyttige til numeriske data, der ikke er normale eller har outliers, arbejder de også for ordinære variabler, især når der er mere end blot nogle få ordnede kategorier.en af de mest almindelige tests, der er baseret på rang, er Kruskal, Spearman korrelation og Friedman.

hver test har en specifik teststatistik baseret på disse rækker, afhængigt af om testen sammenligner grupper eller måler en tilknytning.

begrænsningen af disse tests er dog, at de er ret grundlæggende. Sikker på at du kan sammenligne grupper envejs ANOVA stil eller måle en sammenhæng, men du kan ikke gå ud over det. Du kan for eksempel ikke inkludere interaktioner mellem to uafhængige variabler eller inkludere kovariater.

du har brug for en rigtig model til at gøre det.

Ordinal logistic& probit regression

der er ikke mange tests, der er oprettet kun for ordinære variabler, men der er nogle få. En af de mest almindeligt anvendte er ordinære modeller til logistisk (eller probit) regression.

der er et par forskellige måder at specificere logit-linkfunktionen på, så den bevarer ordren i den afhængige variabel. Den mest almindeligt tilgængelige i programmet er den kumulative link funktion, som giver dig mulighed for at måle effekten af prædiktorer på oddsene for at flytte ind i nogen næste højest ordnede kategori.

disse modeller er komplekse, har deres egne antagelser og kan tage en vis praksis at fortolke. Men de er også nogle gange præcis, hvad du har brug for.

de er et meget godt værktøj at have i din statistiske værktøjskasse.

Rangtransformationer

en anden modelbaseret tilgang kombinerer fordelene ved ordinær logistisk regression og enkelheden i rangbaseret ikke-parametri.

grundideen er en rangtransformation: Transformer hver ordinær resultatscore til rang af denne score og kør din regression, tovejs ANOVA eller anden model på disse rækker.

den ting at huske er dog, at alle resultater skal fortolkes med hensyn til rækkerne. Ligesom en logtransformation på en afhængig variabel sætter alle midler og koefficienter på en log(DV) skala, sætter rangtransformationen alt på en rangskala. Dine fortolkninger vil handle om gennemsnitlige rækker, ikke midler.

binær, ordinær og Multinomial logistisk Regression for kategoriske resultater
kom ud over frustrationen ved at lære odds-forhold, logit-linkfunktioner og proportionale odds-antagelser på egen hånd. Se den utrolige nytte af logistisk regression og kategorisk dataanalyse i denne en times træning.