Articles

Fem sätt att analysera ordinära variabler (vissa bättre än andra)

det finns inte många statistiska metoder utformade bara för ordinära variabler.

men det betyder inte att du sitter fast med få alternativ. Det finns mer än du skulle tro.

vissa är bättre än andra, men det beror på situationen och forskningsfrågorna.

här är fem alternativ när din beroende variabel är ordinal.

behandla ordinära variabler som nominella

ordinära variabler är i grunden kategoriska. Ett enkelt alternativ är att ignorera ordningen i variabelns kategorier och behandla den som nominell. Det finns många alternativ för att analysera kategoriska variabler som inte har någon ordning.

detta kan vara mycket meningsfullt för vissa variabler. Till exempel när det finns få kategorier och ordningen inte är central för forskningsfrågan.

den största fördelen med detta tillvägagångssätt är att du inte bryter mot några antaganden.

behandla ordinära variabler som numeriska

eftersom ordningen av kategorierna ofta är central för forskningsfrågan, gör många dataanalytiker motsatsen: ignorera det faktum att ordningsvariabeln verkligen inte är numerisk och behandla siffrorna som betecknar varje kategori som faktiska siffror.

detta tillvägagångssätt kräver antagandet att avståndet mellan varje uppsättning efterföljande kategorier är lika. Och det kan vara mycket svårt att motivera.

så tänk länge och hårt om du kan motivera detta antagande.

icke-parametriska tester

några goda nyheter: det finns andra alternativ.

många icke-parametriska beskrivande statistik baseras på rangordning av numeriska värden. Rangordningar är själva ordinära – de berättar information om ordern, men inget avstånd mellan värden.

precis som andra ordinära variabler.

Så medan vi tänker på dessa tester som användbara för numeriska data som inte är normala eller har avvikare, fungerar de också för ordinära variabler, särskilt när det finns mer än bara några beställda kategorier.

vanliga rangbaserade icke-parametriska tester inkluderar Kruskal-Wallis, Spearman korrelation, Wilcoxon-Mann-Whitney och Friedman.

varje test har en specifik teststatistik baserad på dessa LED, beroende på om testet jämför grupper eller mäter en förening.

begränsningen av dessa tester är dock ganska grundläggande. Visst kan du jämföra grupper enkelriktad ANOVA stil eller mäta en korrelation, men du kan inte gå utöver det. Du kan till exempel inte inkludera interaktioner mellan två oberoende variabler eller inkludera kovariater.

Du behöver en riktig modell för att göra det.

Ordinal logistic& probit regression

det finns inte många tester som är inställda bara för ordinära variabler, men det finns några. En av de vanligaste är ordinära modeller för logistisk (eller probit) regression.

det finns några olika sätt att specificera logit link-funktionen så att den bevarar ordningen i den beroende variabeln. Den vanligaste tillgängliga i programvara är den kumulativa länkfunktionen, som låter dig mäta effekten av prediktorer på oddsen att flytta in i någon nästa högsta beställda kategori.

dessa modeller är komplexa, har sina egna antaganden och kan ta lite övning att tolka. Men de är också ibland exakt vad du behöver.

de är ett mycket bra verktyg att ha i din statistiska verktygslåda.

Rangtransformationer

en annan modellbaserad metod kombinerar fördelarna med ordinär logistisk regression och enkelheten hos rangbaserade icke-parametriska.

Grundtanken är en rangomvandling: omvandla varje ordinärt resultatpoäng till rankningen av den poängen och kör din regression, tvåvägs ANOVA eller annan modell på dessa LED.

saken att komma ihåg är dock att alla resultat måste tolkas i termer av leden. Precis som en loggtransformation på en beroende variabel sätter alla medel och koefficienter på en loggskala(DV), sätter rangtransformationen allt på en rangskala. Dina tolkningar kommer att handla om medelvärden, inte medel.

binär, Ordinal och Multinomial logistisk Regression för kategoriska resultat
gå bortom frustrationen att lära oddskvoter, logit Link-funktioner och proportionella odds antaganden på egen hand. Se den otroliga användbarheten av logistisk regression och kategorisk dataanalys i denna timmes träning.