Articles

Vijf manieren om ordinale variabelen te analyseren (sommige beter dan andere)

er zijn niet veel statistische methoden die alleen voor ordinale variabelen zijn ontworpen.

maar dat betekent niet dat je vast zit met een paar opties. Er zijn er meer dan je zou denken.

sommige zijn beter dan andere, maar het hangt af van de situatie en onderzoeksvragen.

Hier zijn vijf opties wanneer uw afhankelijke variabele ordinaal is.

behandel ordinale variabelen als nominale

ordinale variabelen zijn fundamenteel categorisch. Een eenvoudige optie is om de volgorde in de categorieën van de variabele te negeren en te behandelen als nominaal. Er zijn veel opties voor het analyseren van categorische variabelen die geen volgorde hebben.

Dit kan veel zin hebben voor sommige variabelen. Bijvoorbeeld wanneer er weinig categorieën zijn en de volgorde niet centraal staat in de onderzoeksvraag.

het grootste voordeel van deze aanpak is dat u geen aannames overtreedt.

behandel ordinale variabelen als numeriek

omdat de volgorde van de categorieën vaak centraal staat in de onderzoeksvraag, doen veel data-analisten het tegenovergestelde: negeer het feit dat de ordinale variabele echt niet numeriek is en behandel de cijfers die elke categorie als werkelijke getallen aanduiden.

bij deze benadering moet worden aangenomen dat de afstand tussen elke reeks volgende categorieën gelijk is. En dat kan heel moeilijk te rechtvaardigen zijn.

denk dus lang en hard na over de vraag of je in staat bent om deze aanname te rechtvaardigen.

niet-parametrische tests

goed nieuws: er zijn andere opties.

veel niet-parametrische beschrijvende statistieken zijn gebaseerd op het rangschikken van numerieke waarden. Rangen zijn zelf ordinaal-ze vertellen je informatie over de orde, maar geen afstand tussen waarden.

net als andere ordinale variabelen.

dus hoewel we denken dat deze tests nuttig zijn voor numerieke gegevens die niet-normaal zijn of uitschieters hebben, werken ze ook voor ordinale variabelen, vooral als er meer dan een paar geordende categorieën zijn.

gemeenschappelijke ranggebaseerde niet-parametrische tests omvatten Kruskal-Wallis, Spearman correlatie, Wilcoxon-Mann-Whitney en Friedman.

elke test heeft een specifieke teststatistiek op basis van deze rangen, afhankelijk van of de test groepen vergelijkt of een associatie meet.

de beperking van deze tests is echter dat ze vrij basic zijn. Natuurlijk kunt u groepen vergelijken one-way ANOVA stijl of het meten van een correlatie, maar je kunt niet verder gaan dan dat. Je kunt bijvoorbeeld geen interacties tussen twee onafhankelijke variabelen opnemen of covariaten opnemen.

daarvoor heb je een echt model nodig.

Ordinal logistic & probit regressie

Er zijn niet veel tests die alleen voor ordinale variabelen worden opgezet, maar er zijn er een paar. Een van de meest gebruikte is ordinale modellen voor logistische (of probit) regressie.

Er zijn een paar verschillende manieren om de logit link functie op te geven zodat deze de volgorde in de afhankelijke variabele behoudt. De meest beschikbare software is de cumulatieve link-functie, waarmee u het effect van voorspellers kunt meten op de kans om naar een op één na hoogste geordende categorie te gaan.

deze modellen zijn complex, hebben hun eigen aannames en kunnen enige praktijk vergen om te interpreteren. Maar ze zijn soms ook precies wat je nodig hebt.

ze zijn een zeer goed hulpmiddel om in uw statistische toolbox te hebben.

Rangtransformaties

een andere modelgebaseerde benadering combineert de voordelen van ordinale logistische regressie en de eenvoud van ranggebaseerde niet-parametrics.

het basisidee is een rangtransformatie: transformeer elke ordinale uitkomstscore in de rang van die score en voer je regressie, tweerichtingsanova of ander model uit op die rangen.

het ding om te onthouden is dat alle resultaten moeten worden geïnterpreteerd in termen van de rangen. Net zoals een log transformatie op een afhankelijke variabele alle middelen en coëfficiënten op een log(DV) schaal zet, zet de rank transformatie alles op een rank schaal. Je interpretaties gaan over gemene rangen, niet over middelen.

Binary, Ordinale, en Multinomiale Logistische Regressie voor Categoriale Uitkomsten
verder dan de frustratie van het leren van odds ratio ‘ s, logit link-functies en evenredige kansen veronderstellingen op uw eigen. Zie het ongelooflijke Nut van logistieke regressie en categorische data-analyse in deze training van één uur.