Fem Måter Å Analysere Ordinære Variabler (Noen Bedre enn Andre)
det er ikke mange statistiske metoder designet bare for ordinære variabler.
Men det betyr ikke at du sitter fast med få alternativer. Det er mer enn du tror.
Noen er bedre enn andre, men det avhenger av situasjonen og forskningsspørsmålene.
her er fem alternativer når den avhengige variabelen er ordinær.
Behandle ordinære variabler som nominelle
Ordinære variabler er fundamentalt kategoriske. Et enkelt alternativ er å ignorere rekkefølgen i variabelens kategorier og behandle den som nominell. Det er mange alternativer for å analysere kategoriske variabler som ikke har noen ordre.
Dette kan gi mye mening for noen variabler. For eksempel, når det er få kategorier og rekkefølgen ikke er sentral i forskningsspørsmålet.
den største fordelen med denne tilnærmingen er at du ikke vil bryte noen forutsetninger.
Behandle ordinære variabler som numeriske
fordi rekkefølgen av kategoriene ofte er sentral i forskningsspørsmålet, gjør mange dataanalytikere det motsatte: ignorer det faktum at ordinærvariabelen egentlig ikke er numerisk og behandle tallene som angir hver kategori som faktiske tall.
denne tilnærmingen krever antagelsen om at avstanden mellom hvert sett av etterfølgende kategorier er lik. Og det kan være svært vanskelig å rettferdiggjøre.
så tenk lenge og hardt om du er i stand til å rettferdiggjøre denne antagelsen.
Ikke-parametriske tester
noen gode nyheter: det finnes andre alternativer.
Mange ikke-parametriske beskrivende statistikker er basert på numeriske verdier. Ranger er selv ordinære-de forteller deg informasjon om ordren–men ingen avstand mellom verdier.
Akkurat som andre ordinære variabler.Så mens vi tenker på disse testene som nyttige for numeriske data som ikke er normale eller har avvik, jobber de også for ordinære variabler, spesielt når det er mer enn bare noen få bestilte kategorier.Vanlige rangbaserte ikke-parametriske tester inkluderer Kruskal-Wallis, Spearman korrelasjon, Wilcoxon-Mann-Whitney og Friedman.
hver test har en spesifikk teststatistikk basert på disse rekkene, avhengig av om testen sammenligner grupper eller måler en forening.
begrensningen av disse testene er imidlertid ganske grunnleggende. Sikker på at du kan sammenligne grupper enveis ANOVA-stil eller måle en korrelasjon, men du kan ikke gå utover det. Du kan for eksempel ikke inkludere interaksjoner mellom to uavhengige variabler eller inkludere kovariater.
du trenger en ekte modell for å gjøre det.
Ordinær logistisk & probit regresjon
det er ikke mange tester som er satt opp bare for ordinære variabler, men det er noen få. En av de mest brukte er ordinære modeller for logistisk (eller probit) regresjon.
det er noen forskjellige måter å spesifisere logit link-funksjonen på, slik at den beholder bestillingen i den avhengige variabelen. Den mest tilgjengelige i programvaren er den kumulative koblingsfunksjonen, som lar deg måle effekten av prediktorer på oddsen for å flytte inn i en neste høyest bestilte kategori.
disse modellene er komplekse, har sine egne forutsetninger, og kan ta litt øvelse å tolke. Men de er også noen ganger akkurat det du trenger.
De Er et veldig godt verktøy å ha i din statistiske verktøykasse.
Ranktransformasjoner
en annen modellbasert tilnærming kombinerer fordelene med ordinær logistisk regresjon og enkelheten til rankbaserte ikke-parametriske.
den grunnleggende ideen er en rangtransformasjon: forvandle hver ordinær utfallspoeng til rangeringen av den poengsummen og kjør regresjon, toveis ANOVA eller annen modell på disse rangeringene.
tingen å huske skjønt, er at alle resultater må tolkes i form av rekkene. Akkurat som en loggtransformasjon på en avhengig variabel setter alle midler og koeffisienter på en logg(DV) skala, setter rangtransformasjonen alt på en rangskala. Dine tolkninger kommer til å være om mean rekkene, ikke betyr.
Leave a Reply