Articles

Cinque modi per analizzare le variabili ordinali (alcune meglio di altre)

Non ci sono molti metodi statistici progettati solo per le variabili ordinali.

Ma questo non significa che sei bloccato con poche opzioni. Ce ne sono piu ‘ di quanto pensiate.

Alcuni sono migliori di altri, ma dipende dalla situazione e dalle domande di ricerca.

Ecco cinque opzioni quando la variabile dipendente è ordinale.

Trattare le variabili ordinali come nominali

Le variabili ordinali sono fondamentalmente categoriche. Una semplice opzione è ignorare l’ordine nelle categorie della variabile e trattarlo come nominale. Ci sono molte opzioni per analizzare le variabili categoriali che non hanno ordine.

Questo può avere molto senso per alcune variabili. Ad esempio, quando ci sono poche categorie e l’ordine non è centrale per la domanda di ricerca.

Il più grande vantaggio di questo approccio è che non violerai alcuna ipotesi.

Tratta le variabili ordinali come numeriche

Poiché l’ordinamento delle categorie è spesso centrale nella domanda di ricerca, molti analisti di dati fanno il contrario: ignora il fatto che la variabile ordinale in realtà non è numerica e tratta i numeri che designano ogni categoria come numeri reali.

Questo approccio richiede l’ipotesi che la distanza tra ogni insieme di categorie successive sia uguale. E questo può essere molto difficile da giustificare.

Quindi pensa a lungo e duramente se sei in grado di giustificare questa ipotesi.

Test non parametrici

Alcune buone notizie: ci sono altre opzioni.

Molte statistiche descrittive non parametriche si basano su valori numerici di classificazione. I ranghi sono essi stessi ordinali-ti dicono informazioni sull’ordine, ma nessuna distanza tra i valori.

Proprio come altre variabili ordinali.

Quindi, mentre pensiamo a questi test come utili per dati numerici che non sono normali o hanno valori anomali, funzionano anche per variabili ordinali, specialmente quando ci sono più di poche categorie ordinate.

I comuni test non parametrici basati sul rango includono Kruskal-Wallis, Spearman correlation, Wilcoxon-Mann-Whitney e Friedman.

Ogni test ha una statistica di test specifica basata su tali ranghi, a seconda che il test stia confrontando gruppi o misurando un’associazione.

La limitazione di questi test, tuttavia, è che sono piuttosto basilari. Certo, puoi confrontare i gruppi in stile ANOVA unidirezionale o misurare una correlazione, ma non puoi andare oltre. Non è possibile, ad esempio, includere interazioni tra due variabili indipendenti o includere covariate.

Hai bisogno di un modello reale per farlo.

Logistica ordinale& regressione probit

Non ci sono molti test impostati solo per variabili ordinali, ma ce ne sono alcuni. Uno dei più comunemente usati sono i modelli ordinali per la regressione logistica (o probit).

Esistono diversi modi per specificare la funzione di collegamento logit in modo che conservi l’ordine nella variabile dipendente. Il più comunemente disponibile nel software è la funzione di collegamento cumulativo, che consente di misurare l’effetto dei predittori sulle probabilità di spostarsi in qualsiasi categoria successiva più ordinata.

Questi modelli sono complessi, hanno le loro ipotesi e possono richiedere un po ‘ di pratica per interpretare. Ma a volte sono anche esattamente ciò di cui hai bisogno.

Sono un ottimo strumento da avere nella tua casella degli strumenti statistici.

Trasformazioni di rango

Un altro approccio basato su modelli combina i vantaggi della regressione logistica ordinale e la semplicità dei non parametri basati su rango.

L’idea di base è una trasformazione di rango: trasforma ogni punteggio ordinale nel rango di quel punteggio ed esegui la tua regressione, ANOVA bidirezionale o altro modello su quei ranghi.

La cosa da ricordare, però, è che tutti i risultati devono essere interpretati in termini di ranghi. Proprio come una trasformazione di registro su una variabile dipendente mette tutti i mezzi e i coefficienti su una scala di registro(DV), la trasformazione di rango mette tutto su una scala di rango. Le tue interpretazioni riguarderanno i ranghi medi, non i mezzi.

Binario, Ordinale, e di Regressione Logistica Multinomiale per i Risultati Categorici
a superare la frustrazione di apprendimento odds ratio, logit link funzioni, e proporzionali quote delle ipotesi sul proprio. Scopri l’incredibile utilità della regressione logistica e dell’analisi dei dati categoriali in questo allenamento di un’ora.