Articles

Cinco maneiras de analisar variáveis ordinais (algumas melhores que outras)

não existem muitos métodos estatísticos projetados apenas para variáveis ordinais.

mas isso não significa que você está preso com poucas opções. Há mais do que pensas.alguns são melhores do que outros, mas depende da situação e das questões de investigação.

Aqui estão cinco opções quando sua variável dependente é ordinal.

Treat ordinal variables as nominal

Ordinal variables are fundamentally categorical. Uma opção simples é ignorar a ordem nas categorias da variável e tratá-la como nominal. Há muitas opções para analisar variáveis categóricas que não têm ordem.

isto pode fazer muito sentido para algumas variáveis. Por exemplo, quando há poucas categorias e a ordem não é central para a questão da pesquisa.

A maior vantagem desta abordagem é que você não vai violar quaisquer pressupostos.

tratar variáveis ordinais como numéricas

porque a ordenação das categorias muitas vezes é central para a questão da Pesquisa, muitos analistas de dados fazem o oposto: ignore o fato de que a variável ordinal realmente não é numérica e trate os numerais que designam cada categoria como números reais.

esta abordagem requer a suposição de que a distância entre cada conjunto de categorias subsequentes é igual. E isso pode ser muito difícil de justificar.

Por isso, pense bem sobre se é capaz de justificar esta suposição.

testes não paramétricos

algumas boas notícias: existem outras opções.

muitas estatísticas descritivas não paramétricas são baseadas na classificação de valores numéricos. As fileiras são elas mesmas ordinais-elas contam informações sobre a ordem, mas nenhuma distância entre valores.

assim como outras variáveis ordinais.

assim, enquanto pensamos nestes testes como úteis para dados numéricos que não são normais ou têm valores anómalos, eles trabalham também para variáveis ordinais, especialmente quando há mais do que apenas algumas categorias ordenadas.

testes não paramétricos comuns baseados em rank incluem Kruskal-Wallis, Spearman correlation, Wilcoxon-Mann-Whitney e Friedman.

cada ensaio tem uma estatística de ensaio específica baseada nessas fileiras, dependendo se o ensaio está a comparar grupos ou a medir uma associação.

a limitação destes testes, no entanto, é que eles são bastante básicos. Claro que você pode comparar grupos unidirecionais estilo ANOVA ou medir uma correlação, mas você não pode ir além disso. Você não pode, por exemplo, incluir interações entre duas variáveis independentes ou incluir covariados.

Você precisa de um modelo real para fazer isso.

logística Ordinal & probit regressão

não Existem muitos testes que são criados apenas para variáveis ordinais, mas existem alguns. Um dos modelos ordinais mais usados é a regressão logística (ou probit).

Existem algumas maneiras diferentes de especificar a função de ligação logit para que ela preserve a ordenação na variável dependente. O mais comumente disponível no software é a função de link cumulativo, que lhe permite medir o efeito dos predictores sobre as chances de se mover para qualquer categoria de ordem mais alta.

estes modelos são complexos, têm as suas próprias suposições, e podem levar alguma prática para interpretar. Mas também são, às vezes, exatamente o que você precisa.

eles são uma ferramenta muito boa para ter em sua caixa de ferramentas estatísticas.

transformações de classificação

outra abordagem baseada em modelos combina as vantagens da regressão logística ordinal e a simplicidade das não-parametricas baseadas em classificações.

A ideia básica é uma transformação de classificação: transformar cada pontuação de resultado ordinal no rank dessa pontuação e executar a sua regressão, ANOVA de duas vias, ou outro modelo nessas fileiras.

a coisa a lembrar no entanto, é que todos os resultados precisam ser interpretados em termos das fileiras. Assim como uma transformação de log em uma variável dependente coloca todos os meios e coeficientes em uma escala de log(DV), A transformação de rank coloca tudo em uma escala de rank. As suas interpretações vão ser sobre as fileiras más, não sobre os meios.

Binário, Ordinal, e a Regressão Logística Multinomial para Categórica Resultados
Obter além da frustração de aprendizagem odds ratio, logit funções de ligação, e proporcional desacordo suposições sobre o seu próprio. Veja a incrível utilidade da regressão logística e análise categórica de dados neste treinamento de uma hora.