Cinq Façons d’analyser les variables Ordinales (Certaines mieux que d’autres)
Il n’y a pas beaucoup de méthodes statistiques conçues uniquement pour les variables ordinales.
Mais cela ne signifie pas que vous êtes coincé avec peu d’options. Il y en a plus que vous ne le pensez.
Certains sont meilleurs que d’autres, mais cela dépend de la situation et des questions de recherche.
Voici cinq options lorsque votre variable dépendante est ordinale.
Traiter les variables ordinales comme nominales
Les variables ordinales sont fondamentalement catégorielles. Une option simple consiste à ignorer l’ordre dans les catégories de la variable et à le traiter comme nominal. Il existe de nombreuses options pour analyser les variables de catégorie qui n’ont pas d’ordre.
Cela peut avoir beaucoup de sens pour certaines variables. Par exemple, lorsqu’il y a peu de catégories et que l’ordre n’est pas au centre de la question de recherche.
Le plus grand avantage de cette approche est que vous ne violerez aucune hypothèse.
Traiter les variables ordinales comme numériques
Parce que l’ordre des catégories est souvent au cœur de la question de recherche, de nombreux analystes de données font le contraire: ignorez le fait que la variable ordinale n’est vraiment pas numérique et traitez les chiffres qui désignent chaque catégorie comme des nombres réels.
Cette approche nécessite l’hypothèse que la distance entre chaque ensemble de catégories suivantes est égale. Et cela peut être très difficile à justifier.
Réfléchissez donc longuement à la question de savoir si vous êtes en mesure de justifier cette hypothèse.
Tests non paramétriques
Quelques bonnes nouvelles : il existe d’autres options.
De nombreuses statistiques descriptives non paramétriques sont basées sur des valeurs numériques de classement. Les rangs sont eux-mêmes ordinaux – ils vous donnent des informations sur l’ordre, mais pas de distance entre les valeurs.
Tout comme les autres variables ordinales.
Ainsi, alors que nous pensons que ces tests sont utiles pour des données numériques qui ne sont pas normales ou qui ont des valeurs aberrantes, ils fonctionnent également pour les variables ordinales, en particulier lorsqu’il y a plus que quelques catégories ordonnées.
Les tests non paramétriques basés sur le rang les plus courants incluent Kruskal-Wallis, la corrélation de Spearman, Wilcoxon-Mann-Whitney et Friedman.
Chaque test a une statistique de test spécifique basée sur ces rangs, selon que le test compare des groupes ou mesure une association.
La limitation de ces tests, cependant, est qu’ils sont assez basiques. Bien sûr, vous pouvez comparer des groupes de style ANOVA à sens unique ou mesurer une corrélation, mais vous ne pouvez pas aller au-delà. Vous ne pouvez pas, par exemple, inclure des interactions entre deux variables indépendantes ou inclure des covariables.
Vous avez besoin d’un vrai modèle pour le faire.
Logistique ordinale &régression probit
Il n’y a pas beaucoup de tests qui sont configurés uniquement pour les variables ordinales, mais il y en a quelques-uns. L’un des modèles ordinaux les plus couramment utilisés pour la régression logistique (ou probit).
Il existe différentes façons de spécifier la fonction de lien logit afin qu’elle préserve l’ordre dans la variable dépendante. Le logiciel le plus couramment disponible est la fonction de lien cumulatif, qui vous permet de mesurer l’effet des prédicteurs sur les chances de passer à n’importe quelle catégorie d’ordre supérieur.
Ces modèles sont complexes, ont leurs propres hypothèses et peuvent nécessiter une certaine pratique à interpréter. Mais ils sont aussi parfois exactement ce dont vous avez besoin.
Ils sont un très bon outil à avoir dans votre boîte à outils statistique.
Transformations de rang
Une autre approche basée sur un modèle combine les avantages de la régression logistique ordinale et la simplicité des non-paramètres basés sur les rangs.
L’idée de base est une transformation de rang: transformez chaque score de résultat ordinal en rang de ce score et exécutez votre régression, votre ANOVA bidirectionnelle ou un autre modèle sur ces rangs.
La chose à retenir cependant, c’est que tous les résultats doivent être interprétés en termes de rangs. Tout comme une transformation de log sur une variable dépendante place toutes les moyennes et tous les coefficients sur une échelle de log (DV), la transformation de rang place tout sur une échelle de rang. Vos interprétations porteront sur les rangs moyens, pas sur les moyens.
Leave a Reply