Articles

Fünf Möglichkeiten, Ordinalvariablen zu analysieren (einige besser als andere)

Es gibt nicht viele statistische Methoden, die nur für Ordinalvariablen entwickelt wurden.

Aber das bedeutet nicht, dass Sie mit wenigen Optionen stecken. Es gibt mehr, als man denkt.

Einige sind besser als andere, aber es hängt von der Situation und den Forschungsfragen ab.

Hier sind fünf Optionen, wenn Ihre abhängige Variable ordinal ist.

Ordinalvariablen als nominal behandeln

Ordinalvariablen sind grundsätzlich kategorisch. Eine einfache Möglichkeit besteht darin, die Reihenfolge in den Kategorien der Variablen zu ignorieren und als nominal zu behandeln. Es gibt viele Optionen zum Analysieren kategorialer Variablen, die keine Reihenfolge haben.

Dies kann für einige Variablen sehr sinnvoll sein. Zum Beispiel, wenn es nur wenige Kategorien gibt und die Reihenfolge für die Forschungsfrage nicht von zentraler Bedeutung ist.

Der größte Vorteil dieses Ansatzes ist, dass Sie keine Annahmen verletzen.

Ordinalvariablen als numerisch behandeln

Da die Reihenfolge der Kategorien oft zentral für die Forschungsfrage ist, machen viele Datenanalysten das Gegenteil: ignorieren Sie die Tatsache, dass die Ordinalvariable wirklich nicht numerisch ist, und behandeln Sie die Ziffern, die jede Kategorie bezeichnen, als tatsächliche Zahlen.

Dieser Ansatz erfordert die Annahme, dass der Abstand zwischen jedem Satz nachfolgender Kategorien gleich ist. Und das kann sehr schwer zu rechtfertigen sein.

Überlegen Sie also lange und gründlich, ob Sie diese Annahme rechtfertigen können.

Nichtparametrische Tests

Eine gute Nachricht: Es gibt andere Optionen.

Viele nichtparametrische deskriptive Statistiken basieren auf numerischen Werten. Ränge sind selbst ordinal – sie geben Ihnen Informationen über die Reihenfolge, aber keinen Abstand zwischen den Werten.

Genau wie andere Ordinalvariablen.

Wir halten diese Tests also für nützlich für numerische Daten, die nicht normal sind oder Ausreißer aufweisen, sie funktionieren jedoch auch für Ordinalvariablen, insbesondere wenn es mehr als nur wenige geordnete Kategorien gibt.Zu den üblichen rangbasierten nichtparametrischen Tests gehören Kruskal-Wallis, Spearman-Korrelation, Wilcoxon-Mann-Whitney und Friedman.

Jeder Test hat eine spezifische Teststatistik, die auf diesen Rängen basiert, je nachdem, ob der Test Gruppen vergleicht oder eine Assoziation misst.

Die Einschränkung dieser Tests ist jedoch, dass sie ziemlich einfach sind. Sicher können Sie einen Einweg-ANOVA-Stil vergleichen oder eine Korrelation messen, aber Sie können nicht darüber hinausgehen. Sie können beispielsweise keine Interaktionen zwischen zwei unabhängigen Variablen oder Kovariaten einschließen.

Dazu benötigen Sie ein reales Modell.

Ordinale Regression & Probit-Regression

Es gibt nicht viele Tests, die nur für ordinale Variablen eingerichtet sind, aber es gibt einige. Eines der am häufigsten verwendeten sind Ordinalmodelle für die logistische (oder Probit-) Regression.

Es gibt verschiedene Möglichkeiten, die Logit-Verknüpfungsfunktion anzugeben, damit die Reihenfolge in der abhängigen Variablen erhalten bleibt. Am häufigsten in Software verfügbar ist die kumulative Link-Funktion, mit der Sie die Auswirkung von Prädiktoren auf die Wahrscheinlichkeit messen können, in eine Kategorie mit der nächsthöheren Ordnung zu gelangen.

Diese Modelle sind komplex, haben ihre eigenen Annahmen und können etwas Übung in der Interpretation erfordern. Aber sie sind manchmal auch genau das, was Sie brauchen.

Sie sind ein sehr gutes Werkzeug in Ihrer statistischen Toolbox.

Rangtransformationen

Ein weiterer modellbasierter Ansatz kombiniert die Vorteile der ordinalen logistischen Regression und die Einfachheit der rangbasierten Nichtparametrie.Die Grundidee ist eine Rangtransformation: Transformieren Sie jeden ordinalen Ergebniswert in den Rang dieses Ergebnisses und führen Sie Ihre Regression, Zwei-Wege-ANOVA oder ein anderes Modell für diese Ränge aus.

Das Wichtigste ist jedoch, dass alle Ergebnisse in Bezug auf die Ränge interpretiert werden müssen. So wie eine Log-Transformation für eine abhängige Variable alle Mittelwerte und Koeffizienten auf eine Log-Skala (DV) setzt, setzt die Rangtransformation alles auf eine Rangskala. Bei Ihren Interpretationen geht es um mittlere Ränge, nicht um Mittel.

Binäre, ordinale und multinomiale logistische Regression für kategoriale Ergebnisse
Überwinden Sie die Frustration, Quotenverhältnisse, Logit-Link-Funktionen und proportionale Quotenannahmen selbst zu lernen. Erleben Sie die unglaubliche Nützlichkeit der logistischen Regression und der kategorialen Datenanalyse in diesem einstündigen Training.