Pięć sposobów analizowania zmiennych porządkowych (niektóre lepsze od innych)
nie ma wielu metod statystycznych zaprojektowanych tylko dla zmiennych porządkowych.
ale to nie znaczy, że utknąłeś z kilkoma opcjami. Jest więcej niż myślisz.
niektóre są lepsze od innych, ale to zależy od sytuacji i pytań badawczych.
Oto pięć opcji, gdy zmienna zależna jest porządkowa.
traktuj zmienne porządkowe jako nominalne
zmienne porządkowe są zasadniczo kategoryczne. Jedną z prostych opcji jest ignorowanie kolejności w kategoriach zmiennej i traktowanie jej jako nominalnej. Istnieje wiele opcji analizy zmiennych kategorycznych, które nie mają porządku.
To może mieć wiele sensu dla niektórych zmiennych. Na przykład, gdy istnieje kilka kategorii, a kolejność nie jest kluczowa dla pytania badawczego.
największą zaletą takiego podejścia jest to, że nie naruszysz żadnych założeń.
traktuj zmienne porządkowe jako liczbowe
ponieważ uporządkowanie kategorii często ma kluczowe znaczenie dla pytania badawczego, wielu analityków danych robi odwrotnie: zignoruj fakt, że zmienna porządkowa naprawdę nie jest numeryczna i traktuj cyfry, które wyznaczają każdą kategorię, jako liczby rzeczywiste.
takie podejście wymaga założenia, że odległość między każdym zbiorem kolejnych kategorii jest równa. A to może być bardzo trudne do uzasadnienia.
więc zastanów się długo i intensywnie, czy jesteś w stanie uzasadnić to założenie.
testy nieparametryczne
dobra wiadomość: są inne opcje.
wiele nieparametrycznych statystyk opisowych opiera się na rankingowych wartościach liczbowych. Szeregi same są porządkowe-informują o kolejności, ale nie mają dystansu między wartościami.
podobnie jak inne zmienne porządkowe.
więc chociaż uważamy te testy za przydatne dla danych liczbowych, które nie są normalne lub mają wartości odstające, działają one również dla zmiennych porządkowych, zwłaszcza gdy istnieje więcej niż tylko kilka uporządkowanych kategorii.
wspólne testy nieparametryczne oparte na randze obejmują Kruskal-Wallis, korelację Spearmana, Wilcoxon-Mann-Whitney i Friedmana.
każdy test ma określoną statystykę testową opartą na tych szeregach, w zależności od tego, czy test porównuje grupy, czy mierzy skojarzenie.
ograniczenie tych testów jest jednak dość proste. Jasne, że można porównywać grupy w jeden sposób w stylu ANOVA lub mierzyć korelację, ale nie można wyjść poza to. Nie można na przykład uwzględniać interakcji między dwiema niezależnymi zmiennymi ani zawierać kowariant.
do tego potrzebny jest prawdziwy model.
Logistyka porządkowa& regresja probitowa
nie ma wielu testów, które są ustawiane tylko dla zmiennych porządkowych, ale jest ich kilka. Jednym z najczęściej używanych są modele porządkowe dla regresji logistycznej (lub probitowej).
istnieje kilka różnych sposobów określenia funkcji logit link tak, aby zachowywała kolejność w zmiennej zależnej. Najczęściej dostępną w oprogramowaniu jest funkcja łącza kumulacyjnego, która pozwala mierzyć wpływ predyktorów na szanse przejścia do dowolnej następnej, najwyżej uporządkowanej kategorii.
te modele są złożone, mają swoje własne założenia i mogą wymagać trochę praktyki, aby je zinterpretować. Ale czasami są one dokładnie tym, czego potrzebujesz.
są bardzo dobrym narzędziem, które można mieć w zestawie narzędzi statystycznych.
transformacje Rang
inne podejście oparte na modelach łączy zalety Porządkowej regresji logistycznej i prostotę nieparametrii opartej na Rang.
podstawową ideą jest transformacja rangi: przekształć każdy wynik porządkowy w rangę tego wyniku i uruchom regresję, dwukierunkową ANOVĘ lub inny model na tych rangach.
należy jednak pamiętać, że wszystkie wyniki muszą być interpretowane w kategoriach Rang. Tak jak transformacja logarytmu na zmiennej zależnej umieszcza wszystkie środki i współczynniki na skali log (DV), transformacja rank umieszcza wszystko na skali rank. Twoje interpretacje będą dotyczyć wrednych rang, a nie środków.
Leave a Reply