Articles

SPSS Kolmogorov-Smirnov Test for normalitet

en alternativ normalitetstest er Shapiro-vilk-testen.

  • hvad er en Kolmogorov-Smirnov normalitetstest?
  • SPSS Kolmogorov-Smirnov test fra NPAR Test
  • SPSS Kolmogorov-Smirnov test fra Undersøg variabler
  • rapportering af en Kolmogorov-Smirnov Test
  • forkerte resultater i SPSS?

SPSS Npar tester en prøve Kolmogorov Smirnov Output

hvad er en Kolmogorov-Smirnov normalitetstest?

Kolmogorov-Smirnov-testen undersøger, om scoringer
sandsynligvis vil følge en vis fordeling i en eller anden befolkning.For at undgå forvirring er der 2 Kolmogorov-Smirnov tests:

  • Der er den ene prøve Kolmogorov-Smirnov test til test, hvis en variabel følger en given fordeling i en population. Denne ” givne fordeling “er normalt-ikke altid – den normale fordeling, derfor”Kolmogorov-Smirnov normalitetstest”.
  • Der er også den (meget mindre almindelige) uafhængige prøver Kolmogorov-Smirnov test til test, hvis en variabel har identiske fordelinger i 2 populationer.

i teorien kunne “Kolmogorov-Smirnov-test” henvise til begge test (men henviser normalt til Kolmogorov-Smirnov-testen med en prøve) og havde bedre undgås. Forresten er begge Kolmogorov-Smirnov-tests til stede i SPSS.

Kolmogorov-Smirnov Test – simpelt eksempel

så siger jeg har en befolkning på 1.000.000 mennesker. Jeg tror, at deres reaktionstider på en eller anden opgave er perfekt normalt fordelt. Jeg prøver 233 af disse mennesker og måler deres reaktionstider.
nu vil den observerede frekvensfordeling af disse sandsynligvis afvige lidt-men ikke for meget – fra en normalfordeling. Så jeg kører et histogram over observerede reaktionstider og overlejrer en normalfordeling med samme middel-og standardafvigelse. Resultatet er vist nedenfor.

Kolmogorov Smirnov en prøvetest Hvad er det Histogram

frekvensfordelingen af mine scoringer overlapper ikke helt med min normale kurve. Nu kunne jeg beregne procentdelen af sager, der afviger fra den normale kurve-procentdelen af røde områder i diagrammet. Denne procentdel er en teststatistik: den udtrykker i et enkelt tal, hvor meget mine data adskiller sig fra min nulhypotese. Så det angiver, i hvilket omfang de observerede scoringer afviger fra en normal fordeling.
nu, hvis min nulhypotese er sand, så skal denne afvigelsesprocent nok være ret lille. Det vil sige, en lille afvigelse har en høj sandsynlighedsværdi eller p-værdi.
omvendt er en enorm afvigelsesprocent meget usandsynlig og antyder, at mine reaktionstider ikke følger en normal fordeling i hele befolkningen. Så en stor afvigelse har en lav p-værdi. Som tommelfingerregel blev nulhypotesen udsat, hvis p < 0.05.So hvis p < 0.05, tror vi ikke, at vores variabel følger en normal fordeling i vores befolkning.

Kolmogorov-Smirnov Test – teststatistik

så det er den nemmeste måde at forstå, hvordan Kolmogorov-Smirnov-normalitetstesten fungerer. Beregningsmæssigt fungerer det imidlertid forskelligt: det sammenligner det observerede versus de forventede kumulative relative frekvenser som vist nedenfor.

Kolmogorov-Smirnov Testlinjediagram over observerede og forventede Relative frekvenser

Kolmogorov – Smirnov-testen bruger den maksimale absolutte forskel mellem disse kurver som dens teststatistik betegnet med D. i dette diagram er den maksimale absolutte forskel D (0,48 – 0,41 =) 0,07, og den forekommer ved en reaktionstid på 960 millisekunder. Husk, at D = 0,07, da vi støder på det i vores SPSS-output om et minut.

Kolmogorov-Smirnov-testen i SPSS

der er 2 måder at køre testen i SPSS:

  • NPAR TESTS som fundet under analyse SPSS Menu pil Nonparametric TestsSPSS Menu pil 1-Prøve K-S… er vores metode til valg, fordi det skaber pænt detaljeret output.
  • Undersøg variabler fra analyser SPSS Menu pil Beskrivende statistik SPSS Menu pil Udforsk er et alternativ. Denne kommando kører både Kolmogorov-Smirnov-testen og Shapiro-vilk-normalitetstesten.
    bemærk, at Undersøg variabler bruger listevis udelukkelse af manglende værdier som standard. Så hvis jeg tester 5 variabler, bruger mine 5 tests kun sager, der ikke har nogen missings på nogen af disse 5 variabler. Dette er normalt ikke, hvad du vil, men vi viser, hvordan du undgår dette.

vi demonstrerer begge metoder ved hjælp af speedtasks.sav hele, hvoraf en del er vist nedenfor.

SPSS Kolmogorov Smirnov Test En Prøvevariabel visning

vores vigtigste forskningsspørgsmål erhvilken af reaktionstidsvariablerne er sandsynligvis
at blive normalt fordelt i vores befolkning?Disse data er et lærebogseksempel på, hvorfor du skal inspicere dine data grundigt, før du begynder at redigere eller analysere dem. Lad os gøre netop det og køre nogle histogrammer fra syntaksen nedenfor.

*Kør grundlæggende histogrammer til inspektion, hvis distributioner ser plausible ud.
frekvenser r01 til r05
/ format bemærkelsesværdigt
/histogram normal.
* Bemærk, at nogle distributioner ikke ser plausible overhovedet!

resultat

SPSS en prøve Kolmogorov Smirnov Testhistogram

Bemærk, at nogle distributioner slet ikke ser plausible ud. Men hvilke vil sandsynligvis blive distribueret normalt?

SPSS Kolmogorov-Smirnov test fra NPAR test

vores foretrukne mulighed for at køre Kolmogorov-Smirnov test er underanalyse SPSS Menu pil Legacy dialoger SPSS menu pil 1-prøve K-S… som vist nedenfor.

SPSS Kolmogorov Smirnov Test Nonparametric Legacy dialoger Menu

næste, vi bare udfylde dialogen som vist nedenfor.

SPSS Kolmogorov Smirnov Test ikke-parametrisk Dialog

Klik på Indsæt resultater i syntaksen nedenfor. Lad os køre det.

Kolmogorov-Smirnov Test syntaks fra Nonparametric Tests

*en-prøve Kolmogorov-Smirnov test fra analysere – nonparametric tests – legacy dialoger – 1 prøve ks-test.
NPAR test
/ K-S (NORMAL)=r01 r02 r03 r04 r05
/Manglende analyse.
* kun reaktionstid 4 har p > 0.05 og synes således normalt fordelt i befolkningen.

resultater

SPSS Npar tester en prøve Kolmogorov Smirnov Output

først skal du bemærke, at teststatistikken for vores første variabel er 0.073-ligesom vi så i vores kumulative relative frekvensdiagram lidt tidligere. Diagrammet indeholder nøjagtigt de samme data, som vi lige har kørt vores test på, så disse resultater konvergerer pænt.
vedrørende vores forskningsspørgsmål: kun reaktionstiderne for forsøg 4 synes at være normalt fordelt.

SPSS Kolmogorov-Smirnov test fra Undersøg variabler

en alternativ måde at køre Kolmogorov-Smirnov test starter fra analysereSPSS Menu pil Beskrivende statistikSPSS Menu pil Udnyttelsesområder vist nedenfor.

SPSS Kolmogorov Smirnov Test analyser Udforsk MenuSPSS Kolmogorov Smirnov Test Udforsk Dialog

Kolmogorov-Smirnov Test syntaks fra ikke-parametriske Tests

*en-prøve Kolmogorov – Smirnov test fra analyser – beskrivende statistik-Udforsk.
EXAMINE VARIABLES=r01 r02 r03 r04 r05
/PLOT BOXPLOT NPPLOT
/COMPARE GROUPS
/STATISTICS NONE
/CINTERVAL 95
/MISSING PAIRWISE /*IMPORTANT!*/
/NOTOTAL.
*Shorter version.
EXAMINE VARIABLES r01 r02 r03 r04 r05
/PLOT NPPLOT
/missing pairwise /*IMPORTANT!*/.

Results

SPSS Kolmogorov Smirnov Test Analyze Explore Output

As a rule of thumb, we conclude thata variable is not normally distributed if “Sig.” < 0.05.Så både Kolmogorov-Smirnov-testen såvel som Shapiro-vilk-testresultaterne antyder, at kun Reaktionstidsforsøg 4 følger en normal fordeling i hele befolkningen.
Bemærk endvidere, at Kolmogorov-Smirnov-testresultaterne er identiske med dem, der opnås fra NPAR-test.

rapportering af en Kolmogorov-Smirnov-Test

for at rapportere vores testresultater efter APA-retningslinjer skriver vi noget som”en Kolmogorov-Smirnov-test indikerer, at reaktionstiderne i forsøg 1 ikke følger en normal fordeling, D(233) = 0,07, p = 0,005.”For yderligere variabler, prøv at forkorte dette, men sørg for at inkludere

  • D (for “forskel”), Kolmogorov-Smirnov teststatistik,
  • df, frihedsgraderne (som er lig med N) og
  • p, den statistiske signifikans.

Kolmogorov-Smirnov Testrapportering i APA-stil

forkerte resultater i SPSS?

Hvis du er studerende, der bare vil bestå en prøve, kan du stoppe med at læse nu. Bare Følg de trin, vi diskuterede indtil videre, så bliver du god.

højre, lad os nu køre de nøjagtige samme tests igen i SPSS version 18 og se på output.

SPSS en prøve Kolmogorov Smirnov Testoutput V18 nøjagtige Tests

i denne output er de nøjagtige p-værdier inkluderet og-heldigvis – de er meget tæt på de asymptotiske p-værdier. Mindre heldigvis er SPSS version 18 resultaterne vildt forskellige
fra SPSS version 24 resultatervi rapporterede hidtil.
årsagen synes at være Lilliefors betydning korrektion, som anvendes i nyere SPSS versioner. Resultatet ser ud til at være, at de asymptotiske signifikansniveauer adskiller sig meget mere fra den nøjagtige betydning, end de gjorde, når korrektionen ikke er underforstået. Dette rejser alvorlig tvivl om rigtigheden af” Lilliefors-resultaterne ” – standard i nyere SPSS-versioner.
konvergerende beviser for dette forslag blev samlet af min kollega Alvin Stegeman, der omlægger alle tests i Matlab. Matlab-resultaterne stemmer overens med SPSS 18-resultaterne og – dermed-ikke med de nyere resultater.

en-prøve Kolmogorov-Smirnov Test - Matlab Output

Kolmogorov-Smirnov normalitetstest – begrænset anvendelighed

Kolmogorov-Smirnov-testen er ofte at teste den normalitetsantagelse, der kræves af mange statistiske tests som ANOVA, t-testen og mange andre. Det er imidlertid næsten rutinemæssigt overset, at sådanne tests er robuste mod en overtrædelse af denne antagelse, hvis stikprøvestørrelser er rimelige, siger n LR 25.Den underliggende årsag til dette er den centrale grænse sætning. Derfor er normalitetstest kun nødvendig for små prøvestørrelserhvis målet er at tilfredsstille normalitetsantagelsen.
desværre resulterer små stikprøvestørrelser i lav statistisk effekt til normalitetstest. Dette betyder, at væsentlige afvigelser fra normalitet ikke vil resultere i statistisk signifikans. Testen siger, at der ikke er nogen afvigelse fra normalitet, mens den faktisk er enorm. Kort sagt er situationen, hvor normalitetstest er nødvendig-små stikprøvestørrelser – også den situation, hvor de klarer sig dårligt.

tak for læsning.