Homoscedasticity / homogenitása variancia/ feltételezése egyenlő variancia
regressziós analízis > Homoscedasticity / homogenitása variancia / feltételezése egyenlő variancia
kép: sreebot| Wikimedia Commons
egyszerűen fogalmazva, homoscedasticity azt jelenti, hogy “ugyanaz a szórás.”Ahhoz, hogy egy adatkészletben létezzen, a pontoknak ugyanolyan távolságra kell lenniük a vonaltól, mint a fenti képen látható. Az ellenkezője a heteroszkedaszticitás (“különböző szórás”), ahol a pontok széles körben eltérő távolságra vannak a regressziós vonaltól.
az x-tengelyen magasabb pontok nagyobb szórással rendelkeznek, mint a kisebb értékek.
vegye figyelembe, hogy itt “távolságot” mondtam, nem pedig varianciát. Grafikon megtekintésekor könnyebb megnézni a pontoktól a vonalig terjedő távolságokat, hogy megállapítsuk, hogy egy adatkészlet homoscedasticitást mutat-e. Technikailag a variancia számít, és ezt használnád a számításokban. Azonban, mivel a variancia képletet igényel, lehetetlen szemgolyó egy grafikonon.
variancia formula.
mivel a variancia csak a szórás négyzete, előfordulhat, hogy a homoscedasticitást olyan állapotként írják le, ahol a szórások minden pont esetében egyenlőek.
formálisabb értelemben
ritkán találkozol olyan adatokkal, amelyek eltérése nulla. Te nagyobb valószínűséggel látni eltérések kezdve bárhol 0.01 hogy 101.01. Tehát mikor minősül egy adathalmaz homoscedasticity-nek? Az Általános hüvelykujjszabály1:
Ha a legnagyobb variancia aránya a legkisebb varianciához 1,5 vagy annál alacsonyabb, az adatok homoszkóposak.
mi az egyenlő szórás feltételezése?
az egyenlő varianciák feltételezése (azaz a homoscedasticitás feltételezése) feltételezi, hogy a különböző minták azonos varianciával rendelkeznek, még akkor is, ha különböző populációkból származnak. A feltételezés számos statisztikai tesztben megtalálható, beleértve a variancia elemzését (ANOVA) és a hallgató t-tesztjét. Más tesztek, mint például a Welch T-tesztje, egyáltalán nem igényelnek egyenlő eltéréseket.
A teszt futtatása az egyenlő eltérések ellenőrzése nélkül jelentős hatással lehet az eredményekre, sőt teljesen érvénytelenítheti őket. Az, hogy mennyire befolyásolja az eredményeket, attól függ, hogy melyik tesztet használja, és mennyire érzékeny a teszt az egyenlőtlen eltérésekre. Például, míg egy azonos mintaméretű fix tényezős ANOVA-teszt csak egy apró mennyiséget érint, az egyenlőtlen mintaméretű ANOVA teljesen érvénytelen eredményeket adhat.
az egyenlő eltérések feltételezését a lineáris regresszióban is alkalmazzák, amely feltételezi, hogy az adatok homoszkóposak. Egyszerűen fogalmazva, ha az adatok széles körben elterjedt (mint kúp alakú a heteroszkedasztikus fenti képen), regresszió nem fog működni, hogy jól. További információ ebben a témában, lásd feltételezések & feltételek regresszió.
A variancia homogenitásának vizsgálata
az adatok ellenőrzéséhez futtatható tesztek megfelelnek ennek a feltételezésnek:
- Bartlett tesztje
- Box M tesztje
- Brown-Forsythe teszt
- Hartley Fmax tesztje
- Levene tesztje
Stephanie Glen. “Homoscedasticity / Homogenity of Variance / Assumption of Equal variancia” From StatisticsHowTo.com: elemi statisztikák a többiek számára! https://www.statisticshowto.com/homoscedasticity/
——————————————————————————
segítségre van szüksége egy házi feladathoz vagy tesztkérdéshez? A Chegg tanulmány segítségével lépésről-lépésre megoldásokat kaphat kérdéseire a terület szakértőjétől. Az első 30 perc egy Chegg oktatóval ingyenes!
Leave a Reply