Wszechnica Wszechwiedzy - Baner

Testowanie hipotez dotyczących jednej wariancji

Testowanie hipotez dotyczących wariancji pozwala sprawdzić, czy zmienność badanej cechy w populacji jest zgodna z wartością przyjętą w normie, specyfikacji technicznej albo wcześniejszym badaniu. W artykule omawiamy test chi-kwadrat dla jednej wariancji: hipotezy jedno- i dwustronne, obszar krytyczny, wartość p, związek z przedziałem ufności oraz znaczenie założenia normalności populacji.

W wielu zagadnieniach praktycznych nie wystarczy wiedzieć, jaka jest średnia wartość cechy. Równie ważna bywa jej zmienność. Producent może na przykład wymagać, aby masa produktu była możliwie stabilna, laboratorium może kontrolować powtarzalność pomiarów, a przedsiębiorstwo może sprawdzać, czy czas realizacji usług nie stał się zbyt zróżnicowany.

Do takich problemów służy test dotyczący wariancji jednej populacji. Jego celem jest ocena, czy wariancja \(\sigma^2\) jest równa określonej wartości, większa od niej albo mniejsza od niej.

Ogólne pojęcia dotyczące hipotezy zerowej, poziomu istotności, wartości p oraz błędów pierwszego i drugiego rodzaju zostały omówione w artykule Testowanie hipotez statystycznych. Warto również przypomnieć zasady estymacji wariancji i odchylenia standardowego.

Co testujemy?

Wariancję populacji oznaczamy symbolem:

\[ \sigma^2=Var(X) \]

Opisuje ona rozproszenie wartości cechy wokół średniej populacji. Im większa wariancja, tym bardziej obserwacje są zróżnicowane.

W teście jednej wariancji porównujemy nieznaną wariancję populacji \(\sigma^2\) z wartością hipotetyczną:

\[ \sigma_0^2 \]

Wartość \(\sigma_0^2\) może wynikać z normy jakościowej, dokumentacji technicznej, danych historycznych albo wymaganego poziomu stabilności procesu.

Przykładowo, producent może deklarować, że odchylenie standardowe objętości produktu nie przekracza 4 ml. Odpowiada to hipotezie dotyczącej wariancji:

\[ \sigma_0=4 \] \[ \sigma_0^2=16 \]

Wariancja a odchylenie standardowe

Test formalnie buduje się dla wariancji \(\sigma^2\), ponieważ to właśnie wariancja ma wygodny związek z rozkładem chi-kwadrat. W praktyce problem może jednak być sformułowany poprzez odchylenie standardowe \(\sigma\).

Ponieważ odchylenie standardowe jest nieujemne:

\[ \sigma\geq0 \]

hipotezy dotyczące wariancji i odpowiadające im hipotezy dotyczące odchylenia standardowego są równoważne. Na przykład:

\[ H_0:\sigma=4 \]

jest równoważna hipotezie:

\[ H_0:\sigma^2=16 \]

W obliczeniach używamy jednak wariancji i statystyki chi-kwadrat, a wynik można później opisać językiem odchylenia standardowego, który bywa bardziej intuicyjny.

Dlaczego nie ma modelu ze znaną wariancją?

Przy testowaniu średniej rozróżnialiśmy sytuację, w której odchylenie standardowe populacji było znane, oraz sytuację, w której było nieznane. W przypadku wariancji taki podział nie ma sensu.

Gdyby wariancja populacji była znana dokładnie, nie byłoby czego testować. Test jednej wariancji służy właśnie do weryfikacji hipotezy o nieznanej wartości \(\sigma^2\) na podstawie danych z próby.

Znana może być natomiast wartość referencyjna \(\sigma_0^2\), czyli wariancja zapisana w normie, deklaracji producenta albo przyjętej specyfikacji. Nie oznacza to jednak, że znamy rzeczywistą wariancję populacji.

Założenia testu dla wariancji

Klasyczny test jednej wariancji oparty na rozkładzie chi-kwadrat wymaga spełnienia ważnych założeń:

Założenie normalności jest tutaj szczególnie ważne. W przeciwieństwie do wielu testów dotyczących średniej, duża liczebność próby nie pozwala po prostu pominąć tego warunku i automatycznie stosować klasycznego testu chi-kwadrat.

Dlaczego normalność ma tak duże znaczenie?

Rozkład chi-kwadrat statystyki testowej wynika dokładnie z założenia, że obserwacje pochodzą z populacji normalnej. Przy wyraźnej asymetrii, ciężkich ogonach albo obserwacjach odstających klasyczny test wariancji może prowadzić do mylących wyników.

Dlatego przed zastosowaniem testu dla wariancji przy małej próbie warto ocenić normalność danych, na przykład wykresem kwantylowym, histogramem albo odpowiednim testem normalności.

Statystyka testowa i rozkład chi-kwadrat

Niech \(S^2\) oznacza skorygowaną wariancję z próby:

\[ S^2= \frac{1}{n-1} \sum_{i=1}^{n} (x_i-\overline{x})^2 \]

Jeżeli populacja ma rozkład normalny, to przy prawdziwości hipotezy:

\[ H_0:\sigma^2=\sigma_0^2 \]

statystyka:

\[ Q= \frac{ (n-1)S^2 }{ \sigma_0^2 } \]

ma rozkład chi-kwadrat z liczbą stopni swobody:

\[ \nu=n-1 \]
\[ Q\sim\chi^2_{\nu} \]

Po podstawieniu danych z próby otrzymujemy obserwowaną wartość statystyki:

\[ q_{\text{obs}}= \frac{ (n-1)s^2 }{ \sigma_0^2 } \]

W niektórych podręcznikach wariancję z próby oblicza się z mianownikiem \(n\). Jeżeli oznaczymy ją przez \(s_n^2\), wtedy:

\[ s_n^2= \frac{1}{n} \sum_{i=1}^{n} (x_i-\overline{x})^2 \]

i równoważna postać statystyki testowej wynosi:

\[ Q= \frac{ n s_n^2 }{ \sigma_0^2 } \]
Infografika przedstawiająca statystykę chi-kwadrat w teście jednej wariancji, wzór na wariancję z próby i założenia testu
Statystyka testowa porównuje wariancję z próby z hipotetyczną wariancją populacji.

Praktyczna zasada

Najpierw sprawdź, z jakim mianownikiem obliczono wariancję w zadaniu lub programie. Dla skorygowanej wariancji \(S^2\) używamy licznika \((n-1)S^2\). Dla wariancji \(s_n^2\) obliczonej z mianownikiem \(n\) używamy licznika \(n s_n^2\).

Hipotezy jedno- i dwustronne

Podobnie jak przy testach dla średniej, postać hipotezy alternatywnej zależy od problemu badawczego.

Test dwustronny

\[ H_0:\sigma^2=\sigma_0^2 \] \[ H_1:\sigma^2\neq\sigma_0^2 \]

Stosujemy go wtedy, gdy interesuje nas każda różnica względem wartości referencyjnej: zarówno zbyt mała, jak i zbyt duża zmienność.

Test prawostronny

\[ H_0:\sigma^2=\sigma_0^2 \] \[ H_1:\sigma^2>\sigma_0^2 \]

Test prawostronny ma sens na przykład wtedy, gdy szczególne znaczenie ma wzrost rozrzutu wyników. Dotyczy to kontroli jakości, stabilności procesu lub powtarzalności pomiarów.

Test lewostronny

\[ H_0:\sigma^2=\sigma_0^2 \] \[ H_1:\sigma^2\sigma_0^2 \]

Test lewostronny stosujemy wtedy, gdy chcemy wykazać, że zmienność jest mniejsza od wartości referencyjnej, na przykład po wdrożeniu bardziej precyzyjnej technologii.

Obszar krytyczny i wartości krytyczne

Rozkład chi-kwadrat jest dodatni i asymetryczny. Dlatego w testach wariancji trzeba bardzo uważnie odczytywać wartości krytyczne z tablicy oraz sprawdzać, czy tablica pokazuje prawdopodobieństwo w lewym, czy w prawym ogonie.

W dalszej części przyjmujemy oznaczenie:

\[ P\left( \chi^2_{\nu} \leq \chi^2_{p;\nu} \right) = p \] 

Symbol \(\chi^2_{p;\nu}\) oznacza więc kwantyl lewostronny rzędu \(p\) rozkładu chi-kwadrat z \(\nu\) stopniami swobody.

Test prawostronny

Dla hipotez:

\[ H_0:\sigma^2=\sigma_0^2 \] \[ H_1:\sigma^2>\sigma_0^2 \]

odrzucamy \(H_0\), gdy obserwowana wartość statystyki jest zbyt duża:

\[ q_{\text{obs}} > \chi^2_{1-\alpha;\nu} \]

Test lewostronny

Dla hipotez:

\[ H_0:\sigma^2=\sigma_0^2 \] \[ H_1:\sigma^2\sigma_0^2 \]

odrzucamy \(H_0\), gdy statystyka jest zbyt mała:

\[ q_{\text{obs}} \chi^2_{\alpha;\nu} \]

Test dwustronny

Dla hipotez:

\[ H_0:\sigma^2=\sigma_0^2 \] \[ H_1:\sigma^2\neq\sigma_0^2 \]

poziom istotności dzielimy na dwa ogony rozkładu. Odrzucamy \(H_0\), gdy:

\[ q_{\text{obs}} \chi^2_{\alpha/2;\nu} \]

albo gdy:

\[ q_{\text{obs}} > \chi^2_{1-\alpha/2;\nu} \]
Trzy wykresy rozkładu chi-kwadrat przedstawiające obszary krytyczne dla testu dwustronnego, prawostronnego i lewostronnego wariancji
Położenie obszaru krytycznego zależy od kierunku hipotezy alternatywnej dotyczącej wariancji.

Nie myl testu jednej wariancji z testem dwóch wariancji

W teście jednej wariancji korzystamy bezpośrednio z dolnego i górnego kwantyla rozkładu chi-kwadrat. Konstrukcje wykorzystujące odwrotność kwantyla oraz zamianę licznika z mianownikiem dotyczą przede wszystkim testu F-Snedecora dla dwóch wariancji.

Wartości krytyczne można odczytać z tablicy rozkładu chi-kwadrat i kalkulatora.

Wartość p

Decyzję można również podjąć na podstawie wartości p. Jeżeli \(F_{\chi^2_\nu}\) oznacza dystrybuantę rozkładu chi-kwadrat z \(\nu\) stopniami swobody, to:

Test prawostronny

\[ p= P\left( \chi^2_{\nu} \geq q_{\text{obs}} \right) \]

Test lewostronny

\[ p= P\left( \chi^2_{\nu} \leq q_{\text{obs}} \right) \]

Test dwustronny

Ze względu na asymetrię rozkładu chi-kwadrat nie należy automatycznie podwajać prawdopodobieństwa w prawym ogonie. Klasyczną wartość p dla testu dwustronnego wyznaczamy jako:

\[ p= 2 \min \left\{ F_{\chi^2_\nu}(q_{\text{obs}}), \; 1-F_{\chi^2_\nu}(q_{\text{obs}}) \right\} \]

Jeżeli:

\[ p\leq\alpha \]

odrzucamy hipotezę zerową. Gdy:

\[ p>\alpha \]

stwierdzamy brak podstaw do odrzucenia \(H_0\).

Test a przedział ufności dla wariancji

Testowanie hipotez dotyczących wariancji jest bezpośrednio związane z estymacją przedziałową wariancji. Dwustronny przedział ufności \(1-\alpha\) dla wariancji ma postać:

\[ \left( \frac{ \nu S^2 }{ \chi^2_{1-\alpha/2;\nu} }, \; \frac{ \nu S^2 }{ \chi^2_{\alpha/2;\nu} } \right) \]

gdzie:

\[ \nu=n-1 \]

Dla testu dwustronnego na poziomie istotności \(\alpha\) obowiązuje zasada:

Przedział ufności dla odchylenia standardowego otrzymujemy przez spierwiastkowanie obu granic przedziału dla wariancji.

W teście prawostronnym można wykorzystać jednostronną dolną granicę ufności dla wariancji:

\[ L= \frac{ \nu S^2 }{ \chi^2_{1-\alpha;\nu} } \]

Jeżeli:

\[ L>\sigma_0^2 \]

to odrzucamy hipotezę \(H_0\) na rzecz alternatywy, że wariancja jest większa od wartości referencyjnej.

Infografika pokazująca związek między testem hipotezy o wariancji a przedziałem ufności dla wariancji populacji
W teście dwustronnym wartość hipotetycznej wariancji należy do przedziału ufności wtedy i tylko wtedy, gdy nie ma podstaw do odrzucenia hipotezy zerowej.

Duża próba i przybliżenie normalne

Przy dużej liczbie stopni swobody rozkład chi-kwadrat staje się mniej asymetryczny i można przybliżać go rozkładem normalnym:

\[ Q \approx N(\nu,2\nu) \]

Po standaryzacji otrzymujemy przybliżenie:

\[ Z= \frac{ Q-\nu }{ \sqrt{2\nu} } \approx N(0,1) \]

Dokładniejsze przybliżenie Fishera ma postać:

\[ \sqrt{2Q} - \sqrt{2\nu-1} \approx N(0,1) \]

W praktyce, gdy mamy dostęp do kalkulatora lub programu statystycznego, najlepiej korzystać z dokładnych wartości rozkładu chi-kwadrat. Przybliżenie normalne może być przydatne w zadaniach teoretycznych, przy bardzo dużych liczebnościach albo wtedy, gdy dysponujemy jedynie tablicą rozkładu normalnego.

Duża próba nie usuwa automatycznie problemu normalności

Przybliżenie normalne opisuje zachowanie rozkładu chi-kwadrat dla dużej liczby stopni swobody. Klasyczna statystyka \(Q\) ma rozkład chi-kwadrat dokładnie wtedy, gdy próbę pobrano z populacji normalnej.

Dla populacji o dowolnym rozkładzie istnieją bardziej zaawansowane asymptotyczne metody testowania wariancji, ale wymagają one dodatkowych informacji o czwartym momencie centralnym i nie są tym samym co standardowy test chi-kwadrat.

Przykład: test prawostronny dla wariancji

Producent kontroluje zmienność objętości napoju w butelkach. Dopuszczalne odchylenie standardowe wynosi 4 ml. Z losowej próby 16 butelek otrzymano skorygowane odchylenie standardowe:

\[ n=16 \]
\[ S=5{,}5 \]

Zakładamy, że objętość napoju w populacji ma rozkład normalny. Chcemy sprawdzić, czy rzeczywiste odchylenie standardowe jest większe od 4 ml.

Krok 1. Hipotezy

\[ H_0:\sigma^2=4^2=16 \]
\[ H_1:\sigma^2>16 \]

Krok 2. Poziom istotności i stopnie swobody

\[ \alpha=0{,}05 \]
\[ \nu=n-1=15 \]

Krok 3. Statystyka testowa

\[ q_{\text{obs}} = \frac{ (16-1)\cdot5{,}5^2 }{ 16 } \] 
\[ q_{\text{obs}} = \frac{ 15\cdot30{,}25 }{ 16 } = 28{,}359 \]

Krok 4. Obszar krytyczny

Dla testu prawostronnego i \(\alpha=0{,}05\) odczytujemy:

\[ \chi^2_{0{,}95;15} \approx 24{,}996 \]

Odrzucamy hipotezę zerową, gdy:

\[ q_{\text{obs}} > 24{,}996 \]

Ponieważ:

\[ 28{,}359 > 24{,}996 \]

odrzucamy hipotezę zerową na poziomie istotności 0,05.

Krok 5. Wartość p

Dla obserwowanej wartości statystyki wartość p wynosi w przybliżeniu:

\[ p\approx0{,}019 \]

Ponieważ:

\[ 0{,}0190{,}05 \]

metoda wartości p prowadzi do tej samej decyzji.

Krok 6. Interpretacja przez jednostronną granicę ufności

Dolna 95-procentowa granica ufności dla wariancji wynosi:

\[ L= \frac{ 15\cdot30{,}25 }{ \chi^2_{0{,}95;15} } \]
\[ L \approx 18{,}15 \]

Otrzymujemy:

\[ 18{,}15>16 \]

Dolna granica ufności dla wariancji przekracza wartość referencyjną. Potwierdza to decyzję o odrzuceniu hipotezy, że odchylenie standardowe wynosi 4 ml.

Dolna granica ufności dla odchylenia standardowego wynosi:

\[ \sqrt{18{,}15} \approx 4{,}26 \]

Wniosek: dane z próby dostarczają podstaw do stwierdzenia, że zmienność objętości napoju jest większa niż dopuszczalna wartość odpowiadająca odchyleniu standardowemu 4 ml.

Zastosowania i związek z testem dwóch wariancji

Test jednej wariancji stosuje się między innymi w kontroli jakości, analizie dokładności pomiarów, ocenie stabilności procesów technologicznych oraz porównywaniu zmienności z wymaganiami określonymi w normach.

Warianty testu dla jednej wariancji są również przydatne jako przygotowanie do testu równości dwóch wariancji. W kolejnym artykule omówimy test F-Snedecora, w którym badamy stosunek:

\[ \frac{ \sigma_1^2 }{ \sigma_2^2 } \]

Test równości dwóch wariancji może mieć znaczenie pomocnicze przy klasycznym porównywaniu średnich w dwóch populacjach. Założenie równości wariancji jest wymagane przez test t-Studenta ze wspólną wariancją, natomiast nie jest konieczne w teście Welcha.

Praktyczne omówienie testu t ze wspólną wariancją i testu Welcha znajduje się w artykule Testowanie różnicy średnich w dwóch populacjach.

Kalkulatory i programy statystyczne

Wartości krytyczne rozkładu chi-kwadrat można odczytywać z tablic, ale w praktyce wygodniejsze jest korzystanie z kalkulatorów i programów statystycznych. Pozwalają one wyznaczyć wartość statystyki testowej, wartość p oraz przedział ufności dla wariancji lub odchylenia standardowego.

Do ręcznej kontroli obliczeń przyda się tablica rozkładu chi-kwadrat i kalkulator. Odpowiednie procedury oferują także Excel, SPSS, Statistica, Gretl, R oraz inne pakiety statystyczne.

Najczęstsze błędy

Podsumowanie

Test jednej wariancji pozwala ocenić, czy zmienność badanej cechy w populacji jest zgodna z wartością przyjętą jako norma, deklaracja albo punkt odniesienia.

Powiązane artykuły

Masz problem z tym tematem?

Wszechwiedza.pl pomaga zrozumieć matematykę, statystykę, ekonometrię, badania operacyjne, analizę danych, mechanikę, rachunkowość i wiele innych przedmiotów — spokojnie, konkretnie i krok po kroku. 

Zapytaj o pomoc