Wszechnica Wszechwiedzy - Baner

Testowanie równości dwóch wariancji — test F-Snedecora i homogeniczność wariancji

Testowanie równości dwóch wariancji pozwala sprawdzić, czy dwie populacje różnią się zmiennością badanej cechy. W artykule omawiamy klasyczny test F-Snedecora dla dwóch wariancji: próby jedno- i dwustronne, wybór licznika i mianownika, obszary krytyczne, wartość p, przedział ufności dla ilorazu wariancji oraz znaczenie tego testu przy porównywaniu średnich.

Porównując dwie populacje, często skupiamy się przede wszystkim na ich średnich. Równie ważne może być jednak pytanie o zmienność. Dwa procesy technologiczne mogą dawać produkty o takiej samej średniej masie, ale jeden z nich może być wyraźnie mniej stabilny. Dwie grupy uczące się różnymi metodami mogą osiągać podobne przeciętne wyniki, lecz w jednej grupie rezultaty mogą być znacznie bardziej zróżnicowane.

Do badania tego problemu służy test równości dwóch wariancji, oparty na rozkładzie F-Snedecora. Pozwala on ocenić, czy różnica między wariancjami z prób jest na tyle duża, że stanowi podstawę do odrzucenia hipotezy o równej zmienności w populacjach.

Wcześniej omówiliśmy już testowanie hipotez dotyczących jednej wariancji oraz testowanie różnicy średnich w dwóch populacjach. Test F stanowi naturalne rozwinięcie obu tych zagadnień.

Co testujemy?

Niech \(\sigma_1^2\) oraz \(\sigma_2^2\) oznaczają wariancje w dwóch populacjach. W najczęstszym przypadku chcemy sprawdzić, czy są one równe:

\[ \sigma_1^2=\sigma_2^2 \]

Równoważnie możemy badać iloraz wariancji:

\[ \theta= \frac{\sigma_1^2}{\sigma_2^2} \]

Hipoteza o równości wariancji jest wtedy hipotezą, że:

\[ \theta=1 \]

Test może służyć zarówno do bezpośredniego badania zmienności dwóch procesów, jak i do oceny założenia pomocniczego potrzebnego w niektórych klasycznych modelach statystycznych.

Wariancja a odchylenie standardowe

Test F konstruuje się formalnie dla wariancji. Ponieważ jednak odchylenie standardowe jest dodatnim pierwiastkiem z wariancji, hipoteza o równości wariancji jest równoważna hipotezie o równości odchyleń standardowych:

\[ \sigma_1^2=\sigma_2^2 \quad\Longleftrightarrow\quad \sigma_1=\sigma_2 \]

W obliczeniach stosujemy wariancje z prób, ponieważ ich iloraz ma rozkład F-Snedecora. Wnioski można jednak opisywać także prostszym językiem: „zmienność w pierwszej populacji jest większa”, „odchylenia standardowe są zgodne” albo „nie ma podstaw do stwierdzenia różnicy rozproszenia”.

Założenia klasycznego testu F

Klasyczny test równości dwóch wariancji wymaga spełnienia kilku istotnych założeń:

Normalność obu populacji jest szczególnie ważna. Rozkład F ilorazu wariancji z prób wynika dokładnie z założenia normalności. Nawet umiarkowane odstępstwa od normalności mogą istotnie zmienić rzeczywisty poziom istotności testu.

Test F jest czuły na brak normalności

Klasyczny test F warto traktować jako właściwy przede wszystkim wtedy, gdy normalność populacji ma uzasadnienie merytoryczne albo została wiarygodnie potwierdzona diagnostycznie. Przy danych silnie asymetrycznych lub zawierających obserwacje odstające bezpieczniejsze mogą być metody bardziej odporne, takie jak test Levene’a lub test Browna – Forsythe’a.

Statystyka testowa i rozkład F-Snedecora

Niech \(S_1^2\) oraz \(S_2^2\) oznaczają skorygowane wariancje z dwóch niezależnych prób:

\[ S_1^2= \frac{1}{n_1-1} \sum_{i=1}^{n_1} (x_{1i}-\overline{x}_1)^2 \]
\[ S_2^2= \frac{1}{n_2-1} \sum_{i=1}^{n_2} (x_{2i}-\overline{x}_2)^2 \]

Statystyka testowa ma postać ilorazu:

\[ F= \frac{S_1^2}{S_2^2} \]

Jeżeli obie populacje są normalne i hipoteza zerowa o równości wariancji jest prawdziwa, statystyka \(F\) ma rozkład F-Snedecora z liczbą stopni swobody:

\[ \nu_1=n_1-1 \]
\[ \nu_2=n_2-1 \]
\[ F\sim F_{\nu_1,\nu_2} \]

Pierwsza liczba stopni swobody należy do wariancji umieszczonej w liczniku, a druga — do wariancji umieszczonej w mianowniku. Kolejność ma więc znaczenie.

Infografika przedstawiająca dwie niezależne próby, wariancje z prób, iloraz F oraz stopnie swobody w teście F-Snedecora
Statystyka F jest ilorazem wariancji z dwóch niezależnych prób.

Hipotezy jedno- i dwustronne

Podobnie jak w innych testach, rodzaj hipotezy alternatywnej powinien wynikać z celu analizy i zostać wybrany przed obejrzeniem wyników.

Test dwustronny

\[ H_0:\sigma_1^2=\sigma_2^2 \]
\[ H_1:\sigma_1^2\neq\sigma_2^2 \]

Ten wariant stosujemy wtedy, gdy interesuje nas każda różnica zmienności: zarówno sytuacja, w której pierwsza populacja jest bardziej zróżnicowana, jak i sytuacja odwrotna.

Test prawostronny

\[ H_0:\sigma_1^2=\sigma_2^2 \]
\[ H_1:\sigma_1^2>\sigma_2^2 \]

Test prawostronny ma zastosowanie na przykład wtedy, gdy chcemy sprawdzić, czy nowy proces produkcyjny zwiększył zmienność wyników względem procesu dotychczasowego.

Test lewostronny

\[ H_0:\sigma_1^2=\sigma_2^2 \]
\[ H_1:\sigma_1^2\sigma_2^2 \]

Test lewostronny wybieramy wtedy, gdy interesuje nas wyłącznie zmniejszenie zmienności w pierwszej populacji względem drugiej.

Którą wariancję umieścić w liczniku?

W testach jednostronnych kolejność wariancji w ilorazie musi odpowiadać kierunkowi hipotezy alternatywnej.

Jeżeli testujemy:

\[ H_1:\sigma_1^2>\sigma_2^2 \]

naturalnie stosujemy statystykę:

\[ F= \frac{S_1^2}{S_2^2} \]

i szukamy dużych wartości w prawym ogonie rozkładu F.

Jeżeli natomiast testujemy:

\[ H_1:\sigma_1^2\sigma_2^2 \]

możemy pozostawić iloraz \(S_1^2/S_2^2\) i porównywać go z dolnym kwantylem rozkładu F albo odwrócić kolejność wariancji:

\[ F^\ast= \frac{S_2^2}{S_1^2} \]

oraz przeprowadzić równoważny test prawostronny. Po odwróceniu ilorazu trzeba jednocześnie zamienić kolejność stopni swobody.

Nie zamieniaj licznika z mianownikiem po to, aby „wyszło większe F”

W teście jednostronnym samowolna zamiana wariancji w ilorazie zmienia kierunek hipotezy alternatywnej. Można ją wykonać wyłącznie wtedy, gdy świadomie przepisujemy test na równoważny wariant dotyczący odwrotnego ilorazu i równocześnie zamieniamy stopnie swobody.

W teście dwustronnym często stosuje się wygodną konwencję:

\[ F^\ast= \frac{ \max(S_1^2,S_2^2) }{ \min(S_1^2,S_2^2) } \]

Wtedy zawsze:

\[ F^\ast\geq1 \]

i wystarczy porównywać statystykę z prawostronną wartością krytyczną. Liczba stopni swobody w liczniku należy wtedy do grupy o większej wariancji z próby, a w mianowniku — do grupy o mniejszej wariancji z próby.

Obszary krytyczne i wartości krytyczne

W dalszej części przyjmujemy oznaczenie lewostronnych kwantyli rozkładu F:

\[ P\left( F_{\nu_1,\nu_2} \leq F_{p;\nu_1,\nu_2} \right) = p \] 

Wartość \(F_{p;\nu_1,\nu_2}\) oznacza więc kwantyl rzędu \(p\). Trzeba pamiętać, że różne tablice i programy mogą stosować inną konwencję oznaczeń, zwłaszcza dla wartości „z prawego ogona”.

Test prawostronny

Dla hipotezy:

\[ H_1:\sigma_1^2>\sigma_2^2 \]

odrzucamy \(H_0\), gdy:

\[ f_{\text{obs}} > F_{1-\alpha;\nu_1,\nu_2} \]

Test lewostronny

Dla hipotezy:

\[ H_1:\sigma_1^2\sigma_2^2 \]

odrzucamy \(H_0\), gdy:

\[ f_{\text{obs}} F_{\alpha;\nu_1,\nu_2} \]

Test dwustronny — zapis bez zmiany kolejności wariancji

Dla hipotezy:

\[ H_1:\sigma_1^2\neq\sigma_2^2 \]

odrzucamy \(H_0\), gdy iloraz wariancji znajduje się w jednym z dwóch ogonów rozkładu:

\[ f_{\text{obs}} F_{\alpha/2;\nu_1,\nu_2} \]

albo gdy:

\[ f_{\text{obs}} > F_{1-\alpha/2;\nu_1,\nu_2} \]

Test dwustronny — większa wariancja w liczniku

W wielu zadaniach najpierw umieszcza się większą wariancję z próby w liczniku. Wtedy wystarczy badać prawy ogon rozkładu F:

\[ F^\ast= \frac{ S_{\max}^2 }{ S_{\min}^2 } \]

Odrzucamy hipotezę o równości wariancji na poziomie istotności \(\alpha\), gdy:

\[ F^\ast > F_{1-\alpha/2;\nu_{\max},\nu_{\min}} \]

Ten zapis jest równoważny badaniu obu ogonów. Zawiera on jednak ważny warunek: stopnie swobody muszą odpowiadać dokładnie tej grupie, której wariancja znalazła się w liczniku i mianowniku.

Trzy wykresy rozkładu F-Snedecora przedstawiające obszary krytyczne dla testu prawostronnego, lewostronnego i dwustronnego
Położenie obszaru krytycznego zależy od kierunku hipotezy alternatywnej oraz od kolejności wariancji w ilorazie F

Wartość p

Alternatywą dla porównywania z wartością krytyczną jest obliczenie wartości p. Wartość p określa, jak skrajny jest obserwowany iloraz wariancji przy założeniu prawdziwości hipotezy zerowej.

Test prawostronny

\[ p= P\left( F_{\nu_1,\nu_2} \geq f_{\text{obs}} \right) \]

Test lewostronny

\[ p= P\left( F_{\nu_1,\nu_2} \leq f_{\text{obs}} \right) \]

Test dwustronny

W klasycznym dwustronnym teście F wartość p można wyznaczyć jako podwojone mniejsze z prawdopodobieństw ogonowych:

\[ p= 2 \min \left\{ P(F_{\nu_1,\nu_2}\leq f_{\text{obs}}), \; P(F_{\nu_1,\nu_2}\geq f_{\text{obs}}) \right\} \]

Jeżeli wcześniej umieścimy większą wariancję w liczniku, można wyznaczyć prawostronne prawdopodobieństwo dla otrzymanego \(F^\ast\), a następnie podwoić je dla testu dwustronnego.

Reguła decyzji jest standardowa:

\[ p\leq\alpha \quad\Longrightarrow\quad \text{odrzucamy }H_0 \]
\[ p>\alpha \quad\Longrightarrow\quad \text{brak podstaw do odrzucenia }H_0 \]

Przedział ufności dla ilorazu wariancji

Testowanie równości wariancji można połączyć z estymacją przedziałową ilorazu:

\[ \frac{\sigma_1^2}{\sigma_2^2} \]

Dwustronny przedział ufności \(1-\alpha\) dla ilorazu wariancji ma postać:

\[ \left( \frac{ f_{\text{obs}} }{ F_{1-\alpha/2;\nu_1,\nu_2} }, \; \frac{ f_{\text{obs}} }{ F_{\alpha/2;\nu_1,\nu_2} } \right) \]

W teście dwustronnym na poziomie istotności \(\alpha\) obowiązuje zasada:

Tak jak w innych testach, przedział ufności daje dodatkową informację o kierunku i skali możliwej różnicy. Test odpowiada przede wszystkim na pytanie decyzyjne, a przedział pokazuje, jakie wartości ilorazu wariancji są zgodne z danymi.

Związek z testowaniem różnicy średnich

Test równości wariancji jest często omawiany jako test pomocniczy przed zastosowaniem klasycznego testu t-Studenta dla dwóch niezależnych średnich.

W modelu ze wspólną wariancją zakładamy:

\[ \sigma_1^2=\sigma_2^2 \]

i wykorzystujemy połączoną wariancję z próby. Szczegóły tej procedury znajdują się w części nieznane, ale równe wariancje.

Jeżeli założenie równości wariancji nie jest wiarygodne, stosujemy test Welcha, który nie wymaga homogeniczności wariancji. Zobacz część nieznane i nierówne wariancje — test Welcha.

Test F nie powinien być jedyną „bramką” do wyboru testu średnich

Brak podstaw do odrzucenia równości wariancji nie dowodzi, że wariancje są równe. Z kolei odrzucenie hipotezy może wynikać z dużej liczebności próby albo wrażliwości testu F na brak normalności.

W praktycznych analizach często stosuje się test Welcha jako domyślną, bardziej odporną procedurę porównywania średnich. Klasyczny test t ze wspólną wariancją jest uzasadniony wtedy, gdy równość wariancji wynika z projektu badania lub mocnych przesłanek merytorycznych.

Schemat pokazujący wpływ wyniku testu F-Snedecora na wybór klasycznego testu t-Studenta ze wspólną wariancją lub testu Welcha dla dwóch średnich
Równość wariancji ma znaczenie przy klasycznym teście t ze wspólną wariancją, natomiast test Welcha nie wymaga tego założenia.

Przykład: test dwustronny równości wariancji

Porównujemy zmienność wyników uzyskanych w dwóch niezależnych grupach. Załóżmy, że obie populacje można uznać za normalne. Otrzymano:

\[ n_1=16 \]
\[ S_1^2=36 \]
\[ n_2=12 \]
\[ S_2^2=16 \]

Chcemy sprawdzić, czy wariancje w populacjach są równe. Formułujemy test dwustronny:

\[ H_0:\sigma_1^2=\sigma_2^2 \]
\[ H_1:\sigma_1^2\neq\sigma_2^2 \]

Przyjmujemy poziom istotności:

\[ \alpha=0{,}05 \]

Większą wariancję umieszczamy w liczniku:

\[ f_{\text{obs}} = \frac{36}{16} = 2{,}25 \]

Liczba stopni swobody wynosi:

\[ \nu_1=16-1=15 \]
\[ \nu_2=12-1=11 \]

Dla testu dwustronnego stosujemy prawostronną wartość krytyczną odpowiadającą \(\alpha/2=0{,}025\):

\[ F_{0{,}975;15,11} \approx 3{,}12 \]

Ponieważ:

\[ 2{,}253{,}12 \]

nie ma podstaw do odrzucenia hipotezy o równości wariancji na poziomie istotności 0,05.

Wniosek należy sformułować ostrożnie: dane z prób nie dostarczają wystarczających podstaw do stwierdzenia, że wariancje w obu populacjach są różne. Nie oznacza to, że udowodniliśmy ich dokładną równość.

Przy wykorzystaniu kalkulatora można dodatkowo wyznaczyć wartość p oraz 95-procentowy przedział ufności dla ilorazu \(\sigma_1^2/\sigma_2^2\). Jeżeli przedział obejmuje wartość 1, otrzymujemy ten sam wniosek co w teście dwustronnym.

Ograniczenia testu F i alternatywy

Klasyczny test F-Snedecora jest bardzo użyteczny w zadaniach opartych na założeniu normalności populacji. Nie należy jednak traktować go jako uniwersalnego testu zmienności dla dowolnych danych.

Przy wyraźnym braku normalności, asymetrii rozkładu lub obecności obserwacji odstających warto rozważyć bardziej odporne procedury. Do najczęściej stosowanych należą test Levene’a oraz jego modyfikacja Browna – Forsythe’a.

Gdy porównujemy więcej niż dwie grupy, problem homogeniczności wariancji można badać między innymi testem Levene’a albo testem Bartletta. Test Bartletta, podobnie jak test F, jest silnie związany z założeniem normalności.

W dalszych materiałach dotyczących testów nieparametrycznych i diagnostyki warto będzie szerzej omówić test Levene’a, test Browna – Forsythe’a oraz ich zastosowanie przed analizą wariancji.

Kalkulatory i programy statystyczne

Wartości krytyczne rozkładu F-Snedecora można odczytywać z tablic, ale wygodniejsze jest korzystanie z kalkulatorów, ponieważ rozkład F zależy od dwóch liczb stopni swobody i łatwo pomylić ich kolejność.

Do obliczeń przyda się tablica rozkładu F-Snedecora i kalkulator. Wartości p, przedziały ufności i testy równości wariancji oferują również między innymi Excel, SPSS, Statistica, Gretl oraz R.

Najczęstsze błędy

Podsumowanie

Test F-Snedecora pozwala sprawdzić, czy dwie normalne populacje mają taką samą wariancję. Jest podstawowym klasycznym narzędziem do badania homogeniczności wariancji w dwóch populacjach.

Powiązane artykuły

Masz problem z tym tematem?

Wszechwiedza.pl pomaga zrozumieć matematykę, statystykę, ekonometrię, badania operacyjne, analizę danych, mechanikę, rachunkowość i wiele innych przedmiotów — spokojnie, konkretnie i krok po kroku. 

Zapytaj o pomoc