Testowanie równości dwóch wariancji — test F-Snedecora i homogeniczność wariancji
Testowanie równości dwóch wariancji pozwala sprawdzić, czy dwie populacje różnią się zmiennością badanej cechy. W artykule omawiamy klasyczny test F-Snedecora dla dwóch wariancji: próby jedno- i dwustronne, wybór licznika i mianownika, obszary krytyczne, wartość p, przedział ufności dla ilorazu wariancji oraz znaczenie tego testu przy porównywaniu średnich.
Porównując dwie populacje, często skupiamy się przede wszystkim na ich średnich. Równie ważne może być jednak pytanie o zmienność. Dwa procesy technologiczne mogą dawać produkty o takiej samej średniej masie, ale jeden z nich może być wyraźnie mniej stabilny. Dwie grupy uczące się różnymi metodami mogą osiągać podobne przeciętne wyniki, lecz w jednej grupie rezultaty mogą być znacznie bardziej zróżnicowane.
Do badania tego problemu służy test równości dwóch wariancji, oparty na rozkładzie F-Snedecora. Pozwala on ocenić, czy różnica między wariancjami z prób jest na tyle duża, że stanowi podstawę do odrzucenia hipotezy o równej zmienności w populacjach.
Wcześniej omówiliśmy już testowanie hipotez dotyczących jednej wariancji oraz testowanie różnicy średnich w dwóch populacjach. Test F stanowi naturalne rozwinięcie obu tych zagadnień.
Co testujemy?
Niech \(\sigma_1^2\) oraz \(\sigma_2^2\) oznaczają wariancje w dwóch populacjach. W najczęstszym przypadku chcemy sprawdzić, czy są one równe:
Równoważnie możemy badać iloraz wariancji:
Hipoteza o równości wariancji jest wtedy hipotezą, że:
Test może służyć zarówno do bezpośredniego badania zmienności dwóch procesów, jak i do oceny założenia pomocniczego potrzebnego w niektórych klasycznych modelach statystycznych.
Wariancja a odchylenie standardowe
Test F konstruuje się formalnie dla wariancji. Ponieważ jednak odchylenie standardowe jest dodatnim pierwiastkiem z wariancji, hipoteza o równości wariancji jest równoważna hipotezie o równości odchyleń standardowych:
W obliczeniach stosujemy wariancje z prób, ponieważ ich iloraz ma rozkład F-Snedecora. Wnioski można jednak opisywać także prostszym językiem: „zmienność w pierwszej populacji jest większa”, „odchylenia standardowe są zgodne” albo „nie ma podstaw do stwierdzenia różnicy rozproszenia”.
Założenia klasycznego testu F
Klasyczny test równości dwóch wariancji wymaga spełnienia kilku istotnych założeń:
- Obie próby są losowe.
- Próby są niezależne od siebie.
- Obserwacje w obrębie każdej próby są niezależne.
- Obie populacje mają rozkład normalny.
Normalność obu populacji jest szczególnie ważna. Rozkład F ilorazu wariancji z prób wynika dokładnie z założenia normalności. Nawet umiarkowane odstępstwa od normalności mogą istotnie zmienić rzeczywisty poziom istotności testu.
Test F jest czuły na brak normalności
Klasyczny test F warto traktować jako właściwy przede wszystkim wtedy, gdy normalność populacji ma uzasadnienie merytoryczne albo została wiarygodnie potwierdzona diagnostycznie. Przy danych silnie asymetrycznych lub zawierających obserwacje odstające bezpieczniejsze mogą być metody bardziej odporne, takie jak test Levene’a lub test Browna – Forsythe’a.
Statystyka testowa i rozkład F-Snedecora
Niech \(S_1^2\) oraz \(S_2^2\) oznaczają skorygowane wariancje z dwóch niezależnych prób:
Statystyka testowa ma postać ilorazu:
Jeżeli obie populacje są normalne i hipoteza zerowa o równości wariancji jest prawdziwa, statystyka \(F\) ma rozkład F-Snedecora z liczbą stopni swobody:
Pierwsza liczba stopni swobody należy do wariancji umieszczonej w liczniku, a druga — do wariancji umieszczonej w mianowniku. Kolejność ma więc znaczenie.

Hipotezy jedno- i dwustronne
Podobnie jak w innych testach, rodzaj hipotezy alternatywnej powinien wynikać z celu analizy i zostać wybrany przed obejrzeniem wyników.
Test dwustronny
Ten wariant stosujemy wtedy, gdy interesuje nas każda różnica zmienności: zarówno sytuacja, w której pierwsza populacja jest bardziej zróżnicowana, jak i sytuacja odwrotna.
Test prawostronny
Test prawostronny ma zastosowanie na przykład wtedy, gdy chcemy sprawdzić, czy nowy proces produkcyjny zwiększył zmienność wyników względem procesu dotychczasowego.
Test lewostronny
Test lewostronny wybieramy wtedy, gdy interesuje nas wyłącznie zmniejszenie zmienności w pierwszej populacji względem drugiej.
Którą wariancję umieścić w liczniku?
W testach jednostronnych kolejność wariancji w ilorazie musi odpowiadać kierunkowi hipotezy alternatywnej.
Jeżeli testujemy:
naturalnie stosujemy statystykę:
i szukamy dużych wartości w prawym ogonie rozkładu F.
Jeżeli natomiast testujemy:
możemy pozostawić iloraz \(S_1^2/S_2^2\) i porównywać go z dolnym kwantylem rozkładu F albo odwrócić kolejność wariancji:
oraz przeprowadzić równoważny test prawostronny. Po odwróceniu ilorazu trzeba jednocześnie zamienić kolejność stopni swobody.
Nie zamieniaj licznika z mianownikiem po to, aby „wyszło większe F”
W teście jednostronnym samowolna zamiana wariancji w ilorazie zmienia kierunek hipotezy alternatywnej. Można ją wykonać wyłącznie wtedy, gdy świadomie przepisujemy test na równoważny wariant dotyczący odwrotnego ilorazu i równocześnie zamieniamy stopnie swobody.
W teście dwustronnym często stosuje się wygodną konwencję:
Wtedy zawsze:
i wystarczy porównywać statystykę z prawostronną wartością krytyczną. Liczba stopni swobody w liczniku należy wtedy do grupy o większej wariancji z próby, a w mianowniku — do grupy o mniejszej wariancji z próby.
Obszary krytyczne i wartości krytyczne
W dalszej części przyjmujemy oznaczenie lewostronnych kwantyli rozkładu F:
Wartość \(F_{p;\nu_1,\nu_2}\) oznacza więc kwantyl rzędu \(p\). Trzeba pamiętać, że różne tablice i programy mogą stosować inną konwencję oznaczeń, zwłaszcza dla wartości „z prawego ogona”.
Test prawostronny
Dla hipotezy:
odrzucamy \(H_0\), gdy:
Test lewostronny
Dla hipotezy:
odrzucamy \(H_0\), gdy:
Test dwustronny — zapis bez zmiany kolejności wariancji
Dla hipotezy:
odrzucamy \(H_0\), gdy iloraz wariancji znajduje się w jednym z dwóch ogonów rozkładu:
albo gdy:
Test dwustronny — większa wariancja w liczniku
W wielu zadaniach najpierw umieszcza się większą wariancję z próby w liczniku. Wtedy wystarczy badać prawy ogon rozkładu F:
Odrzucamy hipotezę o równości wariancji na poziomie istotności \(\alpha\), gdy:
Ten zapis jest równoważny badaniu obu ogonów. Zawiera on jednak ważny warunek: stopnie swobody muszą odpowiadać dokładnie tej grupie, której wariancja znalazła się w liczniku i mianowniku.

Wartość p
Alternatywą dla porównywania z wartością krytyczną jest obliczenie wartości p. Wartość p określa, jak skrajny jest obserwowany iloraz wariancji przy założeniu prawdziwości hipotezy zerowej.
Test prawostronny
Test lewostronny
Test dwustronny
W klasycznym dwustronnym teście F wartość p można wyznaczyć jako podwojone mniejsze z prawdopodobieństw ogonowych:
Jeżeli wcześniej umieścimy większą wariancję w liczniku, można wyznaczyć prawostronne prawdopodobieństwo dla otrzymanego \(F^\ast\), a następnie podwoić je dla testu dwustronnego.
Reguła decyzji jest standardowa:
Przedział ufności dla ilorazu wariancji
Testowanie równości wariancji można połączyć z estymacją przedziałową ilorazu:
Dwustronny przedział ufności \(1-\alpha\) dla ilorazu wariancji ma postać:
W teście dwustronnym na poziomie istotności \(\alpha\) obowiązuje zasada:
- jeżeli liczba \(1\) należy do przedziału ufności dla \(\sigma_1^2/\sigma_2^2\), nie ma podstaw do odrzucenia hipotezy o równości wariancji;
- jeżeli liczba \(1\) nie należy do przedziału, odrzucamy hipotezę o równości wariancji.
Tak jak w innych testach, przedział ufności daje dodatkową informację o kierunku i skali możliwej różnicy. Test odpowiada przede wszystkim na pytanie decyzyjne, a przedział pokazuje, jakie wartości ilorazu wariancji są zgodne z danymi.
Związek z testowaniem różnicy średnich
Test równości wariancji jest często omawiany jako test pomocniczy przed zastosowaniem klasycznego testu t-Studenta dla dwóch niezależnych średnich.
W modelu ze wspólną wariancją zakładamy:
i wykorzystujemy połączoną wariancję z próby. Szczegóły tej procedury znajdują się w części nieznane, ale równe wariancje.
Jeżeli założenie równości wariancji nie jest wiarygodne, stosujemy test Welcha, który nie wymaga homogeniczności wariancji. Zobacz część nieznane i nierówne wariancje — test Welcha.
Test F nie powinien być jedyną „bramką” do wyboru testu średnich
Brak podstaw do odrzucenia równości wariancji nie dowodzi, że wariancje są równe. Z kolei odrzucenie hipotezy może wynikać z dużej liczebności próby albo wrażliwości testu F na brak normalności.
W praktycznych analizach często stosuje się test Welcha jako domyślną, bardziej odporną procedurę porównywania średnich. Klasyczny test t ze wspólną wariancją jest uzasadniony wtedy, gdy równość wariancji wynika z projektu badania lub mocnych przesłanek merytorycznych.

Przykład: test dwustronny równości wariancji
Porównujemy zmienność wyników uzyskanych w dwóch niezależnych grupach. Załóżmy, że obie populacje można uznać za normalne. Otrzymano:
Chcemy sprawdzić, czy wariancje w populacjach są równe. Formułujemy test dwustronny:
Przyjmujemy poziom istotności:
Większą wariancję umieszczamy w liczniku:
Liczba stopni swobody wynosi:
Dla testu dwustronnego stosujemy prawostronną wartość krytyczną odpowiadającą \(\alpha/2=0{,}025\):
Ponieważ:
nie ma podstaw do odrzucenia hipotezy o równości wariancji na poziomie istotności 0,05.
Wniosek należy sformułować ostrożnie: dane z prób nie dostarczają wystarczających podstaw do stwierdzenia, że wariancje w obu populacjach są różne. Nie oznacza to, że udowodniliśmy ich dokładną równość.
Przy wykorzystaniu kalkulatora można dodatkowo wyznaczyć wartość p oraz 95-procentowy przedział ufności dla ilorazu \(\sigma_1^2/\sigma_2^2\). Jeżeli przedział obejmuje wartość 1, otrzymujemy ten sam wniosek co w teście dwustronnym.
Ograniczenia testu F i alternatywy
Klasyczny test F-Snedecora jest bardzo użyteczny w zadaniach opartych na założeniu normalności populacji. Nie należy jednak traktować go jako uniwersalnego testu zmienności dla dowolnych danych.
Przy wyraźnym braku normalności, asymetrii rozkładu lub obecności obserwacji odstających warto rozważyć bardziej odporne procedury. Do najczęściej stosowanych należą test Levene’a oraz jego modyfikacja Browna – Forsythe’a.
Gdy porównujemy więcej niż dwie grupy, problem homogeniczności wariancji można badać między innymi testem Levene’a albo testem Bartletta. Test Bartletta, podobnie jak test F, jest silnie związany z założeniem normalności.
W dalszych materiałach dotyczących testów nieparametrycznych i diagnostyki warto będzie szerzej omówić test Levene’a, test Browna – Forsythe’a oraz ich zastosowanie przed analizą wariancji.
Kalkulatory i programy statystyczne
Wartości krytyczne rozkładu F-Snedecora można odczytywać z tablic, ale wygodniejsze jest korzystanie z kalkulatorów, ponieważ rozkład F zależy od dwóch liczb stopni swobody i łatwo pomylić ich kolejność.
Do obliczeń przyda się tablica rozkładu F-Snedecora i kalkulator. Wartości p, przedziały ufności i testy równości wariancji oferują również między innymi Excel, SPSS, Statistica, Gretl oraz R.
Najczęstsze błędy
- Pomijanie założenia normalności obu populacji. Jest ono kluczowe dla klasycznego testu F.
- Mylenie kolejności stopni swobody. Stopnie swobody muszą odpowiadać wariancji w liczniku i mianowniku.
- Automatyczne umieszczanie większej wariancji w liczniku w teście jednostronnym. Może to zmienić kierunek analizowanej hipotezy.
- Stosowanie prawostronnej wartości krytycznej dla testu dwustronnego bez podzielenia poziomu istotności przez dwa.
- Mylenie konwencji oznaczeń kwantyli F w różnych tablicach i programach.
- Uznawanie braku podstaw do odrzucenia \(H_0\) za dowód równości wariancji.
- Traktowanie testu F jako automatycznej procedury wyboru między testem ze wspólną wariancją a testem Welcha.
- Ignorowanie praktycznego znaczenia różnicy zmienności. Różne wariancje nie zawsze oznaczają problem istotny technologicznie lub ekonomicznie.
Podsumowanie
Test F-Snedecora pozwala sprawdzić, czy dwie normalne populacje mają taką samą wariancję. Jest podstawowym klasycznym narzędziem do badania homogeniczności wariancji w dwóch populacjach.
- Test opiera się na ilorazie wariancji z dwóch niezależnych prób.
- Przy prawdziwości hipotezy o równości wariancji statystyka ma rozkład F-Snedecora.
- Test może być dwustronny, prawostronny albo lewostronny.
- W teście dwustronnym wygodnie jest umieścić większą wariancję z próby w liczniku i porównać iloraz z prawostronną wartością krytyczną dla \(\alpha/2\).
- Wartość 1 należy do przedziału ufności dla ilorazu wariancji wtedy i tylko wtedy, gdy nie ma podstaw do odrzucenia hipotezy o równości wariancji.
- Test F jest użyteczny przy omawianiu klasycznego testu t ze wspólną wariancją, lecz przy wątpliwej homogeniczności wariancji często lepiej zastosować test Welcha.
Utworzono: 23.06.2026
Powiązane artykuły
- Testowanie hipotez statystycznych — hipoteza zerowa, błędy, poziom istotności i moc testu
- Testowanie hipotez dotyczących jednej wariancji
- Testowanie różnicy średnich w dwóch populacjach — próby niezależne i zależne.
Masz problem z tym tematem?
Wszechwiedza.pl pomaga zrozumieć matematykę, statystykę, ekonometrię, badania operacyjne, analizę danych, mechanikę, rachunkowość i wiele innych przedmiotów — spokojnie, konkretnie i krok po kroku.
Zapytaj o pomoc