Testowanie hipotez dotyczących wskaźnika struktury w jednej populacji
Testowanie hipotez dotyczących wskaźnika struktury pozwala sprawdzić, czy udział określonej cechy w populacji jest zgodny z wartością deklarowaną, wymaganą przez normę albo przyjętą w badaniu jako punkt odniesienia. W artykule omawiamy test dla jednej proporcji: hipotezy jedno- i dwustronne, warunki stosowania przybliżenia normalnego, statystykę testową, wartość p oraz dokładny test dwumianowy dla małych prób.
Wskaźnik struktury opisuje udział jednostek posiadających określoną cechę w całej zbiorowości. Może oznaczać odsetek klientów zadowolonych z usługi, udział produktów wadliwych, procent osób popierających danego kandydata, udział zdających egzamin albo częstość występowania określonego zdarzenia.
W praktyce sama wartość wskaźnika obliczona w próbie nie wystarcza. Jeżeli w próbie 59% respondentów deklaruje określoną opinię, pojawia się pytanie: czy rzeczywisty udział w całej populacji różni się od 50%, czy zaobserwowana różnica może być wyłącznie skutkiem losowego doboru próby?
Do odpowiedzi na takie pytania służy test dotyczący wskaźnika struktury w jednej populacji. Najczęściej opiera się on na przybliżeniu normalnym rozkładu proporcji z próby. W przypadku małych prób lub bardzo małych albo bardzo dużych proporcji stosuje się dokładne metody dwumianowe.
Ogólne pojęcia, takie jak hipoteza zerowa, poziom istotności, wartość p, błędy pierwszego i drugiego rodzaju oraz moc testu, zostały omówione w artykule Testowanie hipotez statystycznych.
Co testujemy?
Niech \(X\) oznacza liczbę jednostek posiadających badaną cechę w próbie o liczebności \(n\). Jeżeli każda obserwacja może przyjąć jedną z dwóch wartości, na przykład „tak” albo „nie”, „wadliwy” albo „niewadliwy”, „zdany” albo „niezdany”, w populacji interesuje nas prawdopodobieństwo sukcesu:
Parametr \(p\) jest jednocześnie populacyjnym wskaźnikiem struktury, czyli udziałem jednostek posiadających badaną cechę.
Jeżeli w próbie zaobserwowano \(m\) sukcesów, wskaźnik struktury z próby wynosi:
Test polega na porównaniu nieznanego wskaźnika populacyjnego \(p\) z wartością hipotetyczną:
Wartość \(p_0\) może wynikać z deklaracji producenta, normy jakościowej, wcześniejszego badania, wymaganego poziomu skuteczności albo założenia przyjętego przez badacza.
Wskaźnik struktury i proporcja populacyjna
W języku statystyki opisowej mówi się zwykle o wskaźniku struktury, czyli udziale jednostek określonego typu w całej zbiorowości. W języku rachunku prawdopodobieństwa i statystyki matematycznej ten sam parametr oznacza się najczęściej literą \(p\) i nazywa proporcją populacyjną.
Przykłady:
- odsetek produktów wadliwych w całej produkcji,
- udział osób popierających określone rozwiązanie,
- proporcja klientów dokonujących zakupu po kampanii reklamowej,
- odsetek studentów, którzy zdali egzamin,
- udział pacjentów reagujących pozytywnie na terapię.
W dalszej części symbolem \(p\) oznaczamy wskaźnik struktury w populacji, a symbolem \(\hat p\) — wskaźnik obliczony w próbie.
Hipotezy jedno- i dwustronne
Najczęściej hipoteza zerowa ma postać:
Postać hipotezy alternatywnej zależy od pytania badawczego.
Test dwustronny
Stosujemy go wtedy, gdy interesuje nas każda różnica względem wartości referencyjnej. Przykład: producent deklaruje, że odsetek wadliwych produktów wynosi 3%, a kontrola jakości sprawdza, czy rzeczywisty odsetek różni się od tej wartości w dowolnym kierunku.
Test prawostronny
Test prawostronny ma zastosowanie na przykład wtedy, gdy chcemy sprawdzić, czy odsetek produktów wadliwych przekracza dopuszczalny poziom albo czy poparcie dla określonego rozwiązania wzrosło ponad wartość referencyjną.
Test lewostronny
Test lewostronny stosujemy wtedy, gdy interesuje nas spadek proporcji, na przykład zmniejszenie udziału produktów wadliwych poniżej wcześniejszego poziomu.
Kierunek testu wybieramy przed analizą danych
W testach jednostronnych kierunek hipotezy alternatywnej powinien wynikać z celu badania. Nie należy wybierać testu prawostronnego albo lewostronnego dopiero po zobaczeniu, czy wskaźnik z próby \(\hat p\) okazał się większy czy mniejszy od \(p_0\).
Kiedy można stosować test normalny?
Klasyczny test dla jednej proporcji opiera się na przybliżeniu normalnym rozkładu proporcji z próby. Jest ono wiarygodne wtedy, gdy oczekiwana liczba sukcesów i oczekiwana liczba porażek przy założeniu prawdziwości hipotezy zerowej są dostatecznie duże:
oraz:
W podręcznikach spotyka się różne praktyczne progi, na przykład co najmniej 5 albo co najmniej 10 dla obu tych wartości. Nie jest to bezwzględne prawo matematyczne, lecz reguła oceny jakości przybliżenia normalnego.
Ważne: warunek sprawdzamy względem wartości hipotetycznej \(p_0\), ponieważ to właśnie przy założeniu \(H_0\) wyznaczamy rozkład statystyki testowej.
Przykładowo, gdy testujemy hipotezę \(H_0:p=0{,}03\) na próbie \(n=50\), otrzymujemy:
Przybliżenie normalne jest wtedy słabe, nawet gdy wskaźnik z próby przypadkowo okaże się bliski wartości 0,50. W takim przypadku właściwszy będzie dokładny test dwumianowy.
Statystyka testowa dla jednej proporcji
Jeżeli warunki przybliżenia normalnego są spełnione, statystyka testowa ma postać:
Przy prawdziwości hipotezy zerowej statystyka \(Z\) ma w przybliżeniu rozkład normalny standaryzowany:
Po podstawieniu danych z próby otrzymujemy wartość obserwowaną:
Równoważnie można zapisać statystykę przez liczbę sukcesów \(m\):
Obie postaci prowadzą do dokładnie tej samej wartości statystyki testowej.
Dlaczego we wzorze występuje \(p_0\), a nie \(\hat p\)?
To jeden z najczęstszych błędów przy testowaniu wskaźnika struktury. We wzorze na statystykę testową występuje:
a nie:
Powód jest prosty: w teście sprawdzamy, jak bardzo wynik próby odbiega od tego, czego należałoby oczekiwać, gdyby hipoteza zerowa była prawdziwa. Jeżeli \(H_0:p=p_0\) jest prawdziwa, wariancja wskaźnika z próby wynosi:
Dlatego błąd standardowy w teście obliczamy właśnie z użyciem \(p_0\).
Test i przedział ufności mogą wykorzystywać różne błędy standardowe
W klasycznym teście dla proporcji stosujemy błąd standardowy liczony pod hipotezą zerową, czyli z \(p_0\). Natomiast w typowym przedziale ufności dla proporcji wykorzystuje się zwykle wartość z próby \(\hat p\), ponieważ przedział ma opisywać nieznany parametr na podstawie zaobserwowanych danych.
Nie wolno automatycznie przenosić jednego wzoru do drugiej procedury.

Obszar krytyczny i wartość krytyczna
Po obliczeniu wartości statystyki porównujemy ją z odpowiednią wartością krytyczną rozkładu normalnego.
Test dwustronny
Odrzucamy hipotezę zerową, gdy:
Test prawostronny
Odrzucamy hipotezę zerową, gdy:
Test lewostronny
Odrzucamy hipotezę zerową, gdy:
Dla poziomu istotności \(\alpha=0{,}05\) wartości krytyczne wynoszą:
dla testu dwustronnego oraz:
dla testu jednostronnego. Wartości można odczytać z tablicy rozkładu normalnego i kalkulatora.

Wartość p
Zamiast korzystać z wartości krytycznej można obliczyć wartość p.
Test prawostronny
Test lewostronny
Test dwustronny
Reguła decyzji jest standardowa:
Wartość p nie jest prawdopodobieństwem, że hipoteza zerowa jest prawdziwa. Oznacza ona, jak skrajny byłby wynik z próby przy założeniu prawdziwości \(H_0\).
Test a przedział ufności dla proporcji
W klasycznym podejściu przybliżony dwustronny przedział ufności dla proporcji ma postać:
W odróżnieniu od statystyki testowej w tym wzorze występuje \(\hat p\), czyli proporcja wyznaczona z próby. Dzieje się tak dlatego, że budujemy przedział dla nieznanego parametru na podstawie danych, a nie opisujemy rozkład statystyki przy założeniu prawdziwości konkretnej hipotezy.
Dla dużych prób test dwustronny na poziomie istotności \(\alpha\) i klasyczny dwustronny przedział ufności \(1-\alpha\) zwykle prowadzą do zgodnych wniosków:
- jeżeli \(p_0\) należy do przedziału ufności, nie ma podstaw do odrzucenia \(H_0\);
- jeżeli \(p_0\) leży poza przedziałem ufności, odrzucamy \(H_0\).
Przy małych próbach oraz proporcjach bliskich 0 lub 1 należy zachować ostrożność. Klasyczny przedział normalny i klasyczny test z mogą wtedy mieć słabe własności przybliżone. W praktyce warto stosować metody dokładne albo bardziej odporne przedziały dla proporcji.
Małe próby i dokładny test dwumianowy
Jeżeli warunki przybliżenia normalnego nie są spełnione, nie należy mechanicznie stosować statystyki \(Z\). Dotyczy to przede wszystkim małych prób oraz sytuacji, w których \(p_0\) jest bliskie 0 albo 1.
Wtedy można zastosować dokładny test dwumianowy. Zakładamy, że liczba sukcesów w próbie ma przy prawdziwości \(H_0\) rozkład:
W teście dokładnym nie zastępujemy rozkładu dwumianowego rozkładem normalnym. Wartość p obliczamy bezpośrednio z prawdopodobieństw odpowiednich wyników dwumianowych.
W teście prawostronnym sumujemy prawdopodobieństwa wyników co najmniej tak dużych jak zaobserwowany. W teście lewostronnym sumujemy prawdopodobieństwa wyników co najmniej tak małych. W przypadku testu dwustronnego szczegółowa definicja dokładnej wartości p może nieznacznie różnić się między programami statystycznymi, dlatego warto podać zastosowaną metodę obliczeń.
Małe próby w kontroli jakości
Dokładny test dwumianowy ma szczególne znaczenie między innymi w kontroli jakości. Jeżeli z małej partii wybieramy niewielką próbę i liczymy liczbę wadliwych produktów, normalne przybliżenie może być niedokładne, zwłaszcza gdy dopuszczalny odsetek wad jest niski.
W typowych zadaniach akademickich dotyczących dużych prób najczęściej stosuje się jednak klasyczny test z dla jednej proporcji.
Przykład: test dwustronny dla wskaźnika struktury
W badaniu opinii publicznej przeprowadzono ankietę wśród 200 osób. Za określonym rozwiązaniem opowiedziało się 118 respondentów.
Chcemy sprawdzić, czy w populacji wskaźnik poparcia różni się od 50%.
Krok 1. Wskaźnik z próby
Krok 2. Hipotezy
Krok 3. Warunki przybliżenia normalnego
Obie wartości są duże, więc przybliżenie normalne jest uzasadnione.
Krok 4. Statystyka testowa
Krok 5. Obszar krytyczny
Przyjmujemy poziom istotności:
Dla testu dwustronnego wartość krytyczna wynosi:
Ponieważ:
odrzucamy hipotezę zerową na poziomie istotności 0,05.
Krok 6. Wartość p
Ponieważ wartość p jest mniejsza od 0,05, metoda wartości p prowadzi do tej samej decyzji.
Krok 7. Kontrola przez przedział ufności
Wartość hipotetyczna \(p_0=0{,}50\) nie należy do przedziału ufności. Potwierdza to decyzję o odrzuceniu hipotezy zerowej.
Wniosek: dane z próby dostarczają podstaw do stwierdzenia, że wskaźnik poparcia w populacji różni się od 50%.
Kalkulatory i programy statystyczne
W klasycznych zadaniach wartość krytyczną można odczytać z tablic rozkładu normalnego. W praktyce wygodniejsze jest korzystanie z kalkulatorów i programów statystycznych, które podają statystykę testową, wartość p oraz przedział ufności dla proporcji.
Do kontroli wartości krytycznych przyda się tablica rozkładu normalnego i kalkulator. Test dla jednej proporcji oraz dokładny test dwumianowy oferują również między innymi Excel, SPSS, Statistica, Gretl, R i inne pakiety statystyczne.
Najczęstsze błędy
- Używanie \(\hat p\) zamiast \(p_0\) w błędzie standardowym statystyki testowej. W teście błąd standardowy liczymy pod hipotezą zerową.
- Sprawdzanie warunku dużej próby na podstawie \(\hat p\), a nie \(p_0\).
- Stosowanie testu normalnego przy małej liczbie oczekiwanych sukcesów albo porażek.
- Mylenie wskaźnika z próby \(\hat p\) z proporcją populacyjną \(p\).
- Wybieranie testu jednostronnego po obejrzeniu danych.
- Interpretowanie wartości p jako prawdopodobieństwa prawdziwości hipotezy zerowej.
- Traktowanie braku podstaw do odrzucenia \(H_0\) jako dowodu, że proporcja w populacji jest dokładnie równa \(p_0\).
- Stosowanie klasycznego przedziału normalnego bez ostrożności przy proporcjach bliskich 0 albo 1.
Podsumowanie
Test dla jednego wskaźnika struktury pozwala sprawdzić, czy udział określonej cechy w populacji jest zgodny z wartością referencyjną.
- Parametr \(p\) oznacza wskaźnik struktury w populacji, a \(\hat p\) — wskaźnik obliczony z próby.
- Przy dużej próbie stosujemy statystykę normalną opartą na różnicy \(\hat p-p_0\).
- W błędzie standardowym testu występuje wartość hipotetyczna \(p_0\), ponieważ rozkład statystyki wyznaczamy przy założeniu prawdziwości \(H_0\).
- Test może być dwustronny, prawostronny albo lewostronny.
- Dla małych prób lub proporcji bliskich 0 albo 1 właściwszy może być dokładny test dwumianowy.
- W teście dwustronnym wartość \(p_0\) należąca do przedziału ufności \(1-\alpha\) odpowiada brakowi podstaw do odrzucenia hipotezy zerowej.
Utworzono: 23.06.2026
Powiązane artykuły
- Testowanie hipotez statystycznych — hipoteza zerowa, błędy, poziom istotności i moc testu
- Testowanie hipotez dotyczących wskaźnika struktury w dwóch populacjach
- Estymacja wskaźnika struktury (proporcji) — przedział ufności i minimalna liczebność próby
- Testowanie hipotez dotyczących średniej w jednej populacji
Masz problem z tym tematem?
Wszechwiedza.pl pomaga zrozumieć matematykę, statystykę, ekonometrię, badania operacyjne, analizę danych, mechanikę, rachunkowość i wiele innych przedmiotów — spokojnie, konkretnie i krok po kroku.
Zapytaj o pomoc