Wszechnica Wszechwiedzy - Baner

Testowanie hipotez dotyczących wskaźnika struktury w jednej populacji

Testowanie hipotez dotyczących wskaźnika struktury pozwala sprawdzić, czy udział określonej cechy w populacji jest zgodny z wartością deklarowaną, wymaganą przez normę albo przyjętą w badaniu jako punkt odniesienia. W artykule omawiamy test dla jednej proporcji: hipotezy jedno- i dwustronne, warunki stosowania przybliżenia normalnego, statystykę testową, wartość p oraz dokładny test dwumianowy dla małych prób.

Wskaźnik struktury opisuje udział jednostek posiadających określoną cechę w całej zbiorowości. Może oznaczać odsetek klientów zadowolonych z usługi, udział produktów wadliwych, procent osób popierających danego kandydata, udział zdających egzamin albo częstość występowania określonego zdarzenia.

W praktyce sama wartość wskaźnika obliczona w próbie nie wystarcza. Jeżeli w próbie 59% respondentów deklaruje określoną opinię, pojawia się pytanie: czy rzeczywisty udział w całej populacji różni się od 50%, czy zaobserwowana różnica może być wyłącznie skutkiem losowego doboru próby?

Do odpowiedzi na takie pytania służy test dotyczący wskaźnika struktury w jednej populacji. Najczęściej opiera się on na przybliżeniu normalnym rozkładu proporcji z próby. W przypadku małych prób lub bardzo małych albo bardzo dużych proporcji stosuje się dokładne metody dwumianowe.

Ogólne pojęcia, takie jak hipoteza zerowa, poziom istotności, wartość p, błędy pierwszego i drugiego rodzaju oraz moc testu, zostały omówione w artykule Testowanie hipotez statystycznych.

Co testujemy?

Niech \(X\) oznacza liczbę jednostek posiadających badaną cechę w próbie o liczebności \(n\). Jeżeli każda obserwacja może przyjąć jedną z dwóch wartości, na przykład „tak” albo „nie”, „wadliwy” albo „niewadliwy”, „zdany” albo „niezdany”, w populacji interesuje nas prawdopodobieństwo sukcesu:

\[ p=P(\text{sukces}) \]

Parametr \(p\) jest jednocześnie populacyjnym wskaźnikiem struktury, czyli udziałem jednostek posiadających badaną cechę.

Jeżeli w próbie zaobserwowano \(m\) sukcesów, wskaźnik struktury z próby wynosi:

\[ \hat p= \frac{m}{n} \]

Test polega na porównaniu nieznanego wskaźnika populacyjnego \(p\) z wartością hipotetyczną:

\[ p_0 \] 

Wartość \(p_0\) może wynikać z deklaracji producenta, normy jakościowej, wcześniejszego badania, wymaganego poziomu skuteczności albo założenia przyjętego przez badacza.

Wskaźnik struktury i proporcja populacyjna

W języku statystyki opisowej mówi się zwykle o wskaźniku struktury, czyli udziale jednostek określonego typu w całej zbiorowości. W języku rachunku prawdopodobieństwa i statystyki matematycznej ten sam parametr oznacza się najczęściej literą \(p\) i nazywa proporcją populacyjną.

Przykłady:

W dalszej części symbolem \(p\) oznaczamy wskaźnik struktury w populacji, a symbolem \(\hat p\) — wskaźnik obliczony w próbie.

Hipotezy jedno- i dwustronne

Najczęściej hipoteza zerowa ma postać:

\[ H_0:p=p_0 \]

Postać hipotezy alternatywnej zależy od pytania badawczego.

Test dwustronny

\[ H_0:p=p_0 \] \[ H_1:p\neq p_0 \] 

Stosujemy go wtedy, gdy interesuje nas każda różnica względem wartości referencyjnej. Przykład: producent deklaruje, że odsetek wadliwych produktów wynosi 3%, a kontrola jakości sprawdza, czy rzeczywisty odsetek różni się od tej wartości w dowolnym kierunku.

Test prawostronny

\[ H_0:p=p_0 \] \[ H_1:p>p_0 \]

Test prawostronny ma zastosowanie na przykład wtedy, gdy chcemy sprawdzić, czy odsetek produktów wadliwych przekracza dopuszczalny poziom albo czy poparcie dla określonego rozwiązania wzrosło ponad wartość referencyjną.

Test lewostronny

\[ H_0:p=p_0 \] \[ H_1:p

Test lewostronny stosujemy wtedy, gdy interesuje nas spadek proporcji, na przykład zmniejszenie udziału produktów wadliwych poniżej wcześniejszego poziomu.

Kierunek testu wybieramy przed analizą danych

W testach jednostronnych kierunek hipotezy alternatywnej powinien wynikać z celu badania. Nie należy wybierać testu prawostronnego albo lewostronnego dopiero po zobaczeniu, czy wskaźnik z próby \(\hat p\) okazał się większy czy mniejszy od \(p_0\).

Kiedy można stosować test normalny?

Klasyczny test dla jednej proporcji opiera się na przybliżeniu normalnym rozkładu proporcji z próby. Jest ono wiarygodne wtedy, gdy oczekiwana liczba sukcesów i oczekiwana liczba porażek przy założeniu prawdziwości hipotezy zerowej są dostatecznie duże:

\[ np_0 \] 

oraz:

\[ n(1-p_0) \]

W podręcznikach spotyka się różne praktyczne progi, na przykład co najmniej 5 albo co najmniej 10 dla obu tych wartości. Nie jest to bezwzględne prawo matematyczne, lecz reguła oceny jakości przybliżenia normalnego.

Ważne: warunek sprawdzamy względem wartości hipotetycznej \(p_0\), ponieważ to właśnie przy założeniu \(H_0\) wyznaczamy rozkład statystyki testowej.

Przykładowo, gdy testujemy hipotezę \(H_0:p=0{,}03\) na próbie \(n=50\), otrzymujemy:

\[ np_0=50\cdot0{,}03=1{,}5 \]

Przybliżenie normalne jest wtedy słabe, nawet gdy wskaźnik z próby przypadkowo okaże się bliski wartości 0,50. W takim przypadku właściwszy będzie dokładny test dwumianowy.

Statystyka testowa dla jednej proporcji

Jeżeli warunki przybliżenia normalnego są spełnione, statystyka testowa ma postać:

\[ Z= \frac{ \hat p-p_0 }{ \sqrt{ \frac{ p_0(1-p_0) }{ n } } } \] 

Przy prawdziwości hipotezy zerowej statystyka \(Z\) ma w przybliżeniu rozkład normalny standaryzowany:

\[ Z\approx N(0,1) \]

Po podstawieniu danych z próby otrzymujemy wartość obserwowaną:

\[ z_{\text{obs}}= \frac{ \hat p-p_0 }{ \sqrt{ \frac{ p_0(1-p_0) }{ n } } } \] 

Równoważnie można zapisać statystykę przez liczbę sukcesów \(m\):

\[ Z= \frac{ m-np_0 }{ \sqrt{ np_0(1-p_0) } } \]

Obie postaci prowadzą do dokładnie tej samej wartości statystyki testowej.

Dlaczego we wzorze występuje \(p_0\), a nie \(\hat p\)?

To jeden z najczęstszych błędów przy testowaniu wskaźnika struktury. We wzorze na statystykę testową występuje:

\[ \sqrt{ \frac{ p_0(1-p_0) }{ n } } \] 

a nie:

\[ \sqrt{ \frac{ \hat p(1-\hat p) }{ n } } \] 

Powód jest prosty: w teście sprawdzamy, jak bardzo wynik próby odbiega od tego, czego należałoby oczekiwać, gdyby hipoteza zerowa była prawdziwa. Jeżeli \(H_0:p=p_0\) jest prawdziwa, wariancja wskaźnika z próby wynosi:

\[ Var(\hat p)= \frac{ p_0(1-p_0) }{ n } \] 

Dlatego błąd standardowy w teście obliczamy właśnie z użyciem \(p_0\).

Test i przedział ufności mogą wykorzystywać różne błędy standardowe

W klasycznym teście dla proporcji stosujemy błąd standardowy liczony pod hipotezą zerową, czyli z \(p_0\). Natomiast w typowym przedziale ufności dla proporcji wykorzystuje się zwykle wartość z próby \(\hat p\), ponieważ przedział ma opisywać nieznany parametr na podstawie zaobserwowanych danych.

Nie wolno automatycznie przenosić jednego wzoru do drugiej procedury.

Schemat porównujący proporcję referencyjną p zero i proporcję z próby p z daszkiem we wzorze na błąd standardowy testu dla jednej proporcji
Wartość p₀ opisuje rozkład statystyki przy prawdziwości hipotezy zerowej, dlatego występuje w mianowniku testu.

Obszar krytyczny i wartość krytyczna

Po obliczeniu wartości statystyki porównujemy ją z odpowiednią wartością krytyczną rozkładu normalnego.

Test dwustronny

Odrzucamy hipotezę zerową, gdy:

\[ |z_{\text{obs}}|> u_{\alpha/2} \]

Test prawostronny

Odrzucamy hipotezę zerową, gdy:

\[ z_{\text{obs}}> u_{\alpha} \]

Test lewostronny

Odrzucamy hipotezę zerową, gdy:

\[ z_{\text{obs}} -u_{\alpha} \]

Dla poziomu istotności \(\alpha=0{,}05\) wartości krytyczne wynoszą:

\[ u_{0{,}025}\approx1{,}96 \]

dla testu dwustronnego oraz:

\[ u_{0{,}05}\approx1{,}645 \]

dla testu jednostronnego. Wartości można odczytać z tablicy rozkładu normalnego i kalkulatora.

Infografika przedstawiająca test dla jednej proporcji, wzór statystyki Z z proporcją referencyjną p zero, warunek dużej próby oraz obszary krytyczne testu dwustronnego i jednostronnego
W teście dla proporcji błąd standardowy obliczamy pod hipotezą zerową, dlatego we wzorze występuje wartość referencyjna p₀, a nie wskaźnik z próby p̂.

Wartość p

Zamiast korzystać z wartości krytycznej można obliczyć wartość p.

Test prawostronny

\[ p= P(Z\geq z_{\text{obs}}) \]

Test lewostronny

\[ p= P(Z\leq z_{\text{obs}}) \]

Test dwustronny

\[ p= 2P(Z\geq|z_{\text{obs}}|) \]

Reguła decyzji jest standardowa:

\[ p\leq\alpha \quad\Longrightarrow\quad \text{odrzucamy }H_0 \]
\[ p>\alpha \quad\Longrightarrow\quad \text{brak podstaw do odrzucenia }H_0 \]

Wartość p nie jest prawdopodobieństwem, że hipoteza zerowa jest prawdziwa. Oznacza ona, jak skrajny byłby wynik z próby przy założeniu prawdziwości \(H_0\).

Test a przedział ufności dla proporcji

W klasycznym podejściu przybliżony dwustronny przedział ufności dla proporcji ma postać:

\[ \left( \hat p - u_{\alpha/2} \sqrt{ \frac{ \hat p(1-\hat p) }{ n } }, \; \hat p + u_{\alpha/2} \sqrt{ \frac{ \hat p(1-\hat p) }{ n } } \right) \]

W odróżnieniu od statystyki testowej w tym wzorze występuje \(\hat p\), czyli proporcja wyznaczona z próby. Dzieje się tak dlatego, że budujemy przedział dla nieznanego parametru na podstawie danych, a nie opisujemy rozkład statystyki przy założeniu prawdziwości konkretnej hipotezy.

Dla dużych prób test dwustronny na poziomie istotności \(\alpha\) i klasyczny dwustronny przedział ufności \(1-\alpha\) zwykle prowadzą do zgodnych wniosków:

Przy małych próbach oraz proporcjach bliskich 0 lub 1 należy zachować ostrożność. Klasyczny przedział normalny i klasyczny test z mogą wtedy mieć słabe własności przybliżone. W praktyce warto stosować metody dokładne albo bardziej odporne przedziały dla proporcji.

Małe próby i dokładny test dwumianowy

Jeżeli warunki przybliżenia normalnego nie są spełnione, nie należy mechanicznie stosować statystyki \(Z\). Dotyczy to przede wszystkim małych prób oraz sytuacji, w których \(p_0\) jest bliskie 0 albo 1.

Wtedy można zastosować dokładny test dwumianowy. Zakładamy, że liczba sukcesów w próbie ma przy prawdziwości \(H_0\) rozkład:

\[ X\sim Bin(n,p_0) \]

W teście dokładnym nie zastępujemy rozkładu dwumianowego rozkładem normalnym. Wartość p obliczamy bezpośrednio z prawdopodobieństw odpowiednich wyników dwumianowych.

W teście prawostronnym sumujemy prawdopodobieństwa wyników co najmniej tak dużych jak zaobserwowany. W teście lewostronnym sumujemy prawdopodobieństwa wyników co najmniej tak małych. W przypadku testu dwustronnego szczegółowa definicja dokładnej wartości p może nieznacznie różnić się między programami statystycznymi, dlatego warto podać zastosowaną metodę obliczeń.

Małe próby w kontroli jakości

Dokładny test dwumianowy ma szczególne znaczenie między innymi w kontroli jakości. Jeżeli z małej partii wybieramy niewielką próbę i liczymy liczbę wadliwych produktów, normalne przybliżenie może być niedokładne, zwłaszcza gdy dopuszczalny odsetek wad jest niski.

W typowych zadaniach akademickich dotyczących dużych prób najczęściej stosuje się jednak klasyczny test z dla jednej proporcji.

Przykład: test dwustronny dla wskaźnika struktury

W badaniu opinii publicznej przeprowadzono ankietę wśród 200 osób. Za określonym rozwiązaniem opowiedziało się 118 respondentów.

Chcemy sprawdzić, czy w populacji wskaźnik poparcia różni się od 50%.

Krok 1. Wskaźnik z próby

\[ n=200 \]
\[ m=118 \]
\[ \hat p= \frac{118}{200} = 0{,}59 \]

Krok 2. Hipotezy

\[ H_0:p=0{,}50 \]
\[ H_1:p\neq0{,}50 \]

Krok 3. Warunki przybliżenia normalnego

\[ np_0=200\cdot0{,}50=100 \]
\[ n(1-p_0)=200\cdot0{,}50=100 \]

Obie wartości są duże, więc przybliżenie normalne jest uzasadnione.

Krok 4. Statystyka testowa

\[ z_{\text{obs}}= \frac{ 0{,}59-0{,}50 }{ \sqrt{ \frac{ 0{,}50(1-0{,}50) }{ 200 } } } \] 
\[ z_{\text{obs}} = \frac{0{,}09}{0{,}03536} \approx 2{,}546 \]

Krok 5. Obszar krytyczny

Przyjmujemy poziom istotności:

\[ \alpha=0{,}05 \]

Dla testu dwustronnego wartość krytyczna wynosi:

\[ u_{0{,}025}=1{,}96 \]

Ponieważ:

\[ |2{,}546|>1{,}96 \]

odrzucamy hipotezę zerową na poziomie istotności 0,05.

Krok 6. Wartość p

\[ p\approx0{,}011 \]

Ponieważ wartość p jest mniejsza od 0,05, metoda wartości p prowadzi do tej samej decyzji.

Krok 7. Kontrola przez przedział ufności

\[ 0{,}59 \pm 1{,}96 \sqrt{ \frac{ 0{,}59(1-0{,}59) }{ 200 } } \] 
\[ (0{,}522;\;0{,}658) \]

Wartość hipotetyczna \(p_0=0{,}50\) nie należy do przedziału ufności. Potwierdza to decyzję o odrzuceniu hipotezy zerowej.

Wniosek: dane z próby dostarczają podstaw do stwierdzenia, że wskaźnik poparcia w populacji różni się od 50%.

Kalkulatory i programy statystyczne

W klasycznych zadaniach wartość krytyczną można odczytać z tablic rozkładu normalnego. W praktyce wygodniejsze jest korzystanie z kalkulatorów i programów statystycznych, które podają statystykę testową, wartość p oraz przedział ufności dla proporcji.

Do kontroli wartości krytycznych przyda się tablica rozkładu normalnego i kalkulator. Test dla jednej proporcji oraz dokładny test dwumianowy oferują również między innymi Excel, SPSS, Statistica, Gretl, R i inne pakiety statystyczne.

Najczęstsze błędy

Podsumowanie

Test dla jednego wskaźnika struktury pozwala sprawdzić, czy udział określonej cechy w populacji jest zgodny z wartością referencyjną.

Powiązane artykuły

Masz problem z tym tematem?

Wszechwiedza.pl pomaga zrozumieć matematykę, statystykę, ekonometrię, badania operacyjne, analizę danych, mechanikę, rachunkowość i wiele innych przedmiotów — spokojnie, konkretnie i krok po kroku. 

Zapytaj o pomoc