Wszechnica Wszechwiedzy - Baner

Estymacja wskaźnika struktury (proporcji) — przedział ufności i minimalna liczebność próby

Wskaźnik struktury z próby, czyli po prostu odsetek lub procent badanych jednostek posiadających określoną cechę, jest podstawowym estymatorem proporcji w całej populacji. Sama wartość procentowa nie mówi jednak, jak dokładne jest oszacowanie. W artykule omawiamy estymację punktową i przedziałową proporcji, warunki stosowania klasycznego wzoru, metody dla małych prób oraz sposób wyznaczania minimalnej liczebności próby.

Wskaźniki struktury należą do najczęściej używanych miar statystycznych. Informują, jaka część badanej zbiorowości ma określoną cechę: ilu klientów wybrało dany produkt, jaki odsetek uczniów zdał egzamin, jaka część wyrobów jest wadliwa albo ilu mieszkańców deklaruje określoną opinię.

Obliczanie procentów jest znane już na stosunkowo wczesnym etapie edukacji. W statystyce matematycznej pojawia się jednak pytanie dodatkowe: na ile wskaźnik wyznaczony w próbie jest wiarygodnym przybliżeniem rzeczywistego udziału w całej populacji?

Co estymujemy?

Niech \(p\) oznacza rzeczywisty udział jednostek posiadających określoną cechę w populacji. Parametr ten może przyjmować wartości od \(0\) do \(1\):

\[ 0\leq p\leq1 \]

Przykładowo, jeżeli 30% wszystkich produktów w populacji spełnia określony warunek jakościowy, wtedy:

\[ p=0{,}30 \]

W praktyce wartość \(p\) jest zwykle nieznana. Badamy więc próbę i na jej podstawie budujemy oszacowanie rzeczywistego wskaźnika struktury.

Każdą obserwację można zakodować za pomocą zmiennej zero-jedynkowej:

\[ X_i= \begin{cases} 1, & \text{gdy i-ta jednostka posiada badaną cechę},\\ 0, & \text{gdy i-ta jednostka nie posiada badanej cechy}. \end{cases} \]

Tak zdefiniowana zmienna ma rozkład Bernoulliego z parametrem \(p\):

\[ X_i\sim Bernoulli(p) \]

Wartość oczekiwana takiej zmiennej jest równa proporcji w populacji:

\[ E(X_i)=p \]

Estymacja punktowa wskaźnika struktury

Jeżeli w próbie liczącej \(n\) jednostek badaną cechę posiada \(m\) jednostek, to wskaźnik struktury z próby wynosi:

\[ \hat p=\frac{m}{n} \]

Symbol \(\hat p\) oznacza estymator proporcji populacyjnej \(p\). Ponieważ obserwacje zostały zakodowane jako zera i jedynki, wskaźnik struktury można również zapisać jako średnią z próby:

\[ \hat p=\overline{X} = \frac{1}{n}\sum_{i=1}^{n}X_i \]

Jeżeli w próbie 250 osób 85 odpowiedziało twierdząco, wtedy:

\[ \hat p=\frac{85}{250}=0{,}34 \]

Oznacza to, że w próbie badaną cechę posiadało 34% jednostek. W statystyce opisowej na tym można by zakończyć analizę. W statystyce matematycznej traktujemy jednak wynik 34% jako oszacowanie nieznanego parametru \(p\), a nie jako bezwzględnie pewną informację o całej populacji.

Odsetek nie jest jeszcze pełnym wnioskiem o populacji

Ten sam wskaźnik 34% może pochodzić z próby liczącej 25 osób albo 2500 osób. W obu przypadkach punktowe oszacowanie jest identyczne, ale jego wiarygodność i precyzja są zupełnie różne.

Własności estymatora proporcji

Przy założeniu, że jednostki w próbie są losowane niezależnie z populacji o proporcji \(p\), estymator \(\hat p\) ma bardzo dobre własności.

Przede wszystkim jest estymatorem nieobciążonym:

\[ E(\hat p)=p \]

Gdybyśmy wielokrotnie losowali próby o tej samej liczebności i dla każdej z nich obliczali wskaźnik struktury, średnia z otrzymanych wyników byłaby równa rzeczywistej proporcji w populacji.

Wariancja estymatora proporcji wynosi:

\[ Var(\hat p)=\frac{p(1-p)}{n} \]

Wraz ze wzrostem liczebności próby wariancja maleje. Estymator \(\hat p\) jest również zgodny:

\[ \hat p\xrightarrow{P}p \]

Oznacza to, że przy rosnącej liczebności próby prawdopodobieństwo dużego odchylenia \(\hat p\) od rzeczywistego parametru \(p\) staje się coraz mniejsze.

Błąd standardowy wskaźnika struktury

Pierwiastek z wariancji estymatora proporcji jest jego błędem standardowym:

\[ SE(\hat p) = \sqrt{ \frac{p(1-p)}{n} } \]

W tym wzorze występuje jednak nieznany parametr \(p\). W praktyce zastępujemy go estymatorem \(\hat p\), otrzymując oszacowanie błędu standardowego:

\[ \widehat{SE}(\hat p) = \sqrt{ \frac{\hat p(1-\hat p)}{n} } \]

Warto zauważyć, że nie stosujemy tutaj automatycznie poprawki z mianownikiem \(n-1\), znanej z wariancji klasycznej. Wzór wynika bezpośrednio z rozkładu Bernoulliego i własności średniej z prób zero-jedynkowych.

Błąd standardowy jest największy wtedy, gdy proporcja jest bliska \(0{,}5\). Wynika to z faktu, że iloczyn:

\[ p(1-p) \]

osiąga największą wartość równą \(0{,}25\) właśnie dla \(p=0{,}5\). To będzie ważne przy ustalaniu minimalnej liczebności próby.

Klasyczny przedział ufności dla proporcji

Jeżeli próba jest dostatecznie duża, rozkład estymatora \(\hat p\) można przybliżać rozkładem normalnym. Wtedy dwustronny przedział ufności dla proporcji populacyjnej ma klasyczną postać:

\[ \left( \hat p - u_{\alpha/2} \sqrt{ \frac{\hat p(1-\hat p)}{n} }, \; \hat p + u_{\alpha/2} \sqrt{ \frac{\hat p(1-\hat p)}{n} } \right) \]

Dla współczynnika ufności 95% przyjmujemy \(\alpha=0{,}05\), a wartość krytyczna wynosi:

\[ u_{0{,}025}=1{,}96 \]

Wartość krytyczną można odczytać z tablicy rozkładu normalnego i kalkulatora.

Tak jak przy estymacji średniej, wyższy współczynnik ufności oznacza szerszy przedział. Przedział 99-procentowy będzie szerszy niż przedział 95-procentowy zbudowany na podstawie tej samej próby.

Interpretacja 95-procentowego przedziału ufności

Nie oznacza to, że po obliczeniu konkretnego przedziału parametr \(p\) ma „95% prawdopodobieństwa” znajdować się w środku. Parametr jest ustaloną, choć nieznaną wartością. Poprawna interpretacja dotyczy procedury: gdyby losowanie prób i budowę przedziału powtarzać bardzo wiele razy, około 95% otrzymanych przedziałów zawierałoby prawdziwą wartość \(p\).

Kiedy próba jest dostatecznie duża?

W wielu polskich skryptach i zadaniach spotyka się prostą zasadę, że klasyczny przedział dla proporcji stosuje się dla próby dużej, często przyjmując orientacyjnie:

\[ n\geq100 \]

Jest to wygodna reguła dydaktyczna, ale nie stanowi uniwersalnego warunku matematycznego. O jakości przybliżenia normalnego decyduje nie tylko liczebność całej próby, lecz także liczba jednostek posiadających cechę oraz liczba jednostek jej nieposiadających.

Praktyczny warunek stosowany przy klasycznym przedziale normalnym można zapisać następująco:

\[ n\hat p\geq10 \]
\[ n(1-\hat p)\geq10 \]

Pierwsza nierówność oznacza, że w próbie powinno znaleźć się co najmniej około 10 jednostek posiadających badaną cechę. Druga wymaga co najmniej około 10 jednostek nieposiadających tej cechy.

Przykładowo, próba licząca 100 obserwacji nie musi być automatycznie wystarczająca. Jeżeli cechę posiadają tylko 3 jednostki, mamy:

\[ n\hat p=3 \]

W takiej sytuacji klasyczny symetryczny przedział normalny może działać słabo. Z drugiej strony próba licząca 50 obserwacji, w której 25 jednostek posiada cechę, spełnia oba warunki liczebnościowe.

Mała próba i rzadkie zdarzenia

Jeżeli próba jest mała albo liczba sukcesów lub porażek jest niewielka, klasyczny przedział normalny może prowadzić do błędnych lub mało wiarygodnych wyników. Szczególnie niebezpieczne są sytuacje, w których \(\hat p\) jest bardzo bliskie \(0\) albo \(1\).

Klasyczny wzór może wtedy dać granicę ujemną albo większą od \(1\), mimo że proporcja z definicji musi należeć do przedziału \([0;1]\). Proste „obcięcie” wyniku do zera lub jedności nie usuwa problemu metody.

W takich sytuacjach stosuje się przedziały oparte na dokładnym rozkładzie dwumianowym, na przykład przedział Cloppera – Pearsona, albo bardziej nowoczesne przedziały wynikowe, takie jak przedział Wilsona. Są one zwykle wyznaczane przez program statystyczny, kalkulator lub tablice.

W starszych podręcznikach i zbiorach zadań można spotkać również tablicowe procedury dla małej próby, oparte na odpowiednio przekształconej statystyce. Warto znać istnienie takich metod, ale w typowych zadaniach podstawowym narzędziem pozostaje klasyczny przedział normalny dla próby spełniającej odpowiednie warunki liczebnościowe.

Przykład: 95-procentowy przedział ufności dla proporcji

W reprezentatywnej próbie 600 osób zapytano o posiadanie określonej cechy. Odpowiedź twierdzącą wskazały 222 osoby.

Krok 1. Wskaźnik struktury z próby

\[ n=600 \]
\[ m=222 \]
\[ \hat p=\frac{222}{600}=0{,}37 \]

W próbie badaną cechę posiada 37% jednostek.

Krok 2. Sprawdzenie warunków

\[ n\hat p=600\cdot0{,}37=222 \]
\[ n(1-\hat p)=600\cdot0{,}63=378 \]

W próbie występuje zarówno więcej niż 10 sukcesów, jak i więcej niż 10 braku cechy. Możemy więc zastosować klasyczne przybliżenie normalne.

Krok 3. Błąd standardowy

\[ \widehat{SE}(\hat p) = \sqrt{ \frac{0{,}37\cdot0{,}63}{600} } \approx0{,}0197 \]

Krok 4. Margines błędu

Dla 95-procentowego przedziału ufności:

\[ u_{0{,}025}=1{,}96 \]
\[ d = 1{,}96\cdot0{,}0197 \approx0{,}0386 \]

Krok 5. Przedział ufności

\[ \left( 0{,}37-0{,}0386, \; 0{,}37+0{,}0386 \right) \]
\[ (0{,}3314;\;0{,}4086) \]

Po zapisaniu wyniku w procentach otrzymujemy:

\[ (33{,}14\%;\;40{,}86\%) \]

Możemy więc powiedzieć, że na poziomie ufności 95% rzeczywisty udział jednostek posiadających badaną cechę w populacji szacujemy na przedział od około 33,1% do 40,9%.

Minimalna liczebność próby

W dobrze zaprojektowanym badaniu liczebność próby nie powinna być wybierana przypadkowo. Można ją zaplanować jeszcze przed rozpoczęciem zbierania danych, określając oczekiwany współczynnik ufności oraz maksymalny dopuszczalny margines błędu.

Niech \(d\) oznacza dopuszczalny margines błędu, a \(\tilde p\) — przewidywaną proporcję w populacji. Wtedy minimalną liczebność próby dla klasycznego przedziału normalnego wyznacza wzór:

\[ n \geq \frac{ u_{\alpha/2}^{\,2} \tilde p(1-\tilde p) }{ d^2 } \]

Otrzymany wynik należy zawsze zaokrąglić w górę do liczby całkowitej.

Gdy mamy wcześniejsze dane

Jeżeli istnieje wiarygodne wcześniejsze badanie, dane historyczne albo próbne badanie pilotażowe, możemy przyjąć uzyskany wcześniej wskaźnik struktury jako \(\tilde p\).

Załóżmy, że wcześniejsze badanie wskazuje proporcję zbliżoną do 30%, czyli:

\[ \tilde p=0{,}30 \]

Chcemy otrzymać 95-procentowy przedział ufności z marginesem błędu nie większym niż 4 punkty procentowe:

\[ d=0{,}04 \]
\[ n \geq \frac{ 1{,}96^2 \cdot0{,}30 \cdot0{,}70 }{ 0{,}04^2 } \approx504{,}21 \]

Minimalna liczebność próby wynosi więc:

\[ n=505 \]

Gdy nie znamy oczekiwanej proporcji

Jeżeli nie mamy żadnej rozsądnej informacji o oczekiwanej wartości proporcji, przyjmujemy konserwatywnie:

\[ \tilde p=0{,}5 \]

Jest to wartość najmniej korzystna pod względem wymaganej liczebności próby, ponieważ maksymalizuje iloczyn:

\[ \tilde p(1-\tilde p) \] 

Dla współczynnika ufności 95% oraz dopuszczalnego błędu 4 punktów procentowych otrzymujemy:

\[ n \geq \frac{ 1{,}96^2 \cdot0{,}5 \cdot0{,}5 }{ 0{,}04^2 } \approx600{,}25 \]

Po zaokrągleniu w górę należy więc przebadać co najmniej:

\[ n=601 \]

Próba pilotażowa czy założenie p = 0,5?

Próba pilotażowa jest przydatna wtedy, gdy oczekujemy, że badana cecha występuje bardzo rzadko albo bardzo często. Pozwala wtedy lepiej dopasować plan badania do rzeczywistej sytuacji.

Jeżeli nie mamy żadnych danych wcześniejszych, przyjęcie \(\tilde p=0{,}5\) jest bezpieczne, ponieważ daje największą potrzebną liczebność próby. Nie grozi więc niedoszacowaniem wymaganej próby z powodu zbyt optymistycznego założenia.

Powyższe wzory dotyczą populacji bardzo dużej albo sytuacji, w której losowana próba stanowi niewielką część całej populacji. Gdy badamy znaczną część skończonej, znanej populacji, można dodatkowo stosować poprawkę na skończoną populację.

Najczęstsze błędy przy estymacji proporcji

Podsumowanie

Wskaźnik struktury z próby jest podstawowym estymatorem proporcji populacyjnej. Pozwala łatwo uzyskać oszacowanie punktowe, ale dopiero przedział ufności pokazuje niepewność wynikającą z losowego doboru próby.

Powiązane artykuły

Masz problem z tym tematem?

Wszechwiedza.pl pomaga zrozumieć matematykę, statystykę, ekonometrię, badania operacyjne, analizę danych, mechanikę, rachunkowość i wiele innych przedmiotów — spokojnie, konkretnie i krok po kroku. 

Zapytaj o pomoc