Estymacja wartości oczekiwanej (średniej) — estymacja punktowa i przedziałowa
Estymacja wartości oczekiwanej, czyli średniej populacji, pozwala na podstawie danych z próby ocenić przeciętny poziom badanego zjawiska w całej zbiorowości. W artykule omawiamy estymator punktowy średniej, jego własności oraz trzy klasyczne modele budowy przedziału ufności: dla populacji normalnej ze znanym odchyleniem standardowym, dla populacji normalnej z odchyleniem nieznanym oraz dla dużej próby z populacji o dowolnym rozkładzie.
Średnia arytmetyczna jest jedną z najczęściej stosowanych miar opisujących dane. W statystyce matematycznej pojawia się jednak dodatkowe pytanie: czy średnia obliczona z próby dobrze przybliża średnią całej populacji?
Odpowiedź zależy od sposobu doboru próby, jej liczebności, zmienności badanej cechy oraz założeń dotyczących rozkładu populacji. Teoria estymacji pozwala uporządkować te kwestie i zbudować nie tylko jedno oszacowanie średniej, ale również przedział pokazujący niepewność tego oszacowania.
Co estymujemy?
Niech \(X\) oznacza badaną cechę w populacji. Jej wartość oczekiwaną, czyli średnią populacji, oznaczamy symbolem:
Parametr \(\mu\) jest zwykle nieznany. Może oznaczać na przykład średni dochód, średni czas oczekiwania na usługę, średni wynik egzaminu, przeciętną masę produktu albo przeciętne zużycie energii.
Losujemy próbę o liczebności \(n\):
Po przeprowadzeniu badania otrzymujemy konkretne wartości:
Na ich podstawie chcemy oszacować nieznaną średnią populacji \(\mu\).
Estymacja punktowa średniej populacji
Najbardziej naturalnym estymatorem wartości oczekiwanej jest średnia arytmetyczna z próby:
Po podstawieniu zaobserwowanych danych otrzymujemy oszacowanie punktowe średniej populacji:
Jeżeli przykładowo średnia liczba punktów uzyskanych przez 20 osób wynosi 72,4, to 72,4 jest oszacowaniem średniego wyniku w całej populacji, z której pochodziła próba.
Czy średnia z próby jest zawsze „najlepsza”?
Średnia z próby jest standardowym i bardzo ważnym estymatorem średniej populacji. Jest nieobciążona i zgodna, a w klasycznym modelu normalnym ma szczególnie dobre własności. Nie istnieje jednak jeden estymator, który byłby bezwarunkowo najlepszy w każdym możliwym modelu i według każdego kryterium jakości.
Własności średniej z próby jako estymatora
Zakładając, że obserwacje w próbie są niezależne i pochodzą z populacji o średniej \(\mu\) oraz wariancji \(\sigma^2\), dla średniej z próby zachodzą zależności:
Pierwszy wzór oznacza, że średnia z próby jest nieobciążonym estymatorem średniej populacji. Gdybyśmy wielokrotnie losowali próby o tej samej liczebności i za każdym razem liczyli średnią, średnia z tych oszacowań byłaby równa \(\mu\).
Drugi wzór mówi, że wariancja średniej z próby maleje wraz ze wzrostem \(n\). Im większa próba, tym mniejsza jest losowa zmienność oszacowania.
Odchylenie standardowe rozkładu średniej z próby nosi nazwę błędu standardowego średniej:
Jeżeli populacja ma skończoną wariancję, średnia z próby jest również estymatorem zgodnym:
Oznacza to, że wraz ze wzrostem liczebności próby prawdopodobieństwo dużego odchylenia średniej z próby od rzeczywistej średniej populacji staje się coraz mniejsze.
Czym jest przedział ufności?
Estymacja punktowa daje jedną liczbę, na przykład \(\overline{x}=72{,}4\). Nie pokazuje jednak, jak duża jest niepewność związana z losowym doborem próby.
Przedział ufności uzupełnia oszacowanie punktowe o zakres wartości, który został wyznaczony na podstawie danych, założeń modelu oraz przyjętego współczynnika ufności.
Najczęściej przyjmuje się współczynnik ufności równy \(1-\alpha=0{,}95\), czyli 95%. W klasycznej interpretacji oznacza to, że gdyby tę samą procedurę powtarzać bardzo wiele razy na niezależnych próbach, około 95% otrzymanych przedziałów zawierałoby prawdziwą średnią populacji \(\mu\).
Wyższy współczynnik ufności wymaga większej ostrożności, dlatego prowadzi do szerszego przedziału. Przedział 99-procentowy jest zatem szerszy niż przedział 95-procentowy zbudowany na podstawie tych samych danych.
Dlaczego nie żądać przedziału ufności 100%?
W klasycznych wzorach dla przedziałów ufności, gdy współczynnik ufności dąży do 100%, odpowiednia wartość krytyczna dąży do nieskończoności. Nie można więc otrzymać użytecznego skończonego przedziału ufności o pokryciu równym dokładnie 100%.
Dla średniej populacji zbiorem zawierającym ją na pewno jest całe \(\mathbb{R}\). Taki „przedział” byłby formalnie bezbłędny, ale całkowicie nieużyteczny. Dla wariancji lub odchylenia standardowego analogicznym zbiorem byłby przedział \([0,\infty)\). Przedziały ufności zawsze są więc kompromisem między pewnością a informacyjnością.
Trzy modele estymacji przedziałowej średniej
W klasycznych zadaniach dotyczących średniej populacji najczęściej spotyka się trzy modele. Różnią się one założeniami dotyczącymi rozkładu populacji, znajomości odchylenia standardowego w tejże populacji oraz liczebności próby.
| Model | Założenia | Rozkład wartości krytycznej |
|---|---|---|
| 1 | Populacja normalna, \(\sigma\) znane. | Normalny standaryzowany. |
| 2 | Populacja normalna, \(\sigma\) nieznane. | t-Studenta z \(n-1\) stopniami swobody. |
| 3 | Populacja o dowolnym rozkładzie, próba duża, wariancja skończona. | W przybliżeniu normalny standaryzowany. |
W modelach drugim i trzecim odchylenie standardowe populacji jest nieznane. Zastępujemy je wtedy wielkością obliczoną z próby.
Model 1: populacja normalna i znane odchylenie standardowe
Zakładamy, że populacja ma rozkład normalny:
oraz że odchylenie standardowe populacji \(\sigma\) jest znane. Nie chodzi tutaj o odchylenie obliczone z bieżącej próby, lecz o wartość znaną wcześniej, na przykład z dobrze kontrolowanego procesu technologicznego albo z wiarygodnych danych historycznych.
Wtedy statystyka:
ma rozkład normalny standaryzowany \(N(0,1)\). Dwustronny przedział ufności dla średniej populacji ma postać:
Symbol \(u_{\alpha/2}\) oznacza dodatnią wartość krytyczną rozkładu normalnego spełniającą warunek:
Dla współczynnika ufności 95% mamy \(\alpha=0{,}05\), a wartość krytyczna wynosi około \(u_{0{,}025}=1{,}96\). Można ją odczytać z tablicy rozkładu normalnego i kalkulatora.
Model 2: populacja normalna i nieznane odchylenie standardowe
Ten model jest bardzo częsty w zadaniach. Zakładamy nadal normalność populacji, ale nie znamy jej odchylenia standardowego \(\sigma\). Zastępujemy je odchyleniem wyznaczonym na podstawie próby.
Najpierw definiujemy skorygowaną wariancję z próby:
oraz odpowiadające jej odchylenie standardowe:
Jeżeli populacja ma rozkład normalny, to statystyka:
ma rozkład t-Studenta z \(n-1\) stopniami swobody. Stąd dwustronny przedział ufności dla średniej ma postać:
Wartość \(t_{\alpha/2;n-1}\) odczytuje się dla \(n-1\) stopni swobody. Dla współczynnika ufności 95% korzystamy z wartości odpowiadającej prawdopodobieństwu \(\alpha/2=0{,}025\) w prawym ogonie. Wartości krytyczne można odczytać z tablicy rozkładu t-Studenta i kalkulatora.
Mała próba wymaga założenia normalności
Jeżeli próba jest mała, a odchylenie standardowe populacji jest nieznane, klasyczny przedział oparty na rozkładzie t-Studenta wymaga założenia, że badana populacja ma rozkład normalny.
W zadaniu, które nie podaje tego wprost, ale prowadzi do użycia rozkładu t-Studenta, warto napisać: „Przyjmujemy założenie, że badana populacja ma rozkład normalny”. Pominięcie tego założenia może być uznane za błąd merytoryczny, zwłaszcza przy niewielkiej liczebności próby.
Model 3: dowolny rozkład populacji i duża próba
W trzecim modelu nie zakładamy, że populacja ma rozkład normalny. Wymagamy jednak, aby jej wariancja była skończona oraz aby próba była dostatecznie duża.
Podstawą jest centralne twierdzenie graniczne. Mówi ono, że dla dużych prób rozkład odpowiednio wystandaryzowanej średniej z próby jest w przybliżeniu normalny:
Ponieważ \(\sigma\) jest najczęściej nieznane, w praktyce zastępujemy je odchyleniem standardowym wyznaczonym z próby. Otrzymujemy przybliżony przedział ufności:
W podręcznikowych zadaniach często przyjmuje się orientacyjnie, że próba jest duża, gdy \(n\geq30\). Nie jest to jednak sztywna granica matematyczna. Jeżeli rozkład populacji jest silnie asymetryczny, ma bardzo ciężkie ogony albo zawiera liczne obserwacje nietypowe, nawet próba o liczebności 30 może nie wystarczyć do uzyskania dobrego przybliżenia normalnego.
Jeżeli próba jest mała, populacja nie ma rozkładu normalnego, a normalności nie wolno założyć, nie należy automatycznie stosować klasycznego przedziału t-Studenta. W takiej sytuacji potrzebne mogą być metody bardziej zaawansowane, na przykład procedury bootstrapowe lub metody nieparametryczne.
Dlaczego raz występuje n, a innym razem n − 1?
To jeden z najczęstszych powodów pomyłek w zadaniach dotyczących estymacji średniej. Problem wynika z tego, że różne podręczniki i programy mogą oznaczać symbolem \(s\) różnie zdefiniowane odchylenie standardowe z próby.
Odchylenie standardowe obliczone z mianownikiem \(n\) zapisujemy tutaj jako:
Natomiast odchylenie standardowe oparte na skorygowanej wariancji z mianownikiem \(n-1\) oznaczamy jako \(S\):
Między tymi wielkościami zachodzi zależność:
Po podzieleniu przez pierwiastek z liczebności próby otrzymujemy:
Oznacza to, że przedział ufności w modelu drugim można zapisać na dwa równoważne sposoby:
albo:
Praktyczna zasada
Najpierw sprawdź, jak w zadaniu lub programie zdefiniowano odchylenie standardowe. Jeżeli masz \(S\) oparte na mianowniku \(n-1\), dzielisz je przez \(\sqrt n\). Jeżeli masz \(s_n\) oparte na mianowniku \(n\), dzielisz je przez \(\sqrt{n-1}\).
Nie należy mieszać tych zapisów. Użycie \(s_n/\sqrt n\) prowadziłoby do zaniżenia błędu standardowego, a więc do zbyt wąskiego przedziału ufności.
Warto też pamiętać o terminologii. Skorygowana wariancja \(S^2\) jest nieobciążonym estymatorem wariancji \(\sigma^2\), ale jej pierwiastek \(S\) nie jest w ścisłym sensie nieobciążonym estymatorem odchylenia standardowego \(\sigma\). Mimo to w praktyce \(S\) jest powszechnie stosowane jako standardowe oszacowanie rozproszenia populacji.
Przykład: 95-procentowy przedział ufności dla średniej
W próbie dziesięciu obserwacji otrzymano wartości:
Zakładamy, że próba pochodzi z populacji o rozkładzie normalnym. Odchylenie standardowe populacji jest nieznane. Stosujemy więc model drugi, oparty na rozkładzie t-Studenta.
Krok 1. Liczebność i średnia z próby
Krok 2. Skorygowane odchylenie standardowe
Suma kwadratów odchyleń od średniej wynosi:
Skorygowana wariancja z próby:
Krok 3. Wartość krytyczna
Przy współczynniku ufności 95% mamy:
Liczba stopni swobody wynosi:
Z tablicy rozkładu t-Studenta odczytujemy:
Krok 4. Margines błędu
Krok 5. Przedział ufności
Otrzymujemy 95-procentowy przedział ufności dla średniej populacji równy w przybliżeniu \((14{,}77;\;18{,}23)\).
Gdyby w tym samym przykładzie korzystać z odchylenia obliczonego z mianownikiem \(n\), otrzymalibyśmy \(s_n\approx2{,}2913\). Należałoby wtedy użyć równoważnego błędu standardowego:
Jest to dokładnie ta sama wartość co:
Najczęstsze błędy przy estymacji średniej
- Używanie rozkładu normalnego zamiast t-Studenta przy małej próbie i nieznanym odchyleniu standardowym populacji.
- Pomijanie założenia normalności populacji w modelu z małą próbą.
- Mylenie odchylenia standardowego populacji \(\sigma\) z odchyleniem standardowym wyznaczonym z próby.
- Stosowanie wartości krytycznej \(t_{\alpha;n-1}\) zamiast \(t_{\alpha/2;n-1}\) w przedziale dwustronnym.
- Nieprawidłowe mieszanie mianowników \(n\) i \(n-1\) przy obliczaniu błędu standardowego.
- Traktowanie progu \(n=30\) jako bezwzględnego prawa matematycznego.
- Interpretowanie 95-procentowego przedziału ufności jako dosłownego 95-procentowego prawdopodobieństwa dla już ustalonego parametru.
Podsumowanie
Średnia arytmetyczna z próby jest podstawowym estymatorem wartości oczekiwanej populacji. Jest nieobciążona, zgodna, a jej zmienność maleje wraz ze wzrostem liczebności próby.
- Gdy populacja ma rozkład normalny i znamy \(\sigma\), stosujemy rozkład normalny standaryzowany.
- Gdy populacja ma rozkład normalny, ale \(\sigma\) jest nieznane, stosujemy rozkład t-Studenta z \(n-1\) stopniami swobody.
- Gdy populacja ma dowolny rozkład, ale próba jest duża i wariancja skończona, korzystamy z przybliżenia normalnego wynikającego z centralnego twierdzenia granicznego.
- Przedział ufności staje się szerszy, gdy rośnie współczynnik ufności, zmienność danych lub gdy maleje liczebność próby.
- Przy stosowaniu wzorów trzeba zawsze sprawdzić, czy odchylenie standardowe zostało obliczone z mianownikiem \(n\), czy z mianownikiem \(n-1\).
Powiązane artykuły
- Średnia niejedno ma imię
- Estymacja statystyczna — populacja, próba, estymatory i ich własności
- Odchylenie standardowe i wariancja, jako miary rozrzutu
- Miary zróżnicowania w statystyce opisowej — rozstęp, wariancja i odchylenie standardowe
- Miary statystyczne w statystyce opisowej
Masz problem z tym tematem?
Wszechwiedza.pl pomaga zrozumieć matematykę, statystykę, ekonometrię, badania operacyjne, analizę danych, mechanikę, rachunkowość i wiele innych przedmiotów — spokojnie, konkretnie i krok po kroku.
Zapytaj o pomoc