Średnia niejedno ma imię
Wprowadzenie
Średnia arytmetyczna, to najpowszechniej znana miara statystyki opisowej. Znana i w miarę dobrze rozumiana także i przez najbardziej odżegnujące się od matematycznych sympatii osoby. Stosowana bardzo szeroko zarówno, jako miara zbiorowości, jak i estymator wartości oczekiwanej w populacji generalnej. Jednak statystyka zna nie tylko średnią arytmetyczną. Znane i używane są również inne rodzaje średniej, jak średnia harmoniczna, średnia geometryczna. Wybór konkretnej średniej zależy od specyfiki zbiorowości i cechy, dla której średnia jest obliczana, natomiast sposób obliczania tej miary zależy od rodzaju szeregu statystycznego.
Co to w ogóle jest średnia
Najkrócej mówiąc, średnia to pewna charakterystyka, jest to każda funkcja określona na zbiorze danych $x_1, x_2, ..., x_n$ spełniająca warunek:
$$\min\{x_1, x_2, ..., x_n \} \leq \mu(x_1, x_2, ..., x_n) \leq \max\{x_1, x_2, ..., x_n \} \tag 1 \label {eq:1}$$
Oprócz tego względem każdej ze zmiennych $x_i$ średnia musi być funkcją niemalejącą. Jak więc widać, wiele nie potrzeba, aby dany parametr mógł być nazywany średnią. W tym kontekście, średnią jest zarówno wartość najmniejsza, jak i największa spośród danych, gdyż spełniają one warunek (1). Średnią jest także dominanta, czy mediana a nawet każdy kwantyl1.
Średnia arytmetyczna
Średnia arytmetyczna, jako klasyczna miara tendencji centralnej
Średnia arytmetyczna jest najbardziej znanym przykładem klasycznej miary tendencji centralnej. Miary klasyczne, to takie miary statystyczne, na wartość których wpływają wszystkie dane w szeregu. Zmiana pojedynczej danej zawsze wpływa na wartość miary.
Miara tendencji centralnej oznacza, że wskazuje na przeciętność. Oprócz określenia miara tendencji centralnej, stosuje się także często określenie miara położenia, co jest również trafnym określeniem w stosunku do średniej i nieco szerszym, gdyż w zakres miar położenia wchodzą także kwartyle i kwantyle innych rzędów. W najszerszym ujęciu można powiedzieć, że praktycznie każda miara położenia jest średnią w rozumieniu warunku (1).
Obliczanie średniej w szczegółowym szeregu statystycznym
Średnia arytmetyczna w szczegółowym szeregu statystycznym, to właśnie ta średnia, najszerzej i najlepiej rozumiana w języku potocznym. Sposób jej obliczania można najkrócej streścić, jako dodaj wszystkie wartości i podziel przez ich ilość. Sposób ten zapisuje się najczęściej za pomocą formuły:
$$\bar x = {{x_1 + x_2 + ... + x_n} \over n} \tag {2a} \label {eq:{2a}}$$
Korzystając z operatora sumowania, wzór ten zapisuje się w postaci najczęściej spotykanej w podręcznikach statystyki opisowej:
$$\bar x = {{1 \over n} \cdot \sum_{i = 1}^n x_i} \tag {2b} \label {eq:{2b}}$$
Operator sumowania oznacza, że podstawiamy za indeks przy zmiennej $x$ kolejne wartości $i$ od 1 aż do $n$ i wszystkie kolejno otrzymywane wartości $x_1$, $x_2$, …, $x_n$ sumujemy. Z kolei oznaczenie $\bar x$ to powszechnie przyjęte w statystyce opisowej oznaczenie średniej arytmetycznej, za pomocą poziomej kreski nad nazwą zmiennej.
Przykład 1
Akwizytor w kolejnych miesiącach, od stycznia do grudnia zarobił następujące kwoty prowizji: 2480; 6731; 1128; 5355; 7846; 972; 1571; 9903; 7525; 5644; 2781; 6702. Obliczyć średnią wysokość prowizji akwizytora w miesiącu.
$$\bar x = {{2480 + 6731 + 1128 + 5355 + 7846 + 972 + 1571 + 18903 + 7525 + 5644 + 2781 + 6702} \over 12}$$
$$\bar x = {{67638} \over 12} = 5636,50$$
Tak więc średnia, miesięczna kwota uzyskiwanej przez akwizytora prowizji, wyniosła 5636,50 zł.
Co to oznacza w praktyce? Gdyby nasz akwizytor osiągał regularne miesięczne prowizje, to, gdyby w każdym miesiącu jego prowizja wyniosła 5636,50 zł, można by powiedzieć, że „wyszłoby na to samo”. Taka jest właśnie idea średniej arytmetycznej.
Niektórzy nauczyciele akademiccy tłumaczą studentom, że średnia nie nadaje się dobrze do wielkości silnie zróżnicowanych. Tam, gdzie pojawiają się wartości odstające – tak, jak u nas w jednym miesiącu prowizja wyniosła aż 18903 zł. Nie jest to jednak do końca prawda. Bez względu na to, jak zróżnicowane są wartości i jak bardzo niektóre z nich odstają od reszty, średnia jest zawsze właściwą miarą, dla wielkości, które podlegają sumowaniu, czyli wielkości (zmiennych statystycznych), których suma ma sens praktyczny.
W naszym przypadku, niezależnie od tego, czy nasz akwizytor w danym miesiącu zarobi sto, czy milion złotych, to wszystko wpada do jego i kieszeni i wpływa na średni roczny dochód. Tak więc średnia w tym przypadku zawsze będzie odpowiednią miarą przeciętności.
Przykład 2
Jeśli jednak np. będziemy chcieli ustalić przeciętną cenę zagranicznej wycieczki spośród następujących ofert (ceny za uczestnika, dane uszeregowano od najmniejszej do największej ceny za osobę): 2500; 2850; 2900; 3200; 3350; 3600; 3700; 3800; 25700; 31000, to wówczas średnia wyniesie:
$$\bar x = {{2500 + 2850 + 2900 + 3200 + 3350 + 3600 + 3700 + 3800 + 25700 + 31000} \over 10}$$
$$\bar x = {{82600} \over 10} = 8260$$
Otrzymamy przeciętną cenę wycieczki 8260. Czy jednak w takim wypadku będzie to dobra ocena przeciętności? Otóż – zależy. Jeśli będą to np. kwoty wycieczek sprzedanych przez biuro podróży w danym tygodniu, to można powiedzieć, że średnio biuro uzyskało 8260 zł za jedną wycieczkę. Jeśli jednak jest to 10 ofert i chcemy podać przeciętną cenę – np. dla zorientowania się w sytuacji rynkowej, to średnia nie będzie dobrą miarą.
Wynikająca z niej przeciętna cena wycieczki da całkowicie fałszywy obraz sytuacji. Dla przeciętnego konsumenta wycieczka za ponad 8 tys. zł od osoby jest zbyt droga. I w rzeczywistości, wśród przedstawionych dziesięciu ofert nawet nie ma ani jednej wycieczki z takiej półki cenowej. Dla bogatego miłośnika luksusu z kolei, taka cena może sugerować, że oferowane wycieczki są poniżej jego subiektywnej granicy ekskluzywności.
W tej sytuacji istotnie, pojawienie się odstających danych sprawia, że lepszą miarą przeciętności od średniej okazuje się mediana. W tym wypadku mediana wyniesie 3475 zł i wartość ta dość trafnie obrazuje sytuację. Dzieje się tak dlatego, że dane nie podlegają tutaj sumowaniu. To, że ktoś kupił sobie wycieczkę za ponad 30 tys. zł w żaden sposób nie wpływa na cenę wycieczki dla innych konsumentów. To bardzo istotna kwestia, często poruszana na zajęciach ze statystyki.
Obliczanie średniej arytmetycznej w szeregu rozdzielczym punktowym
Szereg rozdzielczy punktowy, to efekt „kompresji bezstratnej” szeregu szczegółowego. Jeśli dane się powtarzają, zamiast enumeratywnie wypisywać wszystkie takie dane wielokrotnie, można zamiast tego zapisać wartość oraz ilość powtórzeń. Zamiast wielokrotnie dodawać tę samą wartość, można mnożyć wartość przez liczebność.
Schemat szeregu rozdzielczego punktowego jest następujący:
| $x_i$ | $n_i$ | $w_i$ |
|---|---|---|
| $x_1$ | $n_1$ | $w_1$ |
| $x_2$ | $n_2$ | $w_2$ |
| … | … | … |
| $x_k$ | $n_k$ | $w_k$ |
| $\Sigma$ | $N$ | $1$ |
$x_i$ to wartości cechy (zmiennej), $n_i$ to liczebności (częstości) wystąpienia poszczególnej wartości, natomiast $w_i$ to częstości względne: $w_i = {n_i \over N}$.
Wzór na obliczenie średniej arytmetycznej w takim szeregu to:
$$\bar x = {{1 \over n} \cdot \sum_{i=1}^k {x_i \cdot n_i}} \tag {3a} \label {eq:{3a}}$$
Średnią można tez policzyć wykorzystując częstości względne:
$$\bar x = { \sum_{i=1}^k {x_i \cdot w_i}} \tag {3b} \label {eq:{3b}}$$
Należy zwrócić uwagę, że w przeciwieństwie do wzoru (2b), we wzorach (3a) oraz (3b) sumowanie odbywa się do $k$ a nie do $n$. $k$ jest tutaj oczywiście ilością różnych wartości występujących w szeregu.
Średnia arytmetyczna, obliczana dla szeregu rozdzielczego punktowego, to szczególny przypadek średniej arytmetycznej ważonej, o której mowa będzie w dalszej części artykułu.
Przykład 3
Poniżej zebrano dane o ilości wypadków, jakie wydarzyły się w pewnej miejscowości w 100 kolejnych dniach.
| $x_i$ | $n_i$ | $w_i$ |
|---|---|---|
| 0 | 45 | $0,45$ |
| 1 | 22 | $0,22$ |
| 2 | 12 | $0,12$ |
| 3 | 8 | $0,08$ |
| 4 | 7 | $0,07$ |
| 5 | 6 | $0,06$ |
| $\Sigma$ | 100 | $\textbf 1$ |
Średnia arytmetyczna, obliczona wg wzoru (3a) wynosi:
$$\bar x = {{0 \cdot 45 + 1 \cdot 22 + 2 \cdot 12 + 3 \cdot 8 + 4 \cdot 7 + 5 \cdot 6} \over 100}$$
$$\bar x = {128 \over 100} = 1,28$$
Według wzoru (3b):
$$\bar x = \cdot 0,45 + 1 \cdot 0,22 + 2 \cdot 0,12 + 3 \cdot 0,08 + 4 \cdot 0,07 + 5 \cdot 0,06 = 1,28$$
Jak widać, wzór (3b) pozwala na wyliczenie średniej arytmetycznej niejako „bezpośrednio”. Od razu uzyskujemy wynik. Obliczona wartość średniej arytmetycznej oznacza, że w objętej analizą miejscowości w badanym okresie wydarzyło się średnio 1,28 operacji dziennie.
Obliczenie średniej arytmetycznej w szeregu rozdzielczym przedziałowym
W odróżnieniu od szeregu rozdzielczego punktowego, szereg rozdzielczy przedziałowy (zwany czasem także szeregiem rozdzielczym z przedziałami klasowymi) stanowi „kompresję stratną” danych. Szereg zawiera informację o krańcach przedziałów oraz ilości danych, które do należą do poszczególnych przedziałów. Nie wiemy natomiast, jakie dokładnie do tego przedziału trafiły liczby.
Przy obliczaniu miar statystycznych na podstawie szeregów rozdzielczych przedziałowych przyjęto następujące zasady:
- dla potrzeb obliczania miar pozycyjnych (np. mediany) przyjmuje się, że poszczególne elementy zbioru danych w każdym z przedziałów rozłożone są równomiernie;
- dla potrzeb obliczenia miar klasycznych przyjmuje się, że w każdym przedziale, wszystkie elementy do niego należące mają jednakowe wartości, równe wartości środkowej, tj. średniej arytmetycznej początku i końca przedziału.
Wartość środkową przedziału (klasy) oznacza się zazwyczaj symbolem: $\dot x$. Wzory do obliczenia średniej arytmetycznej są w zasadzie identyczne z wzorami (3a), (3b), tyle, że zamiast wartości zmiennej są środki przedziałów. Wzór wykorzystujący liczebności absolutne:
$$\bar x = {{1 \over n} \cdot \sum_{i=1}^k {\dot x_i \cdot n_i}} \tag {4a} \label {eq:{4a}}$$
Wzór wykorzystujący liczebności (częstości) względne, zwane także wskaźnikami struktury:
$$\bar x = { \sum_{i=1}^k {\dot x_i \cdot w_i}} \tag {4b} \label {eq:{4b}}$$
Przykład 4
Zebrano dane o wysokości kontraktów (w tys. zł) zawartych przez przedstawicieli handlowych pewnej firmy.
| $x_{0i} - x_{1i}$ | $n_i$ | $\dot x_i$ | $\dot x_i \cdot n_i$ | $w_i$ | $\dot x_i \cdot w_i$ |
|---|---|---|---|---|---|
| $0 - 10$ | 2 | 5 | 10 | 0,05 | 0,25 |
| $10 - 20$ | 22 | 15 | 330 | 0,55 | 8,25 |
| $20 - 30$ | 10 | 25 | 250 | 0,25 | 6,25 |
| $30 - 40$ | 4 | 35 | 140 | 0,10 | 3,50 |
| $40 - 50$ | 2 | 45 | 90 | 0,05 | 2,25 |
| $\Sigma$ | 40 | 820 | 1,00 | 20,50 |
Dane statystyczne zawarte są w pierwszych dwu kolumnach. Pozostałe kolumny zawierają obliczenia pomocnicze – oznaczone kolorem niebieskim.
Średnia arytmetyczna, obliczona ze wzoru (4a):
$$\bar x = {{5 \cdot 2 + 15 \cdot 22 + 25 \cdot 10 + 35 \cdot 4 + 45 \cdot 2 } \over 40}$$
$$\bar x = {820 \over 40} = 20,50$$
Obliczenie za pomocą wzoru (4b) jest bardzo podobne:
$$\bar x = {5 \cdot 0,05 + 15 \cdot 0,55 + 25 \cdot 0,25 + 35 \cdot 0,10 + 45 \cdot 0,05 } = 20,50 $$
Średnia wartość zawartych kontraktów wyniosła 20,5 tys. zł.
Średnia arytmetyczna ważona
Ze średnią ważoną mamy do czynienia wówczas, gdy obliczamy średnią w sytuacji, gdy wszystkie dane w szeregu statystycznym są dla nas niejednakowo ważne. Z tym mieliśmy do czynienia właśnie w szeregach rozdzielczych, gdzie średnia nie była obliczana przez zwykłe dodanie wartości zmiennej, ale wartości te były mnożone przez liczebności. Liczebności te pełniły rolę wag. We wzorach (3a) oraz (4a) wagami były liczebności (częstości) absolutne, natomiast we wzorach (3b) oraz (4b) były to częstości względne (wskaźniki struktury).
W ogólności bowiem, formuła na średnią arytmetyczną ważoną w szeregu szczegółowym, złożonym z $n$ wartości $x_i$, z których każda posiada swoją wagę $w_i$, wyraża się wzorem:
$${\bar x}_w = {{\sum_{i=1}^n x_i \cdot w_i} \over {\sum_{i=1}^n w_i} \tag 5 \label {eq:5}}$$
Jeśli wagi są unormowane, czyli sumują się do jedności (np. są to wagi określone procentowo), to wówczas $\sum_{i=1}^n w_i = 1$ i we wzorze (5) „znika” mianownik (jest równy jedności).
Wagi mogą być określone arbitralnie. Np. wysokość stypendium naukowego może być określona, jako średnia ważona z odpowiednich przedmiotów.
Przykład 5
Załóżmy, że na pewnej uczelni określono minimalną średnią do ubiegania się o stypendium naukowe w wysokości 4,2. Określono, że do średniej tej wliczają się uzyskane w poprzednim semestrze oceny z analizy matematycznej oraz statystyki opisowej. Wagi przypisane poszczególnym ocenom oraz uzyskane przez pewnego studenta oceny, przedstawia poniższa tabela:
| Przedmiot | Waga oceny | Ocena studenta |
|---|---|---|
| Analiza matematyczna- ćwiczenia | 10% | 4,5 |
| Analiza matematyczna – egzamin | 30% | 4,0 |
| Statystyka opisowa – ćwiczenia | 20% | 4,0 |
| Statystyka opisowa – laboratorium | 15% | 3,5 |
| Statystyka opisowa – egzamin | 25% | 5,0 |
| SUMA | 100% |
Czy student uzyska stypendium?
Obliczamy średnią ważoną. Wagi są unormowane. Średnia wynosi:
$${\bar x}_w = 4,5 \cdot 0,1 + 4,0 \cdot 0,3 + 4,0 \cdot 0,2 + 3,5 \cdot 0,15 + 5,0 \cdot 0,25 = 4,225$$
A zatem nasz student załapał się na stypendium naukowe przysłowiowym „rzutem na taśmę”.
Co jeszcze powinniśmy wiedzieć o średniej arytmetycznej?
Średnia arytmetyczna to najlepszy możliwy estymator wartości oczekiwanej w populacji generalnej. Jeśli mamy populację i chcemy oszacować wartość oczekiwaną jakiejś zmiennej w tej populacji, czyli właśnie taką średnią dla całej populacji, dysponując losowa próbką danych, wówczas nie ma lepszego oszacowania aniżeli średnia arytmetyczna. Będzie to poruszone w artykule o estymatorach.
Średnia harmoniczna
Średnia harmoniczna, jako średnia do zadań specjalnych
Skoro średnia arytmetyczna jest taka dobra, to po co korzystać z jakichś innych średnich? Otóż są sytuacje, gdzie średnia arytmetyczna nie spełnia dobrze swojej roli miary przeciętności. Wcale nie chodzi tutaj o pojawianie się danych odstających, itp. ale o specyfikę zmiennej, dla której liczymy średnią.
Średnią harmoniczną, dla szeregu szczegółowego scharakteryzować można najkrócej w taki sposób, że odwrotność średniej harmonicznej jest średnią arytmetyczną z odwrotności danych. Literalnie zatem wykorzystując tę niby-definicję mamy:
$${1 \over {\bar x_h}} = {{{1 \over {x_1}} + {1 \over {x_2}} + ... + {1 \over {x_n}}} \over n } $$
po obustronnym odwróceniu:
$$\bar x_h = {n \over {{1 \over {x_1}} + {1 \over {x_2}} + ... + {1 \over {x_n}}} } $$
Dostajemy formalny wzór:
$$\bar x_h = {n \over {\sum_{i=1}^n {1 \over {x_i}}} } \tag 6 \label {eq:6} $$
Pierwsze co się powinno „rzucić w oczy” to to, że nie można średniej tej policzyć, gdy wśród danych znajduje się zero. W ogóle najlepiej przyjąć, że średnią harmoniczną liczymy dla danych dodatnich. Oprócz tego, że wśród danych nie może być zera, specyfika wzoru (6) jest taka, że w szczególny sposób traktuje ona liczby. W przeciwieństwie do średniej arytmetycznej, która wszystkie liczy traktuje po równo, średnia harmoniczna faworyzuje wartości niskie, co skutkuje następująca relacją pomiędzy średnią arytmetyczną, a harmoniczną:
$$\bar x_h \leq \bar x \tag 7 \label {eq:7}$$
Czyli średnia harmoniczna zawsze jest nie większa od średniej arytmetycznej, a równość zachodzi tylko wówczas, gdy wszystkie dane w zbiorze są jednakowe.
Kiedy średnia harmoniczna jest lepsza miarą przeciętności od średniej arytmetycznej? Weźmy następujący przykład.
Przykład 6
Adam jechał do swojej babci na rowerze. Do babci, jechał trochę pod górkę, średnio z prędkością $10 \,\frac{\mathrm{km}}{\mathrm{h}}$. Natomiast z powrotem jechał z górki (i cieszył się z prezentu od babci), jechał zatem z prędkością $20 \,\frac{\mathrm{km}}{\mathrm{h}}$. Z jaką średnią prędkością jechał Adam?
Sprawa wydaje się prosta: $\frac {10 + 20} 2 = 15$. Czy jednak $15 \,\frac{\mathrm{km}}{\mathrm{h}}$ to prawidłowa odpowiedź? Okazuje się, że nie.
Załóżmy, że od Adama do Babci jest 10 $\mathrm{km}$. Odległość, jak się zaraz okaże, może być dowolna. Przy prędkości 10 $\mathrm{km}$ droga do babci zajęła Adamowi równą godzinę. Droga powrotna, gdzie ostro pocisnął $20 \,\frac{\mathrm{km}}{\mathrm{h}}$, wymagała tylko pół godziny. W sumie więc, Adam przejechał 20 $\mathrm{km}$, co zajęło mu 1,5 $\mathrm{h}$. Ile zatem wynosiła średnia prędkość? Trzeba podzielić drogę przez czas:
$$\bar v = \frac {20} {1,5} = \frac {40} 3 = 13,33 \,\frac{\mathrm{km}}{\mathrm{h}}$$.
Ciekawe prawda? Zgodnie z ideą średniej harmonicznej, wynik rzeczywiście znajduje się bliżej niższej wartości. Jeśli do kogoś taki przykład słabo przemawia, to weźmy jaskrawszy przykład. Załóżmy, że w drodze powrotnej, Adam został teleportowany z prędkością światła:
$$ c = 299792458 \,\frac{\mathrm m}{\mathrm s} = 1079252849\,\frac{\mathrm{km}}{\mathrm h}$$
Przebycie dystansu 10 $\mathrm{km}$ z taką prędkością, zajmuje niewiele ponad 33 $\mathrm{\mu s}$ (mikrosekund), zatem śmiało można przyjąć zero i w takiej sytuacji podróż w obie strony zajęła mu tyle samo, co w jedną stronę, czyli 1 $\mathrm{h}$ a pokonał w sumie 20 $\mathrm{km}$, czyli średnia prędkość wyniosła $20 \,\frac{\mathrm{km}}{\mathrm{h}}$. Gdybyśmy liczyli według średniej arytmetycznej, wówczas otrzymalibyśmy $539626429,4 \,\frac{\mathrm{km}}{\mathrm{h}}$. Przecież z taką prędkością, zarówno podróż tam, jak i z powrotem zająć powinna mikrosekundy, a zajęła godzinę, prawda?
Przykład 7
Rozważmy problem ogólniej. Jeśli dystans $s$ pokonujemy w jedną stronę z prędkością $v_1$ w drugą zaś – z prędkością $v_2$. Ile wynosi prędkość średnia?
Prędkość średnią wyliczamy jako stosunek (iloraz) łącznego dystansu ($2s$) do łącznego czasu. Ile wynosi łączny czas? Czas jazdy w jedną stronę wynosi: $t_1 = \frac s {v_1}$ a w drugą $t_2 = \frac s {v_2}$. A zatem:
$$\bar v = \frac {2s} {\frac s {v_1} + \frac s {v_2}} = \frac {2s} {s \cdot \left( \frac 1 {v_1} + \frac 1 {v_2} \right)} = \frac 2 {\frac 1 {v_1} + \frac 1 {v_2} } $$
Co otrzymaliśmy? Otrzymaliśmy ni mniej ni więcej, tylko wzór (6) dla $n=2$. Mamy więc pełne uzasadnienie dla stosowania średniej harmonicznej przy obliczaniu średniej prędkości.
Czy jednak zawsze średnią prędkość obliczamy za pomocą średniej harmonicznej?
Przykład 8
Bartek lubi jeździć wyczynowo na rowerze. Pewnego dnia wybrał się w dłuższa, dwugodzinną podróż. Przez pierwszą godzinę jednał w trudnym terenie, pod górkę, z prędkością $10 \,\frac{\mathrm{km}}{\mathrm{h}}$. Później jednak droga stała się prostsza, było z górki. Drugą godzinę jechał z prędkością $20 \,\frac{\mathrm{km}}{\mathrm{h}}$. Jaka była jego średnia prędkość?
Policzmy najpierw, jaki dystans przejechał. Przez pierwszą godzinę jechał z prędkością 10 $\,\frac{\mathrm{km}}{\mathrm{h}}$, przejechał zatem równe 10 $\mathrm{km}$. Drugą godzinę jechał z prędkością 20 $\,\frac{\mathrm{km}}{\mathrm{h}}$, przejechał zatem 20 $\mathrm{km}$. Łącznie przebył więc dystans 30 $\mathrm{km}$ w ciągu dwóch godzin. Średnia prędkość wyniosła więc $15 \,\frac{\mathrm{km}}{\mathrm{h}}$. Tyle, ile wynosi średnia arytmetyczna tych dwu wartości. Zatem:
$$\bar v = \frac {v_1 + v_2} 2$$
O co tutaj chodzi? Dlaczego tym razem to średnia arytmetyczna jest tą właściwą. Zauważmy, że potraktowaliśmy dane, jako dwuelementowy szereg szczegółowy. Elementy szeregu szczegółowego traktujemy, jako jednorodne. W przeciwnym razie należałoby użyć szeregu rozdzielczego lub nadać zmiennym jakieś wagi.
Zmienna, dla której w przykładach nr 7 oraz nr 8 obliczaliśmy średnią, jest wyrażona w jednostce względnej (ilorazowej), $\left[ \frac{\mathrm{km}}{\mathrm h} \right]$. W przykładzie nr 7, gdzie obliczaliśmy średnią prędkość z dwu prędkości „tam” i „z powrotem”, obydwie wartości są jednorodne ze względu na pokonywaną odległość, czyli są jednorodne ze względu na jednostkę z licznika. W takim przypadku właściwą średnią jest średnia harmoniczna.
Z kolei w przykładzie nr 8, gdzie obliczaliśmy średnią prędkość z dwu prędkości w ciągu dwu różnych godzin, obydwie wartości są jednorodne ze względu na jednostkę z mianownika. W takim przypadku właściwą średnia jest „poczciwa” średnia arytmetyczna.
Chcąc zrozumieć logikę tej reguły, pojąć ją „na chłopski rozum” można sobie to wytłumaczyć tak: średnia arytmetyczna ma sens, gdy dane podlegają sumowaniu (patrz przykład 2). Sumować można natomiast liczby o wspólnym mianowniku. Dlatego tez jednorodność pod względem mianownika uzasadnia użycie średniej arytmetycznej. Wspólny licznik nie jest wystarczającym uzasadnieniem dla sumowania, więc używamy średniej harmonicznej, w której wylicza się odwrotności, a wtedy licznik staje się mianownikiem.
W swej już prawie trzydziestoletniej (włączając czasy sprzed założenia Wszechwiedzy) praktyce korepetytorskiej spotkałem się z jeszcze jednym bardzo ciekawym wykorzystaniem średniej harmonicznej. Czy słusznym? Wymaga to głębszej analizy. Jednak innego rodzaju średniej klasycznej w przykładzie, który za chwilę przedstawię, wyliczyć się nie da.
Przykład 9
Składający się z dziecięciu żołnierzy oddział, poszedł na wojnę. Trzech żołnierzy zginęło po pięciu dniach, dwóch po dziesięciu dniach, dwóch po dwudziestu dniach. Pozostali trzej żołnierze przeżyli całą wojnę. Jaki był średni czas życia żołnierza z tego oddziału (licząc od momentu rozpoczęcia wojny)?
Gdybyśmy chcieli tutaj policzyć średnią arytmetyczną, która na pierwszy rzut oka wydaje się być właściwą miarą, to nie jest to możliwe, gdyż nie mamy informacji, ile trwała wojna. Z treści zadania wynika, że na pewno nie była to wojna siedmiodniowa, ale nie wiadomo też, czy była to Druga Wojna Światowa, czy może jednak Wojna Trzydziestoletnia. Nie da się więc policzyć średniej arytmetycznej. W zasadzie wydawałoby się, że nie da się policzyć żadnej miary klasycznej – wszak w wyliczeniu takiej miary udział muszą wziąć wszystkie wartości cechy.
Medianę (jako miarę pozycyjną) można policzyć bez problemu – szereg jest dziesięcioelementowy, medianą jest więc średnia arytmetyczna elementu piątego i szóstego. Czasy życia żołnierzy na wojnie, uporządkowane od najkrótszego do najdłuższego wynoszą:
$$5;\,5;\,5;\,10;\,10;\,20;\,20;\,?;\,?;\,?$$
Trzy nieznane czasy życia żołnierzy, którzy dotrwali do końca wojny, oznaczone są znakami zapytania. Są one z pewnością dłuższe od 20 dni, toteż kolejność elementów nie budzi wątpliwości. Czyli mediana życia żołnierzy wynosi: $Me = \frac {10+20} 2 = 15$ dni. Jest to już coś, ale czy da się policzyć coś jeszcze?
Tak! Rozważając sensowność obliczania średniej harmonicznej w przykładzie nr 6 rozważalibyśmy, co by było, gdyby Adam w drodze powrotnej podróżował z prędkością światła. Przyjęliśmy, że czas trwania takiej podróży byłby praktycznie zerowy. We wzorze (6) mamy odwrotności zmiennej, dla której liczymy średnią harmoniczną. Zakładając, że wojna trwała znacznie dłużej, aniżeli czas przeżycia na niej najpóźniej poległego żołnierza, możemy przyjąć, że czas życia tych, którzy dotrwali do końca wojny dąży do nieskończoności $x_i \rightarrow \infty$, a wówczas odwrotność takiego czasu dąży do zera: $\frac 1 {\infty} \rightarrow 0$. Zatem możemy policzyć średnią harmoniczną w następujący sposób:
$$\bar x_h = \frac {10} {\frac 1 {5} + \frac 1 {5} + \frac 1 {5} + \frac 1 {10} + \frac 1 {10} + \frac 1 {20} + \frac 1 {20} + \frac 1 {\infty} + \frac 1 {\infty} + \frac 1 {\infty}}$$
$$\bar x_h = \frac {10} {0,2 + 0,2 + 0,2 + 0,1 + 0,1 + 0,05 + 0,05 + 0 + 0 + 0 } = \frac {10} {0,9} = \frac {100} 9$$
$$\bar x_h = 11,11$$
A zatem średni czas przeżycia żołnierza ze wspomnianego oddziału, to 11,11 dnia. Z ciekawości możemy zobaczyć, jaki wyszedłby ten średni czas liczony średnią harmoniczną, gdyby przyjąć czas trwania Drugiej Wojny Światowej. Trwała ona równo sześc lat i dwa dni: zaczęła się ona 1.09.1939 atakiem Trzeciej Rzeszy na Polskę a skończyła kapitulacją Japonii 2.09.1945. Przyjmijmy jednak, jako datę końcową, koniec Drugiej Wojny Światowej w Europie, tj. 8.05.1945. Dostajemy wówczas 2076 dni.
Dla tej wartości, średnia wyniesie:
$$\bar x_h = \frac {10} {\frac 1 {5} + \frac 1 {5} + \frac 1 {5} + \frac 1 {10} + \frac 1 {10} + \frac 1 {20} + \frac 1 {20} + \frac 1 {2076} + \frac 1 {2076} + \frac 1 {2076}}$$
$$\bar x_h = \frac {10} {0,901445087}$$
$$\bar x_h = 11,09$$
Różnica niewielka. Dla porównania, średnia arytmetyczna wyniesie:
$$\bar x = \frac {5 \cdot 3 + 10 \cdot 2 + 20 \cdot 2 + 2076 \cdot 3}{10} = 630,3$$
Według średniej arytmetycznej, średni czas przeżycia żołnierza na wojnie – zakładając, że chodzi o Drugą Wojnę Światową w Europie, wyniesie 630,3 dnia. Wcale nie jest trywialnym pytanie, która z tych średnich daje lepszy obraz szans na przeżycie i bardziej realistycznie ocenia te szanse.
„Filozofię” użycia średniej harmonicznej do wyliczenia średniego czasu przeżycia wojny najprościej zrozumieć i wyczuć, biorąc pod uwagę tylko dwóch żołnierzy. Jeden przeżył 10 dni, a drugi doczekał końca wojny. Ich średni czas przeżycia na wojnie, liczony średnią harmoniczną wynosi:
$$\bar x_h = \frac 2 {\frac 1 {10} + \frac 1 {\infty}} = \frac 2 {0,1 + 0} = \frac 2 {0,1} = 20$$
Zatem w takim przypadku, gdy jeden zginął po 10 dniach a drugi dożył końca wojny, średni czas przeżycia wynosi 20 dni.
Tak, czy inaczej, użycie średniej harmonicznej w tym wypadku, choć ciekawe i dające do myślenia, uważam, za wielce dyskusyjne i nie przytoczyłbym tego przykładu, gdyby nie to, że zetknąłem się z nim w mojej praktyce korepetytorskiej, jako z autentycznym przykładem z zajęć na uczelni mojej Klientki.
Czy braki w danych (brak informacji o czasie trwania wojny) bądź tez ich skrajna asymetria – w przykładzie nakładają się oba te czynniki – jest wystarczającym usprawiedliwieniem dla liczenia średniej harmonicznej dla zmiennej niewyrażonej jednostką względną? Może jednak lepiej zostać przy medianie, która też w tym przypadku jest niezła i w większości przypadków da się ją policzyć?
Średnia harmoniczna dla szeregu rozdzielczego
W przypadku szeregu rozdzielczego, gdzie badana zmienna mianowana jest w jednostce, będącej ilorazem innych jednostek, właściwy wybór średniej zależy od tego, w jakiej jednostce wyrażone są liczebności. W przypadku, gdy liczebności wyrażone są w jednostce:
- z licznika jednostki analizowanej zmiennej, właściwą średnią jest średnia harmoniczna;
- z mianownika jednostki analizowanej zmiennej, właściwą średnią jest średnia arytmetyczna.
Średnią harmoniczną z danych przedstawionych w postaci szeregu rozdzielczego punktowego, oblicza się według wzoru:
$$\bar x_h = \frac {\sum_{i=1}^k n_i}{\sum_{i=1}^k \frac{n_i}{x_i}} \tag 8 \label {eq:8}$$
Dla szeregu rozdzielczego przedziałowego będzie podobnie – w roli pojedynczych wartości $x_i$ wystąpią środki $\dot x_i$ przedziałów klasowych, choć jest nieco dyskusyjne, czy w sytuacji konieczności użycia średniej harmonicznej,właściwym jest użycie szeregu rozdzielczego przedziałowego, który – jak wspomnieliśmy – na potrzeby liczenia miar klasycznych zakłada, że wszystkie wartości w przedziale są równe, skoro przyjmuje się, że są one równe środkowi przedziału, a zatem średniej arytmetycznej jego krańców. Występuje tu swego rodzaju pomieszanie obu rodzajów średnich.
Przykład 10
Powiat radomszczański składa się z 14 gmin. Poniższa tabela przedstawia dane o gęstości zaludnienia (zmienna $x_i$) oraz ludności tych gmin (liczebność-waga $n_i$) według stanu na 31.12.2024. Należy policzyć średnią gęstość zaludnienia w powiecie radomszczańskim.
| Gmina | $x_i\,\left[\frac{\mathrm{os}}{\mathrm{km}^2} \right]$ | $n_i ,\left[ \text {os} \right]$ | $\frac {n_i} {x_i}$ |
|---|---|---|---|
| Dobryszyce | 90,61 | 4621 | 51,00 |
| Gidle | 49,19 | 5706 | 116,00 |
| Gomunice | 90,42 | 5606 | 62,00 |
| Kamieńsk | 57,40 | 5510 | 95,99 |
| Kobiele Wielkie | 41,12 | 4194 | 101,99 |
| Kodrąb | 39,82 | 4221 | 106,00 |
| Lgota Wielka | 65,05 | 4098 | 63,00 |
| Ładzice | 55,16 | 4578 | 82,99 |
| Masłowice | 33,22 | 3854 | 116,01 |
| Przedbórz | 33,88 | 6437 | 189,99 |
| Radomsko – miasto | 831,61 | 42412 | 51,00 |
| Radomsko – gmina wiejska | 62,88 | 5408 | 86,01 |
| Wielgomłyny | 34,50 | 4243 | 122,99 |
| Żytno | 23,91 | 4735 | 198,03 |
| Razem | 105623 | 1443 |
Należy bardzo dokładnie podkreślić, że gdyby polecenie brzmiało obliczyć średnią gęstość zaludnienia gminy w powiecie radomszczańskim wówczas można by było policzyć zwyczajną nieważoną średnią arytmetyczną, traktując gminy powiatu radomszczańskiego, jako zbiorowość a powierzchnię, jako cechę. Skoro jednak chodzi o średnią gęstość zaludnienia w powiecie radomszczańskim, czyli niejako średnią gęstość zaludnienia na całej połaci ziemi, zajmowanej przez ten powiat, konieczne jest uwzględnienie liczebności.
Powierzchnia mierzona jest w jednostce względnej $\left[\frac{\mathrm{os}}{\mathrm{km}^2} \right]$, a liczebności podane są w osobach, tj. w jednostce z licznika, konieczne jest użycie średniej harmonicznej, czyli użyjemy wzoru (8). Wartości ilorazów $\frac {n_i} {x_i}$ z mianownika tegoż wzoru, wyliczone zostały w tabeli (zaznaczone na niebiesko).
Średnia harmoniczna gęstości zaludnienia, równa średniej gęstości w powiecie radomszczańskim wynosi zatem:
$$\bar x_h = \frac {\sum_{i=1}^k n_i}{\sum_{i=1}^k \frac{n_i}{x_i}} = \frac {105623}{1443,19}$$
$$\bar x_h = 73,20$$
Średnia gęstość zaludnienia w powiecie radomszczańskim wynosi zatem 73,20 $\frac{\mathrm{os}}{\mathrm{km}^2} $
Zastanówmy się teraz, co tak naprawdę liczyliśmy w naszej tabeli. Czym są obliczone w ostatniej kolumnie wartości ilorazów $\frac {n_i} {x_i}$ ? Otóż dzieląc ludność, mierzoną w osobach przez gęstość zaludnienia wyrażoną w osobach na kilometr kwadratowy, otrzymujemy:
$$\frac {\mathrm{os}}{\frac{\mathrm{os}}{\mathrm{km}^2}} = \cancel{\mathrm{os}} \cdot \frac{\mathrm{km}^2}{\cancel{\mathrm{os}}} = {\mathrm{km}^2}$$
Czyli ostatnia kolumna tabeli, zawierająca wyliczone ilorazy, zawiera de facto powierzchnię każdej z gmin, których suma składa się na całkowitą powierzchnię powiatu radomszczańskiego. Teraz już logicznym jest, że dzieląc ludność powiatu (suma ludności poszczególnych gmin, czyli wartości z przedostatniej kolumny) przez łączną powierzchnię, otrzymujemy ni mniej, ni więcej, tylko średnią gęstość zaludnienia powiatu radomszczańskiego.
Teraz pomyślmy, co by było, gdybyśmy chcieli obliczyć średnią gęstość zaludnienia w powiecie radomszczańskim, mając daną nie ludność każdej gminy, ale jej powierzchnię. Wówczas to niebieskie liczby pełniłyby rolę liczności $n_i$. Jest to jednostka z mianownika, zatem należałoby użyć średniej arytmetycznej i obliczyć ją, ze wzoru (3a).
Wzór ten wymaga wyliczenia iloczynów wartości cechy (czyli gęstości zaludnienia $x_i$ przez liczność. Gdyby licznościami były niebieskie liczby, iloczyny równe byłyby ludności powiatu (obecnym liczebnościom). W takim układzie średnią (ale teraz – arytmetyczną) byłby iloraz tych samych liczb: $\frac {105623}{1443,19}$. Oba sposoby są zatem w 100% ze sobą „kompatybilne”.
Średnia geometryczna
Obliczanie średniej geometrycznej z szeregu szczegółowego
Średnią geometryczną obliczamy analogicznie do średniej harmonicznej, ale zamiast dodawania mamy mnożenie, a zamiast dzielenia – pierwiastkowanie. Wzór na średnią geometryczną w szeregu szczegółowym, to:
$$\bar x_g = \sqrt[n]{x_1 \cdot x_2 \cdot ... \cdot x_n} \tag {9a} \label {eq:{9a}}$$
lub w bardziej „zwarty” sposób, z wykorzystaniem operatora iloczynu:
$$\bar x_g = \sqrt[n]{\prod_{i=1}^n x_i} \tag {9b} \label {eq:{9b}}$$
Podobnie, jak średnia harmoniczna, tak i średnia geometryczna, obliczone mogą być wyłącznie dla liczb dodatnich. W ostateczności nieujemnych, choć jest oczywistym, że jeśli wśród danych pojawi się choćby jedno zero, to średnia wyliczona ze wzorów (9a) oraz (9b) wyniesie zero.
Warto tutaj poruszyć kwestię nazewnictwa. Jest kilka powodów, dla których nosi ona taką nazwę. Jednym z nich jest to, że może być ona użyta do wyliczenia tzw. kwadratury prostokąta. Jeśli mamy prostokąt o bokach $a = x_1$ oraz $b = x_2$, to średnią geometryczną tych dwu liczb:
$$\bar x_g = \sqrt{x_1 \cdot x_2} = \sqrt {a \cdot b}$$
można zinterpretować, jako długość boku kwadratu o polu równym polu wspomnianego prostokąta.
Nie tylko to jednak. Jest też sposób na geometryczną konstrukcję odcinka o długości równej średniej geometrycznej długości dwóch danych odcinków – czyli konstrukcyjna kwadratura prostokąta.
Zasada konstrukcji jest prosta. Trójkąt $\triangle {ACD}$ jest prostokątny, jako oparty na półokręgu. Trójkąty $\triangle ABD$ oraz $\triangle DBC$ również są trójkątami prostokątnymi. Są to też trójkąty podobne. $\triangle{ACD} \sim \triangle{ABD}$ na zasadzie kkk (kąt-kąt-kąt)gdyż jest wspólny kąt $\angle{BAD}$. Podobnie $\triangle{ACD} \sim \triangle{BCD}$ z uwagi na wspólny kąt $\angle{BCD}$. Podobieństwo $\triangle{ABD}$ oraz $\triangle{DBC}$ wynika po pierwsze z jednoczesnego ich podobieństwa do $\triangle{ABD}$ a także z równości kątów np. $\angle{BAD} = \angle{BDC}$, co wynika stąd, że miara zarówno kąta $\angle{BAD}$, jak i $\angle{BDC}$ wynosi $90^{\circ} - \angle {ACD}$. Analogicznie też miary kątów $\angle {ADB}$ oraz $\angle {ACD}$ wynoszą $90^{\circ} - \angle {DAC}$
Wobec tego podobieństwa, można dla trójkątów $\triangle{ABD}$ oraz $\triangle{DBC}$zapisać proporcję wynikającą z równości stosunków: dłuższa przyprostokątna do krótszej przyprostokątnej:
$$ \frac {|BD|}{|AB|} = \frac {|BC|}{|BD|}$$
Korzystając z zasady „mnożenia na krzyż”, dostajemy:
$$|BD|^2 = |AB| \cdot |BC|$$
i stąd:
$$|BD| =\sqrt{ |AB| \cdot |BC|}$$
Mamy to. Długość odcinka $BD$ jest średnią geometryczną odcinków $AB$ oraz $BC$. Oczywiście na rysunku widać także średnią arytmetyczną długości tych odcinków. Jest nią jednakowa długość odcinków $AO$ oraz $OB$, bo przecież:
$$|AO| = |OB| = \frac {|AB| + |BC|} 2$$
Kolejnym i chyba najważniejszym powodem, dla którego średnia obliczana wzorem (9a), (9b), nazywa się średnią geometryczną, jest jej związek z ciągiem geometrycznym. Dwa najważniejsze typy ciągów, poznane w szkole średniej, to ciąg:
- arytmetyczny, w którym różnica kolejnych wyrazów jest stała (np. 2; 4; 6; 8; …);
- geometryczny, w którym iloraz kolejnych wyrazów jest stały (np. 2; 4; 8; 16; …).
W ciągu arytmetycznym, każdy wyraz (oprócz pierwszego i ostatniego) jest średnią arytmetyczną swoich „sąsiadów” z lewej i prawej strony:
$$a_k = \frac {a_{k-1} + a_{k+1}} 2$$
W ciągu geometrycznym, dla każdego z wyrazów (oprócz pierwszego i ostatniego) , spełniony jest warunek:
$$a_k^2 = a_{k-1} \cdot a_{k+1}$$
co dla ciągu o dodatnich wyrazach można utożsamić z zasadą, że każdy wyraz (oprócz pierwszego i ostatniego) jest średnią geometryczną swoich obydwu „sąsiadów”:
$$a_k = \sqrt {a_{k-1} \cdot a_{k+1}}$$
Tyle a propos nazewnictwa.
Średnie tempo zmian
Podręcznikowym, modelowym przykładem sytuacji wymagającej użycia średniej geometrycznej, jest wyliczanie średniego tempa zmian. Otóż jeżeli w kolejnych okresach, tempo zmian wartości zmiennej $y$, wyrażone indeksami łańcuchowymi (tj. stosunkami wartości w okresie bieżącym do wartości w okresie poprzednim:
$$i_t = \frac {y_t}{y_{t-1}} \tag {10} \label {eq:{10}}$$
wynosi $i_1$, $i_2$, …, $i_n$, to średnie tempo zmian w okresie $y_0 - y_n$ wyraża się średnią geometryczną tych indeksów łańcuchowych:
$$\bar i_g = \sqrt[n]{\prod_{k=1}^n i_k} \tag {11} \label {eq:{11}}$$.
Przykład 10
Jacek co roku dostaje podwyżkę. Od 2020 roku dostał następujące podwyżki: o 20% (w stosunku do 2019) i potem kolejno o 5%, o 25%, 10%, 3%, 5%. Podwyżki te są nieregularne. Jaka jest średnia roczna procentowa wysokość podwyżki, jaką daje Jackowi szef? Innymi słowy, jaką regularną podwyżkę co roku musiałby dawać Jackowi szef, aby w 2025 „wyszło na to samo”?
Najpierw wyznaczmy wartości tempa zmian (czyli indeksów łańcuchowych) wysokości wynagrodzenia w kolejnych latach. Obliczamy to tempo, dodając podane wielkości procentowe do 100%, czyli do jedności. Zatem indeksy te wynoszą: 1,2; 1,05; 1,25; 1,1; 1,03; 1,05. Wartości te posiadają czytelną, praktyczną interpretację: pensja w 2020 roku stanowiła 120% pensji z 2019 roku, pensja w roku 2021 stanowiła 105% pensji z roku 2020 i tak dalej. Innymi słowy, wysokość pensji z roku 2020 otrzymamy mnożąc wysokość pensji z roku 2019 przez 1,2 i kolejne lata analogicznie.
Mnożąc poszczególne wartości tych indeksów, obliczamy łączną podwyżkę, aż do 2025 roku:
$$1,2 \cdot 1,05 \cdot 1,25 \cdot 1,1 \cdot 1,03 \cdot 1,05 = 1,8737 \tag {12a} \label {eq:{12a}}$$
Łącznie pensja Jacka w roku 2025 jest wyższa od pensji z roku 2019 o 87,37%. Średnie tempo zmian to taki „procent” podwyżki, który wykonany sześciokrotnie da taka samą, finalną podwyżkę. Jeśli tempo to oznaczymy przez $\bar i_g$, to powyższy warunek oznacza, że musi zachodzić:
$${\bar i_g} \cdot {\bar i_g} \cdot {\bar i_g} \cdot {\bar i_g} \cdot {\bar i_g} \cdot {\bar i_g} = {\bar i_g}^6 = 1,8737 \tag {12b} \label {eq:{12b}}$$
stąd:
$$\bar i_g = \sqrt[6]{1,8737} = 1,1103 \tag {12c} \label {eq:{12c}}$$
Zatem średnie tempo zmian wynosi 1,1103, co oznacza, że gdyby zamiast stóp podwyżek jak w treści zadania, od 2020 szef podnosił Jackowi wypłatę o 11,03% w stosunku do roku poprzedniego, to finalnie w roku 2025 Jacek zarabiałby tyle samo, co teraz.
Jak wynika z obliczeń (12a), (12b), (12c), średnie tempo zmian jest średnią geometryczną indeksów łańcuchowych. Warto tutaj podkreślić, że średnie tempo zmian z indeksów łańcuchowych liczymy tylko wówczas, gdy dysponujemy tylko takimi indeksami. Tak, jak w przykładzie 10. Nie wiemy, ile Jacek zarabiał, znamy tylko stopy procentowe podwyżek.
Kiedy dysponujemy oryginalnymi wielkościami w poszczególnych okresach, nie musimy obliczać indeksów.
Przykład 11
Poniższa tabela przedstawia wartość sprzedaży pewnego przedsiębiorstwa w latach 2019-2024. Obliczyć średnie tempo zmian wartości sprzedaży. Zakładając utrzymanie się takiego tempa, obliczyć prognozę sprzedaży w roku 2025.
| Rok | Sprzedaż [tys. zł] |
|---|---|
| 2019 | 275 |
| 2020 | 280 |
| 2021 | 254 |
| 2022 | 291 |
| 2023 | 305 |
| 2024 | 310 |
Jak wspomniano, średnie tempo zmian należałoby obliczyć, jako średnią geometryczną indeksów łańcuchowych:
$$\bar i_g = \sqrt[4]{i_1 \cdot i_2 \cdot i_3 \cdot i_4}$$
Indeksy obliczamy, jako stosunek wartości zmiennej (czyli wartości sprzedaży) w roku bieżącym do wartości w roku poprzednim. Zatem:
$$\bar i_g = \sqrt[4]{\frac {\cancel {y_{2021}}}{y_{2020}} \cdot \frac {\cancel {y_{2022}}}{\cancel {y_{2021}}} \cdot \frac {\cancel {y_{2023}}}{\cancel {y_{2022}}} \cdot \frac {y_{2024}}{\cancel {y_{2023}}}} = \sqrt[4]{\frac {y_{2024}}{y_{2020}}}$$
Jak widać, „środkowe” lata się skracają i średnie tempo zmian jest pierwiastkiem odpowiedniego stopnia przez stosunek wartości zmiennej dla ostatniego roku do wartości tej zmiennej dla pierwszego roku, tj.:
$$\bar i_q = \sqrt[n-1]{\frac{y_t}{y_1}} \tag {12} \label{eq:{13}}$$
Warto zwrócić uwagę, że stopień pierwiastka jest o 1 mniejszy aniżeli ilość lat. Bierze się to stąd, że indeksów łańcuchowych jest zawsze o jeden mniej aniżeli danych, gdyż wyliczenie ewentualnego indeksu łańcuchowego dla roku 2019 wymagałoby znajomości wartości sprzedaży dla roku 2018, a danych takich nie posiadamy.
W naszym przypadku średnie tempo zmian wynosi:
$$\bar i_g =\sqrt[4]{ \frac {310}{275}} = 1,0304$$
W latach 2019 – 2024, z roku na rok, sprzedaż wzrastała średnio o 3,04%. Chcąc wyznaczyć prognozę na rok 2025, zakładamy, że tempo to się utrzyma, a zatem sprzedaż będzie wyższa także o 3,04%. Wobec tego:
$$y_{2025}^* = y_{2024} \cdot {\bar i_g} = 310 \cdot 1,0304 = 319,4$$
W przykładzie 11, średnie tempo zmian zostało wykorzystane, jak widać, do prostego prognozowania. Jako metoda prognozowania metoda ta nie jest raczej stosowana – lepsze od niej są metody oparte na trendzie – ale często zadania na średnie tempo zmian są rozszerzone o takie właśnie polecenie.
Oczywiście średnie tempo zmian, obliczone jako średnia geometryczna, może przyjąć wartość mniejszą od jedności. Wówczas interpretuje się ją, jako spadek wartości. Przykładowo $\bar i_g = 0,9745$ oznacza spadek, z roku na rok, średnio o 2,55%. Aby wyliczyć wartość spadku wystarczy bowiem odjąć takie tempo zmian od jedności: $1 - 0,9745 = 0,0255$.
Uwaga praktyczna. Wprawdzie na studiach wypadałoby mieć kalkulator naukowy, jednak wielu studentów takowego sprzętu nie posiada. Barierą jest tu przede wszystkim stosunkowo skomplikowana, zdaniem studentów, obsługa takiego sprzętu. O ile w zamierzchłych, „słusznie minionych” czasach, barierą była cena – markowy zachodni sprzęt nie był dostępny, polskie kalkulatory naukowe były rzadkością (choć istniały) a sprzęt zza Buga kupić można było jedynie „tam”, o tyle dziś w „chińskich” marketach, działający i funkcjonalny kalkulator naukowy kupić można już za 40 zł. Sprzęt porządnej firmy dostać można też za dwucyfrową kwotę.
Dostępne są także aplikacje na smartfony emulujące kalkulator naukowy, ale takie rozwiązanie może nie być akceptowane na kolokwium, czy egzaminie, z uwagi na podejrzenia o korzystanie ze zdalnej pomocy. Do czego jednak zmierzam? Gros studentów posiada tylko podstawowe kalkulatory, ja używam dla nich określenia „sklepowe”. Na kalkulatorach takich nie policzymy pierwiastków dowolnego stopnia i prowadzący zajęcia o tym wiedzą.
Zwyczajny „sklepowy” kalkulator oblicza tylko pierwiastek kwadratowy, zrealizowany jako funkcja jednoargumentowa – wciśnięcie przycisku z symbolem √ powoduje natychmiastowe obliczenie pierwiastka kwadratowego z liczby widocznej na wyświetlaczu. Ponowne wciśnięcie przycisku √ spowoduje obliczenie pierwiastka z tego pierwiastka, czyli pierwiastka czwartego stopnia. Kolejne, trzecie wciśnięcie, wyliczy pierwiastek ósmego stopnia i tak dalej.
Zazwyczaj więc na kolokwiach i egzaminach studenci dostają do wyliczenia takie dane, średnie tempo z tylu lat, że stopień pierwiastka potrzebnego do wyliczenia średniego tempa zmian ze średniej geometrycznej, wynosi 2, 4 (najczęściej) lub 8.
Chcąc kwestię różnic pomiędzy średnią arytmetyczną a geometryczną ogarnąć „na chłopski rozum”, najlepiej przypomnieć sobie zasadę, że średnią arytmetyczną liczymy wówczas, gdy dane podlegają sumowaniu, gdy suma wartości ma sens. No to średnią geometryczną liczymy wówczas, gdy średnia nie ma sensu, natomiast sens ma iloczyn. I tak właśnie jest w przypadku tempa zmian. Gdy w grę wchodzą zmiany procentowe, sens ma mnożenie a nie dodawanie. Stąd właśnie celowość użycia średniej geometrycznej.
Średnia geometryczna na straży uczciwego handlu
Bardzo ciekawe zastosowanie średniej geometrycznej opublikowano w popularnonaukowej książce przeznaczonej dla dzieci: Kowal S. Przez rozrywkę do wiedzy. Rozmaitości matematyczne. WNT, Warszawa 1985. Dotyczy ono pewnego problemu z ważeniem na wadze szalkowej.
Dziś mamy wagi elektroniczne, jednak w pewnych obszarach zastosowań, wciąż stosowane są wagi szalkowe. Wagi szalkowe i inne służą do mierzenia masy różnych obiektów, ale robią to poprzez pomiar jego ciężaru, czyli siły, z jaką masa przyciągana jest przez Ziemię. Pomiar samej masy jest również możliwy, ale wymaga specjalistycznych przyrządów, stosowanych np. na Międzynarodowej Stacji Kosmicznej, gdzie nie można mierzyć masy poprzez ciężar, gdyż nie działa ciążenie.
Otóż waga szalkowa działa na zasadzie porównywania masy ważonego obiektu z masą odważnika. Prawidłowa waga szalkowa jest symetryczna. Wagę taką przedstawiono na rysunku 2.

Waga działa w taki sposób, że umieszczone na szalkach: ważony przedmiot oraz odważnik, chcą obrócić ramię wagi, poprzez działanie momentów, którymi są iloczyny ciężarów (odważnika i ważonego przedmiotu) przez ramię, czyli odległość punktu zawieszenia szalki od osi wagi. Waga jest w równowadze, gdy momenty te są jednakowe.
Niech $m$ oznacza masę ważonego przedmiotu, a $w$ wskazania wagi (tj. masę odważników). Gdy waga jest w równowadze:
$$m \cdot l \cdot g = w \cdot l \cdot g /:lg$$
stąd
$$m = w$$
Waga „pokazuje” wówczas prawdziwą masę ważonego przedmiotu. Jednak w pewnych sytuacjach, np. dla nieuczciwego sprzedawcy, taka rzetelność wagi może nie być korzystna. Jednym ze sposobów „oszukania” wagi szalkowej, jest zastosowanie nierównych ramion wagi. Wagę taką pokazano na rysunku 3.

Nierówne ramiona w wadze powodują, że pozostawanie wagi w równowadze nie świadczy o tym, że masa ważonego obiektu jest równa masie położonych na drugiej szalce odważników. Jeśli ważony produkt położony zostanie na lewej szalce, tej z krótszym ramieniem, to zostanie on zrównoważony przez lżejszy odważnik. Waga produktu zostanie zaniżona. Taka sytuacja oczywiście jest niekorzystna dla sprzedającego, gdyż wówczas sprzeda on np. 1,5 kg towaru, licząc kupującemu według wskazań wagi za mniejsza ilość.
Dla sprzedającego korzystna jest sytuacja odwrotna, gdy towar kładziony będzie na prawej szalce, połączonej z dłuższym ramieniem, a odważniki na lewej. Wówczas do zrównoważenia wagi potrzebny będzie odważnik o masie wyższej aniżeli masa ważonego towaru. Masa towaru zostanie więc zawyżona. I o to nieuczciwemu sprzedającemu chodzi.
Jeśli kupujący będzie chciał wykryć taką sytuację, ma kilka możliwości. Może zmierzyć ramiona wagi. Może nakazać sprzedawcy położyć na obu szalkach jednakowe odważniki. Jeśli waga będzie w równowadze – znaczy to, że ma równe ramiona.
Innym sposobem jest dokonanie dwu ważeń: jedno – umieszczając towar na jednej z szalek, odważniki na drugiej a drugie, po zamianie miejscami towaru i odważników. Jeśli oba wskazania będą się różnić, oznacza to, że ramiona wagi nie są równe. Ustalone masy towaru w jednym i drugim ważeniu, różnić się będą od siebie i ani jedna z nich nie będzie prawdziwa. Niższy wynik będzie zaniżony a wyższy – zawyżony. Ile więc towar waży naprawdę?
Niech $m$ oznacza nieznaną masę towaru, $w_1$ oznacza masę odważników w jednym z ważeń (czyli „pierwszy odczyt wagi”) a $w_2$ masę odważników w drugim ważeniu.
Podczas pierwszego ważenia (towar po lewej, odważniki po prawej), warunek równowagi momentów obracających ramiona wagi ma postać:
$$m \cdot g \cdot a = w_1 \cdot g \cdot b\, /:g $$
$$m \cdot a = w_1 \cdot b $$
stąd:
$$m = w_1 \cdot \frac b a \tag {13a} \label {eq:{14a}}$$
podczas drugiego ważenia (odważniki po lewej, towar po prawej):
$$m \cdot g \cdot b = w_2 \cdot g \cdot a\, /:g $$
$$m \cdot b = w_2 \cdot a $$
stąd:
$$m = w_2 \cdot \frac a b \tag {13b} \label {eq:{14b}}$$
Obliczamy wartość $m^2 = m \cdot m$ korzystając ze wzorów (13a) oraz (13b):
$$m^2 = w_1 \cdot \frac {\cancel b} {\cancel a} \cdot w_2 \cdot \frac {\cancel a} {\cancel b}$$
$$m^2 = w_1 \cdot w_2$$
skąd:
$$m = \sqrt{w_1 \cdot w_2}$$
A zatem prawdziwa masa przedmiotu ważonego na wadze o nierównych ramionach, jest średnią geometryczną wyników obu ważeń: przed i po zamianie towaru i odważników miejscami! To ciekawe a jednocześnie bardzo praktyczne i „życiowe” zastosowanie średniej geometrycznej.
Średnia geometryczna dla szeregu rozdzielczego
Rzadkością jest obliczanie średniej geometrycznej dla danych uszeregowanych w postaci szeregu rozdzielczego, a zwłaszcza szeregu rozdzielczego przedziałowego – choćby z uwagi na wspomniane wcześniej „pomieszanie średnich” – środki przedziałów klasowych wylicza się, jako średnie arytmetyczne ich krańców, toteż średnia geometryczna tutaj raczej nie pasuje.
Częściej, choć i tak sporadycznie, może się zdarzyć, że danych (np. indeksów łańcuchowych) będzie na tyle dużo, że zostaną one pogrupowane w szereg rozdzielczy punktowy. Wówczas, poprzez analogię do średniej arytmetycznej z takiego szeregu, stosowny wzór na wyliczenie tej miary zapiszemy w postaci:
$$\bar x_g = \sqrt[n]{\prod_{i=1}^k x_i^{n_i}} \tag {15} \label {eq:{15}}$$
Kończąc omawiać średnią geometryczną, należy jeszcze rozszerzyć zasadę opisaną nierównością (7), o wzajemne relacje pomiędzy średnią geometryczną, a obiema omówionymi wcześniej średnimi. Otóż prawdziwa jest nierówność:
$$\bar x_h \leq \bar x_g \leq \bar x \tag {16} \label {eq:{16}}$$
Zatem średnia geometryczna plasuje się pomiędzy średnią harmoniczną, która jest spośród omawianych średnich najniższą a średnią arytmetyczną, która jest najwyższa. Równość pomiędzy wszystkimi tymi średnimi możliwa jest tylko wówczas, gdy są one obliczane dla zestawu tych samych wartości. Wówczas wszystkie średnie równe są tej wartości (np. dla danych złożonych z samych dwójek: 2; 2; 2; …) wszystkie średnie wynoszą 2.
Średnia kwadratowa
Czym jest średnia kwadratowa?
Średnia kwadratowa, to średnia, która dla danych podanych w postaci szeregu szczegółowego, wyliczana jest według wzoru:
$$\mu_{2x} = \sqrt {\frac 1 n \cdot \sum _{i=1}^n x_i^2} \tag {17} \label {eq:{17}}$$
Średnia ta jest pierwiastkiem ze średniej arytmetycznej kwadratów wartości danych.
Gdzie pojawia się średnia kwadratowa
Średnia ta w swojej czystej postaci jest dość rzadko używana w statystyce. Sam schemat obliczania pierwiastków ze średniej obliczonej dla kwadratów jest jednak w statystyce bardzo dobrze znany, gdyż np. odchylenie standardowe jest właśnie obliczane, jako średnia kwadratowa odchyłek danych od średniej:
$$s = \sqrt {\frac 1 n \cdot \left(x_i - \bar x \right)^2} \tag {18} \label {eq:{18}}$$
Widać tutaj najważniejszą cechę średniej kwadratowej – dzięki podnoszeniu uśrednianych wartości do kwadratu, traktuje ona w jednakowy sposób wartości dodatnie i ujemne – co pozwala na obliczenie średniej odchyłki od ustalonej wartości (w przypadku odchylenia standardowego jest to odchylenie od średniej arytmetycznej), bez względu na kierunek tego odchylenia.
Taki sam jest schemat obliczania średniokwadratowego błędu prognozy ex-post. W tym przypadku obliczane są odchyłki nie od średniej, a od empirycznych wartości zmiennej prognozowanej. Na podobnej zasadzie powyższy schemat obliczenia stosowany jest w rachunku błędów.
Oprócz tego w literaturze spotkać można kilka innych zastosowań średniej kwadratowej, które mają charakter „ciekawostek”:
- średnia kwadratowa długości podstaw trapezu wyznacza długość linii równoległej do podstaw trapezu, która dzieli trapez na dwa trapezy o jednakowych polach powierzchni;
- w termodynamice średnią kwadratową stosuje się do policzenia tzw. średniej kwadratowej prędkości cząsteczek gazu;
- w elektrotechnice i teorii sygnałów, schemat obliczania średniej kwadratowej stosuje się do obliczania wartości skutecznej impulsów prądowych (zazwyczaj stosuje się tam całkę zamiast sumy).
Średnia potęgowa
Uogólnienie omówionych średnich
Średnią potęgową dla danych w postaci szeregu szczegółówego, nazywamy parametr statystyczny, obliczany według wzoru, z zastrzeżeniem $p\neq0$:
$$\mu_p = \sqrt[p]{\sum_{i=1}^n x_i^p} \tag {19} \label {eq:{19}}$$
Średnia ta jest uogólnieniem dotychczas omówionych, średnich:
- dla $\boldsymbol p \textbf {=1}$, średnia potęgowa staje się średnią arytmetyczną;
- dla $\boldsymbol p \textbf{= -1}$, średnia potęgowa staje się średnią harmoniczną;
- dla $\boldsymbol p \textbf{= 2}$, średnia potęgowa staje się średnią kwadratową.
Dodatkowo, definicję średniej potęgowej, określonej wzorem (19) uogólnia się na trzy przypadki szczególne:
dla $\boldsymbol p \textbf{=0}$ przyjmuje się, że średnią oblicza się wg wzorów (9a),(9b), czyli staje się ona średnią geometryczną;
dla $\boldsymbol p \rightarrow \boldsymbol{-\infty}$ średnia potęgowa równa jest $\min \left(x_1,x_2,...,x_n \right)$, a zatem utożsamia się ją z wartością minimalną z szeregu danych;
dla $\boldsymbol p \rightarrow \boldsymbol{+\infty}$ średnia potęgowa równa jest $\max \left(x_1,x_2,...,x_n \right)$, a zatem utożsamia się ją z wartością maksymalną z szeregu danych;
Nierówność średnich
Dzięki uogólnieniu wszystkich uprzednio omówionych średnich na średnią potęgową, możliwe staje się wyrażenie relacji pomiędzy wartościami średnich, wyrażonych wzorami (7) oraz (16) na jedną, prostą regułę. Niech $-\infty \leq p < q +\leq \infty$, wówczas:
$$\mu_p \left(x_1, x_2, ..., x_n \right) \leq \mu_q \left(x_1, x_2, ..., x_n \right) \tag {20} \label {eq:{20}}$$
przy czym równość zachodzi tylko wtedy, gdy $x_1 = x_2 = ... = x_n$. Aby możliwe było wyliczenie uogólnionej średniej potęgowej, dla każdej wartości $p$ konieczne będzie także założenie: $x_i > 0$ dla $1 \leq i \leq n$.
Ma to sens. Przy okazji omawiania średniej harmonicznej wspominaliśmy, że „ciąży” ona ku wartościom niskim a wartości wysokie – nawet nieskończone – nie robią na niej większego wrażenia. Średnia kwadratowa z kolei, przeciwnie. Wartości wysokie mają jeszcze wyższe kwadraty, toteż wartość średniej jest ku nim bardziej przesuwana, aniżeli ma to miejsce w przypadku średniej arytmetycznej. Zasada, wyrażona wzorem (20), to piękne i kompleksowe podsumowanie tych prawidłowości.
Podsumowanie
W powyższym artykule nie przedstawiliśmy najważniejsze charakterystyki średnich klasycznych, stosowanych w statystyce opisowej. Warto tutaj zaznaczyć, że nie ma lepszych i gorszych średnich, są tylko średnie źle i dobrze dobrane. Z omówionych średnich, na pierwszy rzut oka, najlepsza i wręcz idealna wydaje się średnia arytmetyczna. Wszak „leży ona dokładnie pośrodku”. Np. dla liczb 6 oraz 8 idealną średnią wydaje się 7. Takie jednak myślenie to pułapka!
Idealizując średnią arytmetyczną tylko dlatego, że „lezy pośrodku”, myślimy właśnie kategoriami średniej arytmetycznej. A nic dziwnego, że myśląc kategoriami tej miary, to właśnie ją uznajemy za najlepszą. Jednak średnia nie musi leżeć pośrodku, aby być odpowiednią miarą. Wyobraźmy sobie dwie sytuacje:
- przeprowadziliśmy dwie transakcje – na jednej zarobiliśmy 200 zł a na drugiej straciliśmy 200 zł; ile zarobiliśmy w sumie i średnio na transakcji? Odpowiedź brzmi, oczywiście, zero! Tak, tutaj myślenie kategoriami średniej arytmetycznej jest OK, ale:
- przeprowadziliśmy dwie transakcje – na jednej zarobiliśmy 20% a na drugiej straciliśmy 20%; ile zarobiliśmy w sumie i średnio na transakcji? Bynajmniej nie zero! Na jednej transakcji nasz majątek pomnożył się przez 1,2 a na drugiej przez 0,8; per saldo więc przemnożył się on przez 0,96 i w sumie straciliśmy 4%! Tu myślenie kategoriami średniej arytmetycznej zawodzi. Już lepszą odpowiedzią będzie, że średnio na transakcji straciliśmy po 2%, choć najlepiej policzyć $\sqrt{0,96} = 0,9798$ i prawidłowa odpowiedź brzmi: średnio na każdej z transakcji straciliśmy po 2,02%. W przypadku zmian procentowych należy myśleć kategoriami średniej geometrycznej!
A wszystko dlatego, że … średnia niejedno ma imię.
- Obliczaniu mediany, kwartyli, kwantyli oraz innych miar pozycyjnych poświęcone są i będą inne artykuły w naszej Wszechnicy. Np. artykuł o kwantylach w szeregu szczegółowym ↩︎