Średnia niejedno ma imię
Wprowadzenie
Średnia arytmetyczna to najpowszechniej znana miara statystyki opisowej. Znana i w miarę dobrze rozumiana także przez osoby najbardziej odżegnujące się od matematycznych sympatii. Stosowana jest bardzo szeroko zarówno jako miara zbiorowości, jak i estymator wartości oczekiwanej w populacji generalnej. Jednak statystyka zna nie tylko średnią arytmetyczną. Znane i używane są również inne rodzaje średniej, jak średnia harmoniczna czy średnia geometryczna. Wybór konkretnej średniej zależy od specyfiki zbiorowości i cechy, dla której średnia jest obliczana, natomiast sposób obliczania tej miary zależy od rodzaju szeregu statystycznego.
Spis treści
- Co to w ogóle jest średnia
- Średnia arytmetyczna
- Średnia harmoniczna
- Średnia geometryczna
- Średnia kwadratowa
- Średnia potęgowa
- Podsumowanie
Co to w ogóle jest średnia
Najkrócej mówiąc, średnia to pewna charakterystyka danych. Jest to każda funkcja określona na zbiorze danych $x_1, x_2, ..., x_n$, spełniająca warunek:
$$\min\{x_1, x_2, ..., x_n \} \leq \mu(x_1, x_2, ..., x_n) \leq \max\{x_1, x_2, ..., x_n \} \tag 1 \label {eq:1}$$
Oprócz tego względem każdej ze zmiennych $x_i$ średnia musi być funkcją niemalejącą. Jak więc widać, wiele nie potrzeba, aby dany parametr mógł być nazywany średnią. W tym kontekście średnią jest zarówno wartość najmniejsza, jak i największa spośród danych, gdyż spełniają one warunek (1). Średnią jest także dominanta, mediana, a nawet każdy kwantyl1.
Średnia arytmetyczna
Średnia arytmetyczna jako klasyczna miara tendencji centralnej
Średnia arytmetyczna jest najbardziej znanym przykładem klasycznej miary tendencji centralnej. Miary klasyczne to takie miary statystyczne, na wartość których wpływają wszystkie dane w szeregu. Zmiana pojedynczej danej zawsze wpływa na wartość miary.
Miara tendencji centralnej oznacza, że wskazuje na przeciętność. Oprócz określenia miara tendencji centralnej stosuje się także często określenie miara położenia, co jest również trafnym określeniem w stosunku do średniej i nieco szerszym, gdyż w zakres miar położenia wchodzą także kwartyle i kwantyle innych rzędów. W najszerszym ujęciu można powiedzieć, że praktycznie każda miara położenia jest średnią w rozumieniu warunku (1).
Obliczanie średniej w szczegółowym szeregu statystycznym
Średnia arytmetyczna w szczegółowym szeregu statystycznym to właśnie ta średnia, najszerzej i najlepiej rozumiana w języku potocznym. Sposób jej obliczania można najkrócej streścić jako dodaj wszystkie wartości i podziel przez ich liczbę. Sposób ten zapisuje się najczęściej za pomocą formuły:
$$\bar x = {{x_1 + x_2 + ... + x_n} \over n} \tag {2a} \label {eq:{2a}}$$
Korzystając z operatora sumowania, wzór ten zapisuje się w postaci najczęściej spotykanej w podręcznikach statystyki opisowej:
$$\bar x = {{1 \over n} \cdot \sum_{i = 1}^n x_i} \tag {2b} \label {eq:{2b}}$$
Operator sumowania oznacza, że podstawiamy za indeks przy zmiennej $x$ kolejne wartości $i$ od 1 aż do $n$ i wszystkie kolejno otrzymywane wartości $x_1$, $x_2$, …, $x_n$ sumujemy. Z kolei oznaczenie $\bar x$ to powszechnie przyjęte w statystyce opisowej oznaczenie średniej arytmetycznej, za pomocą poziomej kreski nad nazwą zmiennej.
Przykład 1
Akwizytor w kolejnych miesiącach, od stycznia do grudnia, zarobił następujące kwoty prowizji: 2480; 6731; 1128; 5355; 7846; 972; 1571; 18903; 7525; 5644; 2781; 6702. Obliczyć średnią wysokość prowizji akwizytora w miesiącu.
$$\bar x = {{2480 + 6731 + 1128 + 5355 + 7846 + 972 + 1571 + 18903 + 7525 + 5644 + 2781 + 6702} \over 12}$$
$$\bar x = {{67638} \over 12} = 5636,50$$
Tak więc średnia miesięczna kwota uzyskiwanej przez akwizytora prowizji wyniosła 5636,50 zł.
Co to oznacza w praktyce? Gdyby nasz akwizytor osiągał regularne miesięczne prowizje, to gdyby w każdym miesiącu jego prowizja wyniosła 5636,50 zł, można by powiedzieć, że „wyszłoby na to samo”. Taka jest właśnie idea średniej arytmetycznej.
Niektórzy nauczyciele akademiccy tłumaczą studentom, że średnia nie nadaje się dobrze do wielkości silnie zróżnicowanych. Tam, gdzie pojawiają się wartości odstające – tak jak u nas w jednym miesiącu prowizja wyniosła aż 18903 zł. Nie jest to jednak do końca prawda. Bez względu na to, jak zróżnicowane są wartości i jak bardzo niektóre z nich odstają od reszty, średnia jest zawsze właściwą miarą dla wielkości, które podlegają sumowaniu, czyli wielkości (zmiennych statystycznych), których suma ma sens praktyczny.
W naszym przypadku, niezależnie od tego, czy nasz akwizytor w danym miesiącu zarobi sto, czy milion złotych, to wszystko wpada do jego kieszeni i wpływa na średni roczny dochód. Tak więc średnia w tym przypadku zawsze będzie odpowiednią miarą przeciętności.
Przykład 2
Jeśli jednak np. będziemy chcieli ustalić przeciętną cenę zagranicznej wycieczki spośród następujących ofert (ceny za uczestnika, dane uszeregowano od najmniejszej do największej ceny za osobę): 2500; 2850; 2900; 3200; 3350; 3600; 3700; 3800; 25700; 31000, to wówczas średnia wyniesie:
$$\bar x = {{2500 + 2850 + 2900 + 3200 + 3350 + 3600 + 3700 + 3800 + 25700 + 31000} \over 10}$$
$$\bar x = {{82600} \over 10} = 8260$$
Otrzymamy przeciętną cenę wycieczki 8260 zł. Czy jednak w takim wypadku będzie to dobra ocena przeciętności? Otóż – zależy. Jeśli będą to np. kwoty wycieczek sprzedanych przez biuro podróży w danym tygodniu, to można powiedzieć, że średnio biuro uzyskało 8260 zł za jedną wycieczkę. Jeśli jednak jest to 10 ofert i chcemy podać przeciętną cenę – np. dla zorientowania się w sytuacji rynkowej – to średnia nie będzie dobrą miarą.
Wynikająca z niej przeciętna cena wycieczki da całkowicie fałszywy obraz sytuacji. Dla przeciętnego konsumenta wycieczka za ponad 8 tys. zł od osoby jest zbyt droga. I w rzeczywistości wśród przedstawionych dziesięciu ofert nawet nie ma ani jednej wycieczki z takiej półki cenowej. Dla bogatego miłośnika luksusu z kolei taka cena może sugerować, że oferowane wycieczki są poniżej jego subiektywnej granicy ekskluzywności.
W tej sytuacji istotnie pojawienie się odstających danych sprawia, że lepszą miarą przeciętności od średniej okazuje się mediana. W tym wypadku mediana wyniesie 3475 zł i wartość ta dość trafnie obrazuje sytuację. Dzieje się tak dlatego, że dane nie podlegają tutaj sumowaniu. To, że ktoś kupił sobie wycieczkę za ponad 30 tys. zł, w żaden sposób nie wpływa na cenę wycieczki dla innych konsumentów. To bardzo istotna kwestia, często poruszana na zajęciach ze statystyki.
Obliczanie średniej arytmetycznej w szeregu rozdzielczym punktowym
Szereg rozdzielczy punktowy to efekt „kompresji bezstratnej” szeregu szczegółowego. Jeśli dane się powtarzają, zamiast enumeratywnie wypisywać wszystkie takie dane wielokrotnie, można zamiast tego zapisać wartość oraz liczbę powtórzeń. Zamiast wielokrotnie dodawać tę samą wartość, można mnożyć wartość przez liczebność.
Schemat szeregu rozdzielczego punktowego jest następujący:
| $x_i$ | $n_i$ | $w_i$ |
|---|---|---|
| $x_1$ | $n_1$ | $w_1$ |
| $x_2$ | $n_2$ | $w_2$ |
| … | … | … |
| $x_k$ | $n_k$ | $w_k$ |
| $\Sigma$ | $N$ | $1$ |
$x_i$ to wartości cechy (zmiennej), $n_i$ to liczebności (częstości) wystąpienia poszczególnej wartości, natomiast $w_i$ to częstości względne: $w_i = {n_i \over N}$.
Wzór na obliczenie średniej arytmetycznej w takim szeregu to:
$$\bar x = {{1 \over N} \cdot \sum_{i=1}^k {x_i \cdot n_i}} \tag {3a} \label {eq:{3a}}$$
Średnią można też policzyć, wykorzystując częstości względne:
$$\bar x = { \sum_{i=1}^k {x_i \cdot w_i}} \tag {3b} \label {eq:{3b}}$$
Należy zwrócić uwagę, że w przeciwieństwie do wzoru (2b), we wzorach (3a) oraz (3b) sumowanie odbywa się do $k$, a nie do $n$. $k$ jest tutaj oczywiście liczbą różnych wartości występujących w szeregu.
Średnia arytmetyczna obliczana dla szeregu rozdzielczego punktowego to szczególny przypadek średniej arytmetycznej ważonej, o której mowa będzie w dalszej części artykułu.
Przykład 3
Poniżej zebrano dane o liczbie wypadków, jakie wydarzyły się w pewnej miejscowości w 100 kolejnych dniach.
| $x_i$ | $n_i$ | $w_i$ |
|---|---|---|
| 0 | 45 | $0,45$ |
| 1 | 22 | $0,22$ |
| 2 | 12 | $0,12$ |
| 3 | 8 | $0,08$ |
| 4 | 7 | $0,07$ |
| 5 | 6 | $0,06$ |
| $\Sigma$ | 100 | $\textbf 1$ |
Średnia arytmetyczna, obliczona według wzoru (3a), wynosi:
$$\bar x = {{0 \cdot 45 + 1 \cdot 22 + 2 \cdot 12 + 3 \cdot 8 + 4 \cdot 7 + 5 \cdot 6} \over 100}$$
$$\bar x = {128 \over 100} = 1,28$$
Według wzoru (3b):
$$\bar x = 0 \cdot 0,45 + 1 \cdot 0,22 + 2 \cdot 0,12 + 3 \cdot 0,08 + 4 \cdot 0,07 + 5 \cdot 0,06 = 1,28$$
Jak widać, wzór (3b) pozwala na wyliczenie średniej arytmetycznej niejako „bezpośrednio”. Od razu uzyskujemy wynik. Obliczona wartość średniej arytmetycznej oznacza, że w objętej analizą miejscowości w badanym okresie wydarzyło się średnio 1,28 wypadku dziennie.
Obliczenie średniej arytmetycznej w szeregu rozdzielczym przedziałowym
W odróżnieniu od szeregu rozdzielczego punktowego, szereg rozdzielczy przedziałowy (zwany czasem także szeregiem rozdzielczym z przedziałami klasowymi) stanowi „kompresję stratną” danych. Szereg zawiera informację o krańcach przedziałów oraz liczbie danych, które należą do poszczególnych przedziałów. Nie wiemy natomiast, jakie dokładnie liczby do tego przedziału trafiły.
Przy obliczaniu miar statystycznych na podstawie szeregów rozdzielczych przedziałowych przyjęto następujące zasady:
- dla potrzeb obliczania miar pozycyjnych (np. mediany) przyjmuje się, że poszczególne elementy zbioru danych w każdym z przedziałów rozłożone są równomiernie;
- dla potrzeb obliczenia miar klasycznych przyjmuje się, że w każdym przedziale wszystkie elementy do niego należące mają jednakowe wartości, równe wartości środkowej, tj. średniej arytmetycznej początku i końca przedziału.
Wartość środkową przedziału (klasy) oznacza się zazwyczaj symbolem: $\dot x$. Wzory do obliczenia średniej arytmetycznej są w zasadzie identyczne ze wzorami (3a), (3b), tyle że zamiast wartości zmiennej są środki przedziałów. Wzór wykorzystujący liczebności absolutne:
$$\bar x = {{1 \over N} \cdot \sum_{i=1}^k {\dot x_i \cdot n_i}} \tag {4a} \label {eq:{4a}}$$
Wzór wykorzystujący liczebności (częstości) względne, zwane także wskaźnikami struktury:
$$\bar x = { \sum_{i=1}^k {\dot x_i \cdot w_i}} \tag {4b} \label {eq:{4b}}$$
Przykład 4
Zebrano dane o wysokości kontraktów (w tys. zł) zawartych przez przedstawicieli handlowych pewnej firmy.
| $x_{0i} - x_{1i}$ | $n_i$ | $\dot x_i$ | $\dot x_i \cdot n_i$ | $w_i$ | $\dot x_i \cdot w_i$ |
|---|---|---|---|---|---|
| $0 - 10$ | 2 | 5 | 10 | 0,05 | 0,25 |
| $10 - 20$ | 22 | 15 | 330 | 0,55 | 8,25 |
| $20 - 30$ | 10 | 25 | 250 | 0,25 | 6,25 |
| $30 - 40$ | 4 | 35 | 140 | 0,10 | 3,50 |
| $40 - 50$ | 2 | 45 | 90 | 0,05 | 2,25 |
| $\Sigma$ | 40 | 820 | 1,00 | 20,50 |
Dane statystyczne zawarte są w pierwszych dwu kolumnach. Pozostałe kolumny zawierają obliczenia pomocnicze – oznaczone kolorem niebieskim.
Średnia arytmetyczna, obliczona ze wzoru (4a):
$$\bar x = {{5 \cdot 2 + 15 \cdot 22 + 25 \cdot 10 + 35 \cdot 4 + 45 \cdot 2 } \over 40}$$
$$\bar x = {820 \over 40} = 20,50$$
Obliczenie za pomocą wzoru (4b) jest bardzo podobne:
$$\bar x = {5 \cdot 0,05 + 15 \cdot 0,55 + 25 \cdot 0,25 + 35 \cdot 0,10 + 45 \cdot 0,05 } = 20,50 $$
Średnia wartość zawartych kontraktów wyniosła 20,5 tys. zł.
Średnia arytmetyczna ważona
Ze średnią ważoną mamy do czynienia wówczas, gdy obliczamy średnią w sytuacji, gdy wszystkie dane w szeregu statystycznym są dla nas niejednakowo ważne. Z tym mieliśmy do czynienia właśnie w szeregach rozdzielczych, gdzie średnia nie była obliczana przez zwykłe dodanie wartości zmiennej, ale wartości te były mnożone przez liczebności. Liczebności te pełniły rolę wag. We wzorach (3a) oraz (4a) wagami były liczebności (częstości) absolutne, natomiast we wzorach (3b) oraz (4b) były to częstości względne (wskaźniki struktury).
W ogólności bowiem formuła na średnią arytmetyczną ważoną w szeregu szczegółowym, złożonym z $n$ wartości $x_i$, z których każda posiada swoją wagę $w_i$, wyraża się wzorem:
$${\bar x}_w = {{\sum_{i=1}^n x_i \cdot w_i} \over {\sum_{i=1}^n w_i}} \tag 5 \label {eq:5}$$
Jeśli wagi są unormowane, czyli sumują się do jedności (np. są to wagi określone procentowo), to wówczas $\sum_{i=1}^n w_i = 1$ i we wzorze (5) „znika” mianownik (jest równy jedności).
Wagi mogą być określone arbitralnie. Np. wysokość stypendium naukowego może być określona jako średnia ważona z odpowiednich przedmiotów.
Przykład 5
Załóżmy, że na pewnej uczelni określono minimalną średnią do ubiegania się o stypendium naukowe w wysokości 4,2. Określono, że do średniej tej wliczają się uzyskane w poprzednim semestrze oceny z analizy matematycznej oraz statystyki opisowej. Wagi przypisane poszczególnym ocenom oraz uzyskane przez pewnego studenta oceny przedstawia poniższa tabela:
| Przedmiot | Waga oceny | Ocena studenta |
|---|---|---|
| Analiza matematyczna – ćwiczenia | 10% | 4,5 |
| Analiza matematyczna – egzamin | 30% | 4,0 |
| Statystyka opisowa – ćwiczenia | 20% | 4,0 |
| Statystyka opisowa – laboratorium | 15% | 3,5 |
| Statystyka opisowa – egzamin | 25% | 5,0 |
| SUMA | 100% |
Czy student uzyska stypendium?
Obliczamy średnią ważoną. Wagi są unormowane. Średnia wynosi:
$${\bar x}_w = 4,5 \cdot 0,1 + 4,0 \cdot 0,3 + 4,0 \cdot 0,2 + 3,5 \cdot 0,15 + 5,0 \cdot 0,25 = 4,225$$
A zatem nasz student załapał się na stypendium naukowe przysłowiowym „rzutem na taśmę”.
Co jeszcze powinniśmy wiedzieć o średniej arytmetycznej?
Średnia arytmetyczna jest podstawowym i najczęściej stosowanym estymatorem wartości oczekiwanej w populacji generalnej. Jeśli mamy populację i chcemy oszacować wartość oczekiwaną jakiejś zmiennej w tej populacji, czyli właśnie taką średnią dla całej populacji, dysponując losową próbką danych, wówczas naturalnym i najczęściej wykorzystywanym oszacowaniem jest średnia arytmetyczna z próby. Przy typowych założeniach, zwłaszcza przy losowej próbie i skończonej wariancji, ma ona bardzo dobre własności statystyczne. Będzie to poruszone w artykule o estymatorach.
Średnia harmoniczna
Średnia harmoniczna jako średnia do zadań specjalnych
Skoro średnia arytmetyczna jest taka dobra, to po co korzystać z jakichś innych średnich? Otóż są sytuacje, gdzie średnia arytmetyczna nie spełnia dobrze swojej roli miary przeciętności. Wcale nie chodzi tutaj o pojawianie się danych odstających itp., ale o specyfikę zmiennej, dla której liczymy średnią.
Średnią harmoniczną dla szeregu szczegółowego scharakteryzować można najkrócej w taki sposób, że odwrotność średniej harmonicznej jest średnią arytmetyczną z odwrotności danych. Literalnie zatem, wykorzystując tę niby-definicję, mamy:
$${1 \over {\bar x_h}} = {{{1 \over {x_1}} + {1 \over {x_2}} + ... + {1 \over {x_n}}} \over n } $$
po obustronnym odwróceniu:
$$\bar x_h = {n \over {{1 \over {x_1}} + {1 \over {x_2}} + ... + {1 \over {x_n}}} } $$
Dostajemy formalny wzór:
$$\bar x_h = {n \over {\sum_{i=1}^n {1 \over {x_i}}} } \tag 6 \label {eq:6} $$
Pierwsze, co powinno się „rzucić w oczy”, to to, że nie można średniej tej policzyć, gdy wśród danych znajduje się zero. W ogóle najlepiej przyjąć, że średnią harmoniczną liczymy dla danych dodatnich. Oprócz tego, że wśród danych nie może być zera, specyfika wzoru (6) jest taka, że w szczególny sposób traktuje ona liczby. W przeciwieństwie do średniej arytmetycznej, która wszystkie liczby traktuje po równo, średnia harmoniczna faworyzuje wartości niskie, co skutkuje następującą relacją pomiędzy średnią arytmetyczną a harmoniczną:
$$\bar x_h \leq \bar x \tag 7 \label {eq:7}$$
Czyli średnia harmoniczna zawsze jest nie większa od średniej arytmetycznej, a równość zachodzi tylko wówczas, gdy wszystkie dane w zbiorze są jednakowe.
Kiedy średnia harmoniczna jest lepszą miarą przeciętności od średniej arytmetycznej? Weźmy następujący przykład.
Przykład 6
Adam jechał do swojej babci na rowerze. Do babci jechał trochę pod górkę, średnio z prędkością $10 \,\frac{\mathrm{km}}{\mathrm{h}}$. Natomiast z powrotem jechał z górki (i cieszył się z prezentu od babci), jechał zatem z prędkością $20 \,\frac{\mathrm{km}}{\mathrm{h}}$. Z jaką średnią prędkością jechał Adam?
Sprawa wydaje się prosta: $\frac {10 + 20} 2 = 15$. Czy jednak $15 \,\frac{\mathrm{km}}{\mathrm{h}}$ to prawidłowa odpowiedź? Okazuje się, że nie.
Załóżmy, że od Adama do babci jest 10 $\mathrm{km}$. Odległość, jak się zaraz okaże, może być dowolna. Przy prędkości $10 \,\frac{\mathrm{km}}{\mathrm{h}}$ droga do babci zajęła Adamowi równą godzinę. Droga powrotna, gdzie ostro pocisnął $20 \,\frac{\mathrm{km}}{\mathrm{h}}$, wymagała tylko pół godziny. W sumie więc Adam przejechał 20 $\mathrm{km}$, co zajęło mu 1,5 $\mathrm{h}$. Ile zatem wynosiła średnia prędkość? Trzeba podzielić drogę przez czas:
$$\bar v = \frac {20} {1,5} = \frac {40} 3 = 13,33 \,\frac{\mathrm{km}}{\mathrm{h}}$$
Ciekawe, prawda? Zgodnie z ideą średniej harmonicznej, wynik rzeczywiście znajduje się bliżej niższej wartości. Jeśli do kogoś taki przykład słabo przemawia, to weźmy jaskrawszy przykład. Załóżmy, że w drodze powrotnej Adam został teleportowany z prędkością światła:
$$ c = 299792458 \,\frac{\mathrm m}{\mathrm s} = 1079252848,8\,\frac{\mathrm{km}}{\mathrm h}$$
Przebycie dystansu 10 $\mathrm{km}$ z taką prędkością zajmuje niewiele ponad 33 $\mathrm{\mu s}$ (mikrosekundy), zatem śmiało można przyjąć, że czas ten jest praktycznie zerowy. W takiej sytuacji podróż w obie strony zajęła mu prawie tyle samo, co w jedną stronę, czyli 1 $\mathrm{h}$, a pokonał w sumie 20 $\mathrm{km}$. Średnia prędkość wyniosła więc około $20 \,\frac{\mathrm{km}}{\mathrm{h}}$. Gdybyśmy liczyli według średniej arytmetycznej, wówczas otrzymalibyśmy ponad $539626000 \,\frac{\mathrm{km}}{\mathrm{h}}$. Przecież z taką prędkością zarówno podróż tam, jak i z powrotem zająć powinna mikrosekundy, a zajęła godzinę, prawda?
Przykład 7
Rozważmy problem ogólniej. Jeśli dystans $s$ pokonujemy w jedną stronę z prędkością $v_1$, w drugą zaś – z prędkością $v_2$, ile wynosi prędkość średnia?
Prędkość średnią wyliczamy jako stosunek (iloraz) łącznego dystansu ($2s$) do łącznego czasu. Ile wynosi łączny czas? Czas jazdy w jedną stronę wynosi: $t_1 = \frac s {v_1}$, a w drugą $t_2 = \frac s {v_2}$. A zatem:
$$\bar v = \frac {2s} {\frac s {v_1} + \frac s {v_2}} = \frac {2s} {s \cdot \left( \frac 1 {v_1} + \frac 1 {v_2} \right)} = \frac 2 {\frac 1 {v_1} + \frac 1 {v_2} } $$
Co otrzymaliśmy? Otrzymaliśmy ni mniej, ni więcej, tylko wzór (6) dla $n=2$. Mamy więc pełne uzasadnienie dla stosowania średniej harmonicznej przy obliczaniu średniej prędkości, gdy mamy do czynienia z jednakowymi drogami pokonywanymi z różnymi prędkościami.
Czy jednak zawsze średnią prędkość obliczamy za pomocą średniej harmonicznej?
Przykład 8
Bartek lubi jeździć wyczynowo na rowerze. Pewnego dnia wybrał się w dłuższą, dwugodzinną podróż. Przez pierwszą godzinę jechał w trudnym terenie, pod górkę, z prędkością $10 \,\frac{\mathrm{km}}{\mathrm{h}}$. Później jednak droga stała się prostsza, było z górki. Drugą godzinę jechał z prędkością $20 \,\frac{\mathrm{km}}{\mathrm{h}}$. Jaka była jego średnia prędkość?
Policzmy najpierw, jaki dystans przejechał. Przez pierwszą godzinę jechał z prędkością $10\,\frac{\mathrm{km}}{\mathrm{h}}$, przejechał zatem równe 10 $\mathrm{km}$. Drugą godzinę jechał z prędkością $20\,\frac{\mathrm{km}}{\mathrm{h}}$, przejechał zatem 20 $\mathrm{km}$. Łącznie przebył więc dystans 30 $\mathrm{km}$ w ciągu dwóch godzin. Średnia prędkość wyniosła więc $15 \,\frac{\mathrm{km}}{\mathrm{h}}$. Tyle, ile wynosi średnia arytmetyczna tych dwu wartości. Zatem:
$$\bar v = \frac {v_1 + v_2} 2$$
O co tutaj chodzi? Dlaczego tym razem to średnia arytmetyczna jest tą właściwą? Zauważmy, że potraktowaliśmy dane jako dwuelementowy szereg szczegółowy. Elementy szeregu szczegółowego traktujemy jako jednorodne. W przeciwnym razie należałoby użyć szeregu rozdzielczego lub nadać zmiennym jakieś wagi.
Zmienna, dla której w przykładach nr 7 oraz nr 8 obliczaliśmy średnią, jest wyrażona w jednostce względnej (ilorazowej), $\left[ \frac{\mathrm{km}}{\mathrm h} \right]$. W przykładzie nr 7, gdzie obliczaliśmy średnią prędkość z dwu prędkości „tam” i „z powrotem”, obydwie wartości są jednorodne ze względu na pokonywaną odległość, czyli są jednorodne ze względu na jednostkę z licznika. W takim przypadku właściwą średnią jest średnia harmoniczna.
Z kolei w przykładzie nr 8, gdzie obliczaliśmy średnią prędkość z dwu prędkości w ciągu dwu różnych godzin, obydwie wartości są jednorodne ze względu na jednostkę z mianownika. W takim przypadku właściwą średnią jest „poczciwa” średnia arytmetyczna.
Chcąc zrozumieć logikę tej reguły, pojąć ją „na chłopski rozum”, można sobie to wytłumaczyć tak: średnia arytmetyczna ma sens, gdy dane podlegają sumowaniu (patrz przykład 2). Sumować można natomiast liczby o wspólnym mianowniku. Dlatego też jednorodność pod względem mianownika uzasadnia użycie średniej arytmetycznej. Wspólny licznik nie jest wystarczającym uzasadnieniem dla sumowania, więc używamy średniej harmonicznej, w której wylicza się odwrotności, a wtedy licznik staje się mianownikiem.
W swej już prawie trzydziestoletniej (włączając czasy sprzed założenia Wszechwiedzy) praktyce korepetytorskiej spotkałem się z jeszcze jednym bardzo ciekawym wykorzystaniem średniej harmonicznej. Czy słusznym? Wymaga to głębszej analizy. Jednak innego rodzaju średniej klasycznej w przykładzie, który za chwilę przedstawię, wyliczyć się nie da.
Przykład 9
Składający się z dziesięciu żołnierzy oddział poszedł na wojnę. Trzech żołnierzy zginęło po pięciu dniach, dwóch po dziesięciu dniach, dwóch po dwudziestu dniach. Pozostali trzej żołnierze przeżyli całą wojnę. Jaki był średni czas życia żołnierza z tego oddziału (licząc od momentu rozpoczęcia wojny)?
Gdybyśmy chcieli tutaj policzyć średnią arytmetyczną, która na pierwszy rzut oka wydaje się właściwą miarą, to nie jest to możliwe, gdyż nie mamy informacji, ile trwała wojna. Z treści zadania wynika, że na pewno nie była to wojna siedmiodniowa, ale nie wiadomo też, czy była to II wojna światowa, czy może jednak wojna trzydziestoletnia. Nie da się więc policzyć średniej arytmetycznej. W zasadzie wydawałoby się, że nie da się policzyć żadnej miary klasycznej – wszak w wyliczeniu takiej miary udział muszą wziąć wszystkie wartości cechy.
Medianę (jako miarę pozycyjną) można policzyć bez problemu – szereg jest dziesięcioelementowy, medianą jest więc średnia arytmetyczna elementu piątego i szóstego. Czasy życia żołnierzy na wojnie, uporządkowane od najkrótszego do najdłuższego, wynoszą:
$$5;\,5;\,5;\,10;\,10;\,20;\,20;\,?;\,?;\,?$$
Trzy nieznane czasy życia żołnierzy, którzy dotrwali do końca wojny, oznaczone są znakami zapytania. Są one z pewnością dłuższe od 20 dni, toteż kolejność elementów nie budzi wątpliwości. Czyli mediana życia żołnierzy wynosi: $Me = \frac {10+20} 2 = 15$ dni. Jest to już coś, ale czy da się policzyć coś jeszcze?
Tak, choć trzeba od razu zaznaczyć, że dalsze rozumowanie ma charakter dyskusyjnej ciekawostki dydaktycznej, a nie standardowej procedury analizy przeżycia. Rozważając sensowność obliczania średniej harmonicznej w przykładzie nr 6, zastanawialiśmy się, co by było, gdyby Adam w drodze powrotnej podróżował z prędkością światła. Przyjęliśmy, że czas trwania takiej podróży byłby praktycznie zerowy. We wzorze (6) mamy odwrotności zmiennej, dla której liczymy średnią harmoniczną. Zakładając, że wojna trwała znacznie dłużej aniżeli czas przeżycia na niej najpóźniej poległego żołnierza, możemy przyjąć, że czas życia tych, którzy dotrwali do końca wojny, jest bardzo duży, czyli w przybliżeniu $x_i \rightarrow \infty$, a wówczas odwrotność takiego czasu dąży do zera: $\frac 1 {x_i} \rightarrow 0$. Zatem możemy policzyć średnią harmoniczną w następujący sposób:
$$\bar x_h = \frac {10} {\frac 1 {5} + \frac 1 {5} + \frac 1 {5} + \frac 1 {10} + \frac 1 {10} + \frac 1 {20} + \frac 1 {20} + 0 + 0 + 0}$$
$$\bar x_h = \frac {10} {0,2 + 0,2 + 0,2 + 0,1 + 0,1 + 0,05 + 0,05 + 0 + 0 + 0 } = \frac {10} {0,9} = \frac {100} 9$$
$$\bar x_h = 11,11$$
A zatem przy takim, bardzo szczególnym założeniu, średni czas przeżycia żołnierza ze wspomnianego oddziału wyniósłby 11,11 dnia. Z ciekawości możemy zobaczyć, jaki wyszedłby ten średni czas liczony średnią harmoniczną, gdyby przyjąć konkretny czas trwania wojny. Załóżmy, że chodzi o II wojnę światową w Europie: od 1.09.1939 do 8.05.1945, czyli 2076 dni.
Dla tej wartości średnia wyniesie:
$$\bar x_h = \frac {10} {\frac 1 {5} + \frac 1 {5} + \frac 1 {5} + \frac 1 {10} + \frac 1 {10} + \frac 1 {20} + \frac 1 {20} + \frac 1 {2076} + \frac 1 {2076} + \frac 1 {2076}}$$
$$\bar x_h = \frac {10} {0,901445087}$$
$$\bar x_h = 11,09$$
Różnica niewielka. Dla porównania, średnia arytmetyczna wyniesie:
$$\bar x = \frac {5 \cdot 3 + 10 \cdot 2 + 20 \cdot 2 + 2076 \cdot 3}{10} = 630,3$$
Według średniej arytmetycznej średni czas przeżycia żołnierza na wojnie – zakładając, że chodzi o II wojnę światową w Europie – wyniesie 630,3 dnia. Wcale nie jest trywialnym pytanie, która z tych średnich daje lepszy obraz sytuacji i bardziej realistycznie ocenia szanse przeżycia. W klasycznej analizie przeżycia stosuje się oczywiście specjalne metody uwzględniające obserwacje ucięte, czyli takie przypadki, w których wiemy tylko, że dana osoba przeżyła co najmniej do końca obserwowanego okresu.
„Filozofię” użycia średniej harmonicznej do wyliczenia średniego czasu przeżycia wojny najprościej zrozumieć i wyczuć, biorąc pod uwagę tylko dwóch żołnierzy. Jeden przeżył 10 dni, a drugi doczekał końca wojny. Ich średni czas przeżycia na wojnie, liczony średnią harmoniczną przy założeniu, że czas drugiego żołnierza jest bardzo duży, wynosi:
$$\bar x_h = \frac 2 {\frac 1 {10} + 0} = \frac 2 {0,1} = 20$$
Zatem w takim przypadku, gdy jeden zginął po 10 dniach, a drugi dożył końca bardzo długiej wojny, średni czas przeżycia liczony tym sposobem wynosi 20 dni.
Tak czy inaczej, użycie średniej harmonicznej w tym wypadku, choć ciekawe i dające do myślenia, uważam za wielce dyskusyjne i nie przytoczyłbym tego przykładu, gdyby nie to, że zetknąłem się z nim w mojej praktyce korepetytorskiej jako z autentycznym przykładem z zajęć na uczelni mojej Klientki.
Czy braki w danych (brak informacji o czasie trwania wojny) bądź też ich skrajna asymetria – w przykładzie nakładają się oba te czynniki – są wystarczającym usprawiedliwieniem dla liczenia średniej harmonicznej dla zmiennej niewyrażonej jednostką względną? Może jednak lepiej zostać przy medianie, która też w tym przypadku jest niezła i w większości przypadków da się ją policzyć? To dobre pytania, które warto zostawić Czytelnikowi do przemyślenia.
Średnia harmoniczna dla szeregu rozdzielczego
W przypadku szeregu rozdzielczego, gdzie badana zmienna mianowana jest w jednostce będącej ilorazem innych jednostek, właściwy wybór średniej zależy od tego, w jakiej jednostce wyrażone są liczebności. W przypadku, gdy liczebności wyrażone są w jednostce:
- z licznika jednostki analizowanej zmiennej, właściwą średnią jest średnia harmoniczna;
- z mianownika jednostki analizowanej zmiennej, właściwą średnią jest średnia arytmetyczna.
Średnią harmoniczną z danych przedstawionych w postaci szeregu rozdzielczego punktowego oblicza się według wzoru:
$$\bar x_h = \frac {\sum_{i=1}^k n_i}{\sum_{i=1}^k \frac{n_i}{x_i}} \tag 8 \label {eq:8}$$
Dla szeregu rozdzielczego przedziałowego będzie podobnie – w roli pojedynczych wartości $x_i$ wystąpią środki $\dot x_i$ przedziałów klasowych, choć jest nieco dyskusyjne, czy w sytuacji konieczności użycia średniej harmonicznej właściwym jest użycie szeregu rozdzielczego przedziałowego, który – jak wspomnieliśmy – na potrzeby liczenia miar klasycznych zakłada, że wszystkie wartości w przedziale są równe środkowi przedziału, a zatem średniej arytmetycznej jego krańców. Występuje tu swego rodzaju pomieszanie obu rodzajów średnich.
Przykład 10
Powiat radomszczański składa się z 14 gmin. Poniższa tabela przedstawia dane o gęstości zaludnienia (zmienna $x_i$) oraz ludności tych gmin (liczebność-waga $n_i$) według stanu na 31.12.2024. Należy policzyć średnią gęstość zaludnienia w powiecie radomszczańskim.
| Gmina | $x_i\,\left[\frac{\mathrm{os}}{\mathrm{km}^2} \right]$ | $n_i \,\left[ \text {os} \right]$ | $\frac {n_i} {x_i}$ |
|---|---|---|---|
| Dobryszyce | 90,61 | 4621 | 51,00 |
| Gidle | 49,19 | 5706 | 116,00 |
| Gomunice | 90,42 | 5606 | 62,00 |
| Kamieńsk | 57,40 | 5510 | 95,99 |
| Kobiele Wielkie | 41,12 | 4194 | 101,99 |
| Kodrąb | 39,82 | 4221 | 106,00 |
| Lgota Wielka | 65,05 | 4098 | 63,00 |
| Ładzice | 55,16 | 4578 | 82,99 |
| Masłowice | 33,22 | 3854 | 116,01 |
| Przedbórz | 33,88 | 6437 | 189,99 |
| Radomsko – miasto | 831,61 | 42412 | 51,00 |
| Radomsko – gmina wiejska | 62,88 | 5408 | 86,01 |
| Wielgomłyny | 34,50 | 4243 | 122,99 |
| Żytno | 23,91 | 4735 | 198,03 |
| Razem | 105623 | 1443,00 |
Należy bardzo dokładnie podkreślić, że gdyby polecenie brzmiało obliczyć średnią gęstość zaludnienia gminy w powiecie radomszczańskim, wówczas można by było policzyć zwyczajną nieważoną średnią arytmetyczną, traktując gminy powiatu radomszczańskiego jako zbiorowość, a gęstość zaludnienia jako cechę. Skoro jednak chodzi o średnią gęstość zaludnienia w powiecie radomszczańskim, czyli niejako średnią gęstość zaludnienia na całej połaci ziemi zajmowanej przez ten powiat, konieczne jest uwzględnienie liczebności.
Gęstość zaludnienia mierzona jest w jednostce względnej $\left[\frac{\mathrm{os}}{\mathrm{km}^2} \right]$, a liczebności podane są w osobach, tj. w jednostce z licznika. Konieczne jest więc użycie średniej harmonicznej, czyli użyjemy wzoru (8). Wartości ilorazów $\frac {n_i} {x_i}$ z mianownika tegoż wzoru wyliczone zostały w tabeli (zaznaczone na niebiesko).
Średnia harmoniczna gęstości zaludnienia, równa średniej gęstości w powiecie radomszczańskim, wynosi zatem:
$$\bar x_h = \frac {\sum_{i=1}^k n_i}{\sum_{i=1}^k \frac{n_i}{x_i}} = \frac {105623}{1443,00}$$
$$\bar x_h = 73,20$$
Średnia gęstość zaludnienia w powiecie radomszczańskim wynosi zatem 73,20 $\frac{\mathrm{os}}{\mathrm{km}^2}$.
Zastanówmy się teraz, co tak naprawdę liczyliśmy w naszej tabeli. Czym są obliczone w ostatniej kolumnie wartości ilorazów $\frac {n_i} {x_i}$? Otóż dzieląc ludność mierzoną w osobach przez gęstość zaludnienia wyrażoną w osobach na kilometr kwadratowy, otrzymujemy:
$$\frac {\mathrm{os}}{\frac{\mathrm{os}}{\mathrm{km}^2}} = \cancel{\mathrm{os}} \cdot \frac{\mathrm{km}^2}{\cancel{\mathrm{os}}} = {\mathrm{km}^2}$$
Czyli ostatnia kolumna tabeli, zawierająca wyliczone ilorazy, zawiera de facto powierzchnię każdej z gmin, których suma składa się na całkowitą powierzchnię powiatu radomszczańskiego. Teraz już logiczne jest, że dzieląc ludność powiatu (suma ludności poszczególnych gmin, czyli wartości z przedostatniej kolumny) przez łączną powierzchnię, otrzymujemy ni mniej, ni więcej, tylko średnią gęstość zaludnienia powiatu radomszczańskiego.
Teraz pomyślmy, co by było, gdybyśmy chcieli obliczyć średnią gęstość zaludnienia w powiecie radomszczańskim, mając daną nie ludność każdej gminy, ale jej powierzchnię. Wówczas to niebieskie liczby pełniłyby rolę liczności $n_i$. Jest to jednostka z mianownika, zatem należałoby użyć średniej arytmetycznej i obliczyć ją ze wzoru (3a).
Wzór ten wymaga wyliczenia iloczynów wartości cechy (czyli gęstości zaludnienia $x_i$) przez liczność. Gdyby licznościami były niebieskie liczby, iloczyny równe byłyby ludności gmin (obecnym liczebnościom). W takim układzie średnią (ale teraz – arytmetyczną) byłby iloraz tych samych liczb: $\frac {105623}{1443,00}$. Oba sposoby są zatem w 100% ze sobą „kompatybilne”.
Średnia geometryczna
Obliczanie średniej geometrycznej z szeregu szczegółowego
Średnią geometryczną obliczamy analogicznie do średniej harmonicznej, ale zamiast dodawania mamy mnożenie, a zamiast dzielenia – pierwiastkowanie. Wzór na średnią geometryczną w szeregu szczegółowym to:
$$\bar x_g = \sqrt[n]{x_1 \cdot x_2 \cdot ... \cdot x_n} \tag {9a} \label {eq:{9a}}$$
lub w bardziej „zwarty” sposób, z wykorzystaniem operatora iloczynu:
$$\bar x_g = \sqrt[n]{\prod_{i=1}^n x_i} \tag {9b} \label {eq:{9b}}$$
Podobnie jak średnia harmoniczna, tak i średnia geometryczna może być obliczana przede wszystkim dla liczb dodatnich. W ostateczności można dopuścić liczby nieujemne, choć jest oczywiste, że jeśli wśród danych pojawi się choćby jedno zero, to średnia wyliczona ze wzorów (9a) oraz (9b) wyniesie zero.
Warto tutaj poruszyć kwestię nazewnictwa. Jest kilka powodów, dla których nosi ona taką nazwę. Jednym z nich jest to, że może być ona użyta do wyliczenia tzw. kwadratury prostokąta. Jeśli mamy prostokąt o bokach $a = x_1$ oraz $b = x_2$, to średnią geometryczną tych dwu liczb:
$$\bar x_g = \sqrt{x_1 \cdot x_2} = \sqrt {a \cdot b}$$
można zinterpretować jako długość boku kwadratu o polu równym polu wspomnianego prostokąta.
Nie tylko to jednak. Jest też sposób na geometryczną konstrukcję odcinka o długości równej średniej geometrycznej długości dwóch danych odcinków – czyli konstrukcyjna kwadratura prostokąta.
Zasada konstrukcji jest prosta. Odcinki $AB$ oraz $BC$ odkładamy na jednej prostej, tak aby razem tworzyły odcinek $AC$. Następnie na odcinku $AC$ budujemy półokrąg o średnicy $AC$. Z punktu $B$ prowadzimy prostą prostopadłą do $AC$, przecinającą półokrąg w punkcie $D$. Wtedy odcinek $BD$ ma długość równą średniej geometrycznej długości odcinków $AB$ oraz $BC$.
Dlaczego tak jest? Trójkąt $\triangle ACD$ jest prostokątny, ponieważ jest oparty na średnicy półokręgu. Odcinek $BD$ jest wysokością opuszczoną z wierzchołka kąta prostego na przeciwprostokątną $AC$. Z twierdzenia o wysokości w trójkącie prostokątnym wynika, że kwadrat długości tej wysokości jest równy iloczynowi długości odcinków, na które wysokość dzieli przeciwprostokątną:
$$|BD|^2 = |AB| \cdot |BC|$$
i stąd:
$$|BD| =\sqrt{ |AB| \cdot |BC|}$$
Mamy to. Długość odcinka $BD$ jest średnią geometryczną odcinków $AB$ oraz $BC$. Oczywiście na rysunku widać także średnią arytmetyczną długości tych odcinków. Jest nią promień półokręgu, czyli jednakowa długość odcinków $AO$ oraz $OC$, bo przecież:
$$|AO| = |OC| = \frac {|AB| + |BC|} 2$$
Kolejnym i chyba najważniejszym powodem, dla którego średnia obliczana wzorem (9a), (9b), nazywa się średnią geometryczną, jest jej związek z ciągiem geometrycznym. Dwa najważniejsze typy ciągów, poznane w szkole średniej, to ciąg:
- arytmetyczny, w którym różnica kolejnych wyrazów jest stała (np. 2; 4; 6; 8; …);
- geometryczny, w którym iloraz kolejnych wyrazów jest stały (np. 2; 4; 8; 16; …).
W ciągu arytmetycznym każdy wyraz (oprócz pierwszego i ostatniego) jest średnią arytmetyczną swoich „sąsiadów” z lewej i prawej strony:
$$a_k = \frac {a_{k-1} + a_{k+1}} 2$$
W ciągu geometrycznym dla każdego z wyrazów (oprócz pierwszego i ostatniego) spełniony jest warunek:
$$a_k^2 = a_{k-1} \cdot a_{k+1}$$
co dla ciągu o dodatnich wyrazach można utożsamić z zasadą, że każdy wyraz (oprócz pierwszego i ostatniego) jest średnią geometryczną swoich obydwu „sąsiadów”:
$$a_k = \sqrt {a_{k-1} \cdot a_{k+1}}$$
Tyle a propos nazewnictwa.
Średnie tempo zmian
Podręcznikowym, modelowym przykładem sytuacji wymagającej użycia średniej geometrycznej jest wyliczanie średniego tempa zmian. Otóż jeżeli w kolejnych okresach tempo zmian wartości zmiennej $y$, wyrażone indeksami łańcuchowymi, tj. stosunkami wartości w okresie bieżącym do wartości w okresie poprzednim:
$$i_t = \frac {y_t}{y_{t-1}} \tag {10} \label {eq:{10}}$$
wynosi $i_1$, $i_2$, …, $i_n$, to średnie tempo zmian wyraża się średnią geometryczną tych indeksów łańcuchowych:
$$\bar i_g = \sqrt[n]{\prod_{k=1}^n i_k} \tag {11} \label {eq:{11}}$$
Przykład 11
Jacek co roku dostaje podwyżkę. Od 2020 roku dostał następujące podwyżki: o 20% (w stosunku do 2019) i potem kolejno o 5%, o 25%, 10%, 3%, 5%. Podwyżki te są nieregularne. Jaka jest średnia roczna procentowa wysokość podwyżki, jaką daje Jackowi szef? Innymi słowy, jaką regularną podwyżkę co roku musiałby dawać Jackowi szef, aby w 2025 „wyszło na to samo”?
Najpierw wyznaczmy wartości tempa zmian (czyli indeksów łańcuchowych) wysokości wynagrodzenia w kolejnych latach. Obliczamy to tempo, dodając podane wielkości procentowe do 100%, czyli do jedności. Zatem indeksy te wynoszą: 1,2; 1,05; 1,25; 1,1; 1,03; 1,05. Wartości te posiadają czytelną, praktyczną interpretację: pensja w 2020 roku stanowiła 120% pensji z 2019 roku, pensja w roku 2021 stanowiła 105% pensji z roku 2020 i tak dalej. Innymi słowy, wysokość pensji z roku 2020 otrzymamy mnożąc wysokość pensji z roku 2019 przez 1,2 i kolejne lata analogicznie.
Mnożąc poszczególne wartości tych indeksów, obliczamy łączną podwyżkę aż do 2025 roku:
$$1,2 \cdot 1,05 \cdot 1,25 \cdot 1,1 \cdot 1,03 \cdot 1,05 = 1,8737 \tag {12a} \label {eq:{12a}}$$
Łącznie pensja Jacka w roku 2025 jest wyższa od pensji z roku 2019 o 87,37%. Średnie tempo zmian to taki „procent” podwyżki, który wykonany sześciokrotnie da taką samą finalną podwyżkę. Jeśli tempo to oznaczymy przez $\bar i_g$, to powyższy warunek oznacza, że musi zachodzić:
$${\bar i_g} \cdot {\bar i_g} \cdot {\bar i_g} \cdot {\bar i_g} \cdot {\bar i_g} \cdot {\bar i_g} = {\bar i_g}^6 = 1,8737 \tag {12b} \label {eq:{12b}}$$
stąd:
$$\bar i_g = \sqrt[6]{1,8737} = 1,1103 \tag {12c} \label {eq:{12c}}$$
Zatem średnie tempo zmian wynosi 1,1103, co oznacza, że gdyby zamiast stóp podwyżek jak w treści zadania, od 2020 roku szef podnosił Jackowi wypłatę o 11,03% w stosunku do roku poprzedniego, to finalnie w roku 2025 Jacek zarabiałby tyle samo, co teraz.
Jak wynika z obliczeń (12a), (12b), (12c), średnie tempo zmian jest średnią geometryczną indeksów łańcuchowych. Warto tutaj podkreślić, że średnie tempo zmian z indeksów łańcuchowych liczymy tylko wówczas, gdy dysponujemy tylko takimi indeksami. Tak, jak w przykładzie 11. Nie wiemy, ile Jacek zarabiał, znamy tylko stopy procentowe podwyżek.
Kiedy dysponujemy oryginalnymi wielkościami w poszczególnych okresach, nie musimy obliczać indeksów.
Przykład 12
Poniższa tabela przedstawia wartość sprzedaży pewnego przedsiębiorstwa w latach 2019-2024. Obliczyć średnie tempo zmian wartości sprzedaży. Zakładając utrzymanie się takiego tempa, obliczyć prognozę sprzedaży w roku 2025.
| Rok | Sprzedaż [tys. zł] |
|---|---|
| 2019 | 275 |
| 2020 | 280 |
| 2021 | 254 |
| 2022 | 291 |
| 2023 | 305 |
| 2024 | 310 |
Jak wspomniano, średnie tempo zmian należałoby obliczyć jako średnią geometryczną indeksów łańcuchowych. Ponieważ mamy dane od 2019 do 2024 roku, mamy sześć wartości, ale pięć okresów zmian:
$$\bar i_g = \sqrt[5]{i_1 \cdot i_2 \cdot i_3 \cdot i_4 \cdot i_5}$$
Indeksy obliczamy jako stosunek wartości zmiennej (czyli wartości sprzedaży) w roku bieżącym do wartości w roku poprzednim. Zatem:
$$\bar i_g = \sqrt[5]{\frac {\cancel {y_{2020}}}{y_{2019}} \cdot \frac {\cancel {y_{2021}}}{\cancel {y_{2020}}} \cdot \frac {\cancel {y_{2022}}}{\cancel {y_{2021}}} \cdot \frac {\cancel {y_{2023}}}{\cancel {y_{2022}}} \cdot \frac {y_{2024}}{\cancel {y_{2023}}}} = \sqrt[5]{\frac {y_{2024}}{y_{2019}}}$$
Jak widać, „środkowe” lata się skracają i średnie tempo zmian jest pierwiastkiem odpowiedniego stopnia ze stosunku wartości zmiennej dla ostatniego roku do wartości tej zmiennej dla pierwszego roku, tj.:
$$\bar i_g = \sqrt[n-1]{\frac{y_n}{y_1}} \tag {13} \label{eq:{13}}$$
Warto zwrócić uwagę, że stopień pierwiastka jest o 1 mniejszy aniżeli liczba lat. Bierze się to stąd, że indeksów łańcuchowych jest zawsze o jeden mniej aniżeli danych, gdyż wyliczenie ewentualnego indeksu łańcuchowego dla roku 2019 wymagałoby znajomości wartości sprzedaży dla roku 2018, a danych takich nie posiadamy.
W naszym przypadku średnie tempo zmian wynosi:
$$\bar i_g =\sqrt[5]{ \frac {310}{275}} = 1,0244$$
W latach 2019-2024, z roku na rok, sprzedaż wzrastała średnio o 2,44%. Chcąc wyznaczyć prognozę na rok 2025, zakładamy, że tempo to się utrzyma, a zatem sprzedaż będzie wyższa także o 2,44%. Wobec tego:
$$y_{2025}^* = y_{2024} \cdot {\bar i_g} = 310 \cdot 1,0244 = 317,56$$
W przykładzie 12 średnie tempo zmian zostało wykorzystane, jak widać, do prostego prognozowania. Jako metoda prognozowania metoda ta nie jest raczej stosowana – lepsze od niej są metody oparte na trendzie – ale często zadania na średnie tempo zmian są rozszerzone o takie właśnie polecenie.
Oczywiście średnie tempo zmian, obliczone jako średnia geometryczna, może przyjąć wartość mniejszą od jedności. Wówczas interpretuje się ją jako spadek wartości. Przykładowo $\bar i_g = 0,9745$ oznacza spadek z roku na rok średnio o 2,55%. Aby wyliczyć wartość spadku, wystarczy bowiem odjąć takie tempo zmian od jedności: $1 - 0,9745 = 0,0255$.
Uwaga praktyczna. Wprawdzie na studiach wypadałoby mieć kalkulator naukowy, jednak wielu studentów takowego sprzętu nie posiada. Barierą jest tu przede wszystkim stosunkowo skomplikowana, zdaniem studentów, obsługa takiego sprzętu. O ile w zamierzchłych, „słusznie minionych” czasach barierą była cena – markowy zachodni sprzęt nie był dostępny, polskie kalkulatory naukowe były rzadkością (choć istniały), a sprzęt zza Buga kupić można było jedynie „tam” – o tyle dziś w „chińskich” marketach działający i funkcjonalny kalkulator naukowy kupić można już za 40 zł. Sprzęt porządnej firmy dostać można też za dwucyfrową kwotę.
Dostępne są także aplikacje na smartfony emulujące kalkulator naukowy, ale takie rozwiązanie może nie być akceptowane na kolokwium czy egzaminie, z uwagi na podejrzenia o korzystanie ze zdalnej pomocy. Do czego jednak zmierzam? Gros studentów posiada tylko podstawowe kalkulatory, ja używam dla nich określenia „sklepowe”. Na kalkulatorach takich nie policzymy pierwiastków dowolnego stopnia i prowadzący zajęcia o tym wiedzą.
Zwyczajny „sklepowy” kalkulator oblicza tylko pierwiastek kwadratowy, zrealizowany jako funkcja jednoargumentowa – wciśnięcie przycisku z symbolem √ powoduje natychmiastowe obliczenie pierwiastka kwadratowego z liczby widocznej na wyświetlaczu. Ponowne wciśnięcie przycisku √ spowoduje obliczenie pierwiastka z tego pierwiastka, czyli pierwiastka czwartego stopnia. Kolejne, trzecie wciśnięcie wyliczy pierwiastek ósmego stopnia i tak dalej.
Zazwyczaj więc na kolokwiach i egzaminach studenci dostają do wyliczenia takie dane, średnie tempo z tylu lat, że stopień pierwiastka potrzebnego do wyliczenia średniego tempa zmian ze średniej geometrycznej wynosi 2, 4 (najczęściej) lub 8.
Chcąc kwestię różnic pomiędzy średnią arytmetyczną a geometryczną ogarnąć „na chłopski rozum”, najlepiej przypomnieć sobie zasadę, że średnią arytmetyczną liczymy wówczas, gdy dane podlegają sumowaniu, gdy suma wartości ma sens. No to średnią geometryczną liczymy wówczas, gdy średnia arytmetyczna nie ma sensu, natomiast sens ma iloczyn. I tak właśnie jest w przypadku tempa zmian. Gdy w grę wchodzą zmiany procentowe, sens ma mnożenie, a nie dodawanie. Stąd właśnie celowość użycia średniej geometrycznej.
Średnia geometryczna na straży uczciwego handlu
Bardzo ciekawe zastosowanie średniej geometrycznej opublikowano w popularnonaukowej książce przeznaczonej dla dzieci: Kowal S. Przez rozrywkę do wiedzy. Rozmaitości matematyczne. WNT, Warszawa 1985. Dotyczy ono pewnego problemu z ważeniem na wadze szalkowej.
Dziś mamy wagi elektroniczne, jednak w pewnych obszarach zastosowań wciąż stosowane są wagi szalkowe. Wagi szalkowe i inne służą do mierzenia masy różnych obiektów, ale robią to poprzez porównanie ciężarów, czyli sił, z jakimi Ziemia przyciąga ważony obiekt i odważniki. Pomiar samej masy w warunkach nieważkości również jest możliwy, ale wymaga specjalistycznych przyrządów, stosowanych np. na Międzynarodowej Stacji Kosmicznej, gdzie zwykłe ważenie przez ciężar nie działa tak jak na Ziemi.
Otóż waga szalkowa działa na zasadzie porównywania momentów sił działających na oba ramiona wagi. Prawidłowa waga szalkowa jest symetryczna – oba ramiona mają jednakową długość. Wagę taką przedstawiono na rysunku 2.

Waga działa w taki sposób, że umieszczone na szalkach: ważony przedmiot oraz odważnik, chcą obrócić ramię wagi poprzez działanie momentów sił. Moment siły jest iloczynem ciężaru oraz ramienia, czyli odległości punktu zawieszenia szalki od osi obrotu wagi. Waga jest w równowadze, gdy momenty po obu stronach są jednakowe.
Niech $m$ oznacza masę ważonego przedmiotu, $w$ wskazanie wagi (tj. masę odważników), $l$ długość ramienia, a $g$ przyspieszenie ziemskie. Gdy waga o równych ramionach jest w równowadze, mamy:
$$m \cdot g \cdot l = w \cdot g \cdot l \,\,/:gl$$
stąd:
$$m = w$$
Waga „pokazuje” wówczas prawdziwą masę ważonego przedmiotu. Jednak w pewnych sytuacjach, np. dla nieuczciwego sprzedawcy, taka rzetelność wagi może nie być korzystna. Jednym ze sposobów „oszukania” wagi szalkowej jest zastosowanie nierównych ramion wagi. Wagę taką pokazano na rysunku 3.

Nierówne ramiona w wadze powodują, że pozostawanie wagi w równowadze nie świadczy o tym, że masa ważonego obiektu jest równa masie położonych na drugiej szalce odważników. Jeśli ważony produkt położony zostanie na szalce połączonej z krótszym ramieniem, to zostanie on zrównoważony przez lżejszy odważnik. Waga produktu zostanie zaniżona. Taka sytuacja oczywiście jest niekorzystna dla sprzedającego, gdyż wówczas sprzeda on np. 1,5 kg towaru, licząc kupującemu według wskazań wagi za mniejszą masę.
Dla sprzedającego korzystna jest sytuacja odwrotna, gdy towar kładziony będzie na szalce połączonej z dłuższym ramieniem, a odważniki na szalce połączonej z ramieniem krótszym. Wówczas do zrównoważenia wagi potrzebny będzie odważnik o masie wyższej aniżeli masa ważonego towaru. Masa towaru zostanie więc zawyżona. I o to nieuczciwemu sprzedającemu chodzi.
Jeśli kupujący będzie chciał wykryć taką sytuację, ma kilka możliwości. Może zmierzyć ramiona wagi. Może nakazać sprzedawcy położyć na obu szalkach jednakowe odważniki. Jeśli waga będzie w równowadze – znaczy to, że ma równe ramiona.
Innym sposobem jest dokonanie dwu ważeń: jedno – umieszczając towar na jednej z szalek, odważniki na drugiej, a drugie – po zamianie miejscami towaru i odważników. Jeśli oba wskazania będą się różnić, oznacza to, że ramiona wagi nie są równe. Ustalone masy towaru w jednym i drugim ważeniu różnić się będą od siebie i ani jedna z nich nie będzie prawdziwa. Niższy wynik będzie zaniżony, a wyższy – zawyżony. Ile więc towar waży naprawdę?
Niech $m$ oznacza nieznaną masę towaru, $w_1$ oznacza masę odważników w jednym z ważeń (czyli „pierwszy odczyt wagi”), $w_2$ masę odważników w drugim ważeniu, a długości ramion wagi oznaczmy przez $a$ oraz $b$.
Podczas pierwszego ważenia (towar po lewej, odważniki po prawej), warunek równowagi momentów obracających ramiona wagi ma postać:
$$m \cdot g \cdot a = w_1 \cdot g \cdot b\, /:g $$
$$m \cdot a = w_1 \cdot b $$
stąd:
$$m = w_1 \cdot \frac b a \tag {14a} \label {eq:{14a}}$$
podczas drugiego ważenia (odważniki po lewej, towar po prawej):
$$m \cdot g \cdot b = w_2 \cdot g \cdot a\, /:g $$
$$m \cdot b = w_2 \cdot a $$
stąd:
$$m = w_2 \cdot \frac a b \tag {14b} \label {eq:{14b}}$$
Obliczamy wartość $m^2 = m \cdot m$, korzystając ze wzorów (14a) oraz (14b):
$$m^2 = w_1 \cdot \frac {\cancel b} {\cancel a} \cdot w_2 \cdot \frac {\cancel a} {\cancel b}$$
$$m^2 = w_1 \cdot w_2$$
skąd:
$$m = \sqrt{w_1 \cdot w_2}$$
A zatem prawdziwa masa przedmiotu ważonego na wadze o nierównych ramionach jest średnią geometryczną wyników obu ważeń: przed i po zamianie towaru i odważników miejscami! To ciekawe, a jednocześnie bardzo praktyczne i „życiowe” zastosowanie średniej geometrycznej.
Średnia geometryczna dla szeregu rozdzielczego
Rzadkością jest obliczanie średniej geometrycznej dla danych uszeregowanych w postaci szeregu rozdzielczego, a zwłaszcza szeregu rozdzielczego przedziałowego – choćby z uwagi na wspomniane wcześniej „pomieszanie średnich” – środki przedziałów klasowych wylicza się jako średnie arytmetyczne ich krańców, toteż średnia geometryczna tutaj raczej nie pasuje.
Częściej, choć i tak sporadycznie, może się zdarzyć, że danych (np. indeksów łańcuchowych) będzie na tyle dużo, że zostaną one pogrupowane w szereg rozdzielczy punktowy. Wówczas, poprzez analogię do średniej arytmetycznej z takiego szeregu, stosowny wzór na wyliczenie tej miary zapiszemy w postaci:
$$\bar x_g = \sqrt[N]{\prod_{i=1}^k x_i^{n_i}} \tag {15} \label {eq:{15}}$$
gdzie $N=\sum_{i=1}^k n_i$.
Kończąc omawiać średnią geometryczną, należy jeszcze rozszerzyć zasadę opisaną nierównością (7) o wzajemne relacje pomiędzy średnią geometryczną a obiema omówionymi wcześniej średnimi. Otóż prawdziwa jest nierówność:
$$\bar x_h \leq \bar x_g \leq \bar x \tag {16} \label {eq:{16}}$$
Zatem średnia geometryczna plasuje się pomiędzy średnią harmoniczną, która jest spośród omawianych średnich najniższa, a średnią arytmetyczną, która jest najwyższa. Równość pomiędzy wszystkimi tymi średnimi możliwa jest tylko wówczas, gdy są one obliczane dla zestawu tych samych wartości. Wówczas wszystkie średnie równe są tej wartości (np. dla danych złożonych z samych dwójek: 2; 2; 2; …) wszystkie średnie wynoszą 2.
Średnia kwadratowa
Czym jest średnia kwadratowa?
Średnia kwadratowa to średnia, która dla danych podanych w postaci szeregu szczegółowego wyliczana jest według wzoru:
$$\mu_{2x} = \sqrt {\frac 1 n \cdot \sum _{i=1}^n x_i^2} \tag {17} \label {eq:{17}}$$
Średnia ta jest pierwiastkiem ze średniej arytmetycznej kwadratów wartości danych.
Gdzie pojawia się średnia kwadratowa
Średnia ta w swojej czystej postaci jest dość rzadko używana w statystyce. Sam schemat obliczania pierwiastka ze średniej obliczonej dla kwadratów jest jednak w statystyce bardzo dobrze znany, gdyż np. odchylenie standardowe jest właśnie obliczane jako średnia kwadratowa odchyłek danych od średniej:
$$s = \sqrt {\frac 1 n \cdot \sum_{i=1}^n \left(x_i - \bar x \right)^2} \tag {18} \label {eq:{18}}$$
Widać tutaj najważniejszą cechę średniej kwadratowej – dzięki podnoszeniu uśrednianych wartości do kwadratu traktuje ona w jednakowy sposób wartości dodatnie i ujemne – co pozwala na obliczenie średniej odchyłki od ustalonej wartości (w przypadku odchylenia standardowego jest to odchylenie od średniej arytmetycznej), bez względu na kierunek tego odchylenia.
Taki sam jest schemat obliczania średniokwadratowego błędu prognozy ex-post. W tym przypadku obliczane są odchyłki nie od średniej, a od empirycznych wartości zmiennej prognozowanej. Na podobnej zasadzie powyższy schemat obliczenia stosowany jest w rachunku błędów.
Oprócz tego w literaturze spotkać można kilka innych zastosowań średniej kwadratowej, które mają charakter „ciekawostek”:
- średnia kwadratowa długości podstaw trapezu wyznacza długość linii równoległej do podstaw trapezu, która dzieli trapez na dwa trapezy o jednakowych polach powierzchni;
- w termodynamice średnią kwadratową stosuje się do policzenia tzw. średniej kwadratowej prędkości cząsteczek gazu;
- w elektrotechnice i teorii sygnałów schemat obliczania średniej kwadratowej stosuje się do obliczania wartości skutecznej impulsów prądowych (zazwyczaj stosuje się tam całkę zamiast sumy).
Średnia potęgowa
Uogólnienie omówionych średnich
Średnią potęgową dla danych w postaci szeregu szczegółowego nazywamy parametr statystyczny obliczany według wzoru, z zastrzeżeniem $p\neq0$:
$$\mu_p = \left(\frac 1 n \sum_{i=1}^n x_i^p\right)^{\frac 1 p} = \sqrt[p]{\frac 1 n \sum_{i=1}^n x_i^p} \tag {19} \label {eq:{19}}$$
Średnia ta jest uogólnieniem dotychczas omówionych średnich:
- dla $\boldsymbol p \textbf {=1}$ średnia potęgowa staje się średnią arytmetyczną;
- dla $\boldsymbol p \textbf{= -1}$ średnia potęgowa staje się średnią harmoniczną;
- dla $\boldsymbol p \textbf{= 2}$ średnia potęgowa staje się średnią kwadratową.
Dodatkowo definicję średniej potęgowej, określonej wzorem (19), uogólnia się na trzy przypadki szczególne:
dla $\boldsymbol p \textbf{=0}$ przyjmuje się, że średnią oblicza się według wzorów (9a), (9b), czyli staje się ona średnią geometryczną;
dla $\boldsymbol p \rightarrow \boldsymbol{-\infty}$ średnia potęgowa równa jest $\min \left(x_1,x_2,...,x_n \right)$, a zatem utożsamia się ją z wartością minimalną z szeregu danych;
dla $\boldsymbol p \rightarrow \boldsymbol{+\infty}$ średnia potęgowa równa jest $\max \left(x_1,x_2,...,x_n \right)$, a zatem utożsamia się ją z wartością maksymalną z szeregu danych.
Nierówność średnich
Dzięki uogólnieniu wszystkich uprzednio omówionych średnich na średnią potęgową możliwe staje się wyrażenie relacji pomiędzy wartościami średnich, wyrażonych wzorami (7) oraz (16), za pomocą jednej, prostej reguły. Niech $-\infty \leq p < q \leq \infty$, wówczas:
$$\mu_p \left(x_1, x_2, ..., x_n \right) \leq \mu_q \left(x_1, x_2, ..., x_n \right) \tag {20} \label {eq:{20}}$$
przy czym równość zachodzi tylko wtedy, gdy $x_1 = x_2 = ... = x_n$. Aby możliwe było wyliczenie uogólnionej średniej potęgowej dla każdej wartości $p$, konieczne będzie także założenie: $x_i > 0$ dla $1 \leq i \leq n$.
Ma to sens. Przy okazji omawiania średniej harmonicznej wspominaliśmy, że „ciąży” ona ku wartościom niskim, a wartości wysokie – nawet nieskończone – nie robią na niej większego wrażenia. Średnia kwadratowa z kolei przeciwnie. Wartości wysokie mają jeszcze wyższe kwadraty, toteż wartość średniej jest ku nim bardziej przesuwana, aniżeli ma to miejsce w przypadku średniej arytmetycznej. Zasada wyrażona wzorem (20) to piękne i kompleksowe podsumowanie tych prawidłowości.
Podsumowanie
W powyższym artykule przedstawiliśmy najważniejsze charakterystyki średnich klasycznych, stosowanych w statystyce opisowej. Warto tutaj zaznaczyć, że nie ma lepszych i gorszych średnich, są tylko średnie źle i dobrze dobrane. Z omówionych średnich, na pierwszy rzut oka, najlepsza i wręcz idealna wydaje się średnia arytmetyczna. Wszak „leży ona dokładnie pośrodku”. Np. dla liczb 6 oraz 8 idealną średnią wydaje się 7. Takie jednak myślenie to pułapka!
Idealizując średnią arytmetyczną tylko dlatego, że „leży pośrodku”, myślimy właśnie kategoriami średniej arytmetycznej. A nic dziwnego, że myśląc kategoriami tej miary, to właśnie ją uznajemy za najlepszą. Jednak średnia nie musi leżeć pośrodku, aby być odpowiednią miarą. Wyobraźmy sobie dwie sytuacje:
- przeprowadziliśmy dwie transakcje – na jednej zarobiliśmy 200 zł, a na drugiej straciliśmy 200 zł; ile zarobiliśmy w sumie i średnio na transakcji? Odpowiedź brzmi, oczywiście, zero! Tak, tutaj myślenie kategoriami średniej arytmetycznej jest OK, ale:
- przeprowadziliśmy dwie transakcje – na jednej zarobiliśmy 20%, a na drugiej straciliśmy 20%; ile zarobiliśmy w sumie i średnio na transakcji? Bynajmniej nie zero! Na jednej transakcji nasz majątek pomnożył się przez 1,2, a na drugiej przez 0,8; per saldo więc przemnożył się on przez 0,96 i w sumie straciliśmy 4%! Tu myślenie kategoriami średniej arytmetycznej zawodzi. Już lepszą odpowiedzią będzie, że średnio na transakcji straciliśmy po 2%, choć najlepiej policzyć $\sqrt{0,96} = 0,9798$ i prawidłowa odpowiedź brzmi: średnio na każdej z transakcji straciliśmy po 2,02%. W przypadku zmian procentowych należy myśleć kategoriami średniej geometrycznej!
A wszystko dlatego, że … średnia niejedno ma imię.
Utworzono: 26.10.2025 | Zmodyfikowano: 21.06.2026
- Obliczaniu mediany, kwartyli, kwantyli oraz innych miar pozycyjnych poświęcone są i będą inne artykuły w naszej Wszechnicy. Np. artykuł o kwantylach w szeregu szczegółowym ↩︎
Powiązane artykuły
- Miary położenia, statystyka opisowa, średnia, mediana, dominanta, kwartyle.
- Estymacja wartości oczekiwanej (średniej) — estymacja punktowa i przedziałowa
- Miary statystyczne w statystyce opisowej
- Rodzaje danych statystycznych: zmienne jakościowe, skokowe i ciągłe
- Szeregi statystyczne i formy prezentacji danych
- Estymacja statystyczna — populacja, próba, estymatory i ich własności
- Miary zróżnicowania w statystyce opisowej — rozstęp, wariancja i odchylenie standardowe
- Odchylenie standardowe i wariancja, jako miary rozrzutu
- Kwantyle w szeregu szczegółowym
Masz problem z tym tematem?
Wszechwiedza.pl pomaga zrozumieć matematykę, statystykę, ekonometrię, badania operacyjne, analizę danych, mechanikę, rachunkowość i wiele innych przedmiotów — spokojnie, konkretnie i krok po kroku.
Zapytaj o pomoc