Wszechnica Wszechwiedzy - Baner

Kurtoza, eksces i koncentracja w statystyce opisowej

Kurtoza, eksces i miary koncentracji opisują kształt rozkładu danych: czy wartości silnie skupiają się wokół środka, czy rozkład jest bardziej spłaszczony, a także czy w ogonach rozkładu pojawiają się wartości skrajne.

W poprzednich artykułach omawialiśmy miary położenia, miary zróżnicowania oraz miary asymetrii. Każda z tych grup opisuje inną cechę rozkładu. Miary położenia mówią, gdzie znajduje się środek danych. Miary zróżnicowania informują, jak bardzo dane są rozproszone. Miary asymetrii pokazują, czy rozkład ma dłuższy ogon po jednej stronie.

Kurtoza i eksces pozwalają spojrzeć na rozkład jeszcze inaczej. Interesuje nas tutaj przede wszystkim koncentracja wartości wokół środka rozkładu oraz zachowanie ogonów rozkładu. W klasycznej dydaktyce mówi się często o rozkładach bardziej „spiczastych” i bardziej „spłaszczonych”, choć warto pamiętać, że kurtoza wiąże się także z ciężkością ogonów i wpływem wartości skrajnych.

Ten artykuł jest częścią szerszego cyklu o miarach statystycznych. Ogólne omówienie całego podziału znajduje się w artykule Miary statystyczne w statystyce opisowej.

Czym jest koncentracja rozkładu?

Koncentracja rozkładu opisuje, w jakim stopniu wartości skupiają się wokół środka rozkładu oraz jak zachowują się wartości oddalone od środka. Jeżeli wiele obserwacji znajduje się bardzo blisko wartości typowej, rozkład może sprawiać wrażenie bardziej skupionego. Jeżeli obserwacje są bardziej równomiernie rozłożone albo występują szerokie obszary wartości, rozkład może być bardziej spłaszczony.

Miary koncentracji opisują kształt rozkładu pod względem skupienia wartości wokół środka oraz zachowania ogonów rozkładu. W statystyce opisowej najczęściej omawia się je poprzez kurtozę i eksces.

W praktyce dydaktycznej koncentrację rozkładu często porównuje się z rozkładem normalnym. Rozkład normalny pełni wtedy rolę punktu odniesienia: można zapytać, czy badany rozkład jest bardziej spiczasty, podobny, czy bardziej spłaszczony od rozkładu normalnego.

Kurtoza a eksces — ważna uwaga terminologiczna

Przy omawianiu kurtozy trzeba uważać na terminologię, ponieważ w różnych książkach, programach i kursach można spotkać nieco inne nazewnictwo.

W klasycznym ujęciu kurtoza to iloraz czwartego momentu centralnego i czwartej potęgi odchylenia standardowego. Dla rozkładu normalnego taka kurtoza wynosi \(3\).

Eksces to kurtoza pomniejszona o \(3\). Dzięki temu dla rozkładu normalnego eksces wynosi \(0\). Taka postać jest wygodna, ponieważ wynik od razu pokazuje, czy rozkład jest bardziej leptokurtyczny, mezokurtyczny czy platykurtyczny.

Najczęstsza konwencja:

kurtoza rozkładu normalnego wynosi:

\[ \beta_2=3 \]

eksces rozkładu normalnego wynosi:

\[ \gamma_2=\beta_2-3=0 \]

Można jednak spotkać autorów i programy, które słowem „kurtoza” nazywają właśnie eksces, czyli wartość już pomniejszoną o \(3\). Dlatego przy interpretacji wyniku zawsze warto sprawdzić, jakiej definicji używa podręcznik, wykładowca albo program statystyczny.

Jeżeli program zwraca wartość dodatnią dla rozkładu bardziej spiczastego od normalnego, a wartość ujemną dla rozkładu bardziej spłaszczonego od normalnego, to najprawdopodobniej raportuje eksces, a nie klasyczną kurtozę równą \(3\) dla rozkładu normalnego.

Czwarty moment centralny

Podstawą klasycznej miary koncentracji jest czwarty moment centralny. Jest on podobny konstrukcyjnie do wariancji, ale zamiast drugich potęg odchyleń od średniej wykorzystuje czwarte potęgi.

Przypomnijmy: wariancja opiera się na kwadratach odchyleń od średniej. Czwarty moment centralny idzie dalej i podnosi te odchylenia do czwartej potęgi. Dlatego bardzo duże odchylenia od średniej mają szczególnie silny wpływ na jego wartość. Samą wariancję i odchylenie standardowe omawiamy szerzej w artykule Odchylenie standardowe i wariancja.

Czwarty moment centralny:

\[ m_4=\frac{1}{n}\sum_{i=1}^{n}(x_i-\bar{x})^4 \]

gdzie:

Czwarty moment centralny jest miarą bezwzględną. Jego wartość zależy od jednostki pomiaru i skali danych, dlatego samodzielnie bywa trudny do interpretacji. Z tego powodu zwykle przechodzi się do miary względnej, czyli kurtozy.

Kurtoza jako klasyczny współczynnik koncentracji

Klasyczny współczynnik koncentracji, nazywany kurtozą, otrzymujemy przez podzielenie czwartego momentu centralnego przez czwartą potęgę odchylenia standardowego. Równoważnie można powiedzieć, że dzielimy czwarty moment centralny przez kwadrat wariancji.

Kurtoza:

\[ \beta_2=\frac{m_4}{s^4} \]

ponieważ \(s^2\) jest wariancją, można też zapisać:

\[ \beta_2=\frac{m_4}{(s^2)^2} \]

gdzie:

Dzięki podzieleniu przez \(s^4\) miara staje się względna, czyli nie zależy bezpośrednio od jednostki pomiaru. Możemy więc porównywać kształt różnych rozkładów, nawet jeśli dane są wyrażone w innych jednostkach.

Uwaga: kurtozy nie można sensownie obliczyć, gdy odchylenie standardowe jest równe zero. Oznaczałoby to, że wszystkie wartości są jednakowe, a w mianowniku wzoru pojawiłoby się dzielenie przez zero.

Eksces

Eksces jest kurtozą pomniejszoną o \(3\). Odejmowanie trójki wynika z tego, że klasyczna kurtoza rozkładu normalnego wynosi \(3\). Po odjęciu \(3\) rozkład normalny ma wartość odniesienia równą \(0\).

Eksces:

\[ \gamma_2=\beta_2-3 \]

Jeżeli:

W praktyce eksces jest często wygodniejszy niż sama kurtoza, ponieważ wynik dodatni, ujemny albo równy zero od razu wskazuje, jak rozkład wypada względem rozkładu normalnego.

Kurtoza \(\beta_2\) Eksces \(\gamma_2\) Typ rozkładu Interpretacja
\(\beta_2=3\) \(\gamma_2=0\) mezokurtyczny koncentracja podobna do rozkładu normalnego
\(\beta_2>3\) \(\gamma_2>0\) leptokurtyczny większa koncentracja wokół środka lub cięższe ogony niż w rozkładzie normalnym
\(\beta_2<3\) \(\gamma_2<0\) platykurtyczny mniejsza koncentracja wokół środka lub lżejsze ogony niż w rozkładzie normalnym

Rozkład leptokurtyczny, mezokurtyczny i platykurtyczny

Najczęściej w statystyce opisowej wyróżnia się trzy typy rozkładów ze względu na kurtozę lub eksces: leptokurtyczne, mezokurtyczne i platykurtyczne. Punktem odniesienia jest rozkład normalny, dla którego klasyczna kurtoza wynosi \(3\), a eksces \(0\).

Infografika przedstawiająca rozkład leptokurtyczny, mezokurtyczny i platykurtyczny oraz zależność między kurtozą i ekscesem
Kurtoza i eksces pozwalają porównać koncentrację rozkładu względem rozkładu normalnego.

Rozkład mezokurtyczny

Rozkład mezokurtyczny ma koncentrację podobną do rozkładu normalnego. W klasycznej konwencji jego kurtoza wynosi około \(3\), a eksces około \(0\).

Można go traktować jako punkt odniesienia. Nie oznacza to, że każdy rozkład mezokurtyczny musi być dokładnie normalny, lecz że jego koncentracja i ogony są podobne do rozkładu normalnego.

Rozkład leptokurtyczny

Rozkład leptokurtyczny ma dodatni eksces:

\[ \gamma_2>0 \]

W klasycznym opisie mówi się, że taki rozkład jest bardziej spiczasty niż normalny. Warto jednak pamiętać, że wysoka kurtoza oznacza również większy wpływ wartości oddalonych od średniej. Dlatego rozkłady leptokurtyczne często wiążą się z cięższymi ogonami i większą skłonnością do wartości skrajnych.

Przykładowo w finansach dodatni eksces może oznaczać, że bardzo duże dodatnie lub ujemne stopy zwrotu pojawiają się częściej, niż sugerowałby prosty model normalny.

Rozkład platykurtyczny

Rozkład platykurtyczny ma ujemny eksces:

\[ \gamma_2<0 \]

W klasycznej dydaktyce mówi się, że taki rozkład jest bardziej spłaszczony niż normalny. Oznacza to mniejszą koncentrację wokół środka albo lżejsze ogony w porównaniu z rozkładem normalnym.

Przykładem rozkładu o ujemnym ekscesie może być rozkład, w którym wartości są bardziej równomiernie rozłożone w pewnym przedziale, bez silnego skupienia w środku i bez bardzo długich ogonów.

Kurtoza nie jest tym samym co asymetria

Kurtoza i asymetria opisują dwie różne cechy rozkładu. Asymetria mówi, czy rozkład ma dłuższy ogon po lewej czy po prawej stronie. Kurtoza mówi o koncentracji wartości i zachowaniu ogonów rozkładu względem rozkładu normalnego.

Oznacza to, że rozkład może być jednocześnie:

To bardzo ważne, ponieważ nie należy utożsamiać „spiczastości” rozkładu z jego asymetrią. Rozkład może być wyraźnie przechylony w prawo, a jednocześnie mieć małą koncentrację w środku. Może też być symetryczny, ale mieć bardzo ciężkie ogony. Miary asymetrii omawiamy osobno w artykule Miary asymetrii w statystyce opisowej.

Najważniejsza intuicja: asymetria odpowiada na pytanie, po której stronie znajduje się dłuższy ogon rozkładu. Kurtoza i eksces odpowiadają na pytanie, jak rozkład zachowuje się względem rozkładu normalnego pod względem koncentracji i ogonów.

Jak interpretować wynik kurtozy i ekscesu?

Przy interpretacji trzeba najpierw ustalić, czy mamy do czynienia z kurtozą, czy z ekscesem. To najczęstsze źródło nieporozumień.

Otrzymany wynik Jeżeli to kurtoza \(\beta_2\) Jeżeli to eksces \(\gamma_2\)
\(0\) wartość nietypowa dla klasycznej kurtozy; możliwa tylko w szczególnych przypadkach rozkład podobny do normalnego pod względem kurtozy
\(3\) rozkład podobny do normalnego pod względem kurtozy silnie dodatni eksces
\(1\) kurtoza mniejsza niż normalna, czyli rozkład platykurtyczny dodatni eksces, czyli rozkład leptokurtyczny
\(-0{,}5\) kurtoza klasyczna nie powinna być tak interpretowana w prostym ujęciu ujemny eksces, czyli rozkład platykurtyczny

Dlatego przed interpretacją warto sprawdzić, czy program lub podręcznik podaje kurtozę w postaci \(\beta_2\), czy eksces w postaci \(\gamma_2=\beta_2-3\).

Kurtoza w programach statystycznych i arkuszach kalkulacyjnych

W programach statystycznych i arkuszach kalkulacyjnych trzeba zachować szczególną ostrożność, ponieważ nazwa funkcji może sugerować „kurtozę”, ale wynik bywa raportowany względem rozkładu normalnego. W praktyce oznacza to, że funkcja może zwracać eksces, czyli wartość znormalizowaną tak, aby rozkład normalny miał wynik równy \(0\).

Jeżeli program zwraca wynik dodatni, oznacza to zwykle rozkład bardziej leptokurtyczny niż normalny. Jeżeli wynik jest ujemny, oznacza rozkład bardziej platykurtyczny niż normalny. Jeżeli wynik jest bliski zeru, rozkład jest pod względem kurtozy zbliżony do normalnego.

Praktyczna zasada: jeżeli program interpretuje wynik tak, że wartość dodatnia oznacza większą spiczastość niż normalna, a ujemna większe spłaszczenie niż normalna, to najprawdopodobniej podaje eksces, a nie surową kurtozę równą \(3\) dla rozkładu normalnego.

Najczęstsze błędy przy interpretacji kurtozy

1. Mylenie kurtozy z ekscesem

Najczęstszy błąd polega na tym, że ktoś otrzymuje wynik \(0\) i uznaje, że kurtoza wynosi zero. W wielu programach taki wynik oznacza jednak eksces równy zero, czyli kurtozę równą \(3\), a więc rozkład podobny do normalnego pod względem koncentracji.

2. Utożsamianie kurtozy wyłącznie z wysokością wierzchołka

W podstawowych wyjaśnieniach mówi się często, że rozkład leptokurtyczny jest bardziej spiczasty, a platykurtyczny bardziej spłaszczony. To użyteczna intuicja, ale niepełna. Kurtoza jest silnie związana także z zachowaniem ogonów i wartościami oddalonymi od średniej.

3. Mylenie koncentracji z asymetrią

Rozkład może być symetryczny, ale leptokurtyczny albo platykurtyczny. Może też być asymetryczny i jednocześnie mieć dodatni lub ujemny eksces. Asymetria i kurtoza opisują różne cechy rozkładu, dlatego należy je interpretować osobno.

4. Interpretowanie kurtozy bez sprawdzenia skali i wartości odstających

Pojedyncze wartości skrajne mogą mieć duży wpływ na czwarty moment centralny, a więc także na kurtozę. Wynika to z czwartej potęgi odchyleń od średniej. Dlatego przy wysokiej kurtozie warto sprawdzić, czy w danych nie występują obserwacje nietypowe.

Zadanie dla czytelnika

Kurtoza czy eksces?

Dla pewnego zbioru danych obliczono klasyczną kurtozę:

\[ \beta_2=4{,}6 \]

Oblicz eksces i określ, czy rozkład jest leptokurtyczny, mezokurtyczny czy platykurtyczny.

Pokaż rozwiązanie

Eksces obliczamy jako:

\[ \gamma_2=\beta_2-3 \]

Podstawiamy:

\[ \gamma_2=4{,}6-3=1{,}6 \]

Eksces jest dodatni, więc rozkład jest leptokurtyczny. Oznacza to, że ma większą koncentrację wokół środka lub cięższe ogony niż rozkład normalny.

Podsumowanie

Kurtoza, eksces i miary koncentracji opisują kształt rozkładu pod względem skupienia wartości wokół środka oraz zachowania ogonów. Klasyczna kurtoza jest ilorazem czwartego momentu centralnego i czwartej potęgi odchylenia standardowego. Dla rozkładu normalnego wynosi \(3\).

Eksces to kurtoza pomniejszona o \(3\). Dzięki temu rozkład normalny ma eksces równy \(0\). Dodatni eksces oznacza rozkład leptokurtyczny, a ujemny eksces oznacza rozkład platykurtyczny.

Najważniejsze jest to, aby nie mylić kurtozy z ekscesem oraz nie utożsamiać koncentracji z asymetrią. Asymetria mówi o stronie ogona rozkładu, natomiast kurtoza i eksces opisują koncentrację oraz zachowanie ogonów względem rozkładu normalnego.

Powiązane artykuły

Masz problem z tym tematem?

Wszechwiedza.pl pomaga zrozumieć matematykę, statystykę, ekonometrię, badania operacyjne, analizę danych, mechanikę, rachunkowość i wiele innych przedmiotów — spokojnie, konkretnie i krok po kroku. 

Zapytaj o pomoc