Wszechnica Wszechwiedzy - Baner

Miary asymetrii w statystyce opisowej — asymetria prawostronna i lewostronna

Miary asymetrii pokazują, czy rozkład danych jest zrównoważony po obu stronach środka, czy też wartości „ciągną się” bardziej w jedną stronę. Dzięki nim możemy rozpoznać, czy mamy do czynienia z rozkładem symetrycznym, prawostronnie asymetrycznym czy lewostronnie asymetrycznym.

W poprzednich artykułach omawialiśmy miary położenia, takie jak średnia, mediana i dominanta, oraz miary zróżnicowania, takie jak rozstęp, wariancja i odchylenie standardowe. Miary asymetrii są kolejnym krokiem w opisie rozkładu danych. Nie pytają już tylko o to, gdzie leży środek i jak bardzo dane są rozproszone, ale także o to, czy rozkład jest przechylony w którąś stronę.

Ten artykuł jest częścią szerszego cyklu o statystyce opisowej. Ogólny podział miar statystycznych omawiamy w artykule Miary statystyczne w statystyce opisowej.

Czym jest asymetria rozkładu?

Asymetria rozkładu oznacza brak symetrii wartości względem środka rozkładu. Jeżeli dane są rozłożone równomiernie po obu stronach środka, mówimy o rozkładzie symetrycznym. Jeżeli jedna strona rozkładu jest bardziej „wydłużona”, mówimy o rozkładzie asymetrycznym.

Asymetria informuje, czy wartości badanej cechy są rozłożone podobnie po obu stronach środka rozkładu, czy też po jednej stronie występuje dłuższy „ogon” wartości.

W rozkładzie idealnie symetrycznym, zwłaszcza jednomodalnym, średnia arytmetyczna, mediana i dominanta zwykle pokrywają się lub są bardzo blisko siebie:

\[ \bar{x}=Me=Mo \]

Oznacza to, że środek rozkładu jest jednoznaczny: ta sama wartość może być traktowana jako średnia, wartość środkowa i wartość najczęściej występująca. W takim przypadku mniej więcej tyle samo obserwacji znajduje się poniżej środka rozkładu, co powyżej niego.

W rozkładzie asymetrycznym sytuacja jest inna. Średnia, mediana i dominanta nie muszą się pokrywać. Właśnie ich wzajemne położenie jest jedną z najprostszych wskazówek pozwalających rozpoznać kierunek asymetrii.

Asymetria prawostronna i lewostronna

W praktyce najważniejsze są dwa typy asymetrii: asymetria prawostronna oraz asymetria lewostronna. Nazwa asymetrii pochodzi od strony, po której znajduje się dłuższy ogon rozkładu.

Najprostsza reguła zapamiętywania: patrzymy, po której stronie rozkładu znajduje się dłuższy ogon. Jeżeli ogon jest po prawej stronie, mamy asymetrię prawostronną. Jeżeli ogon jest po lewej stronie, mamy asymetrię lewostronną.

To ważne, ponieważ na wykresie może to być na początku mylące. Przy asymetrii prawostronnej najwyższa część wykresu, czyli „górka”, często znajduje się raczej po lewej stronie, a długi ogon rozciąga się w prawo. Przy asymetrii lewostronnej sytuacja jest odwrotna: górka jest często po prawej stronie, a ogon ciągnie się w lewo.

Infografika przedstawiająca asymetrię lewostronną, rozkład symetryczny i asymetrię prawostronną
Rodzaj asymetrii określa strona, po której znajduje się dłuższy ogon rozkładu.
Typ rozkładu Położenie ogona Inna nazwa Typowy układ miar
Symetryczny brak wyraźnego ogona brak asymetrii \(\bar{x}\approx Me\approx Mo\)
Prawostronnie asymetryczny ogon po prawej stronie asymetria dodatnia \(Mo < Me < \bar{x}\)
Lewostronnie asymetryczny ogon po lewej stronie asymetria ujemna \(\bar{x} < Me < Mo\)

Układ średniej, mediany i dominanty jest pomocą interpretacyjną, a nie bezwzględną regułą dla każdego możliwego zbioru danych. W typowych przykładach dydaktycznych bardzo dobrze pokazuje jednak sens asymetrii. Szerzej o średniej, medianie i dominancie piszemy w artykule Miary położenia w statystyce opisowej.

Przykład z wynagrodzeniami: asymetria prawostronna

Bardzo dobrym przykładem asymetrii prawostronnej są wynagrodzenia. W wielu grupach większość osób zarabia mniej niż wynosi średnie wynagrodzenie, ponieważ niewielka liczba bardzo wysokich wynagrodzeń podnosi średnią.

Załóżmy, że w pewnej małej grupie wynagrodzenia wynoszą:

\[ 4000,\ 4300,\ 4500,\ 4700,\ 5000,\ 5200,\ 18000 \]

Widzimy, że większość wartości znajduje się w okolicach od \(4000\) do \(5200\), ale jedna osoba zarabia \(18000\). Ta jedna wysoka wartość przesuwa średnią w prawo.

W takim rozkładzie zwykle obserwujemy sytuację:

\[ Me < \bar{x} \]

Oznacza to, że mediana, czyli wartość środkowa, jest niższa od średniej arytmetycznej. To właśnie dlatego wiele osób zauważa, że „średnie wynagrodzenie jest wysokie, ale większość ludzi zarabia mniej niż średnia”. Jest to klasyczna intuicja asymetrii prawostronnej, czyli dodatniej.

Praktyczna ściąga: jeżeli chcesz zapamiętać asymetrię prawostronną, pomyśl o dochodach lub wynagrodzeniach. Niewielka liczba bardzo wysokich wartości ciągnie rozkład w prawo, dlatego średnia jest zwykle większa od mediany.

Po co mierzyć asymetrię?

Samo stwierdzenie, że rozkład jest asymetryczny, bywa bardzo pomocne, ale często chcemy określić także siłę i kierunek asymetrii. Do tego służą miary asymetrii.

Miary asymetrii pozwalają odpowiedzieć na pytania:

Asymetria ma duże znaczenie przy analizie wynagrodzeń, dochodów, cen nieruchomości, wyników sprzedaży, czasu oczekiwania, stóp zwrotu i wielu innych zjawisk społeczno-ekonomicznych.

Bezwzględna i względna miara asymetrii

Podobnie jak przy miarach zróżnicowania, także przy asymetrii można odróżnić miary bezwzględne i względne. Bezwzględną miarą asymetrii może być na przykład trzeci moment centralny, natomiast względną — współczynnik asymetrii oparty na trzecim momencie centralnym.

Miary względne są zwykle wygodniejsze w interpretacji i porównywaniu różnych rozkładów, ponieważ nie zależą bezpośrednio od jednostki pomiaru. Podobną logikę stosuje się przy miarach zróżnicowania, gdzie obok odchylenia standardowego używa się współczynnika zmienności. Szerzej o tym piszemy w artykule Miary zróżnicowania w statystyce opisowej.

Trzeci moment centralny

Trzeci moment centralny jest klasyczną bezwzględną miarą asymetrii. Opiera się na trzecich potęgach odchyleń wartości od średniej arytmetycznej.

Trzeci moment centralny:

\[ m_3=\frac{1}{n}\sum_{i=1}^{n}(x_i-\bar{x})^3 \]

gdzie:

Dlaczego występuje trzecia potęga? Odchylenia dodatnie i ujemne nie znoszą się tak jak przy zwykłej sumie odchyleń, ponieważ zachowują znak po podniesieniu do trzeciej potęgi. Duże dodatnie odchylenia zwiększają wartość \(m_3\), a duże ujemne odchylenia ją zmniejszają.

Wartość \(m_3\) Interpretacja
\(m_3=0\) brak asymetrii albo rozkład bliski symetrycznemu
\(m_3>0\) asymetria prawostronna, czyli dodatnia
\(m_3<0\) asymetria lewostronna, czyli ujemna

Trzeci moment centralny pokazuje kierunek asymetrii, ale jego wartość zależy od jednostki pomiaru i skali danych. Dlatego w praktyce częściej używa się względnego współczynnika asymetrii.

Momentowy współczynnik asymetrii

Momentowy współczynnik asymetrii jest jedną z najważniejszych klasycznych miar asymetrii. Powstaje przez podzielenie trzeciego momentu centralnego przez trzecią potęgę odchylenia standardowego.

Momentowy współczynnik asymetrii:

\[ A_s=\frac{m_3}{s^3} \]

gdzie:

Odchylenie standardowe występuje w mianowniku po to, aby sprowadzić miarę do postaci względnej. Dzięki temu współczynnik asymetrii nie zależy bezpośrednio od jednostki pomiaru. Samo odchylenie standardowe oraz wariancję omawiamy dokładniej w artykule Odchylenie standardowe i wariancja.

Wartość \(A_s\) Interpretacja kierunku asymetrii
\(A_s=0\) brak asymetrii albo rozkład bliski symetrycznemu
\(A_s>0\) asymetria prawostronna, dodatnia
\(A_s<0\) asymetria lewostronna, ujemna

Im dalej wartość współczynnika znajduje się od zera, tym silniejsza jest asymetria. Warto jednak pamiętać, że momentowy współczynnik asymetrii nie jest ograniczony do przedziału od \(-1\) do \(1\). Może przyjmować wartości mniejsze od \(-1\) albo większe od \(1\), zwłaszcza przy silnie asymetrycznych danych lub przy obecności wartości odstających.

Orientacyjnie można przyjąć, że wartości bliskie zera wskazują na słabą asymetrię, wartości około \(0{,}5\) lub \(-0{,}5\) na asymetrię zauważalną, a wartości przekraczające \(1\) lub mniejsze od \(-1\) na asymetrię silną. Są to jednak progi umowne, zależne od dziedziny i charakteru danych.

Pozycyjny współczynnik asymetrii

Drugą ważną grupą miar asymetrii są miary pozycyjne. Opierają się one nie na wszystkich wartościach i ich odchyleniach od średniej, lecz na medianie i kwartylach. Dzięki temu są bardziej odporne na wartości odstające.

Najczęściej stosowany pozycyjny współczynnik asymetrii, nazywany również współczynnikiem Bowleya, ma postać:

Pozycyjny współczynnik asymetrii:

\[ A_Q=\frac{(Q_3-Me)-(Me-Q_1)}{Q_3-Q_1} \]

czyli równoważnie:

\[ A_Q=\frac{Q_3+Q_1-2Me}{Q_3-Q_1} \]

gdzie:

Współczynnik ten porównuje odległość mediany od kwartyla pierwszego z odległością mediany od kwartyla trzeciego. Jeżeli mediana leży dokładnie pośrodku między kwartylami, asymetria pozycyjna wynosi zero.

Kwartyle i sposób ich wyznaczania omawiamy dokładniej w artykule Kwantyle w szeregu szczegółowym. Ich znaczenie jako miar położenia przedstawiamy natomiast w artykule Miary położenia w statystyce opisowej.

Wartość \(A_Q\) Interpretacja
\(A_Q=0\) mediana leży pośrodku między kwartylami; brak asymetrii pozycyjnej
\(A_Q>0\) asymetria prawostronna w środkowej części rozkładu
\(A_Q<0\) asymetria lewostronna w środkowej części rozkładu

Pozycyjny współczynnik asymetrii mieści się zwykle w przedziale od \(-1\) do \(1\). Jeżeli \(Q_3=Q_1\), nie można go obliczyć, ponieważ w mianowniku pojawiłoby się zero. Taka sytuacja oznacza brak zróżnicowania w środkowej części danych.

Współczynnik asymetrii oparty na średniej i dominancie

Popularną miarą asymetrii jest również współczynnik oparty na różnicy między średnią arytmetyczną i dominantą. Wykorzystuje on intuicję, że w rozkładzie symetrycznym średnia, mediana i dominanta są blisko siebie, natomiast w rozkładzie asymetrycznym średnia przesuwa się w stronę ogona rozkładu.

Współczynnik asymetrii oparty na średniej i dominancie:

\[ A_P=\frac{\bar{x}-Mo}{s} \]

gdzie:

Jeżeli \(\bar{x}>Mo\), współczynnik jest dodatni i wskazuje na asymetrię prawostronną. Jeżeli \(\bar{x}

W niektórych ujęciach zamiast odchylenia standardowego w mianowniku stosuje się odchylenie przeciętne:

Wariant z odchyleniem przeciętnym:

\[ A_d=\frac{\bar{x}-Mo}{d} \]

gdzie \(d\) oznacza odchylenie przeciętne. Obie wersje mają podobną intuicję, ale mogą dawać inne wartości liczbowe, ponieważ wykorzystują inną miarę zróżnicowania w mianowniku. Odchylenie przeciętne, odchylenie standardowe i inne miary rozproszenia omawiamy w artykule Miary zróżnicowania w statystyce opisowej.

W praktyce problemem może być wyznaczenie dominanty. Dla danych jakościowych dominanta jest naturalna, ale dla danych ciągłych lub bardzo szczegółowych może nie występować albo może być mało stabilna. Wtedy niektórzy autorzy stosują przybliżony współczynnik Pearsona oparty na średniej i medianie:

Drugi współczynnik Pearsona:

\[ A_{P2}=\frac{3(\bar{x}-Me)}{s} \]

Ten wzór wykorzystuje medianę zamiast dominanty i bywa stosowany wtedy, gdy dominanta nie jest jednoznaczna lub trudno ją sensownie wyznaczyć.

Porównanie najważniejszych miar asymetrii

Miara Wzór Rodzaj Uwagi interpretacyjne
Trzeci moment centralny \(m_3=\frac{1}{n}\sum_{i=1}^{n}(x_i-\bar{x})^3\) bezwzględna zależy od jednostki i skali danych
Momentowy współczynnik asymetrii \(A_s=\frac{m_3}{s^3}\) względna klasyczna często stosowany, ale wrażliwy na wartości odstające
Pozycyjny współczynnik asymetrii \(A_Q=\frac{Q_3+Q_1-2Me}{Q_3-Q_1}\) względna pozycyjna bardziej odporny na wartości skrajne
Współczynnik średnia – dominanta \(A_P=\frac{\bar{x}-Mo}{s}\) względna klasyczna wymaga sensownie wyznaczonej dominanty
Wariant z odchyleniem przeciętnym \(A_d=\frac{\bar{x}-Mo}{d}\) względna klasyczna różni się mianownikiem, więc może dawać inną wartość liczbową
Drugi współczynnik Pearsona \(A_{P2}=\frac{3(\bar{x}-Me)}{s}\) względna klasyczna stosowany, gdy dominanta jest trudna do wyznaczenia

Jak interpretować znak współczynnika asymetrii?

Niezależnie od tego, czy korzystamy z miary momentowej, pozycyjnej czy współczynnika opartego na średniej i dominancie, najważniejsza jest interpretacja znaku.

Znak miary asymetrii Rodzaj asymetrii Interpretacja
\(0\) brak asymetrii rozkład symetryczny albo bardzo bliski symetrycznemu
dodatni asymetria prawostronna długi ogon po prawej stronie; średnia zwykle większa od mediany
ujemny asymetria lewostronna długi ogon po lewej stronie; średnia zwykle mniejsza od mediany

Najważniejsze jest więc nie tylko to, jaką wartość liczbową przyjmuje współczynnik, ale także to, czy jest dodatni, ujemny czy bliski zeru.

Miary klasyczne i pozycyjne asymetrii

Podobnie jak w przypadku miar zróżnicowania, także przy asymetrii można odróżnić podejście klasyczne i pozycyjne.

Cecha Miary klasyczne Miary pozycyjne
Punkt odniesienia średnia arytmetyczna mediana i kwartyle
Przykłady momentowy współczynnik asymetrii, współczynnik Pearsona pozycyjny współczynnik asymetrii Bowleya
Wrażliwość na wartości odstające większa mniejsza
Zastosowanie dane ilościowe, zwłaszcza gdy zależy nam na pełnym wykorzystaniu wartości dane z wartościami odstającymi lub rozkłady silnie asymetryczne

Jeżeli rozkład jest regularny i nie zawiera silnych wartości odstających, miary klasyczne i pozycyjne zwykle prowadzą do podobnych wniosków co do kierunku asymetrii. Jeżeli jednak występują wartości skrajne, miary klasyczne mogą reagować znacznie silniej niż pozycyjne.

Przykład: rozpoznawanie asymetrii na podstawie średniej, mediany i dominanty

Rozważmy dane:

\[ 2,\ 3,\ 4,\ 4,\ 5,\ 6,\ 20 \]

Średnia wynosi:

\[ \bar{x}=\frac{2+3+4+4+5+6+20}{7} =\frac{44}{7}\approx 6{,}29 \]

Mediana to środkowa, czwarta wartość:

\[ Me=4 \]

Dominanta to wartość występująca najczęściej:

\[ Mo=4 \]

Mamy więc układ:

\[ Mo=Me<\bar{x} \]

Średnia została przesunięta w prawo przez wysoką wartość \(20\). Oznacza to asymetrię prawostronną, czyli dodatnią.

Najczęstsze błędy przy interpretacji asymetrii

1. Mylenie strony „górki” ze stroną asymetrii

Stronę asymetrii określa strona ogona rozkładu, a nie strona, po której znajduje się najwyższa część wykresu. Jeżeli ogon jest po prawej stronie, asymetria jest prawostronna, nawet jeśli większość obserwacji skupia się po lewej stronie wykresu.

2. Zakładanie, że współczynnik asymetrii musi mieścić się od \(-1\) do \(1\)

Nie wszystkie współczynniki asymetrii mają taki sam zakres wartości. Pozycyjny współczynnik asymetrii jest zwykle ograniczony do przedziału od \(-1\) do \(1\), ale momentowy współczynnik asymetrii może przyjmować wartości mniejsze od \(-1\) albo większe od \(1\).

3. Mechaniczne traktowanie asymetrii równej zero

Współczynnik asymetrii równy zero sugeruje brak asymetrii, ale nie zawsze oznacza, że rozkład jest idealnie symetryczny pod każdym względem. Warto patrzeć również na wykres, tabelę liczebności i inne miary statystyczne.

4. Porównywanie różnych współczynników bez uwzględnienia ich konstrukcji

Współczynnik momentowy, pozycyjny i współczynnik Pearsona mogą dawać różne wartości liczbowe, ponieważ opierają się na innych miarach: średniej, odchyleniu standardowym, dominancie, medianie albo kwartylach. Najważniejsze jest więc rozumienie, co dokładnie mierzy dany współczynnik.

Zadanie dla czytelnika

Rozpoznaj kierunek asymetrii

Dany jest zbiór wartości:

\[ 2,\ 3,\ 4,\ 4,\ 5,\ 6,\ 20 \]

Oblicz średnią arytmetyczną, medianę i dominantę. Następnie określ, czy rozkład jest symetryczny, prawostronnie asymetryczny czy lewostronnie asymetryczny.

Pokaż rozwiązanie

Średnia arytmetyczna wynosi:

\[ \bar{x}=\frac{2+3+4+4+5+6+20}{7} =\frac{44}{7}\approx 6{,}29 \]

Dane są uporządkowane rosnąco, a liczba obserwacji wynosi \(7\). Środkowa, czwarta wartość to:

\[ Me=4 \]

Najczęściej występuje wartość \(4\), dlatego:

\[ Mo=4 \]

Otrzymujemy więc:

\[ Mo=Me<\bar{x} \]

Średnia jest większa od mediany i dominanty, ponieważ wysoka wartość \(20\) przesuwa ją w prawo. Rozkład jest więc prawostronnie asymetryczny, czyli ma asymetrię dodatnią.

Podsumowanie

Miary asymetrii pozwalają określić, czy rozkład danych jest symetryczny, czy przechylony w jedną stronę. W asymetrii prawostronnej, zwanej dodatnią, długi ogon rozkładu znajduje się po prawej stronie, a średnia jest zwykle większa od mediany. W asymetrii lewostronnej, zwanej ujemną, długi ogon znajduje się po lewej stronie, a średnia jest zwykle mniejsza od mediany.

Najważniejsze miary asymetrii to trzeci moment centralny, momentowy współczynnik asymetrii, pozycyjny współczynnik asymetrii oraz współczynniki oparte na relacji między średnią, medianą i dominantą. Każda z tych miar ma trochę inną konstrukcję, dlatego ich wartości liczbowe mogą się różnić.

W praktyce najpierw warto zrozumieć kierunek asymetrii, a dopiero potem interpretować dokładną wartość współczynnika. Szczególnie ważne jest zapamiętanie, że stronę asymetrii określa strona ogona rozkładu, a nie strona, po której znajduje się najwyższa część wykresu.

Powiązane artykuły

Masz problem z tym tematem?

Wszechwiedza.pl pomaga zrozumieć matematykę, statystykę, ekonometrię, badania operacyjne, analizę danych, mechanikę, rachunkowość i wiele innych przedmiotów — spokojnie, konkretnie i krok po kroku. 

Zapytaj o pomoc