Model ekonometryczny — czym jest, do czego służy i jak go zbudować?

Sebastian Dziarmaga-Działyński

Wprowadzenie

Ekonometria jest dziedziną łączącą ekonomię, matematykę, statystykę oraz analizę danych. Jej podstawowym narzędziem jest model ekonometryczny, czyli matematyczny opis zależności pomiędzy badanymi zjawiskami. Za pomocą takiego modelu można próbować odpowiedzieć na pytania typu: jak zmiana jednej wielkości wpływa na inną, które czynniki są istotne dla badanego zjawiska, czy na podstawie danych historycznych można przewidzieć przyszłe wartości oraz jak silna jest zależność między zmiennymi.

Modele ekonometryczne są wykorzystywane między innymi w ekonomii, finansach, marketingu, zarządzaniu, demografii, logistyce, analizie rynku pracy, bankowości, ubezpieczeniach, a także w szeroko rozumianej analizie danych. Choć nazwa „ekonometria” sugeruje związek przede wszystkim z ekonomią, to same metody modelowania mogą być stosowane wszędzie tam, gdzie badamy zależności ilościowe między zmiennymi.

Spis treści

Czym jest model ekonometryczny?
Zmienna objaśniana i zmienne objaśniające
Składnik losowy w modelu ekonometrycznym
Przykład prostego modelu ekonometrycznego
Rodzaje danych w ekonometrii
Do czego można wykorzystać model ekonometryczny?
Etapy budowy modelu ekonometrycznego
Modelowanie a data mining
Korelacja nie zawsze oznacza przyczynowość
Model dobry statystycznie a model dobry merytorycznie
Najczęstsze błędy przy budowie modeli ekonometrycznych
Jakich programów używa się w ekonometrii?
Podsumowanie

Czym jest model ekonometryczny?

Model ekonometryczny to równanie lub układ równań opisujących zależność między zmienną objaśnianą a jedną lub wieloma zmiennymi objaśniającymi. Mówiąc prościej, model ekonometryczny pozwala zbadać, w jaki sposób pewne wielkości wpływają na inną wielkość, którą chcemy wyjaśnić, opisać lub prognozować.

Przykładowo możemy badać, od czego zależy wysokość sprzedaży produktu. Zmienną objaśnianą będzie wtedy sprzedaż, natomiast zmiennymi objaśniającymi mogą być cena produktu, wydatki na reklamę, dochody konsumentów, liczba punktów sprzedaży, sezonowość albo działania konkurencji.

Ogólną ideę prostego modelu ekonometrycznego można zapisać następująco:

$$Y = f(X_1, X_2, \ldots, X_k) + \varepsilon$$

gdzie:

$Y$ oznacza zmienną objaśnianą, czyli tę wielkość, którą chcemy wyjaśnić lub przewidzieć,
$X_1, X_2, \ldots, X_k$ oznaczają zmienne objaśniające, czyli czynniki wpływające na zmienną $Y$,
$f$ oznacza postać zależności między zmiennymi,
$\varepsilon$ oznacza składnik losowy, czyli część zmienności, której model nie wyjaśnia w sposób deterministyczny.

W praktyce bardzo często stosuje się modele liniowe, których ogólna postać jest następująca:

$$Y = \beta_0 + \beta_1X_1 + \beta_2X_2 + \ldots + \beta_kX_k + \varepsilon$$

Współczynniki $\beta_0, \beta_1, \beta_2, \ldots, \beta_k$ nazywamy parametrami modelu. Ich wartości są szacowane na podstawie danych empirycznych, najczęściej przy użyciu metody najmniejszych kwadratów.

Zmienna objaśniana i zmienne objaśniające

Podstawą każdego modelu ekonometrycznego jest rozróżnienie między zmienną objaśnianą a zmiennymi objaśniającymi. Zmienna objaśniana to ta wielkość, której zachowanie chcemy opisać. Często oznacza się ją symbolem $Y$. Może to być na przykład poziom sprzedaży, wysokość wynagrodzenia, wartość PKB, stopa bezrobocia, cena mieszkania albo zysk przedsiębiorstwa.

Zmienne objaśniające to czynniki, które potencjalnie wpływają na zmienną objaśnianą. Oznacza się je zwykle symbolami $X_1, X_2, \ldots, X_k$. W modelu ceny mieszkania zmiennymi objaśniającymi mogą być powierzchnia lokalu, liczba pokoi, lokalizacja, rok budowy, piętro, odległość od centrum miasta albo standard wykończenia.

Dobór zmiennych objaśniających jest jednym z najważniejszych etapów budowy modelu. Z jednej strony model powinien uwzględniać istotne czynniki wpływające na badane zjawisko, z drugiej jednak strony nie powinien być nadmiernie rozbudowany. Zbyt duża liczba zmiennych może prowadzić do problemów interpretacyjnych, współliniowości oraz nadmiernego dopasowania modelu do konkretnej próby danych.

Składnik losowy w modelu ekonometrycznym

W modelu ekonometrycznym zwykle pojawia się składnik losowy, oznaczany najczęściej symbolem $\varepsilon$. Jest on niezwykle ważny, ponieważ w rzeczywistości rzadko mamy do czynienia z zależnościami idealnymi. Nawet jeżeli pewna zmienna wyraźnie wpływa na drugą, to zwykle istnieją również inne czynniki, których nie uwzględniliśmy w modelu, błędy pomiaru, przypadkowe zaburzenia oraz indywidualne odchylenia obserwacji.

Przykładowo, jeżeli budujemy model wyjaśniający wynagrodzenie pracownika na podstawie stażu pracy i poziomu wykształcenia, to nadal nie uwzględniamy wszystkich możliwych czynników. Na wynagrodzenie mogą wpływać także branża, region, znajomość języków obcych, umiejętności negocjacyjne, sytuacja gospodarcza, wielkość firmy, doświadczenie praktyczne czy cechy trudne do zmierzenia. Składnik losowy reprezentuje właśnie tę część zmienności, której model nie opisuje za pomocą wybranych zmiennych objaśniających.

Obecność składnika losowego odróżnia model ekonometryczny od prostego równania matematycznego. Model ekonometryczny nie mówi zazwyczaj, że dana zależność zachodzi zawsze dokładnie, lecz że zachodzi przeciętnie, statystycznie, z pewnym błędem.

Przykład prostego modelu ekonometrycznego

Załóżmy, że chcemy zbadać zależność między miesięcznymi wydatkami na reklamę a wartością sprzedaży. Możemy zaproponować prosty model liniowy:

$$Y = \beta_0 + \beta_1X + \varepsilon$$

gdzie:

$Y$ — wartość sprzedaży,
$X$ — wydatki na reklamę,
$\beta_0$ — wyraz wolny,
$\beta_1$ — parametr informujący o przeciętnym wpływie wydatków reklamowych na sprzedaż,
$\varepsilon$ — składnik losowy.

Jeżeli po oszacowaniu modelu otrzymamy równanie:

$$\hat{Y} = 12000 + 4{,}5X$$

to możemy interpretować je następująco: przy braku wydatków na reklamę przewidywana sprzedaż wynosi 12 000 jednostek pieniężnych, natomiast wzrost wydatków na reklamę o jedną jednostkę powoduje przeciętny wzrost sprzedaży o 4,5 jednostki. Oczywiście interpretacja taka ma sens tylko przy zachowaniu odpowiednich jednostek oraz w zakresie danych, na podstawie których model został oszacowany.

Symbol $\hat{Y}$ oznacza wartość teoretyczną, czyli wartość przewidywaną przez model. Różnica między wartością rzeczywistą a wartością przewidywaną nazywana jest resztą modelu:

$$e_i = y_i - \hat{y}_i$$

Reszty odgrywają bardzo ważną rolę przy ocenie jakości modelu, ponieważ pokazują, jak bardzo wartości rzeczywiste różnią się od wartości wynikających z modelu.

Rodzaje danych w ekonometrii

Modele ekonometryczne buduje się na podstawie danych empirycznych. W zależności od charakteru tych danych można wyróżnić trzy podstawowe typy prób: dane przekrojowe, szeregi czasowe oraz dane panelowe.

Dane przekrojowe

Dane przekrojowe opisują wiele jednostek badania w tym samym momencie lub okresie. Jednostkami mogą być osoby, gospodarstwa domowe, przedsiębiorstwa, kraje, województwa, banki albo produkty.

Przykładem danych przekrojowych może być zestawienie cen mieszkań sprzedanych w danym mieście w 2025 roku. Każda obserwacja dotyczy innego mieszkania, a zmiennymi mogą być cena, powierzchnia, liczba pokoi, piętro, lokalizacja i standard wykończenia.

Modele oparte na danych przekrojowych często służą do badania różnic między jednostkami. Można za ich pomocą analizować, dlaczego jedne osoby zarabiają więcej od innych, dlaczego jedne firmy osiągają wyższe zyski albo dlaczego ceny mieszkań różnią się między lokalizacjami.

Szeregi czasowe

Szereg czasowy to zbiór obserwacji dotyczących jednej jednostki lub zjawiska w kolejnych momentach czasu. Dane takie są uporządkowane chronologicznie. Mogą dotyczyć na przykład miesięcznej sprzedaży przedsiębiorstwa, kwartalnego PKB, rocznej inflacji, kursu walutowego, liczby bezrobotnych albo dziennych cen akcji.

W przypadku szeregów czasowych szczególnie ważna jest kolejność obserwacji. Wartość z danego okresu może zależeć od wartości z okresów wcześniejszych. Dlatego w modelach szeregów czasowych pojawiają się takie zagadnienia jak trend, sezonowość, cykliczność, opóźnienia czasowe, autokorelacja oraz stacjonarność.

Przykładowo, analizując miesięczną sprzedaż lodów, należy uwzględnić nie tylko cenę czy wydatki reklamowe, ale również sezonowość. Sprzedaż będzie zwykle wyższa latem niż zimą, nawet przy podobnym poziomie innych czynników.

Dane panelowe

Dane panelowe łączą cechy danych przekrojowych i szeregów czasowych. Oznacza to, że obserwujemy wiele jednostek w wielu okresach. Przykładowo możemy analizować wyniki finansowe kilkunastu banków w kolejnych latach albo poziom bezrobocia w poszczególnych województwach w okresie kilkunastu lat.

Dane panelowe są bardzo cenne, ponieważ pozwalają badać zarówno różnice między jednostkami, jak i zmiany zachodzące w czasie. Modele panelowe są jednak bardziej zaawansowane niż proste modele przekrojowe, ponieważ trzeba uwzględnić dodatkową strukturę danych oraz możliwość występowania efektów indywidualnych charakterystycznych dla poszczególnych jednostek.

Do czego można wykorzystać model ekonometryczny?

Model ekonometryczny może pełnić kilka różnych funkcji. Najczęściej wykorzystuje się go do opisu zależności, wyjaśniania zjawisk, prognozowania, symulacji oraz wspomagania decyzji.

Opis zależności między zmiennymi

Najprostszym zastosowaniem modelu jest opis zależności między zmiennymi. Możemy na przykład zbadać, czy istnieje zależność między ceną produktu a wielkością sprzedaży, między dochodem a konsumpcją, między stopą procentową a poziomem inwestycji albo między doświadczeniem zawodowym a wynagrodzeniem.

Model pozwala nie tylko stwierdzić, że pewna zależność występuje, ale także oszacować jej siłę i kierunek. Dzięki temu możemy powiedzieć, czy wzrost danej zmiennej wiąże się przeciętnie ze wzrostem czy spadkiem innej zmiennej.

Wyjaśnianie zjawisk ekonomicznych

Modele ekonometryczne pomagają wyjaśniać, dlaczego pewne zjawiska przyjmują określone wartości. Przykładowo można analizować, jakie czynniki wpływają na bezrobocie w regionach, które zmienne wyjaśniają poziom inflacji, od czego zależy rentowność przedsiębiorstw albo jakie czynniki wpływają na poziom zadłużenia gospodarstw domowych.

W takim zastosowaniu szczególnie ważna jest interpretacja parametrów modelu oraz ich istotność statystyczna. Nie wystarczy bowiem otrzymać równania. Trzeba jeszcze ocenić, czy uzyskane zależności są zgodne z teorią, logiczne i statystycznie wiarygodne.

Prognozowanie

Bardzo ważnym zastosowaniem modeli ekonometrycznych jest prognozowanie. Jeżeli znamy zależność między zmienną objaśnianą a zmiennymi objaśniającymi, możemy próbować przewidywać przyszłe wartości badanej wielkości.

Przykładowo przedsiębiorstwo może wykorzystać model do prognozowania sprzedaży w kolejnych miesiącach. Bank może prognozować ryzyko kredytowe klientów, a instytucja publiczna może przewidywać poziom bezrobocia lub wpływy podatkowe.

Należy jednak pamiętać, że prognoza jest zawsze obarczona niepewnością. Model oparty na danych historycznych zakłada, że przynajmniej w pewnym stopniu zależności zaobserwowane w przeszłości będą utrzymywać się w przyszłości. Jeżeli warunki gospodarcze gwałtownie się zmienią, trafność prognoz może znacząco spaść.

Symulacje i analiza wariantowa

Model ekonometryczny można wykorzystać także do symulacji. Jeżeli znamy postać zależności między zmiennymi, możemy sprawdzić, jak zmieni się przewidywana wartość zmiennej objaśnianej przy różnych założeniach dotyczących zmiennych objaśniających.

Przykładowo firma może zapytać: co stanie się ze sprzedażą, jeśli zwiększymy wydatki reklamowe o 20%? Jak zmieni się popyt, jeśli cena produktu wzrośnie o 5%? Jaki będzie wpływ wzrostu wynagrodzeń na koszty przedsiębiorstwa? Tego typu pytania są typowe dla analizy wariantowej.

Wspomaganie decyzji

Modele ekonometryczne mogą wspierać podejmowanie decyzji. Nie zastępują zdrowego rozsądku ani wiedzy eksperckiej, ale dostarczają uporządkowanej informacji o zależnościach w danych. Dzięki nim decyzje mogą być bardziej oparte na faktach, a mniej na intuicji.

W praktyce model może pomóc w ustaleniu ceny, zaplanowaniu budżetu reklamowego, ocenie ryzyka kredytowego, wyborze inwestycji, określeniu czynników wpływających na rentowność albo przygotowaniu prognozy finansowej.

Etapy budowy modelu ekonometrycznego

Budowa modelu ekonometrycznego nie polega jedynie na wpisaniu danych do programu statystycznego i odczytaniu wyniku. Jest to proces, który wymaga zarówno wiedzy merytorycznej, jak i umiejętności statystycznych. Można wyróżnić kilka podstawowych etapów budowy modelu.

1. Sformułowanie problemu badawczego

Pierwszym etapem jest określenie, co właściwie chcemy zbadać. Należy jasno wskazać zmienną objaśnianą oraz pytanie badawcze. Przykładowo: od czego zależy cena mieszkania? Jakie czynniki wpływają na poziom sprzedaży? Czy wydatki na reklamę istotnie wpływają na przychody? Jak stopa bezrobocia zależy od tempa wzrostu gospodarczego?

Na tym etapie ważna jest również wiedza dziedzinowa. Model powinien mieć sens ekonomiczny, a nie być jedynie mechanicznym dopasowaniem równania do danych.

2. Dobór zmiennych

Następnie wybiera się zmienne, które mogą wyjaśniać badane zjawisko. Dobór zmiennych powinien wynikać z teorii, doświadczenia, wcześniejszych badań lub logicznego rozumowania. W praktyce często łączy się podejście merytoryczne z analizą empiryczną.

Nie każda dostępna zmienna powinna znaleźć się w modelu. Zmienna może być nieistotna, źle zmierzona, nadmiernie skorelowana z inną zmienną albo pozornie powiązana z badanym zjawiskiem. Dlatego dobór zmiennych jest jednym z najtrudniejszych i najbardziej odpowiedzialnych etapów modelowania.

3. Zebranie i przygotowanie danych

Kolejnym krokiem jest zebranie danych. Mogą one pochodzić z baz statystycznych, sprawozdań finansowych, ankiet, systemów informatycznych, danych transakcyjnych, banków danych, raportów branżowych albo obserwacji własnych.

Dane często wymagają oczyszczenia i przygotowania. Trzeba sprawdzić braki danych, wartości odstające, jednostki miary, zgodność okresów, sposób kodowania zmiennych jakościowych oraz ewentualną potrzebę przekształceń, takich jak logarytmowanie, standaryzacja lub przeliczenie wartości nominalnych na realne.

4. Wybór postaci modelu

Następnie należy określić postać modelu. Najczęściej punktem wyjścia jest model liniowy, ale w praktyce stosuje się również modele logarytmiczne, potęgowe, wykładnicze, wielomianowe, modele z opóźnieniami, modele trendu, modele sezonowe, modele jakościowe oraz wiele bardziej zaawansowanych konstrukcji.

Wybór postaci modelu powinien wynikać z charakteru badanego zjawiska. Nie każdą zależność da się dobrze opisać prostą linią. Czasami wzrost jednej zmiennej powoduje coraz słabszy przyrost drugiej zmiennej, czasami zależność jest nieliniowa, a czasami wpływ danej zmiennej ujawnia się dopiero po pewnym czasie.

5. Estymacja parametrów

Po ustaleniu postaci modelu należy oszacować jego parametry. W modelach liniowych najczęściej stosuje się metodę najmniejszych kwadratów. Polega ona na takim dobraniu parametrów równania, aby suma kwadratów różnic między wartościami rzeczywistymi a wartościami przewidywanymi przez model była jak najmniejsza.

Estymacja parametrów pozwala przejść od ogólnego równania teoretycznego do konkretnego modelu liczbowego. Zamiast symboli $\beta_0, \beta_1, \ldots, \beta_k$ otrzymujemy konkretne wartości współczynników, które można interpretować i wykorzystywać do obliczeń.

6. Weryfikacja modelu

Oszacowanie modelu nie oznacza jeszcze końca pracy. Model trzeba zweryfikować. Sprawdza się między innymi dopasowanie modelu do danych, istotność parametrów, zgodność znaków parametrów z oczekiwaniami, własności reszt oraz spełnienie założeń metody estymacji.

W przypadku klasycznego modelu liniowego szczególną uwagę zwraca się na takie problemy jak autokorelacja składnika losowego, heteroskedastyczność, współliniowość zmiennych objaśniających, nietypowe obserwacje oraz poprawność specyfikacji modelu.

7. Interpretacja wyników

Nawet najlepszy formalnie model nie ma dużej wartości, jeśli nie potrafimy poprawnie zinterpretować jego wyników. Interpretacja parametrów powinna być zgodna z jednostkami miary zmiennych oraz postacią modelu.

W modelu liniowym parametr przy zmiennej objaśniającej informuje, o ile przeciętnie zmieni się zmienna objaśniana, gdy dana zmienna objaśniająca wzrośnie o jedną jednostkę, przy założeniu niezmienności pozostałych zmiennych. W modelach logarytmicznych interpretacja może dotyczyć zmian procentowych lub elastyczności.

8. Zastosowanie modelu

Ostatnim etapem jest wykorzystanie modelu do celu, dla którego został zbudowany. Może to być prognoza, symulacja, analiza wariantowa, ocena wpływu zmiennych, przygotowanie raportu albo wsparcie decyzji biznesowej.

Warto pamiętać, że model ekonometryczny jest uproszczeniem rzeczywistości. Nie powinien być traktowany jako nieomylna maszyna do produkowania odpowiedzi. Jest narzędziem analitycznym, którego wyniki należy oceniać krytycznie i zestawiać z wiedzą merytoryczną.

Modelowanie a data mining

W klasycznej ekonometrii często zaczyna się od teorii lub hipotezy badawczej. Najpierw zastanawiamy się, jakie czynniki powinny wpływać na badane zjawisko, a następnie sprawdzamy tę zależność na danych. W praktyce analizy danych spotyka się jednak również podejście bardziej eksploracyjne, określane często jako data mining.

Data mining polega na poszukiwaniu wzorców, zależności i regularności w dużych zbiorach danych. Czasami badacz lub analityk nie ma z góry jednej konkretnej hipotezy, lecz przeszukuje dane w celu znalezienia interesujących relacji. Można powiedzieć, że jest to częściowo badanie „po omacku”, choć oczywiście powinno być prowadzone z zachowaniem odpowiedniej ostrożności metodologicznej.

Takie podejście może być bardzo użyteczne, zwłaszcza gdy dysponujemy dużą liczbą zmiennych i nie wiemy jeszcze, które z nich mogą mieć znaczenie. Przykładowo firma analizująca zachowania klientów może szukać czynników wpływających na rezygnację z usługi, skłonność do zakupu, reakcję na reklamę albo ryzyko opóźnienia płatności.

Należy jednak uważać na pułapkę przypadkowych zależności. Jeżeli badamy bardzo wiele zmiennych, zawsze istnieje ryzyko znalezienia korelacji, która powstała przypadkowo i nie ma sensownej interpretacji. Dlatego wyniki eksploracyjnej analizy danych powinny być później weryfikowane na nowych danych, testowane statystycznie i oceniane merytorycznie.

Korelacja nie zawsze oznacza przyczynowość

Jednym z najważniejszych ostrzeżeń przy interpretacji modeli ekonometrycznych jest zasada, że korelacja nie oznacza automatycznie przyczynowości. To, że dwie zmienne są ze sobą statystycznie powiązane, nie musi jeszcze oznaczać, że jedna z nich jest przyczyną drugiej.

Przykładowo możemy zaobserwować zależność między sprzedażą lodów a liczbą osób korzystających z kąpielisk. Nie oznacza to jednak, że jedzenie lodów powoduje wizyty na kąpielisku albo odwrotnie. Obie zmienne mogą być zależne od trzeciego czynnika, którym jest temperatura lub pora roku.

W modelach ekonometrycznych szczególnie ważne jest więc rozróżnienie między zależnością statystyczną a zależnością przyczynową. Aby mówić o przyczynowości, potrzebne są dodatkowe argumenty: teoria, konstrukcja badania, odpowiednia specyfikacja modelu, kontrola zmiennych zakłócających, a czasami także metody eksperymentalne lub quasi-eksperymentalne.

Model dobry statystycznie a model dobry merytorycznie

W praktyce można spotkać modele, które bardzo dobrze dopasowują się do danych, ale nie mają sensownej interpretacji. Wysoki współczynnik determinacji albo istotne statystycznie parametry nie wystarczają, aby uznać model za dobry. Model powinien być również logiczny, zgodny z wiedzą merytoryczną i użyteczny dla celu badania.

Przykładowo, jeżeli model wskazuje, że wzrost ceny produktu powoduje wzrost popytu, to taki wynik może być podejrzany, chyba że mamy do czynienia ze szczególnym przypadkiem, takim jak dobra luksusowe, efekt prestiżu albo błędna specyfikacja modelu. Sam wynik obliczeń nie zwalnia z obowiązku krytycznego myślenia.

Dobry model ekonometryczny powinien łączyć trzy cechy: poprawność statystyczną, sensowność merytoryczną oraz przydatność praktyczną. Brak którejkolwiek z tych cech może ograniczać wartość modelu.

Najczęstsze błędy przy budowie modeli ekonometrycznych

Początkujący użytkownicy ekonometrii często popełniają kilka typowych błędów. Jednym z nich jest automatyczne wrzucanie do modelu wszystkich dostępnych zmiennych bez zastanowienia, czy mają one sens merytoryczny. Innym błędem jest ocenianie modelu wyłącznie na podstawie współczynnika determinacji $R^2$.

Częstym problemem jest także nieuwzględnianie specyfiki danych. Inaczej pracuje się z danymi przekrojowymi, inaczej z szeregami czasowymi, a jeszcze inaczej z danymi panelowymi. W przypadku szeregów czasowych nie można ignorować trendu, sezonowości czy autokorelacji. W przypadku danych przekrojowych trzeba zwracać uwagę na obserwacje nietypowe i heteroskedastyczność.

Innym błędem jest interpretowanie zależności statystycznych jako dowodu przyczynowości bez dodatkowego uzasadnienia. Model może pokazywać związek między zmiennymi, ale nie zawsze pozwala jednoznacznie stwierdzić, że jedna zmienna jest przyczyną drugiej.

Wreszcie, dużym problemem bywa budowanie modelu wyłącznie pod konkretny wynik. Jeżeli analityk wielokrotnie zmienia zestaw zmiennych, postać modelu i zakres danych tylko po to, aby uzyskać oczekiwane parametry, to model traci wartość poznawczą. Wyniki powinny wynikać z danych i poprawnej metody, a nie z dopasowywania obliczeń do z góry założonej tezy.

Jakich programów używa się w ekonometrii?

Modele ekonometryczne można budować w wielu programach. Do prostych zastosowań wystarczy arkusz kalkulacyjny, na przykład Excel lub LibreOffice Calc. Bardziej zaawansowane analizy wykonuje się często w programach statystycznych i ekonometrycznych, takich jak Gretl, R, Python, Stata, EViews, SPSS, SAS czy Matlab.

W dydaktyce ekonometrii popularny jest Gretl, ponieważ jest darmowy, stosunkowo prosty w obsłudze i dobrze dostosowany do klasycznych modeli ekonometrycznych. R i Python dają natomiast bardzo duże możliwości, szczególnie gdy ekonometria łączy się z analizą danych, machine learningiem, automatyzacją raportów albo przetwarzaniem dużych zbiorów danych.

Wybór programu ma znaczenie praktyczne, ale nie zastępuje zrozumienia metody. Ten sam model można zwykle oszacować w różnych narzędziach, a wyniki powinny być takie same lub bardzo podobne. Najważniejsze jest rozumienie, co program liczy, jakie założenia stoją za metodą oraz jak poprawnie interpretować otrzymane rezultaty.

Podsumowanie

Model ekonometryczny jest narzędziem służącym do ilościowego opisu zależności między zmiennymi. Pozwala badać wpływ jednych wielkości na inne, wyjaśniać zjawiska ekonomiczne, budować prognozy, wykonywać symulacje oraz wspierać podejmowanie decyzji. Podstawowymi elementami modelu są zmienna objaśniana, zmienne objaśniające, parametry oraz składnik losowy.

Modele ekonometryczne mogą być budowane na podstawie danych przekrojowych, szeregów czasowych lub danych panelowych. Każdy z tych typów danych ma swoją specyfikę i wymaga odpowiedniego podejścia. Proces budowy modelu obejmuje sformułowanie problemu badawczego, dobór zmiennych, zebranie i przygotowanie danych, wybór postaci modelu, estymację parametrów, weryfikację, interpretację oraz praktyczne zastosowanie wyników.

Ekonometria nie polega na mechanicznym dopasowaniu równania do danych. Dobry model powinien być poprawny statystycznie, sensowny merytorycznie i użyteczny praktycznie. Dlatego obok znajomości metod obliczeniowych potrzebne jest również krytyczne myślenie, znajomość badanego zjawiska oraz ostrożność przy interpretacji wyników.

W kolejnym artykule omówimy jedną z najważniejszych metod estymacji parametrów modelu liniowego, czyli metodę najmniejszych kwadratów. Wyjaśnimy, na czym polega jej idea, dlaczego minimalizuje się sumę kwadratów reszt oraz jak interpretować otrzymane równanie regresji.

Sebastian Dziarmaga-Działyński

Utworzono: 16.05.2026