ТАБЛИЧНОЕ МОДЕЛИРОВАНИЕ КАК ИНСТРУМЕНТ ИНТЕРАКТИВНОГО ОБУЧЕНИЯ БАЗОВЫМ ПОНЯТИЯМ ЭКОНОМЕТРИКИ
УДК 303.064
Екатерина Борисовна Грибанова,
к.т.н., Томский государственный университет систем управления и радиоэлектроники Тел.: (3822) 701-536 Эл. почта: [email protected]
В статье описывается разработка интерактивных графических средств для иллюстрации базовых понятий эконометрики: парная линейная регрессия, индекс детерминации, автокорреляция, гетероскедастичность и др. Реализация выполнена в табличном процессоре Excel с применением метода имитационного моделирования и может быть полезна в обучении дисциплине.
Ключевые слова: эконометрика, электронные таблицы, диаграммы, функция регрессии, обучение.
Ekaterina B. Gribanova,
PhD in Technique, Tomsk State University of Control System and Radio electronics Tel.: (3822) 701-536 E-mail: [email protected]
SPREADSHEET MODELING AS A TOOL FOR INTERACTIVE LEARNING OF BASIC CONCEPTS OF ECONOMETRICS
The article describes how to develop interactive graphical tools to illustrate the basic concepts of econometrics: linear regression, index of determination, autocorrelation, heteroscedasticity, etc. the Implementation is made in the spreadsheet program Excel using the simulation method and can be useful in teaching discipline.
Keywords: econometrics, spreadsheets, charts, regression, training.
1. Введение
В работе экономиста возникают задачи, связанные с оценкой, прогнозированием, исследованием влияния факторов на результирующую величину, выявлением взаимосвязей между явлениями. Их решение требует применения современных математических методов и моделей, которые в том числе рассматриваются в рамках такой дисциплины как эконометрика. Чтение экономической литературы также предполагает хорошую эконометрическую подготовку.
Центральной задачей эконометрики является построение эконометричес-кой модели и определение возможностей ее использования для описания, анализа и прогнозирования реальных экономических процессов.
Приведем основные принципы, которыми следует руководствоваться при обучении эконометрике [1].
Использование реальных данных в примерах и при выполнении практических работ. Осознание того, что решаются реальные задачи и изучаемые инструменты могут быть использованы на практике повышает интерес и мотивацию студентов. Также большую роль играют примеры, иллюстрирующие области применения эконометрических методов. Можно найти много интересных работ, посвященных построению моделей в сфере финансов, образования, интернет-маркетинга, ценообразования и т.д. в таких журналах как Прикладная эконометрика, Прикладная информатика, Вопросы экономики и др. Кроме того, при решении практических задач с использованием реальных данных студенты получают навыки сбора информации и работы с такими интернет-источниками как, например, Финам (сайт, посвященный финансовым рынкам), сайт Федеральной службы государственной статистики и т.д.
Решение практических заданий наряду с изучением теоретического материала. Эффективным способом организации практических работ является совместный разбор решения задач в аудитории и выполнение самостоятельного проекта (возможно в группах), в котором студенты выполнят все этапы, начиная со сбора информации и заканчивая, например, составлением прогноза с помощью разработанной модели. Некоторые преподаватели при этом предоставляют свободу студентам в выборе объекта исследования и источников сбора информации.
Выполнение расчетов вручную для изучения методов и их взаимосвязи. Прежде чем использовать существующие прикладные программы: SPSS, STATISTICA и т.д. [2], работающие по принципу черного ящика, студенты должны выполнить расчеты вручную, разобраться как работает метод, каковы его особенности и ограничения. Впоследствии при выполнении исследовательских работ использование прикладных программ является обоснованным и позволяет сократить время и избежать вычислительных ошибок.
Критическое отношение к результатам моделирования. При выполнении практических заданий нужно оценить, насколько результаты моделирования являются адекватными и каким образом можно модель улучшить, и тем самым получить, например, наиболее точный прогноз. Бывают ситуации, когда студенту нужно сделать шаг назад и использовать другой метод или модель.
Использование графической информации для иллюстрации понятий и методов. Студенты намного лучше понимают математические методы, если сначала представить их графическую интерпретацию. Диаграммы позволяют компактно представить большой объем данных, обобщить и выявить закономерность, облегчить сравнение различных вариантов. Положительных примеров использования графиков в учебном процессе довольно много. Так, в статье [3] говорится о том, в ходе изучения курса статистики
Рис. 1. Построение линии регрессии путём изменения углового коэффициента
большинство студентов ошибочно считают, что в методе наименьших квадратов минимизируется сумма остатков, а не сумма квадратов ошибок. В связи с этим авторами был разработан интерактивный график в Excel, который наглядно показывает квадраты невязок. Файл доступен для скачивания на сайте Informs.
При создании графических иллюстраций экономических явлений нередко используется метод имитационного моделирования [4,5], который основан на воспроизводстве поведения изучаемого объекта с помощью программных алгоритмов с учётом влияния случайных факторов и позволяет получить ответ на вопрос «что будет, если?».
В работе [6] имитационное моделирование используется для ознакомления с функцией регрессии. Механизм её построения воспроизводится с помощью случайной генерации углового коэффициента. Также в работе рассматривается моделирование такого явления как мультиколлинеарность - наличие связи между объясняющими переменными модели. Некоторые из приведенных имитаций включает программа ActivStats. Также на сайте исследовательского центра статистики Левена [7] можно скачать Java-апплеты, которые моделируют построение регрессионной функции.
Данная работа посвящена изучению существующих и разработке новых интерактивных графических материалов для иллюстрации базовых понятий эконометрики. При разработке был использован метод имитационного моделирования, а также методы оптимизации. Реализация выполнена в пакете Excel, что обеспечивает ряд преимуществ по сравнению с созданием приложения на языке программирования. Среди них можно отметить широкую распространенность системы, её доступность, надежность, возможность просматривать и легко модифицировать используемые расчеты, наличие средств оптимизации и построения диаграмм разных типов. Excel является достаточно эффективным средством обучения эконометрике, позволяет как выполнять расчеты по заданным формулам, так
и использовать встроенные функции анализа. В работе [8] в качестве интерактивного инструмента обучения эконометрике рассматривается электронная рабочая тетрадь, включающая разработанные в Excel шаблоны с заданиями, исходными данными, описание алгоритмов решений. Опыт показывает, что студент гораздо лучше понимают метод, если наряду с лекционным материалом ему предоставить пример расчета в Excel, где представлены формулы расчета и отображаются зависимости между величинами (ячейками). По этой причине некоторые авторы Интернет-курсов по эконометрике и статистике выкладывают вместе с теоретическим материалом реализацию расчетов в Excel [9,10].
2. Парная регрессия. Метод наименьших квадратов
Для иллюстрации механизма построения парной линейной регрессии вида y = a + bx, графической интерпретации её параметров a и b, а также их определения методом наименьших квадратов реализованы два интерактивных графика (рис. 1, 2).
При представлении первого графика (рис. 1) перед аудиторией ставится задача оптимизации: проведение линии таким образом, чтобы она была максимально близка ко всем точкам. Устанавливается, что линия должна проходить через среднюю точку, однако этой информации недостаточно для построения
прямой, поэтому возникает задача определения её угла наклона. Характеристикой наклона является угловой коэффициент Ь, который показывает величину возрастания у при изменении х на единицу. С помощью элемента управления «Полоса прокрутки» изменяются значения коэффициента Ь и анализируется полученные положения линии. Коэффициент а уравнения регрессии показывает точку пересечения с осью У (иногда этот коэффициент называют У-пересечением) и вычисляется по формуле [11]:
а = у - х • Ь,
где у - среднее значение величины у;
у - среднее значение величины х.
Определяется критерий, с помощью которого можно сравнивать различные варианты положения линии - сумма квадратов отклонений точки от линии, которые называются ошибкой (регрессионным остатком, невязкой).
Здесь используется два вида графиков: точечный (для отображения исходных данных, линии регрессии) и гистограмма, которая выступает в роли индикатора.
Вторая диаграмма предназначена для иллюстрации нахождения параметров а и Ь методом наименьших квадратов (рис. 2), её описание приводится в публикации []. Данный вариант представления метода является наиболее наглядным, т.к. квадраты отклонений представлены
Рис. 2. Иллюстрация метода наименьших квадратов
Рис. 3. Связь индекса детерминации с расположением точек относительно
линии регрессии
на графике и изменяются в зависимости от значений параметров, устанавливаемых с помощью элементов управления.
С помощью аналогичных диаграмм также осуществляется графическое представление свойств дисперсии и математического ожидания.
3. Индекс детерминации
Для оценки качества регрессионной модели используется ряд показателей, основным из которых является индекс детерминации. Для парной регрессии индекс детерминации равен квадрату коэффициента корреляции. Максимальное значение этого показателя равно единице (когда существует функциональная связь между эндогенной и экзогенной величиной), и оно уменьшается по мере увеличения разброса исходных данных относительно регрессионной функции.
На рис. 3 приведен точечный график, показывающий связь индекса детерминации с расположением точек относительно линии регрессии.
Для отображения нового варианта с помощью элемента управления устанавливается значение индекса детерминации ^-квадрат) и после этого определяются соответствующие величины объясняющей и ре-
зультирующей переменной. Это осуществляется с помощью надстройки «Поиск решения»: расположение оптимизируемой функции - С13, изменяемые ячейки переменных -В3:С12, условие - С13=Е15.
В ячейке С13 рассчитывается значение индекса детерминации:
[С13] =
= КОРРЕЛ(В3:В12;С3:С12)Л2.
Можно увидеть, что при индексе детерминации, равном единице, все точки будут лежать на прямой, а при его уменьшении будет возрастать разброс значений относительно этой линии регрессии.
С помощью аналогичной техники осуществляется иллюстрация корреляции и мультиколлинеарности, т.е. связи между объясняющими переменными.
4. Прогнозирование
Прогнозирование с помощью модели осуществляется путем подстановки известного значения объясняющей переменной х в полученное уравнение регрессии и получения величины у.
На рис. 4а представлены значения цены акции (Сбербанк, 2014-2015 год) за 10 месяцев, а также полученное уравнение регрессии.
Студентам необходимо рассчитать, используя представленную функцию, прогнозные значения
а)
б)
Рис. 4. Прогнозирование цены акции: а) исходные данные; б) прогнозирование
цены акции на 5 месяцев вперед, а также предложить свой вариант прогноза. На листе последовательно заполняются значения ячеек С 16:С20 (рис. 4б), рассчитываются ошибки каждого прогноза и квадрат регрессионных остатков. После этого осуществляется сравнение полученных результатов.
Модельные значения цены акции рассчитываются по формуле (в ячейках M2, N2 рассчитаны значения параметров регрессии с помощью встроенных функций Excel Отрезок и Наклон):
[D16]=ЕСЛИ(ЕПУСТО(С 16);"" ;$M $2+$N$2*B16).
Реальная цена акции в последующие 5 месяцев хранится в скрытых для пользователя ячейках (О2:О6) и отображается после ввода вариантов прогноза:
[Е16]=ЕСЛИ(ЕПУСТО(С16);""; $02).
В следующих четырех столбцах рассчитываются невязки и сумма их квадратов:
[F16] = ЕСЛИ(ЕПУСТО(С 16);0;E16-C16)
[G16] = ЕСЛИ(ЕПУСТО(С16);0;Е16-D16)
[H22] = F16A2 + F17A2 + F18A2 + F19A2 + F20A2
[I22] = G16A 2 + G17A2 + G18A2 + G19A2 + G20A2.
5. Автокорреляция. Метод рядов
Во временных выборках часто встречается такое явление как автокорреляция, которое характеризуется наличием взаимосвязи между последовательными значениями регрессионных остатков. Например, формула расчета невязок при автокорреляции первого порядка будет иметь вид:
£ t = P^t-i + П
где р - коэффициент автокорреляции; П - случайная величина.
При коэффициенте автокорреляции меньшем нуля наблюдается отрицательная автокорреляция, характеризующаяся тем, что значения остатков располагаются на графике по принципу маятника: положительные значения сменяют отрицательные и наоборот. Если ко-
эффициент автокорреляции больше нуля, то наблюдается положительная автокорреляция, когда чередуются зоны положительных и отрицательных остатков.
Моделирование данного явления осуществляется с помощью изменения коэффициента автокорреляции и среднего квадратического отклонения случайной величины п (рис. 5а). Расчет остатков в соответствии с заданными параметрами осуществляется следующим образом.
В ячейках С3:С14 хранятся исходные значения цены акции, параметры уравнения регрессии рассчитаны в ячейках В17, С17. В столбцах Е3 и F3 осуществляется расчет оценок и ошибок:
[Е3] = $В$17+$С$17*В3 [Т3] = С3-Е3.
В следующем столбце генерируется случайное число п с нормальным законом распределения (математическое ожидание данной величины равно нулю, а значение среднего квадратического отклонения устанавливается с помощью элемента управления и хранится в ячейке С32, рис. 5а): ^3] = ((СЛЧИС() + СЛЧИС() + СЛЧИС() + СЛЧИС() + СЛЧИС() + СЛЧИС() + СЛЧИС() + СЛЧИС() + СЛЧИС() + СЛЧИС()+ СЛЧИС() + СЛЧИС())-6)*$С$32.
Далее рассчитывается новое значение ошибки с учетом полученного значения случайной величины п и коэффициента автокорреляции:
[Н3] = F3
[H4]=H3*$B$32+G4, и т.д.
Значения, полученные в столбце Н, используются для построения графика остатков (рис. 5а).
Новое значение цены акции вычисляется по формуле:
^3] = $В$17+$С$17*В3+Н3.
Одним из способов обнаружения автокорреляции является метод рядов, основанный на анализе знаков регрессионных остатков. Его реализация осуществляется следующим образом (рис. 5б).
Определяются знаки невязок и устанавливается флаг изменения (1-изменение знака произошло, 0 -знак остался неизменным):
^3] = ЕСЛИ(Н4<=0;0;1) [М4] = ЕСЛИЪ4^3;0;1).
Рассчитываются показатели: общее число наблюдений, количество знаков «+», количество знаков «-»:
[03] = СЧЁТ(М3:М14) [Р3] = СЧЁТЕСЛИ(L3:L14;1) [Q3] = СЧЁТЕСЛИЪ3±14;0).
Определяется количество рядов -непрерывных последовательностей одинаковых знаков:
[R3] = СЧЁТЕСЛИ(М3:М14;1).
Величины к1 и к2 определяются с помощью таблиц Эйзенхарта как пересечение значений п1 и п2:
[S3]=ИНДЕКС('k1 '!А2:Т21;Лист12 !06+1;Лист12!05+1) [Т3]=ИНДЕКС('к2'!А2:Т19;Лист12 !07+1;Лист12!08+1)
[05] = ПОИСКПОЗ (Р3; 'к1 '! А3:А21;1)
[06]=ПОИСКПОЗ(Q3;'k1'!B2:T2;1)
[07]=ПОИСКПОЗ(Р3 ;'к2'!А3:А19;1)
[08]=ПОИСКПОЗ(Q3;'k2'!B2:T2;1)
Рис. 5. Моделироване автокорреляции: а) влияние параметров на расположение регрессионных остатков; б) метод рядов
Рис. 6. Иллюстрация теста Дарбина-Уотсона
Наконец, осуществляется проверка на автокорреляцию:
R6 = ЕСЛИ(R3<=S3;"положительная" ;ЕСЛИ^3>=Т3;"отрицательная"; "отсутствует"))
Диаграмма на рис. 5б показывает изменение знаков остатков: один цвет обозначает знак плюс, другой - минус. С её помощью можно увидеть, что при отрицательной автокорреляции происходит частая смена цвета, а при положительной наблюдаются непрерывные последовательности одного цвета. Построение графика для 12 наблюдений осуществляется следующим образом. В столбец W занесены цифры от 1 до 12, причем каждая цифра встречается 2 раза: W3 = 1, W4 = 1, W5 = 2^6 = 2, ..., W26 = 12. В столбце Y также строится последовательность из 24 элементов, каждая первая цифра переносится из W, а вторая определяется в зависимости от того, произошло ли изменение знака ошибки:
^4]=ЕСЛИ^4=Ь3^4;0) ^6]=ЕСЛИ^5=Ь4^6;0), и т.д.
В следующем столбце вся последовательность упорядочивается по возрастанию:
[23]=НАИМЕНЬШИЙ^$3Ж26;1)
[24]= НАИМЕНЬШИЙ^$3^$26;2), и т.д.
Далее по данным столбца 2 строится линейчатая диаграмма с расположением рядов в строках, и для одного из рядов устанавливается значение перекрытия, равное 100%. В списке ряды упорядочиваются по убыванию и выбирается 2 цвета, которые и используются для поочередного закрашивания.
Обнаружение автокорреляции также может быть выполнено с помощью метода Дарбина-Уотсона, его графическая иллюстрация представлена на рис. 6. Чтобы сделать вывод о её наличии или отсутствии необходимо определить, в какой интервал попадает значение статистики Дар-бина-Уотсона (величина отмечается вертикальной линией и изменяется в зависимости от исходных значений).
6. Гетероскедастичность
Гетероскедастичность характеризуется изменением дисперсии регрессионных остатков от наблюдения к наблюдению, например, её ростом по мере увеличения объясняющей переменной х. Так, анализируя зависимость стоимости квартиры (в тыс. руб.) от количества комнат (1, 2 или 3) можно обнаружить, что с увеличением числа комнат разброс цен возрастает (рис. 7а).
Моделирование данного явления осуществляется с помощью изменения величины среднего квадрати-ческого отклонения регрессионных остатков для каждого значения объясняющей переменной (рис. 7б).
На листе выполняются следующие расчеты.
Вычисляется оценка результирующей величины и ошибка:
[03]=ПРЕДСКАЗ(В3;$С$3:$С$14;$ В$3:$В$14)
[Е3]=С3-03.
Определяются случайные величины регрессионных остатков s с нормальным законом распределения и средним квадратическим отклонением, устанавливаемым с помощью полосы прокрутки:
^3]=ЕСЛИ(В3 = 1;((СЛЧИС()+С ЛЧИС()+СЛЧИС()+СЛЧИС()+С
лчис()+слчис()+слчис()+с лчис()+слчис()+слчис()+с
ЛЧИС()+СЛЧИС())-6)*$Е$30;ЕС ЛИ(В3=2;((СЛЧИС()+СЛЧИС()-+СЛЧИС()+СЛЧИС()+СЛЧИС()+СЛ ЧИС()+СЛЧИС()+СЛЧИС()+СЛЧИ
со+слчисо+слчисО+слчисО)-
6)*$F$30;((СЛЧИС()+СЛЧИС()+С ЛЧИС()+СЛЧИС()+СЛЧИС()+СЛЧ ИС()+СЛЧИС()+СЛЧИС()+СЛЧИС ()+СЛЧИС()+СЛЧИС()+СЛЧИС())-6)*$G$30)).
Рассчитываются новые значения величины y с учетом определённых невязок (рис. 7в).
Заключение
В статье представлены разработанные интерактивные графические средства для иллюстрации базовых понятий эконометрики: парная линейная регрессия, метод наименьших квадратов, индекс детерминации, гетероскедастичность, автокорреляция, метод рядов и т.д. Реализация выполнена в Excel без написания программного кода на языке программирования. При разработке были использованы различные виды диаграмм, надстройка «Поиск решения». Для иллюстрации таких явлений как автокорреляция и гете-роскедастичность используется метод имитационного моделирования, значения остатков и результирующей переменной определяются с помощью генерации случайных чисел. Представленные модели могут быть
а) б) в)
Рис. 7. Модель с гетероскедастичными регрессионными остатками: а) исходные данные; б) график ошибок; в) график цены
использованы для обучения основам эконометрики в качестве демонстрационного материала при чтении лекций, а также в самостоятельной работе студентов.
Литература
1. Loomis D.G., Cox J.E. Principles for teaching economic forecasting // International Review of Economic education. - 2003. - Vol. 2, № 1. -P. 69-79.
2. Гафарова Е.А. Применение прикладных программ при обучении экономическим дисциплинам // Современные проблемы науки и образования. - 2014. - № 6.
3. Erkut E. Ingolfsson A. Let's put the squares in Least-Squares // INFORMS Transactions on Education. - 2000. -Vol. 1, № 1. - P. 47-50.
4. Емельянов А.А., Власова Е.А., Дума Р.В. Имитационное моделирование экономических процессов. - М.: Финансы и статистика, 2009. - 416 с.
5. Brooks C. Introductory Econometrics for Finance. - Cambridge university press, 2008. - 648 c.
6. Walker J.H. Teaching regression with simulation // Proc. of the 2004 Winter Simulation Conference. - Washington, 2004. -P. 2096-2102.
7. http://lstat.kuleuven.be/ newjava/vestac/ (дата обращения: 23.01.2016).
8. Игнаткина Л.А., Репина Е.Г. Электронная рабочая тетрадь как интерактивное дидактическое средство обучения эконометрике // Фундаментальные исследования. - 2014. - Т. 3, № 3. - С.590-595.
9. http://www. real-statistics. com/ (дата обращения: 23.01.2016).
10. http://www3.wabash.edu/ (дата обращения: 23.01.2016).
11. Айвазян С.А., Мхитарян В.С. Прикладная статистика и основы эконометрики: Учебник для вузов. -М.: ЮНИТИ, 1998. - 1005 с.