Научная статья на тему 'К вопросу корреляционно-регрессионного анализа взаимосвязи факторов объектов недвижимости (на примере вторичного рынка жилья)'

К вопросу корреляционно-регрессионного анализа взаимосвязи факторов объектов недвижимости (на примере вторичного рынка жилья) Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
329
33
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
КОРРЕЛЯЦИОННО-РЕГРЕССИОННЫЙ АНАЛИЗ / CORRELATION-REGRESSION ANALYSIS / РЕЗУЛЬТАТИВНЫЙ ПРИЗНАК / FACTOR SIGN / ФАКТОРНЫЙ ПРИЗНАК / АНАЛИТИЧЕСКАЯ ГРУППИРОВКА / ANALYTICAL GROUP / КОРРЕЛЯЦИЯ / CORRELATION / РЕГРЕССИОННЫЕ ОСТАТКИ / REGRESSION BALANCES / PRODUCTIVE

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Иконников О. А.

Рассматриваются вопросы моделирования взаимосвязей внутренних факторов объектов недвижимости с результирующим фактором на основе корреляционно-регрессионного анализа (на примере вторичного рынка жилья).

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Иконников О. А.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

ON CORRELATION-REGRESSION ANALYSIS OF REAL ESTATE OBJECTS FACTORS INTERCONNECTION (in example of secondary housing market)

The problems of modeling of real estate objects factors interconnection with resultant factor on the base of correlation-regression analysis are considered (in example of secondary housing market).

Текст научной работы на тему «К вопросу корреляционно-регрессионного анализа взаимосвязи факторов объектов недвижимости (на примере вторичного рынка жилья)»

References

1. Brown W. F. Micromagnetics. New York : Wiley, 1963. 143 p.

2. Aharoni A. Micromagnetics: past, present and future // Physica B, 2001, vol. 306, pp. 1-9.

3. Chechenin N. G. Magnitnye nanostruktury i ih primenenie (Magnetic nanostructures and their application). Moscow, Knizhnyj dom Universitet, 2008, 166 p.

4. Izotov A. V., Beljaev B. A., Valihanov M. M., Polenga S. V., Stefanjuk A. V. Vychislitel'nye metody i programmirovanie. 2012, vol. 13, no. 1, pp. 551-558.

© Изотов А. В., Беляев Б. А., Валиханов М. М., Боев Н. М., Поленга С. В., 2013

УДК 51-77

К ВОПРОСУ КОРРЕЛЯЦИОННО-РЕГРЕССИОННОГО АНАЛИЗА ВЗАИМОСВЯЗИ ФАКТОРОВ ОБЪЕКТОВ НЕДВИЖИМОСТИ (НА ПРИМЕРЕ ВТОРИЧНОГО РЫНКА ЖИЛЬЯ)

О. А. Иконников

Сибирский государственный аэрокосмический университет имени академика М. Ф. Решетнева Россия, 660014, г. Красноярск, просп. им. газ. «Красноярский рабочий», 31

E-mail: [email protected]

Рассматриваются вопросы моделирования взаимосвязей внутренних факторов объектов недвижимости с результирующим фактором на основе корреляционно-регрессионного анализа (на примере вторичного рынка жилья).

Ключевые слова: корреляционно-регрессионный анализ, результативный признак, факторный признак, аналитическая группировка, корреляция, регрессионные остатки.

ON CORRELATION-REGRESSION ANALYSIS OF REAL ESTATE OBJECTS FACTORS INTERCONNECTION (IN EXAMPLE OF SECONDARY HOUSING MARKET)

O. A. Ikonnikov

Siberian State Aerospace University named after academician M. F. Reshetnev 31, "Krasnoyarsky Rabochy" Av., Krasnoyarsk, 660014, Russia. E-mail: [email protected]

The problems of modeling of real estate objects factors interconnection with resultant factor on the base of correlation-regression analysis are considered (in example of secondary housing market).

Keywords: correlation-regression analysis, a productive, factor sign, analytical group, correlation, regression balances.

Обработка статистических данных уже давно применяется в самых разнообразных видах человеческой деятельности. Но, пожалуй, ни в одной области знаний и практической деятельности обработка статистических данных не играет такой исключительно большой роли, как в экономике, имеющей дело с обработкой и анализом огромных массивов информации о социально-экономических явлениях и процессах. Всесторонний и глубокий анализ этой информации, так называемых статистических данных, предполагает использование различных специальных методов, важное место среди которых занимает корреляционный и регрессионный анализы обработки статистических данных.

Имеются выборочные данные о ценах на рынке жилья (тыс. руб. за квартиру) и площади квартиры (м2) по 70 объявлениям о продаже в г. Красноярске (2012 г.): результативный признак - цена квартиры (У); факторный признак - площадь квартиры (Х). Построим стати-

стический ряд квартир по признаку площади. Далее проводим ранжирование исходных данных. Находим размах R = Xmax - Xmin = 213 м2. Находим число групп по формуле Стержеса: n = 7 групп. Находим размах увеличивающегося интервала I = R/n = 30,43 м2. Строим интервальный ряд распределения квартир, выбирая совокупности по площади (табл. 1).

Вывод: ряд распределения показывает, что наибольшее количество квартир на вторичном рынке жилья в выборочной совокупности устанавливает цену от 42,43 до 72,86 м2.

Для характеристики средней величины определим середины интервалов и численность накопленных частот. Для этого построим расчетную табл. 2.

Теперь находим среднее арифметическое:

X" = (27,21-23 + 57,64-30 + 88,07-13 + 118,5-2 + + 148,94-1 + 178,37-0 + 209,79-1)/ 70 = 58,51.

Вывод: в среднем площадь одной квартиры составляет 58,51 м2.

Решетневскуе чтения. 2013

Таблица 1

№ группы Группы по площади Число квартир в группе

1 12 - 42,43 23

2 42,43 - 72,86 30

3 72,86 - 103,29 13

4 103,29 - 133,72 2

5 133,72 - 164,15 1

6 164,15 - 194,58 0

7 194,58 - 225 1

Таблица 2

№ группы Группы по цене Число организаций Середина интервала Б накопленных частот

1 12 - 42,43 23 27,21 23

2 42,43 - 72,86 30 57,64 53

3 72,86 - 103,29 13 88,07 66

4 103,29 - 133,72 2 118,5 68

5 133,72 - 164,15 1 148,94 69

6 164,15 - 194,58 0 179,37 69

7 194,58 - 225 1 209,79 70

Найдем среднее квадратическое отклонение: с = ± V X (X, -Х")2 / X/ = ± 32,11 м2.

Вывод: площадь квартир отклоняется в среднем от среднего значения на ± 32,11 м2.

Коэффициент вариации V = (с/Х )• 100 % = (32,11/58,51)^100 = 54,88 %.

Вывод: совокупность количественно неоднородна, так как коэффициент вариации превышает 33 %.

Мода, равная 67,1, показывает, что наиболее часто в выборочной совокупности площадь квартиры составляет 67,1 м2.

Найденная медиана показывает, что одна половина квартир имеет площадь менее 49,32 м2, а другая более 49,32 м2.

Проверим первичную информацию на нормальность распределения с помощью правила «трех сигм». Интервалы для значений признака-фактора: (х_±с); (х""±2с); (х_±3с), т. е. (58,51-32,11) - (58,51+32,11); (58,51-64,22) - (58,51+64,22); (58,51-96,33) -(58,51+96,33).

После проведения расчетов выяснилось, что первичная информация по признаку-фактору не подчиняется закону нормального распределения, однако это еще не является основанием для отказа использования корреляционно-регрессионного анализа.

Далее исключим из первичной информации резко выделяющиеся единицы, которые по признаку-фактору не попадают в интервал х_-3с < хг < х_+ 3 с. Резко выделяющейся (аномальной) единицей в выборке является х = 225. Удаляем эту единицу и формируем новый массив. Далее снова проверяем выборку на однородность. Среднее арифметическое: X = 55,93. Среднее квадратическое отклонение: с = 25,64. Коэффициент вариации V = 45,84 %. Коэффициент вариации уменьшился с 54,88 до 45,84 %, однако он все же превышает 33 %, что говорит о неоднородности выборки. Далее проверяем выборку на нормальность с помощью правила «трех сигм» [1]. Интервалы для значений признака-фактора:

(55,93-25,64) - (55,93+25,64); (55,93-51,28) -(55,93+51,28); (55,93-76,92) - (55,93+76,92). Первичная информация по признаку-фактору не подчиняется закону нормального распределения, однако это не является основанием для отказа использования корре-ляционно-рег-рессионного анализа [2]. После расчетов выяснилось, что первичная информация по признаку-фактору подчиняется закону нормального распределения. Резко выделяющихся единиц в выборке сейчас нет.

Для установления факта наличия связи производится аналитическая группировка по признаку-фактору. Она выполняется при равных интервалах в 7 группах. Интервал определяется по формуле г = (Хтах -Xтт)/п, где п - число групп. Отсюда г = (115-12)/7 = 14,71 ~ 15м2.

Рис. 1. Зависимость цены от площади

Построенная аналитическая группировка показывает, что с увеличением группировочного признака также увеличивается и среднее значение цены (результативного признака). На рис. 1 представлен график связи. Эмпирическая линия связи приближается к прямой линии. Следовательно, можно считать наличие прямолинейной корреляции. Для измерения степени тесноты связи используется линейный коэффициент корреляции.

8000

6000

У

4000

2000

50

150

I

D Столбец C Линейная регрессия доя Столбец C

О I-il-il-il-1 I-1 I-1 о

19,36 34,07 48,79 63,5 78,21 92,93 107,64 1697

2389 3080 3771

4463 5154

Рис. 2. Линия регрессии

Рис. 3. Гистограмма площади

Рис. 4. Гистограмма цены

Коэффициент корреляции равен 0,83, что свидетельствует о наличии прямой и тесной связи. Средняя квадратическая ошибка коэффициента корреляции:

or = (1 - r2) / V(n - 1) = (1 - 0,832)/V(68 - 1) = = 0,04 | r |/or = 0,83/0,04 = 20,75.

По справочной таблице [2] определяется t - критерий Стьюдента при Р = 0,95 и k = 68-2; ^абл = 1,96 (| r |/or) > ^абл (20,75 > 1,96). Следовательно, можно утверждать существенность коэффициента корреляции. Далее определяем модель связи. График линии средних показывает наличие линейной связи, поэтому используем функцию у = a + bx. Используя метод наименьших квадратов, получаем следующую модель: у = 494,08 + 37,63x (рис. 2). Построим гистограмму частот распределения площади (рис. 3) и цены (рис. 4).

Проведенный корреляционный анализ показал, что зависимость между площадью и ценой квартир существенна. Следовательно, использование линейного коэффициента корреляции оправдано. Анализ регрессионных остатков показал следующее: а) сумма остатков (y-y) равна (-1,54), т. е. близка к нулю относи-

тельно значений выборки; б) эти остатки носят практически случайный характер и не имеют явно выраженного тренда. Эти два результата говорят в пользу построенной модели. В дальнейшем планируется провести регрессионный анализ более объемной выборки с применением как линейных, так и нелинейных моделей.

Библиографические ссылки

1. Елисеева И. И. Общая теория статистики : учебник. М. : Финансы и статистика, 2004. 656 с.

2. Ефимова М. Р. Практикум по общей теории статистики : учеб. пособие. М. : Финансы и статистика, 2000. 280 с.

References

1. Eliseeva I. I. Obshhaja teorija statistiki : Uchebnik. Moskva : Finansy i statistika, 2004. 656 s.

2. Efimova M. R. Praktikum po obshhej teorii statistiki: Ucheb. posobie. Moskva : Finansy i statistika, 2000. 280 s.

© Иконников О. А., 2013

25

20

15

10

100

УДК 519.6

О ПРИМЕНЕНИИ МЕТОДА ГЕНЕТИЧЕСКОГО ПРОГРАММИРОВАНИЯ ДЛЯ РЕШЕНИЯ ЗАДАЧ СИМВОЛЬНОЙ РЕГРЕССИИ

Ю. А. Камшилова

Сибирский государственный аэрокосмический университет имени академика М. Ф. Решетнева Россия, 660014, г. Красноярск, просп. им. газ. «Красноярский рабочий», 31 E-mail: [email protected]

Рассматривается схема алгоритма метода генетического программирования для решения задач аппроксимации и символьной регрессии.

Ключевые слова: генетическое программирование, символьная регрессия.

i Надоели баннеры? Вы всегда можете отключить рекламу.