Научная статья на тему 'Предварительная математическая обработка данных в задачах обоснования решений о состоянии социально-экономических систем'

Предварительная математическая обработка данных в задачах обоснования решений о состоянии социально-экономических систем Текст научной статьи по специальности «Экономика и бизнес»

CC BY
53
14
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ДИНАМИЧЕСКИЕ РЯДЫ / НЕОДНОРОДНЫЕ ДАННЫЕ / КОИНТЕГРАЛЬНАЯ РЕГРЕССИЯ / КОРРЕЛЯЦИЯ / ЛИНЕЙНОЕ РАССТОЯНИЕ / МНОГОМЕРНОЕ СРЕДНЕЕ ЗНАЧЕНИЕ / ЕВКЛИДОВО РАССТОЯНИЕ / TIME SERIES / HETEROGENEOUS DATA / COINTEGRAL REGRESSION / CORRELATION / LINEAR DISTANCE / MULTIDIMENSIONAL AVERAGE / EUCLIDEAN DISTANCE

Аннотация научной статьи по экономике и бизнесу, автор научной работы — Шаныгин Сергей Иванович

Рассмотрены подходы к обработке данных о социально-экономических системах, представленных в виде динамических рядов. Предложены теоретические положения по исследованию корреляции между ними на основе разделения общей тенденции и колеблемости. Рассмотрены приемы анализа информации о многомерных элементах наблюдения, являющихся составляющими указанных систем. Предложены технологии анализа комплексной вариации их параметров как неделимых по факторному признаку объектов.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

PRELIMINARY MATHEMATICAL DATA PROCESSING IN PROBLEMS OF DECISIONS JUSTIFICATION ON THE SOCIO-ECONOMIC SYSTEM'S STATE

The approaches to the processing of data on socio-economic systems presented in the form of time series are considered. Theoretical propositions are proposed for studying the correlation between them based on the separation of the general tendency and oscillation. The methods of analysis of information on multidimensional elements of observation that are components of these systems are considered. Technologies are proposed for analyzing the complex variation of their parameters as indivisible objects by factor characteristics.

Текст научной работы на тему «Предварительная математическая обработка данных в задачах обоснования решений о состоянии социально-экономических систем»

Шаныгин С.И.

ПРЕДВАРИТЕЛЬНАЯ МАТЕМАТИЧЕСКАЯ ОБРАБОТКА ДАННЫХ В ЗАДАЧАХ ОБОСНОВАНИЯ РЕШЕНИЙ О СОСТОЯНИИ СОЦИАЛЬНО-ЭКОНОМИЧЕСКИХ СИСТЕМ

Аннотация. Рассмотрены подходы к обработке данных о социально-экономических системах, представленных в виде динамических рядов. Предложены теоретические положения по исследованию корреляции между ними на основе разделения общей тенденции и колеблемости. Рассмотрены приемы анализа информации о многомерных элементах наблюдения, являющихся составляющими указанных систем. Предложены технологии анализа комплексной вариации их параметров как неделимых по факторному признаку объектов.

Ключевые слова. Динамические ряды, неоднородные данные, коинтегральная регрессия, корреляция, линейное расстояние, многомерное среднее значение, Евклидово расстояние.

Shanygin S.I.

PRELIMINARY MATHEMATICAL DATA PROCESSING IN PROBLEMS OF DECISIONS JUSTIFICATION ON THE SOCIO-ECONOMIC SYSTEM'S STATE

Abstract. The approaches to the processing of data on socio-economic systems presented in the form of time series are considered. Theoretical propositions are proposed for studying the correlation between them based on the separation of the general tendency and oscillation. The methods of analysis of information on multidimensional elements of observation that are components of these systems are considered. Technologies are proposed for analyzing the complex variation of their parameters as indivisible objects by factor characteristics.

Keywords. Time series, heterogeneous data, cointegral regression, correlation, linear distance, multidimensional average, Euclidean distance.

Введение и актуальность исследования

Применение математических методов и информационных технологий для анализа социально-экономических систем является необходимой составляющей многих исследований. Однако в таких системах объекты наблюдения с позиции статистики обычно оказываются неоднородными, по этой причине не все математические способы их обработки применимы в полной мере. Кроме того, указанные объекты являются почти всегда существенно многофакторными, и традиционно принято по-отдельности анализировать каждый из них (по показателям), а затем экспертным путем сводить вместе и интерпретировать. Такой подход, с одной стороны, огрубляет анализ, т.к. все факторы в реальных системах взаимосвязаны. С другой стороны, когда даже немного похожие объекты наблюдения разделяются на «почти независимые» с позиции процесса исследования факторы, неоднородность объектов фактически еще более усиливается. В итоге его результаты часто становятся поверхностны-

ГРНТИ 06.39.31 © Шаныгин С.И., 2019

Сергей Иванович Шаныгин - кандидат экономических наук, доцент, доцент кафедры статистики, учета и аудита Санкт-Петербургского государственного университета.

Контактные данные для связи с автором: 199034, Санкт-Петербург, Университетская наб., 7-9 (Russia, St. Petersburg, Universitetskaya emb., 7-9). Тел.: +7 (812) 363-67-68. Е-mail: s.shanygin@spbu.ru. Статья поступила в редакцию 21.09.2019.

ми и условно пригодными для полноценного прогнозирования развития рассматриваемых систем. Количество доступной эксперту информации в настоящее время обычно очень большое, естественной является автоматизация первичных этапов исследований и применение при этом статистических методов. Соответственно формализованные методы востребованы в этой области, и остро стоит проблема обеспечения корректности их применения в сочетании со снижением потерь информации при обработке и обобщении.

В России и в мире опубликовано большое количество научных трудов, посвященных проблемам применения формализованных методов в социально-экономических исследованиях. В частности, в статьях Ю.К. Бгане, А.В. Болика, Н.А. Тупихи, Л.В. Хараджяна, З.В. Хетагуровой, Н.Б. Читанава [3, 4] анализируются неоднородные экономические системы. Выделены их роль и место как категории систем, описаны отдельные свойства, сделаны предположения об особенностях эволюции. Выявлено, что в таких системах, помимо неоднородности структурных частей, наблюдается еще и неоднородность целей их деятельности, что обычно затрудняет управление. Проанализировано социально-экономическое устройство России, отмечена неоднородность ее как системы, что является признаком скрытого кризисного состояния. Обоснована целесообразность перехода к устойчивому экономическому развитию с одновременным снижением административной составляющей в управлении.

Работа Г.А. Щербакова [23] посвящена исследованию проявлений экономических законов в околокризисные периоды применительно к странам и к мировой экономике. Выделены существенные отличия последствий разных кризисов, сделано предположение, что эти различия обусловлены влиянием неоднородных экономических процессов. Для анализа сущности происходящих событий рекомендовано использовать теоретические положения, основные идеи которых были предложены Н.Д. Кондратьевым.

В статьях В.В. Бузырева, Л.А. Головановой, В.Г. Полякова [5, 7] выполнен сопоставительный анализ методов оценивания привлекательности регионов для инвестиций, выявлена недостаточная при практическом применении их универсальность. Отмечено, что исходные данные для большинства подобных расчетов являются неоднородными по структуре и размерности, что еще более огрубляет результаты исследований. Рассмотрены проблемы учета и анализа потенциала энергосбережения отрасли и/или региона, проанализированы основные методы его оценивания. Предложен подход к комплексному анализу и прогнозированию этого потенциала, отмечена неоднородность регионов в плане условий использования энергетических ресурсов. Рекомендовано учитывать факторные особенности реализации этого потенциала региона при экономическом планировании.

В работе А.А. Ермоленко [10] анализируются подходы к исследованию национальных хозяйственных систем на основе теории интегрированных субъектов. Сделана попытка оценить фактический потенциал современной российской экономики с этих позиций. Рекомендовано использование для подобного анализа положений системного подхода, экономической теории, концепции неоднородных экономических систем.

В публикациях Р. Досмуханбетовой, М. Ежебекова, А. Настанского, Х.Г. Штрова [8, 15] рассмотрены подходы к составлению эконометрических моделей коинтегральной регрессии применительно к макроэкономическим показателям Казахстана, выполнена проверка их адекватности. Исследовано влияние объема запасов и качества природных ресурсов Казахстана и мировых цен на нефть на экономику страны. Проанализированы экономические механизмы влияния цен на недвижимость и стоимостей акций на уровни инвестиционной активности и потребления. Для исследования подобных систем предложены коинтеграционные соотношения в рамках моделей коррекции ошибок. Отмечено возрастание заинтересованности в изменениях цен активов, в т.ч. у центробанков.

В работе Е.Д. Копновой, Л.А. Родионовой [13] приведены результаты исследования параметров продовольственной безопасности ряда государств Африки. Предложены подходы по дополнению традиционно используемых в этой предметной области методов описательной статистики коинтегра-ционным анализом. Проведены соответствующие практические расчеты взаимовлияния параметров, выполнена их интерпретация.

В работах Р.Ю. Архипова, К.А. Ивановой, П.К. Катышева, И.Л. Савостьяновой [2, 12] выполнен коинтеграционный анализ влияния объема производства электроэнергии на значения отдельных макропоказателей России. На рассмотренном интервале времени (до 2015 г.) выявлено наличие структурного сдвига и изменения коинтеграционного соотношения. Подтверждено наличие коинтеграции вре-

менных рядов ВВП, расходов госбюджета, объема денежной массы РФ, валютного курса и объема производства электроэнергии. Выполнено оценивание коинтеграционного соотношения валютного курса рубля и цен на нефть. Выявлено наличие такой коинтеграции, установлена стационарность остатков регрессии.

В статье Ал.Ю. Рогачева, Ан.Ю. Рогачева [18] применительно к финансовому рынку рассмотрен способ анализа нестационарных рядов. На основе метода С. Йохансена предложены подходы к определению коинтеграционного пространства и составлению функциональной зависимости. Подчеркнуто, что такой способ является более результативным по сравнению с известными методами Г. Бокса -Дж. Дженкинса и Р. Энгла - К. Грейнджера.

В публикациях Д.А. Кирюхина, В.В. Стрижова, А.В. Субботенко, Г.Д. Петрухина [19, 20] представлены подходы к осуществлению многоклассового распознавания объектов. Предложено применение для этих целей ковариационной матрицы, рекомендованы приемы определения весовых коэффициентов классификаторов. Представлены способы выделения факторов и выбора объектов при восстановлении регрессионной модели. Метод базируется на составлении и анализе ковариационной матрицы параметров модели с последующим распределением объектов наблюдения по подмножествам.

В статьях А.А. Зайцева, Ю.Д. Царикаева [11, 22] проанализирована устойчивость оценок ковариационной матрицы характеристик моделей регрессии, оценено влияние качества признаков на эти оценки. Проведены эмпирическое исследование и моделирование, рассмотрены подходы к формированию расширенного вектора характеристик модели. Предложено использование ковариационного анализа для исследования проблем обеспечения безопасности людей, позволяющего сопоставлять пространственные данные, а также временные ряды. Показано применение таких подходов в региональном и глобальном разрезах.

Таким образом, можно констатировать, что несмотря на большое количество проведенных исследований, многие проблемы анализа сложных социально-экономических систем с помощью формализованных методов пока в значительной мере остаются нерешенными. Соответственно тематика подобных исследований представляется актуальной. Рассмотрим далее отдельные подходы к статистическому анализу данных о таких системах. Для удобства и универсальности использования сформулируем их в виде обобщенных технологий. Оценивание взаимосвязи между динамическими рядами данных

Общеизвестный коэффициент парной линейной корреляции К. Пирсона полноценно применим для пространственных (одномоментных) данных наблюдений при условии, что они однородны, распределены по нормальному закону и др. [9, 17, 21]. Причем этот коэффициент корреляции характеризует силу линейной зависимости между значениями показателей, самого «жесткого» вида статистической связи. Наиболее распространенная его формула для парной связи имеет вид:

N

£(х - х)( у, - у)

г =

,=1

N N

,=1 ,=1

(1)

;(х - х )2 £ (у, - у )2

где х и у - независимый и результативный показатели соответственно; N - количество наблюдений.

Однако в социальной и/или экономической сферах подавляющее большинство исходных данных представляют собой временные ряды отчетных показателей компаний или официальной информации стран. Названные выше требования к данным в этой сфере практически никогда не выполняются:

- значения показателей фактически представляют собой характеристики уникальных экономических объектов, поэтому их совокупности часто неоднородны; количество же данных - обычно небольшое;

- соответствующие частотные распределения во многих случаях хотя и имеют «нормалеобразный» вид, но почти всегда с ненулевыми значениями коэффициентов асимметрии и эксцесса; иногда данные представляют собой «ТОР-50 (или 100, ...)» объектов наблюдения, тогда эмпирическим распределением является только часть «нормалеобразного» закона (чаще всего правая);

- средние значения показателей меняются со временем, причем часто - в рамках вполне описываемой тенденции, поэтому общие закономерности для каждого из них выражаются не через общепринятое среднее значение, а через теоретическое (по уравнению) значение временного тренда в каждый 7-й период (момент времени) наблюдения;

- внешние условия деятельности исследуемой системы меняются со временем, и эти изменения могут оказывать влияние на взаимосвязь показателей.

При наличии идеальной линейной причинно-следственной зависимости между двумя показателями указанный выше коэффициент корреляции (1) может применяться и для данных, представленных в виде временных рядов, но при обязательной интерпретации высококвалифицированным экспертом (т. к. многие временные ряды исходных данных в социально-экономической области не являются стационарными). При нелинейной зависимости целесообразность его применения несколько условна в связи с тем, что он будет характеризовать только долю линейной составляющей в фактической взаимозависимости. И если высокие значения этого коэффициента будут позволять делать предположения о наличии взаимовлияния показателей, то низкие - только об отсутствии линейной компоненты, но ничего - о нелинейной.

На практике в социально-экономической сфере линейные зависимости крайне редки. Для оценивания корреляции между такими показателями возможен примерно следующий подход. При классическом статистическом анализе динамики показателя традиционно принято выделять два этапа: определение общей тенденции в изменении его значений и оценивание колеблемости относительно нее. При исследовании взаимовлияния двух показателей можно поступить аналогично. Сначала для каждого из них выявить общую тенденцию изменения во времени и построить уравнение динамического тренда. При этом тренд может оказаться и нелинейным. Затем необходимо выделить колеблемость значений каждого показателя относительно его тренда и, если возможно, формализованно описать ее.

Далее оценить корреляционную связь показателей - отдельно между их трендами и отдельно между колеблемостями относительно них. Для этого могут быть применены две основные технологии (см. ниже «Технологии 1 и 2»). Рассмотрим такой двухэтапный анализ на примере исследования парной корреляции показателей, каждый из которых исходно представлен в виде временного ряда наблюдений за одни и те же периоды (моменты) времени.

Технология 1

Применим общепринятый подход с использованием коэффициента парной линейной корреляции К. Пирсона (1). На первом этапе для выявления возможной корреляции между временными трендами процедура исследования может быть следующей:

- по-отдельности составляются уравнения временных трендов двух показателей, проверяется их значимость; по уравнениям составляются теоретические динамические ряды обоих показателей и соотносятся между собой по периодам (моментам времени) наблюдения;

- вычисляется оценка среднего по времени уровня ряда как среднее значение теоретических (по уравнению тренда) значений во все периоды (моменты времени) наблюдения;

- определяется теснота статистической связи между трендами показателей по формуле К. Пирсона; при этом в качестве среднего значения каждого показателя используются рассчитанные оценки средних по времени теоретических уровней (по тренду) каждого ряда:

N

2 " ~сред )(~7 " ~ сред )

Г = .'=' , (2)

2 - ~сред )2 2 - ~сред )2 7 =1 7=1

где х7 и У7 - трендовые значения независимого и результативного показателей (соответственно) в 7-й период (момент времени) наблюдения; N - количество наблюдений (периодов или моментов времени); хсред и усред - оценки средних теоретических (по уравнению временного тренда) значений независимого и результативного показателей, вычисленные по формулам:

N N

£ ~ £ ~

~сред = 7=1 ~сРеД = 1=1 . (3)

N ' N '

- дополнительно строится поле корреляции и анализируется зрительно; при необходимости аналогично оценивается корреляция между трендами с временным лагом между периодами (моментами времени) наблюдения X и У;

- при выявлении возможной зависимости составляется уравнение регрессии с помощью метода наименьших квадратов (МНК), оценивается статистическая значимость, выполняется интерпретация.

На втором этапе для измерения колеблемости значений показателей относительно их временных трендов необходимо для каждого 7-го периода (момента времени) определить разность между фактическими (наблюдаемыми) значениями показателей и уровнями трендов:

ДХ = (х, -~), Ду = (у -~7) при 7 = 1, 2, ..., N. (4)

Это позволяет исключить возможную нелинейную составляющую тренда каждого показателя из фактических значений и/или возможный наклон линейной составляющей к оси времени. В итоге, с позиции анализа отклонений, тренды каждого показателя «сводятся» к условным прямым линиям, параллельным оси времени на протяжении всего интервала наблюдения. В результате получаются два временных ряда «Отклонений от трендов». Далее для каждого из них рассчитываются средние значения по формулам:

N

£Дх1 £Ду,

Дх = -7=-, Ду = -7=-. (5)

N N

Для оценивания взаимосвязи между такими отклонениями вполне применима известная классическая технология, включающая в себя вычисление коэффициента парной линейной корреляции К. Пирсона (1), зрительный анализ поля корреляции и построение уравнения регрессии. При необходимости также можно дополнить анализ исследованием взаимосвязи рассчитанных «Отклонений от трендов» с временным лагом между периодами (моментами времени) наблюдения Ах и Ду.

Описанная «Технология 1» является «предварительной» и применима, если априорно существуют основания предполагать, что между показателями может быть линейная причинно-следственная зависимость. Но описанное оценивание корреляции между трендами возможно с приемлемой точностью, если средние теоретические значения показателей имеют смысл.

Следует отметить, что процедура второго этапа позволяет получить оценки взаимовлияния «остатков», необъясненных уравнениями динамических трендов, причинами появления которых могут быть или случайные стечения обстоятельств, или комплексные изменения в условиях деятельности социально-экономической системы, или другие. Поэтому на практике такие оценки менее ценны для описания взаимовлияния показателей по сравнению с результатами первого этапа. Однако они могут быть использованы для анализа внешних условий деятельности исследуемой социально-экономической системы и чувствительности ее параметров к влиянию внешней среды. Технология 2

Недостатком предыдущей технологии на описанном первом этапе является оценивание только линейной компоненты корреляции между трендами показателей. Возможная нелинейность этой зависимости может быть выявлена только экспертным путем по результатам анализа поля корреляции. Для получения же количественных ее оценок и возможной автоматизации процесса на этом этапе более целесообразен подход на основе исследования динамики линейного расстояния (ЬК) между трендами. Процедура на первом этапе заключается в следующем:

- выполняется нормирование значений отдельно каждого показателя по его средней теоретической (по тренду) за весь период наблюдения величине:

Х7 ~ норм _ У,

УГи = ^Г для всех 7 = 1, ..., N. (6)

Х сред ^ 1 ~ сред

- для каждого 7-го периода (момента времени) рассчитывается линейное расстояние между трендами показателей по формуле:

щ = ~гн°Р« _ ^ для всех 7 = 1, ..., N (7)

- на основе полученных значений ЬЯ строится график динамики «Линейного расстояния»; по общей форме графика и его «гладкости» экспертным путем делается вывод о наличии или отсутствии зависимости и ее типе (линейная/нелинейная, форма нелинейности и пр.); при этом возможно автоматизированное применение известных методов классификации плоских кривых [1, 6, 14, 16];

- при необходимости с помощью МНК для выбранного типа зависимости составляется регрессионное уравнение взаимовлияния показателей, оценивается его значимость;

- составляется уравнение динамики «Линейного расстояния» как дополнительная характеристика зависимости между трендами показателей; оценивается его значимость.

На втором этапе исследуются зависимости между «Отклонениями от трендов» аналогично «Технологии 1», но с использованием «Линейного расстояния». По окончании этих двух этапов выполняется совместная интерпретация полученных результатов.

Вышеприведенные подходы применимы и при исследовании множественной корреляции (регрессии). Для «Технологии 1» возможно использование общеизвестных классических способов анализа для нескольких независимых показателей [9, 17, 21], но с разделением на указанные два этапа. Для «Технологии 2» - также в два этапа аналогично вышеописанной процедуре, но в многомерном пространстве независимых показателей на основе их «Многомерного среднего значения». Процедура его вычисления для каждого показателя заключается в следующем:

- для каждого 7-го периода (момента времени) значения каждого /-го независимого показателя (х7]-) нормируются по его среднему за все время наблюдения значению:

~ ~7у

Х7тГрм = для всех 7 = 1, ..., N и всех/ = 1, ..., К; (8)

х/

где К - количество независимых показателей;

- рассчитывается «Многомерное среднее значение» нормированных показателей (МЖ7) для каждого 7-го периода (момента времени) по формуле:

I х;г

М811 = - для всех 7 = 1, N. (9)

7 К

Если независимые показатели неравноценны, то усреднение выполняется по взвешенной формуле:

I хнорм • ^

М81г = - для всех 7 = 1, N (10)

I

/=1

где М/ - важность (приоритет) /-го независимого показателя (назначается экспертным путем; в статистике традиционно принято, что 0 < < 1, в теории принятия решений - 0 < < 10 ).

Затем составляется временной ряд МЖ как обобщенная характеристика всех рядов независимых показателей (х;), и в полном соответствии с «Технологией 2» (во всех вышеприведенных формулах х7 заменяется на МБ2) исследуется зависимость между МЖ и результирующим показателем (у).

Оценивание дисперсии для данных о многомерных объектах наблюдения

В социально-экономической области объектами наблюдения (ОН) являются чаще всего регионы, отрасли или компании. Каждый из них представляет собой сложную систему, и относительно полноценно такой ОН возможно охарактеризовать только перечнем параметров. Одной из важных задач многих исследований является статистический анализ естественных совокупностей таких ОН, а часто используемыми показателями вариации при этом являются дисперсия и аналогичные ей (производные от нее). Классическая формула дисперсии одного параметра (х) имеет вид:

в = , (11)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

N

где 7 = 1, ..., N - номер объекта наблюдения.

Фактически такая дисперсия представляет собой усредненный по всем ОН квадрат расстояния по оси X от значения параметра каждого 7-го ОН до среднего по этой совокупности значения (центра совокупности). При социально-экономических исследованиях возникает необходимость оценивания дисперсии объектов наблюдения в целом (по всем параметрам одновременно) в рамках совокупности, поэтому представляет интерес вычисление комплексной дисперсии многомерных ОН.

Каждый наблюдаемый параметр фактически характеризует одно или несколько его свойств, подавляющее большинство таких свойств взаимосвязаны между собой. Вычленение каких-то из них для изучения отдельно от остальных нежелательно, т. к. это может привести к чрезмерному упрощению результатов исследования и потере их информативности. Востребованным является разработка технологий оценивания комплексной дисперсии - характеристики фактической вариации объектов наблюдения в совокупности как неделимых объектов, обладающих перечнем свойств. Такие оценки могут быть получены на основе «Многомерных средних величин» (см. ниже «Технологию 3») и/или на основе «Евклидова расстояния» (см. ниже «Технологию 4»). Рассмотрим их более подробно. Технология 3

1. Отдельно для каждого у-го параметра ОН ( = 1, ..., М) вычисляется среднее по всей совокупности объектов значение:

УУ х--

X/ = 1 1 1 , (12)

' N

где 7 = 1, ., N - номер ОН; у = 1, ., М - номер параметра ОН (одинаково для всех объектов).

2. Фактическое значение каждого у-го параметра каждого 7-го ОН нормируется по его среднему по совокупности значению:

X' '

= -=Г для всех 7 = 1, ...,N и 7 = 1, ...,М. (13)

Ч Xу

3. Рассчитывается для каждого 7-го ОН значение многомерной средней величины всех нормированных значений его параметров по формуле средней арифметической простой; при необходимости учета важности параметров используются соответствующие весовые коэффициенты, назначенные экспертным путем, и взвешенная формула:

ут н ут

_ _ ¿/=1

ШБ; — - или ШБ; — —-~м- для всех 7 = 1, ..., N, (14)

1 М 1

где - вес (важность) параметра Ху.

Желательно, чтобы весовые коэффициенты при одних и тех же параметрах были одинаковы для всех ОН (это необязательное требование, но иначе сложно назначать веса и интерпретировать результаты).

4. Учитывая, что среднее значение многомерных средних величин всех ОН (т5) будет равно единице:

тБ = —- =1 , (15)

N

рассчитывается комплексная дисперсия по классической формуле:

_ _ уЦ1(Ш5^-Ш5)2

^ОН - ---. (16)

При необходимости определяются значения «производных» от нее статистических показателей: стандартного отклонения, коэффициента вариации и других. После выполнения соответствующих группировок ОН могут быть вычислены межгрупповая и внутригрупповые дисперсии, рассчитано корреляционное отношение. Аналогичные подходы могут быть применены и для расчета коэффициентов асимметрии и эксцесса при анализе распределения объектов наблюдения в многомерном пространстве параметров. Технология 4

1. Рассчитываются средние значения каждого у-го параметра (у = 1, . , М) по всей совокупности ОН по формуле простой средней арифметической величины; при необходимости могут быть учтены

важности ОН через назначенные экспертным путем весовые коэффициенты и с использованием взвешенной формулы:

-V- уМ ш-.т-н — _ М=1Х1] — _

X,- — - или X,- — —гт^- для всех у = 1, ..., М, (17)

> ~ N ) ~

Wi

где w7 - вес (важность) 7-го ОН.

Желательно, чтобы эти весовые коэффициенты были одинаковы для всех параметров одного (каждого) ОН (это необязательно, однако иначе сложно назначать такие веса и интерпретировать получившиеся результаты). В итоге получается совокупность координат точки в многомерном пространстве параметров, являющейся центром исследуемой совокупности объектов наблюдения (при неравной важности ОН центр оказывается смещенным).

2. Вычисляется стандартное отклонение (су) по-отдельности для каждого у-го параметра (у = 1, ..., М) по всей совокупности ОН:

Оу = ^ „ для всех ] = 1, ..., М. (18)

3. Рассчитывается «Евклидово расстояние» (Я,) в многомерном пространстве параметров между центром совокупности и каждым 7-м ОН, нормированное для каждого у-го параметра по су:

Ri = ч

f - \ 2 'Xii-Xj

Ylf=\ ~ ) для всех i = 1, N. (19)

4. Определяется комплексная дисперсия ОН в совокупности по формуле:

yN 2

ЯОН = , (20)

где i = 1, ..., N - номер объекта наблюдения.

При необходимости также вычисляются значения «производных» от дисперсии и «близких» к ней показателей.

Значения комплексных дисперсий (^он), полученные по Технологиям 3 и 4, могут не совпадать, что обусловлено различиями в процедурах нормировки значений показателей. При таком подходе к расчету дисперсии оценивается вариация не каждого абстрактного статистического параметра ОН в отдельности, а объектов в целом в комплексе неотделимых друг от друга свойств.

Свойства ОН и их взаимосвязи в социально-экономической области формируются в значительной мере естественным путем, т. к. прямое изолированное управление отдельными свойствами (по выбору) обычно затруднительно. Поэтому интерес представляет изучение таких ОН и их совокупностей именно при естественных сочетаниях свойств. Выделение отдельных свойств, декомпозиция в разных формах, снижение размерностей решаемых задач и аналогичные общеизвестные способы анализа хотя и позволяют получать локальные результаты, но обычно приводят и к возрастанию уровней ошибок, не всегда верной трактовке фактов совместного проявления свойств ОН, снижению в дальнейшем точности прогнозирования поведения таких объектов при разработке концепций и сценариев их развития.

В свою очередь, рассматриваемые при социально-экономических исследованиях совокупности ОН чаще всего формируются также естественным (тематическим, по каким-либо принципам) путем. В этой предметной области классические статистические подходы к формированию выборок не всегда применимы на практике. Независимо от уровня однородности ОН (часто он достаточно низкий) такую совокупность можно рассматривать как обособленный и отличный от других кластер. Представляет интерес изучение его в целом с целью определения типовых свойств, что в последствии может быть использовано для выявления в совокупности действительно аномальных (не мнимых) ОН, последующего описания свойств кластера и использования полученных результатов для решения в будущем задач классификации при разработке систем поддержки принятия управленческих решений.

Заключение

Проблема обработки заведомо неоднородной информации о социально-экономических системах до настоящего времени не решена в полном объеме. Особо важный статус она имеет в плане применения классических методов статистики для такого типа систем. В статье сделана попытка снизить остроту этой проблемы и предложить практические подходы к использованию статистики для анализа этих систем. Описанные «Технологии 1-4» могут применяться по-отдельности, независимо друг от друга в зависимости от целей исследования. С вычислительных позиций они являются относительно трудоемкими, но не требуют обязательного участия экспертов при подготовке и первичной обработки данных, хорошо алгоритмизируются. Целесообразно при практическом применении предварительно реализовать их в виде отдельных программных модулей и встроить в имеющиеся системы статистической обработки данных.

ЛИТЕРАТУРА

1. Андрафанова Н.В. Исследование свойств плоских кривых в системе динамической геометрии GeoGebra // Личность, семья и общество: вопросы педагогики и психологии. 2016. № 64. С. 27-36.

2. Архипов Р.Ю., Катышев П.К. Производство электроэнергии в России и ВВП: анализ коинтеграции // Прикладная эконометрика. 2016. № 4 (44). С. 38-49.

3. Бгане Ю.К., Болик А.В., Тупиха Н.А., Хетагурова З.В. Место и роль категории «Неоднородная экономическая система» в системе категорий экономической науки // Экономика и управление: проблемы, решения. 2018. Т. 5. № 11. С. 4-9.

4. Бгане Ю.К., Хетагурова З.В., Хараджян Л.В., Читанава Н.Б. Кризисы в эволюции неоднородных экономических систем // Экономика и предпринимательство. 2015. № 3-2 (56). С. 89-92.

5. Бузырев В.В., Поляков В.Г. Выявление степени влияния функциональных факторов территориальной организации экономики региона на его инвестиционную привлекательность // Вестник Тихоокеанского государственного университета. 2010. № 2 (17). С. 147-156.

6. Гильмутдинов Р.З., Ушаков В.В., Иваньо Я.М. Математические основы развития пространственного воображения // Вестник УГНТУ. Наука, образование, экономика. Серия: Экономика. 2017. № 4 (22). С. 149-154.

7. Голованова Л. А. Методика оценки потенциала энергосбережения в экономике региона // Вестник Тихоокеанского государственного университета. 2018. № 4 (51). С. 133-142.

8. Досмуханбетова Р., Ежебеков М. Оценка гипотезы «ресурсозависимости» тестированием коинтеграции мировых цен на нефть сырую и ВВП Казахстана // Современный научный вестник. 2016. Т. 12. № 2. С. 177-183.

9. Елисеева И.И., Юзбашев М.М. Общая теория статистики. М.: Финансы и статистика, 2006.

10. Ермоленко А.А. Субъектная целостность российской экономики: взгляд через призму теории интегрированных субъектов // Вестник Волгоградского государственного университета. Серия 3: Экономика. Экология. 2018. Т. 20. № 2. С. 5-15.

11. Зайцев А.А. Исследование устойчивости оценок ковариационной матрицы признаков // Машинное обучение и анализ данных. 2011. Т. 1. № 2. С. 163-171.

12. Иванова К.А., Савостьянова И.Л. Модель определения коинтеграции между ценой нефти и курсом рубля // Актуальные проблемы авиации и космонавтики. 2016. Т. 2. № 12. С. 49-51.

13. Копнова Е.Д., Родионова Л.А. Моделирование влияния иностранных инвестиций на продовольственную безопасность на основе моделей панельной коинтеграции // Бизнес-информатика. 2017. № 3 (41). С. 20-29.

14. Куссуль М.Э. Кодирование контуров, представленных кривыми Безье, в задачах нейросетевой классификации // Математические машины и системы. 2004. № 3. С. 17-30.

15. Настанский А., ШтровХ.Г. Коинтеграция между доходом, ценами активов, потреблением и инвестициями // Вестник НГУЭУ. 2011. № 1. С. 119-128.

16. Николаев П.П. Распознавание проективно преобразованных плоских фигур. Х. Методы поиска октета инвариантных точек контура овала - итог включения развитой теории в схемы его описания // Сенсорные системы. 2017. Т. 31. № 3. С. 202-226.

17. Официальный сайт компании «StatSoft Russia». Электронный учебник по статистике. [Электронный ресурс]. Режим доступа: http://statsoft.ru/home/textbook/default.htm (дата обращения 11.06.2019).

18. Рогачев Ал.Ю., Рогачев Ан.Ю. Анализ рынка на основе теории коинтеграции // Экономика и математические методы. 2007. Т. 43. № 2. С. 101-110.

19. Стрижов В.В. Задача выбора многоуровневых моделей с анализом ковариационной матрицы параметров // Математические методы распознавания образов. 2011. Т. 15. № 1. С. 154-157.

20. Субботенко А.В., Петрухин Г.Д., Кирюхин Д.А. Использование ковариационной матрицы для вычисления весовых коэффициентов классификаторов в задаче многоклассового распознавания // Информация и космос. 2016. № 4. С. 96-100.

21. Теория статистики с элементами эконометрики / под ред. В.В. Ковалева. М.: Юрайт, 2014.

22. Царикаев Ю.Д. Ковариационная матрица регионального анализа // Этносоциум и межнациональная культура. 2011. № 5 (37). С. 84-93.

23. Щербаков Г.А. Количественные и качественные процессы в экономике как фундаментальная основа хозяйственных явлений среднесрочного и долгосрочного экономических циклов // Азимут научных исследований: экономика и управление. 2016. Т. 5. № 1 (14). С. 73-77.

i Надоели баннеры? Вы всегда можете отключить рекламу.