Научная статья на тему 'Роль больших данных и имитационного моделирования в социально -экономических исследованиях '

Роль больших данных и имитационного моделирования в социально -экономических исследованиях Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
1141
140
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
большие данные / имитационное моделирование / социально-экономические процессы / big data / simulation modeling / socio-economic studies

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — А. Г. Баханов

В статье анализируются методы больших данных и имитационного моделирования. Акцентируется внимание на применении метода «big data» в социально-экономических исследованиях.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — А. Г. Баханов

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

The role of big data and simulation modeling in socio -economic studies

The methods of big data and simulation modeling handling are analyzed in the article. The attention is focused on the method of “big data” application in socio-economic studies.

Текст научной работы на тему «Роль больших данных и имитационного моделирования в социально -экономических исследованиях »

УДК 316.628

А. Г. БАХАНОВ,

Институт социологии НАН Беларуси, г. Минск

РОЛЬ БОЛЬШИХ ДАННЫХ И ИМИТАЦИОННОГО МОДЕЛИРОВАНИЯ В СОЦИАЛЬНО-ЭКОНОМИЧЕСКИХ ИССЛЕДОВАНИЯХ

В статье анализируются методы больших данных и имитационного моделирования. Акцентируется внимание на применении метода «big data» в социально-экономических исследованиях.

Ключевые слова: большие данные, имитационное моделирование, социально-экономические процессы.

С возникновением новых информационных технологий в современном обществе происходит накопление разнородной информации. Появляется множество социальных сервисов и интернет-ресурсов, которые востребованы пользователями. В постиндустриальном обществе индивиды все чаще проводят свободное время в Интернете, тем самым порождая массу неструктурированных сведений. Чтобы проанализировать весь накопленный массив данных, требуются высокопроизводительные компьютеры и ресурсоемкие приложения. Следовательно, в цифровую эпоху многократно увеличивается и число электронных сервисов, которые накапливают (архивируют) данные. Этому процессу способствует использование различных мобильных устройств и приложений, интернет-сайтов и всевозможных носимых гаджетов. Большая часть населения, использующего широкополосный доступ к Глобальной сети, не представляет свою повседневность без «виртуальной среды», например, регистрации личных профилей в социальных сетях, «виртуальных кабинетах», загрузки данных в «облачные сервисы», использование on-line платежей, системы «Умный дом» и др. В таком многообразии информации применение классических методов обработки и анализа данных для решения поставленных перед исследователем задач не является оптимальным с точки зрения самой методики. В свою очередь, экспоненциальный рост всевозможной информации повлиял как на положительные качества личности, так и отрицательные. Информация, которая ранее представляла ценность для конечного потребителя, в связи с распространением всевозможных интернет-ресурсов быстро теряет свою актуальность (устаревает). Соответственно, среди пользователей Интернета постоянно преобладает определенный «стереотип». Данный образ «подкрепляется» «трендовым» мышлением референтной груп-

пы. Чтобы разрешить возникающие в обществе информационные и социальные противоречия, необходимо быстро анализировать поступающие данные. Безусловно, большой массив данных подвержен изменчивости и нелинейной зависимости. Поэтому, чтобы исключить вероятностные ошибки, при проведении и анализе социально-экономических исследований стоит обратить внимание на новые методы обработки данных.

В качестве примера рассмотрим краткий отчет из книги В. Майер-Шен-бергера и К. Кукьера «Большие данные. Революция, которая изменит то, как мы живем, работаем и мыслим». «Не так давно, - пишут авторы, - нечто подобное произошло в процессе опросов, связанных с выборами. Опросы проводились с помощью стационарных телефонов. Выборка оказалась недостаточно случайной из-за погрешности, вызванной тем, что люди, которые пользуются исключительно мобильными телефонами (более молодая и либеральная категория населения), не брались в расчет. Это привело к неправильным прогнозам результатов выборов. В 2008 году в период президентских выборов между Бараком Обамой и Джоном Маккейном главные организации по проведению анкетного опроса населения - Gallup, Pew и ABC/Washington Post - обнаружили разницу в один-три пункта между опросами с учетом пользователей мобильных телефонов и без них. С учетом напряженности гонки это была огромная разница» [1, с. 32]. В данном примере отражается погрешность, которую можно было бы исключить, применив современные методы анализа данных. В связи с этим мы рассмотрим современный подход «big data». Термин «big data» (большие данные) получил распространение в начале XXI в. Первоначально данный метод применялся только в специализированных научно-исследовательских лабораториях. Дальнейший рост производительности персональных компьютеров, а также широкое распространение доступа к Интернету способствовали внедрению нового метода анализа данных. Строгого определения «big data» и тем более узконаправленного применения мы не будем придерживаться в силу его специфики. Мы определяем термин «big data» как собирательное название, включающее различные подходы, инструменты и методики анализа статистических данных. Следовательно, можно выделить следующие основные структурные элементы метода «big data»: 1) обучение ассоциативным правилам, 2) смешение и интеграция данных, 3) машинное обучение, 4) нейронные сети, 5) распознавание образов, 6) прогнозная аналитика, 7) имитационное моделирование, 8) пространственный анализ, 9) статистический анализ. Охарактеризуем кратко вышеперечисленную терминологию.

Обучение ассоциативным правилам - методика из области машинного обучения, которая обеспечивает извлечение правил «if-then» из набора данных [2].

Смешение и интеграция данных - совокупность подходов, которые позволяют интегрировать разнородные данные в единое целое для дальнейшего анализа.

Машинное обучение (Machine Learning) - обширный подраздел искусственного интеллекта, изучающий методы построения алгоритмов, способных обучаться [3].

Нейронные сети (искусственные) - устройства параллельных вычислений, состоящие из множества взаимодействующих простых процессоров [4, с. 13].

Прогнозная аналитика - набор методов и инструментов, позволяющий прогнозировать будущее поведение анализируемых объектов [5].

Вышеперечисленные методы и методики находят широкое применение и в междисциплинарных исследованиях. Так, например, метод «распознавание образов» используется в решении задач, связанных с потребительскими предпочтениями. Суть данного метода заключается в преобразовании и соотнесении исходных данных (графическая, визуальная информация) к определенному классу признаков, которые затем обрабатываются на компьютере.

В случае, когда мы анализируем выборочную совокупность классическими методами, большая часть данных не учитывается в силу специфики самой методики. Большие данные «помогают» улучшить полученные результаты, но при этом исследователю необходимо учитывать колеблющиеся социально-экономические изменения в обществе на данный момент времени. Вероятно, при решении сложных задач «big data» является самым оптимальным и с точки зрения «время-аналитика». Время, затраченное на обработку и анализ неструктурированной информации, способствует качественной аналитике. Таким образом, при исследовании экономических и социальных реформ необходимо учитывать большое количество различных факторов. Например, в роли социальных изменений могут выступать повышение и понижение подоходного налога, повышение пенсионного возраста, увеличение количества безработных и др. Не стоит пренебрегать и такими понятиями, как экономическое положение различных слоев населения, в том числе и совокупный доход. Из-за возможных накладываемых методом ограничений (сложная социальная структура, доступность и открытость данных и др.) необходимо комбинировать статистические методы. Основываясь на представленных данных об объекте, следует учитывать и социальные изменения, которые происходят на данный момент времени в обществе.

В связи с этим для более точного анализа и прогнозирования следует обратить внимание на метод имитационного моделирования. Данный метод позволяет выявить на предварительном этапе первичного анализа большинство исследовательских ошибок. Имитационное моделирование - это метод исследования, при котором изучаемая система заменяется моделью, которая с достаточной точностью описывает реальную систему и с которой проводятся эксперименты с целью получения информации о поведении моделируемой системы.

Моделирование социально-экономических процессов и явлений позволяет исследователю «проиграть» возможные варианты поставленных задач. Несомненным преимуществом данного метода является возможность проверить

множество гипотез и подобрать оптимальное решение. Когда большие данные анализируются при помощи имитационного моделирования, то исключается возможность неэффективного использования программных и технических ресурсов. «Имитационная модель должна отражать большое число параметров, логику и закономерности поведения моделируемого объекта во времени (временная динамика) и в пространстве (пространственная динамика)», - отмечают российские экономисты [6, с. 6].

Построение «имитационных моделей» позволяет исследователю улучшить качество проводимых исследований и тем самым повысить репрезентативность интерпретируемых данных. Стоит отметить, что построение моделей требует наличия эмпирической базы социально-экономических исследований или большого массива данных. Однако возможно построение и «виртуальных» моделей посредством генерации случайных переменных. В таком случае при создании имитационной модели обрабатывается множество вариантов при заданных определенных параметрах. Полученное решение позволяет «упростить» модель социальных связей при минимизации экономических издержек.

Имитационное моделирование как особая информационная технология состоит из следующих основных этапов:

1) структурный анализ процессов. Проводится формализация структуры сложного реального процесса путем разложения его на подпроцессы, вьпол-няющие определенные функции и имеющие взаимные функциональные связи согласно легенде, разработанной рабочей экспертной группой [6, с. 15];

2) формализованное описание модели. Графическое изображение имитационной модели, функции, выполняемые каждым подпроцессом, условия взаимодействия всех подпроцессов и особенности поведения моделируемого процесса (временная, пространственная и финансовая динамика) должны быть описаны на специальном языке для последующей трансляции [6, с. 16];

3) построение модели (build). Обычно это трансляция и редактирование связей (сборка модели), верификация (калибровка) параметров [6, с. 16];

4) проведение экстремального эксперимента для оптимизации определенных параметров реального процесса [6, с. 17].

Дальнейшее построение алгоритма действий позволяет учитывать различные условия, которые возникают в общественных явлениях. При проведении социально-экономических исследований часто возникают противоречия в формулировке вопросов и вариантов ответа. Для решения данного противоречия можно применить моделирование. Имитационное моделирование позволяет «проиграть» сложную социально-экономическую модель, тем самым исключив множество ошибок при ее построении. Модель, которая создается с помощью n-го количества переменных, содержит практически все необходимые условия, позволяющие определить наиболее оптимальный вариант. Имитационная модель - логико-математическое описание объекта, которое может быть использовано для экспериментирования на компьютере в целях

проектирования, анализа и оценки функционирования объекта. Существует несколько типов имитационных моделей.

1. Непрерывные модели - это модели, которые используются для описания поведения систем во времени. Непрерывные имитационные модели обычно представляются в виде разностно-дифференциальных уравнений, которые описывают взаимодействие между различными элементами системы. Типичным примером непрерывной имитационной модели является изучение динамики народонаселения мира [7, с. 703].

2. Дискретные модели - это модели, описывающие поведение различных систем (социально-экономических) в заданный интервал времени. Типичным примером такой модели является очередь [7, с. 703].

Социальные системы исследуются с помощью виртуальных моделей, в которых участвует «имитационный агент». При этом социальная природа исследуемого объекта не искажается, что позволяет улучшить результаты. Процесс моделирования предоставляет возможность наблюдать за социальными изменениями в определенный отрезок времени. Имитационные модели находят свое применение как в теоретических, так и в прикладных социологических исследованиях. Компьютерное моделирование ускоряет процесс построения и анализа решаемых социально-экономических систем. С применением компьютерных технологий решается широкий круг задач, при котором задей-ствуется множество переменных. Так, компьютерное моделирование «помогает» исследователю получать новые качественные и количественные признаки в результате социальных изменений. Полученные результаты выявляют новые свойства социальной системы, определенную структуру, динамику изменений, «устойчивые образы» поведения и др. Таким образом, имитационное моделирование способствует «быстрому» реагированию как на изменение разнородных признаков, так и для прогнозирования будущих систем.

Моделирование социально-экономических систем позволяет также выявить латентные закономерности общественных процессов. Анализируя происходящие события в обществе, необходимо иметь в виду вариативность социальных аспектов человеческой жизнедеятельности. Многофакторность исследуемых явлений «обязывает» учитывать индивидуальные признаки групп и сообществ. В таком случае, чтобы не исказить реальную картину социальных взаимодействий, необходимо построить модель динамики общества на основе социологических данных. То есть учитывать социальные процессы до и после социальных изменений. Построенные компьютерные модели в дальнейшем помогут исследователям получить новые знания о социальной системе.

При моделировании социальных процессов следует применять несколько подходов: локальный и глобальный [8, с. 23]. Различие данных подходов состоит в том, что рассматривается разная численность индивидов. Для локального подхода необходимым условием является наличие следующих категорий: человек, семья, группа. Также создается необходимый набор правил, при

котором взаимодействуют индивиды. Глобальный подход основан на изучении всего социума, представленного многогранностью социальных субъектов и факторов. Выделяются следующие критерии классификации математических моделей социальных процессов [8, с. 24]. Первый критерий связан с типом математического аппарата, с помощью которого происходит процесс формализации. В данном случае различают модели стохастические (вероятностные) и детерминистские (определенные). Другие подклассификации относятся к типу используемых переменных: непрерывное или дискретное время (является ли зависимая переменная непрерывной или же представляет дискретные состояния). Вторым критерием выступает функция моделей процессов в теоретическом и эмпирическом исследовании. В соответствии с этой основной функцией модели делятся на теоретические и эмпирические. Дальнейшее разграничение приводит к подклассификациям: описательные, объяснительные и предсказательные модели. Третьим критерием являются социальные процессы, которые происходят в различных группах, а также процессы в индивидуальных и групповых решениях, динамике социальной группы. Четвертый критерий - тип концептуализации социального процесса: является ли данный процесс управляемым или без управления. Управляемые процессы можно разделить на процессы целесообразного поведения рефлексного типа и процессы целенаправленного поведения нерефлексного типа.

Построение виртуальных моделей предполагает применение социологической теории, позволяющей оптимизировать поиск основных структурных элементов. Следовательно, когда построена компьютерная модель, необходимо учитывать «реальные» социальные изменения, с учетом традиций и социальных условий. Если мы наблюдаем неопределенность поведения модели, тогда изменяются переменные, условия моделируемой системы и другие необходимые элементы.

Таким образом, современные методы исследования социологической информации позволяют изучить сложные социально-экономические системы. Повысить репрезентативность проводимых исследований можно при комбинировании методов «big data» и имитационного моделирования. Чтобы минимизировать социальные риски и улучшить качество принимаемых решений, следует использовать метод имитационного моделирования.

Список использованных источников

1. Майер-Шенбергер, В. Революция, которая изменит то, как мы живем, работаем и мыслим / В. Майер-Шенбергер, К. Кукьер ; пер. с англ. И. Гайдюк. - М. : Манн, Иванов и Фербер, 2014. - 240 с.

2. Обучение ассоциативным правилам [Электронный ресурс]. - Режим доступа: https:// msdn.microsoft.com/ru-ru/magazine/dn683798.aspx. - Дата доступа: 10.10.2016.

3. Машинное обучение [Электронный ресурс]. - Режим доступа: http://statsoft.ru/home/ textbook/modules/stmachlearn.html. - Дата доступа: 10.10.2016.

4. Каллан, Р. Основные концепции нейронных сетей : пер. с англ. / Р. Каллан. - М. : Виль-ямс, 2001. - 291 с.

5. Бизнес-аналитика и прогнозная аналитика: сходства и различия [Электронный ресурс]. - Режим доступа: http://datareview.info/article/biznes-analitika-i-prognoznaya-analitika-shodstva-i-razlichiya/ - Дата доступа: 10.10.2016.

6. Имитационное моделирование экономических процессов / А. А. Емельянов [и др.] ; под ред. А. А. Емельянова. - М. : Финансы и статистика, 2002. - 368 с.

7. Таха, Х. А. Введение в исследование операций : пер. с англ. / Х. А. Таха. - М. : Вильямс, 2005. - 912 с.

8. Омский государственный университет в дополнительных страницах [Электронный ресурс] / Социальные системы. Формализация и компьютерное моделирование : учеб. пособие. -Омск : Омск. гос. ун-т, 2000. - 160 с. - Режим доступа: http://www.univer.omsk.su/socsys/book1. pdf. - Дата доступа: 10.10.2016.

A. G. BAHANOV

THE ROLE OF BIG DATA AND SIMULATION MODELING IN SOCIO-ECONOMIC STUDIES

Summary

The methods of big data and simulation modeling handling are analyzed in the article. The attention is focused on the method of "big data" application in socio-economic studies.

Keywords: big data, simulation modeling, socio-economic studies.

Поступила 18.11.2016 г.

i Надоели баннеры? Вы всегда можете отключить рекламу.