УДК 004.94:001.57
В.В. Быстров1, М.Г. Шишаев1,2
1 Институт информатики и математического моделирования технологических процессов Кольского НЦ РАН
2 ФГБОУ ВО «МАГУ»
ОСНОВЫ ИНФОРМАЦИОННОЙ ТЕХНОЛОГИИ АВТОМАТИЗИРОВАННОГО СИНТЕЗА РАНДОМИЗИРОВАННЫХ КОМПЛЕКСНЫХ МОДЕЛЕЙ МИГРАЦИИ*
Аннотация
В статье рассмотрены основные компоненты и принципы использования информационной технологии автоматизированного синтеза
рандомизированных комплексных моделей миграции населения. Представлена структура полимодельного комплекса, включающего в себя комбинации различных видов имитационных моделей, онтологические описания, опирающиеся на оригинальные энтропийные динамические модели миграции. Описано функциональное назначение и принципы реализации компонентов информационной технологии.
Ключевые слова:
миграция населения, демоэкономика, математическое моделирование, полимодельные комплексы, онтология, имитационное моделирование.
V.V. Bystrov, M.G. Shishaev
FUNDAMENTALS OF INFORMATION TECHNOLOGY OF AUTOMATED SYNTHESIS OF RANDOMIZED COMPLEX MODELS OF MIGRATION
Abstract
The article considers the main components and principles of using the information technology for automated synthesis of randomized complex population migration models. The structure of a poly-model complex including combinations of different types of simulation models, ontological descriptions based on original entropic dynamic migration models is presented. The functional purpose and principles of the implementation of information technology components are described.
Keywords:
migration of population, demoeconomics, mathematical modeling, polymodel complexes, ontology, simulation.
Введение
Одной из отличительных особенностей современного мира является наличие разнообразных миграционных процессов. Значительная масса людей по всей планете вовлечены в непрекращающиеся процессы перемещения в поисках более приемлемых для себя условий проживания. Данное явление оказывает существенное влияние на изменение численности населения, его половозрастную структуру, на показатели смертности и рождаемости. Изменение перечисленных показателей опосредовано влияет на региональные экономические процессы, а вместе с ними и на условия проживания будущих поколений.
* Работа выполнена при финансовой поддержки РФФИ, проект № 16-29-12878 (офи_м) «Развитие методов идентификации динамических моделей со случайными параметрами и их применение для прогнозирования миграции в Евразии».
В частности, миграционные процессы оказывают непосредственное влияние на преобразование социально пространственных отношений, что приводит к формированию нового рынка труда. Темпы развития таких отношений различны и не всегда согласуются с адаптационными возможностями, как самих мигрантов, так и коренных жителей регионов. Эти несогласованности могут служить причиной повышения социальной напряженности в отдельных регионах. По мнению некоторых исследователей [2, 5], задача составления прогноза миграции является наиболее сложной из задач прогнозирования динамики населения. Основной причиной сложности моделирования миграции является отсутствие полной информации о структуре миграционных потоков. В связи с этим при решении задачи прогнозирования миграции практически невозможно достижение той же точности, как и при расчете естественного движения населения.
На сегодняшний день появились научно-исследовательские работы, анализирующие генезис развития различных подходов к моделированию и прогнозированию миграции [11], что создает определенные основания для изучения миграционных процессов на базе современных информационных технологий с использованием математического моделирования.
Многие математические модели, связанные с исследованием динамики населения, и, в частности, миграции, отражают взаимосвязь демографических и экономических процессов. Подход к изучению подобного рода социально-экономических систем предложен академиком Ю.С. Попковым [8]. Основная идея предложенного подхода заключается в выявлении определенных состояний демоэкономических систем, которые появляются в результате взаимодействия процессов пространственно-временной эволюции населения и экономики в терминах макропоказателей. При этом базовым предположением является то, что население региона экономически мотивировано, т.е. поведение отдельных индивидов большей частью определяется разнообразными экономическими показателями. В агрегированном виде демоэкономическая система представляется в виде соответствующей модели, структурно состоящей из двух основных подсистем - «Население» и «Экономика», а также вспомогательной подсистемы «Взаимодействие». Подсистемы построенной таким образом демоэкономической модели включены в замкнутый контур, и поэтому обозначение прямых и обратных связей в нем зависит от приоритета, который придается подсистеме «Население» по отношению к подсистеме «Экономика».
Стоит отдельно отметить, что, предпринимая меры по повышению уровня макромоделирования, обычно снижается точность прогнозирования, но сохраняется горизонт прогнозирования и его качественные характеристики. Одним из возможных путей устранения указанного недостатка является разработка полимодельных комплексов, интегрирующих в себе разные подходы моделирования. Например, аналитическое моделирование в терминах экономических и демографических макропоказателей можно применить для выявления (расчета) базовых трендов миграционных процессов, а имитационное моделирование - как средство повышения адекватности прогноза на основе коллективных экспертных знаний. Отметим, что приводимый ниже материал направлен на развитие указанной концепции для исследования миграционных процессов.
Так в данной статье приводятся отдельные результаты первого года исследования по проекту «Развитие методов идентификации динамических моделей со случайными параметрами и их применение для прогнозирования миграции в Евразии». В рамках указанного научно-исследовательского проекта авторский коллектив предлагает осуществить междисциплинарный синтез процедур идентификации и прогнозирования, ориентированных на процессы пространственно-временной, многоцелевой миграции населения. Одним из предполагаемых результатов выполняемой работы является информационная технология автоматизированного синтеза рандомизированных комплексных моделей миграции.
Концепция информационной технологии
Для повышения качества моделирования миграционных процессов было принято решение в рамках проводимого научно-исследовательского проекта расширить аналитические модели за счет применения методов имитационного моделирования. Одной из поставленных задач является создание целого полимодельного комплекса, включающего в себя комбинации различных видов имитационных моделей, онтологические описания, опирающиеся на оригинальные энтропийные динамические модели миграции. Для создания такого комплекса разрабатывается информационная технология синтеза рандомизированных комплексных моделей миграции. В основу технологии положены развиваемые последние десятилетия авторским коллективом подходы, методы и средства исследования сложных социально-экономических систем.
Данная информационная технология позволит генерировать комплексные модели миграционных процессов в автоматизированном режиме, основываясь как на результатах вычислительного эксперимента описанных выше математических моделей, так и на формализованных экспертных знаниях о макросистеме «население-экономика».
На рис. приводится общая структура разрабатываемой информационной технологии синтеза моделей миграционных процессов. В конечной реализации технология будет представлена программным комплексом, включающим в себя набор взаимодействующих относительно независимых программных компонентов, каждый из которых выполняет определенный набор функций в соответствии с предлагаемой схемой. Из приведенной структуры сознательно опущены процессы, связанные с организацией взаимодействия между конечным пользователем и программным комплексом, т.к. рандомизированные комплексные модели миграции будут являться частью более масштабного средства поддержки принятия решений, с которым непосредственно и будет взаимодействовать пользователь.
Согласно приведенной схеме (рис.) разрабатываемая информационная технология включает в себя следующие компоненты:
• Аналитическая модель. Представляет собой рандомизированную параметрическую модель миграции, настроенную с помощью алгоритма энтропийного рандомизированного машинного обучения. На выходе данного компонента формируются параметры и закономерности между ними в формализованном виде.
Структура информационной технологии синтеза рандомизированных комплексных моделей миграции
• Вычислительный компонент. Предназначен для проведения вычислительного эксперимента для разработанных аналитических моделей миграции. Реализуется в виде программного модуля, осуществляющего проведение расчетов математических моделей в численном виде. На выходе формирует ансамбли траекторий динамики миграционных потоков.
• Компонент извлечения знаний. Применяется для организации взаимодействия с экспертами с целью формирования и последующего пополнения базы знаний и данных о моделируемых процессах. Выделены две категории пользователей для данного компонента: эксперты и системный аналитик. Эксперт является носителем знаний о явлениях и процессах исследуемой предметной области. Системный аналитик является экспертом в области системного анализа и создания имитационных моделей сложных систем. На выходе компонента формируются экспертные знания, представленные в удобной для занесения в онтологии форме.
• Онтология предметной области [6]. Выполняет роль базы знаний и данных об исследуемых явлениях и процессах. Реализуется в виде прикладной онтологии в формате OWL [13, 14, 15].
• Онтология верхнего уровня [12]. Содержит информацию о терминах, отношениях, правилах и механизмах, используемых в области имитационного моделирования. Выступает в роли базы знаний, применяемой для синтеза системно-динамических, агентных и дискретно-событийных моделей и их комбинаций в конкретной среде моделирования.
• Процедуры синтеза. Представляют собой алгоритмы генерации имитационных моделей, сформированные на основе правил, хранящихся в онтологии верхнего уровня. Основное назначение формирование базовой конструкции полимодельного комплекса в результате установления соответствия между понятиями из онтологии предметной области и объектами определенной нотации метода моделирования, между отношениями и связями в имитационной модели. При определении процедур синтеза имитационных моделей используются наработки прошлых лет научного коллектива Института информатики и математического моделирования КНЦ РАН [1, 4, 7, 9, 10].
• Рандомизированная комплексная модель. Представляет собой полимодельный комплекс, состоящий из набора взаимосвязанных по параметрам системно-динамических, агентных и дискретно-событийных моделей, синтезированных на основе информации, представленной в онтологии предметной области и онтологии верхнего уровня, а также о параметрах энтропийной рандомизированной модели миграции. В качестве программной платформы используется среда имитационного моделирования Anylogic 7.
Основное назначение рандомизированной комплексной модели заключается в уточнении траекторий изменения миграционных потоков между территориально-административными образованиями (в частности, странами) за счет включения в имитационные модели факторов, которые не учитывались при построении аналитических моделей, но определяются экспертным сообществом как существенно значимые.
В рамках выполняемого научно-исследовательского проекта предлагается также разработать информационную технологию валидации рандомизированных моделей миграции. Технология базируется на механизмах сравнения результатов вычислительного эксперимента и мнения экспертов, представленного в формализованном виде. Экспертные знания формируются в виде онтологического описания и содержат информацию о свойствах и характеристиках явлений и процессов, наблюдаемых в демоэкономической системе и оказывающих явное или опосредованное влияние на миграцию. В рамках информационной технологии осуществляется количественное и качественное сопоставление математических моделей и эмпирических предположений о поведении исследуемых систем. Процедура качественного сопоставления заключается в выявлении отличий в составе и структуре аналитических моделей от соответствующей семантической организации прикладной онтологии. В качестве промежуточного звена процедуры сравнения строится для математической модели соответствующая вспомогательная онтология, содержащая информацию о ее параметрах и отношениях между ними. В результате задача качественного сопоставления сводится к сравнению двух онтологий (вспомогательной и предметной области), которая решается с помощью существующих методов из области управления знаниями. Процедура количественного сопоставления заключается в построении имитационных моделей на основе онтологий верхнего уровня и предметной области и последующее соотнесение результатов вычисления рандомизированных динамических моделей миграции и вычислительного эксперимента имитационных моделей.
Заключение
В статье предлагается расширить возможности аналитических моделей, разрабатываемых для прогнозирования миграционных процессов в системе «население-экономика», за счет использования имитационного моделирования. Интеграция демоэкономических энтропийных моделей, настроенных с помощью методов рандомизированного машинного обучения, с комплексом имитационных моделей, созданных на основе формализованных экспертных знаний, позволит повысить адекватность результатов прогнозирования. Для этих целей разрабатывается информационная технология автоматизированного синтеза рандомизированных комплексных моделей миграции. Отличительной особенностью данной технологии является совместное использование энтропийных аналитических моделей, полимодельного комплекса, онтологий разных уровней, процедур синтеза моделей.
Полимодельный комплекс представляет собой набор взаимосвязанных системно-динамических и агентных моделей, сгенерированных с помощью процедур автоматизированного синтеза. Генерация моделей производится на основе информации о параметрах и связей между ними, получаемой из «обученной» методами рандомизированного машинного обучения динамической модели миграции и онтологии предметной области. Прикладная онтология содержит экспертные знания о демографических и экономических составляющих, оказывающих влияние на миграционные процессы. Для реализации процедур автоматизированного синтеза строится онтология верхнего уровня, содержащая термины, принципы и правила создания системно-динамических, агентных и дискретно-событийных моделей.
В целом, проводимое исследование является развитием теории общих методов моделирования процессов миграции, а также обладает определенной научной новизной для общих методов анализа данных и прогнозирования на основе компьютерного моделирования.
Литература
1. Быстров, В.В. Информационная технология синтеза динамических моделей сложных систем /В.В. Быстров, А.В. Горохов // Информационные ресурсы России. - М: Российское энергетическое агентство МЭ РФ. -2007. -№2. - С.5-9.
2. Денисенко, М.Б. Математические модели миграции населения / М.Б. Денисенко // В кн.: Современная демография; под ред. А.Я. Кваши, В.А. Ионцева. -М.: Изд-во МГУ. - 1995. - 272 с.
3. Добров, Б.В., Онтологии и тезаурусы: модели, инструменты, приложения: учебное пособие / Б.В. Добров и другие. - М.: Бином. Лаборатория знаний, 2009. - 173 с.
4. Кудинова, О.В. Синтез имитационных моделей на основе онтологий с использованием процедуры соотнесения шаблонов и обратной «допарамет-ризации» онтологии / О.В. Кудинова // Труды КНЦ РАН. - Апатиты: КНЦ РАН, 2010, №3. - С.46-49.
5. Лукина, А.А. Анализ и математическое моделирование международной трудовой миграции / А.А. Лукина, А.В. Прасолов // Управленческое консультирование, 2015. - №10 (82). - С.146-156.
6. Найханова, Л.В. Технология создания методов автоматического построения онтологий с применением генетического и автоматного программирования / Л.В. Найханова // Монография. - Улан-Удэ: Изд-во БНЦ СО РАН, 2008.
- 244 с.
7. Олейник, А.Г. Инструментальные средства интерактивного формирования имитационных моделей деятельности региональной системы профессионального образования / А.Г. Олейник, А.Н. Лексиков // Труды ИСА РАН.
- М.: ИСА РАН. - 2008. -Т.39. - С.267-276.
8. Попков, Ю.С. Математическая демоэкономика: Макросистемный подход / Ю.С. Попков. - М.: ЛЕНАНД, 2013. - 560 с.
9. Путилов, В.А. Синтез имитационных моделей сложных систем на основе экспертных знаний / В.А. Путилов, А.В. Горохов, В.В. Быстров // Информационные технологии и вычислительные системы. -М.: УРСС. - 2008. - №2.
- С.27-35
10. Халиуллина, Д.Н. Проблемно-ориентированный программный комплекс поддержки стратегического планирования развития малых инновационных предприятий / Д.Н. Халиуллина //Труды СПИИРАН. -СПб: СПИИРАН, 2016, №3 (46). -С.190-211.
11. Юдина, Т.Н. Прогностические модели миграции в Россию: подходы и анализ / Т.Н. Юдина // In MIGRATION 6. Tbilisi, Ivane Javakhishvili Tbilisi State University Migration Research Center, 2013. -Р.25-43.
12. Vargas-Vera, M. MnM: Ontology-Driven Tool for Semantic Markup / Vargas-Vera M. and other // European Conf. on Artificial Intelligence (ECAI 2002). In Proc. of the Workshop Semantic Authoring, Annotation & Knowledge Markup (SAAKM 2002). Lyon France, July 22-23, 2002. -Р.19-24.
13. Клинов, П. О формальных основах OWL.
- Режим доступа: http://shcherbak.net/2009/03/o-formalnyx-osnovax-owl/ (дата доступа: 10.11.2017).
14. OWL, язык веб-онтологий. Руководство. Рекомендация W3C. 10 февраля 2004. - Режим доступа: http: //sherdim.ru/pts/semantic_web/REC-owl -guide -20040210 ru.html (дата доступа: 10.11.2017).
15. Balani N. The future of the Web is Semantic. - Режим доступа:
http: //masters.donntu.org/2012/iii/shelyuk/library/semantic_future.htm (дата доступа - 10.11.2017).
Сведения об авторах
Быстров Виталий Викторович - к.т.н., старший научный сотрудник, e-mail: [email protected]
Vitaliy V. Bystrov - PhD (Tech. Sci.), senior researcher
Шишаев Максим Геннадьевич - д.т.н, доцент, главный научный сотрудник, е-mail: [email protected]
Maxim G. Shishaev - Dr. Sci. (Tech.), associate professor, lead researcher