Научная статья на тему 'Мультиагентное моделирование процессов распространения массовых эпидемий с использованием суперкомпьютеров'

Мультиагентное моделирование процессов распространения массовых эпидемий с использованием суперкомпьютеров Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
291
113
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
мультиагентное моделирование / теория перколяции / перколяционный кластер / распространение эпидемий / высокопроизводительные вычислительные системы / multi-agent simulation / theory of percolation / percolating cluster / advance of an epidemic / high-performance computing systems

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — С Ю. Лапшина

В статье рассматривается возможность использования современных суперкомпьютеров при решении ресурсоемких задач мультиагентного моделирования процессов распространения массовых эпидемий на основе теории роста перколяционных кластеров. Мультиагентная перколяционная модель в задачах определения карантинных зон при распространении эпидемий предполагает формирование решетки взаимодействия представителей популяции, моделирование среды распространения заболевания, сбор информации о численности населения, реализацию параллельного алгоритма многократной маркировки перколяционных кластеров с механизмом линковки меток, визуализацию полученных результатов. Описываются усовершенствованный для применения на многопроцессорной системе вариант алгоритма многократной маркировки перколяционных кластеров Хошена–Копельмана, а также действующий прототип его реализации, разработанный в МСЦ РАН. Данный алгоритм может быть использован в любой области в качестве инструмента дифференцирования кластеров решетки большого размера, так как ему на вход подаются данные в не зависимом от приложения формате. Демонстрируется возможность выявления зависимостей латентных периодов распространения эпидемий от вероятности инфицирования агрегатов популяционных представителей и формирования пороговых значений перехода локальных эпидемий в крупномасштабные пандемии. Задав латентный период, вероятность инфицирования и очаг заражения, можно определить круг городов, где можно ожидать инфицирование. Эта информация используется для определения радиуса карантинной зоны. Если в некотором городе обнаружен очаг заболевания и латентный период уже закончился, то с помощью данного инструмента определяется зона, которую нужно изолировать от внешнего мира. В работе приводятся оценки времени выполнения алгоритма многократной маркировки перколяционных кластеров Хошена–Копельмана при различных значениях входных параметров на двух высокопроизводительных вычислительных системах, установленных в МСЦ РАН, – МВС-100К и МВС-10П.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Multi-agent simulation of epidemics' distribution on supercomputers

Abstract. The paper considers the possibility of using modern supercomputers to solve resource-intensive problems of multi-agent simulation of the advance of mass epidemics based on the percolating cluster growth theory. In the problems of determining quarantine zones in advance of epidemics a multi-agent percolation model supposes the formation of an interaction grid of population representatives, modeling of a disease distribution medium, the collection of information on the population size, the implementation of a parallel algorithm for multiple marking of percolating clusters with a tagging mechanism, and result visualization. The article describes an improved variant of the algorithm of multiple marking of Hoshen-Kopelman percolation clusters for a multiprocessor system, as well as a working prototype of its implementation developed at the JSCC RAS (Branch of SRISA). This algorithm can be used in any area as a tool for differentiating large-size lattice clusters, since it has the input in a format that is independent of the application. The paper demonstrates the possibility of revealing the dependencies of latent periods of epidemic spread on the probability of infecting aggregates of population representatives and the formation of threshold values for the transition of local epidemics into large-scale pandemics. After setting a latent period, the chance and the source of infection one can determine the range of cities where infection can be expected. This information is used to determine the radius of a quarantine zone. If a hotbed of disease is found in some city and the latent period has already ended, then this tool might help to determine a zone to be isolated from the outside world. The article also provides estimates of the execution time of the multiple-labeling algorithm for Hoshen-Kopelman percolating clusters for different values of input parameters in two high-performance computing systems installed in the MSC RAS – MVS-100K and MVS-10P.

Текст научной работы на тему «Мультиагентное моделирование процессов распространения массовых эпидемий с использованием суперкомпьютеров»

УДК 519.673 Дата подачи статьи: 31.05.18

DOI: 10.15827/0236-235Х.031.3.640-644 2018. Т. 31. № 3. С. 640-644

Мультиагентное моделирование процессов распространения массовых эпидемий с использованием суперкомпьютеров

С.Ю. Лапшина 1, начальник научно-организационного отдела, [email protected]

1 Межведомственный суперкомпьютерный центр РАН - филиал ФНЦ НИИСИ РАН, г. Москва, 119334, Россия

В статье рассматривается возможность использования современных суперкомпьютеров при решении ресурсоемких задач мультиагентного моделирования процессов распространения массовых эпидемий на основе теории роста перколяционных кластеров.

Мультиагентная перколяционная модель в задачах определения карантинных зон при распространении эпидемий предполагает формирование решетки взаимодействия представителей популяции, моделирование среды распространения заболевания, сбор информации о численности населения, реализацию параллельного алгоритма многократной маркировки перколяционных кластеров с механизмом линковки меток, визуализацию полученных результатов.

Описываются усовершенствованный для применения на многопроцессорной системе вариант алгоритма многократной маркировки перколяционных кластеров Хошена-Копельмана, а также действующий прототип его реализации, разработанный в МСЦ РАН. Данный алгоритм может быть использован в любой области в качестве инструмента дифференцирования кластеров решетки большого размера, так как ему на вход подаются данные в не зависимом от приложения формате.

Демонстрируется возможность выявления зависимостей латентных периодов распространения эпидемий от вероятности инфицирования агрегатов популяционных представителей и формирования пороговых значений перехода локальных эпидемий в крупномасштабные пандемии. Задав латентный период, вероятность инфицирования и очаг заражения, можно определить круг городов, где можно ожидать инфицирование. Эта информация используется для определения радиуса карантинной зоны. Если в некотором городе обнаружен очаг заболевания и латентный период уже закончился, то с помощью данного инструмента определяется зона, которую нужно изолировать от внешнего мира.

В работе приводятся оценки времени выполнения алгоритма многократной маркировки перколяционных кластеров Хошена-Копельмана при различных значениях входных параметров на двух высокопроизводительных вычислительных системах, установленных в МСЦ РАН, - МВС-100К и МВС-10П.

Ключевые слова: мультиагентное моделирование, теория перколяции, перколяционный кластер, распространение эпидемий, высокопроизводительные вычислительные системы.

В практике компьютерного моделирования поведения сложных систем часто проявляется феномен скачкообразного и лавинообразного изменения характеристик поведения системы под воздействием плавных изменений одного или нескольких ключевых параметров. Так, при исследовании распространения массовых эпидемий относительно малые изменения значений одного или нескольких параметров (например, вероятности инфицирования) могут привести к скачкообразному изменению поведения всей системы (заболевание локального характера становится широкомасштабным). Одним из интересных и эффективных инструментов исследования подобных ситуаций является метод построения и анализа роста перколяционных кластеров.

Теория перколяции достаточно подробно описывает процессы на виртуальных решетках, по отношению к ним доказан ряд строгих утверждений. Для реализации широкомасштабных приложений подобных процессов эффективно используются возможности современных суперкомпьютерных технологий. Что, в свою очередь, требует разработки соответствующих моделей компьютерной имитации, в том числе мультиагентных [1-3], а также специализированных алгоритмов распараллеливания [4, 5].

Агентный подход в разработке имитационных моделей применяется во всех случаях, когда именно индивидуальное поведение объектов является существенным в системе, а интегральные характеристики и динамика всей системы выводятся из этих особенностей. Под агентом понимается некая сущность, которая обладает активностью, автономным поведением, может принимать решения в соответствии с определенными правилами, взаимодействовать с окружением и другими агентами, а также изменяться (эволюционировать) [6-8]. Агентные модели используются для исследования децентрализованных систем, динамика функционирования которых определяется не глобальными правилами и законами, а наоборот, эти глобальные правила и законы являются результатами индивидуальной активности агента или группы агентов. Цель агентной модели - получить представление об этих глобальных правилах, исходя из предположений об индивидуальном, частном поведении ее активных объектов и взаимодействии этих объектов в системе.

При создании агентной модели логика поведения агентов и их взаимодействие не всегда могут быть выражены чисто графическими средствами, часто приходится использовать программный код. Обычно для этих целей применяется язык Java.

С применением положений теории перколяции в МСЦ РАН - филиале ФНЦ НИИСИ РАН был разработан действующий прототип реализации алгоритма многократной маркировки перколяционных кластеров (ММПК) Хошэна-Копельмана [9] на языке Си с использованием библиотеки MPI. Он позволяет выделить связные подграфы (кластеры) некоторого графа (решетки), а также выяснить, к какому кластеру относится тот или иной узел решетки. Алгоритм был адаптирован для применения на многопроцессорной системе. Данный вариант алгоритма совпадает с однопроцессорным вариантом за одним исключением: вместо прохода по всей решетке каждый процессор активизирует действия алгоритма ММК только на выделенной ему группе узлов с последующим обменом информацией между процессорами.

Разработанный прототип был использован для исследования возникновения и распространения широкомасштабных эпидемий. Для формирования анализируемой решетки использовались общедоступные демографические данные о численности населения городов всего мира и некоторые предположения об интенсивности и характере взаимодействия между людьми. Для получения сведений о численности населения городов был разработан алгоритм обработки и анализа карт плотности населения (реализация на языке java). Сами карты были позаимствованы у Google при помощи Google Maps API, а для удобства восприятия результатов имитационных экспериментов были разработаны соответствующие средства визуализации.

Принципиальная схема действующего прототипа

Действующий прототип реализации алгоритма многократной маркировки перколяционных кластеров Хошэна-Копельмана, разработанный в МСЦ РАН, состоит из этапов, представленных на рисунке 1.

При помощи алгоритма сбора информации о численности населения (обработчик карт MapManager) были получены данные о городах мира и сохранены в БД в формате «номер города, численность населения, широта, долгота». БД городов содержит информацию о 56 976 городах с общей численностью населения 6 114 628 510 человек.

С помощью алгоритма формирования решетки взаимодействия представителей популяции (построитель графа GridBuilder) была создана исходная решетка (реализация на java) и сохранена в трех файлах: решетка grid размера 475 Мб и 2 файла edgesl и edges2 - ребра общим размером 429 Мб. Для каждого значения входного изменяемого параметра вероятности заражения при контакте с больным (параметр p = 0,01-1,00 с шагом 0,01) исходной решетки в оперативной памяти формируется анализируемая решетка.

Далее проводилась разбивка графа соседних городов на связанные подмножества алгоритмом Хо-шена-Копельмана (маркировка кластеров Load). Для каждой анализируемой решетки запускался алгоритм ММК. Работу алгоритма можно разделить на три этапа.

Этап. 1. Инициализация: первый процесс загружает решетку в оперативную память из файла, преобразует ее по входным параметрам, распределяет узлы в группы по процессам и отсылает им. Остальные процессы ждут получения своей группы узлов. Получив такую группу, процессы выделяют из них подгруппу внешне связанных узлов, то есть узлов, связанных с узлами из групп других процессов. Для каждого узла своей группы задаются начальные значения меток в соответствии с абсолютным (в рамках всей решетки) номером узла. Каждый процесс создает группу внешних уз-

Рис. 1. Схема действующего прототипа Fig. 1. The scheme of the working prototype

лов, связанных с узлами своей группы, и инициализирует их метками связанных узлов своей группы.

Этап 2. Работа собственно алгоритма. Каждый процесс запускает алгоритм ММК на своей группе узлов.

Этап 3. Обмен информацией. Происходит в несколько шагов до тех пор, пока после очередного обмена метки узлов всех процессов не перестанут изменяться. Обмен информацией можно разделить на три шага. Первый шаг - каждый процесс посылает значения меток узлов из подгруппы внешне связанных узлов тем процессам, с которыми эти узлы связаны. Второй шаг - каждый процесс принимает значения меток от процессов, имеющих узлы, связанные с узлами данного. Эти значения присваиваются меткам узлов из группы внешних узлов. Если хоть одна из меток узлов из внешней группы была изменена, процесс должен повторить обмен информацией. Все метки узлов своей группы, равные замененным меткам внешней группы, должны быть также заменены. Третий шаг - отправка сообщения первому процессу о том, должен или нет данный процесс повторить обмен информацией с другими процессами. Первый процесс получает от всех процессов подобную информацию. Если все процессы не нуждаются в повторном обмене, первый процесс рассылает всем остальным сигнал о завершении работы всего алгоритма и начинает процедуру сбора данных по меткам их узлов. Если же хоть один процесс прислал сообщение, что ему необходимо продолжить обмен, всем процессам придется повторить процедуру обмена информацией.

В качестве результата маркировки кластеров был получен массив кластерных меток (с индексами от 1 до 100). Размер каждого сохраненного массива составляет около 24 Мб.

Программа маркировки кластеров Load запускалась в Межведомственном суперкомпьютерном центре на суперкомпьютере МВС-100К с общим количеством процессорных ядер 13 004 на 48 264

процессорах. Среднее время выполнения программы с входным параметром p от 0,01 до 1 с шагом в 0,01 при постоянных значениях t = 1, 3, 5, 10, 15, 20, 25, 30 дней составило около 10 минут для каждого значения t [10].

На суперкомпьютере МВС-10П с общим количеством процессорных ядер 28 704 среднее время выполнения этой программы составило около 5 минут.

На следующем этапе проводился имитационный эксперимент с определенным городом (преобразователь кластеров GridTransformer). Визуализация полученных результатов в модели проводится с помощью Google Maps Api (реализация на java).

Выбирался город - очаг заражения, задавалось количество зараженных узлов в этом городе, и для данных p и t загружался вычисленный ранее массив кластерных меток. После определения меток зараженных узлов выбранного города проводился последовательный обход меток всех узлов из загруженного массива. Если метка являлась потенциально зараженной, то город, в который входил узел с данной меткой, также объявлялся потенциально зараженным. Таким образом формировался список потенциально зараженных городов. Этот список сохранялся в виде JavaScript-команд Google Maps API в html-файле. В зависимости от численности населения зараженный город помечался красным кругом определенного размера. Для визуализации результатов html-файл запускался в браузере.

Результаты моделирования попыток предсказания распространения массовых эпидемий

На рисунке 2 демонстрируется результат проведения численного эксперимента при размещении очага заражения в г. Токио, который является ближайшим крупным населенным пунктом к возможным местам вскрытия и расконсервации захоронений бактериологических отходов (под воздействием тектонических разломов, резкого потеп-

^ 3 <u 3

Г*-.J-/-I^T'l**"»^Г' ' ^ ** '

J

s — 8 j

-12 J

I

V Вероятность, %

Рис. 2. Вероятность инфицирования в районе г. Токио Fig. 2. The chance of infection in Tokyo's district

ления, террористических актов, промышленных аварий и т.д.).

Как видно, максимальная вероятность инфицирования в районе Токио достигает ~ 0.3, то есть уже при вероятности инфицирования 0.3 эпидемия за счет высокой плотности населения в регионе может превратиться в широкомасштабную пандемию.

На рисунке 3 продемонстрированы результаты имитационных экспериментов при возникновении очага заражения в районе г. Токио.

В период с 5-го по 7-й день виден резкий скачок размера потенциально зараженного кластера и эпидемия имеет все шансы распространиться по миру.

Проводились численные эксперименты и с размещением очага заражения в городах России. На рисунке 4 продемонстрированы результаты имитационных экспериментов при возникновении очага заражения в районе г. Иваново. Результаты показывают, что даже при более высокой вероятности инфицирования и более длительном периоде, чем в Токио, эпидемия в стадию пандемии не переходит.

Расчеты проводились в Межведомственном суперкомпьютерном центре Российской академии наук на высокопроизводительных вычислительных системах МВС-100К и МВС-10П.

7-ой де(ь

Рис. 3. Очаг заражения в районе г. Токио на 1-й, 5-й и 7-й день развития эпидемии

Fig. 3. The site of infection in Tokyo's district on the 1st, 5th and 7th day of epidemic development

Работа выполнена в МСЦ РАН в рамках государственного задания по теме «Разработка архитектур, системных решений и методов для создания вычислительных комплексов и распределенных сред мультипетафлопсного диапазона производительности, в том числе нетрадиционных архитектур микропроцессоров» (№ 0065-2018-0409).

Начальный очаг инфицирования = 100 узлов Латентный период = 30 дней Вероятность инфицирования = 0,4

А* .

гг г • —'

ч

Уфам йчцч'ИЖ* — ^

»

jr

■I ии^

Рис. 4. Очаг заражения в районе г. Иваново на 5-й и 20-й день развития эпидемии Fig. 4. The site of infection in Ivanovo's district on the 5th and 20th day of epidemic development

Литература

1. Калихман Р.С., Шебеко Ю.А. Моделирование роста перколяционных кластеров на компьютерах с сильно выраженной параллельной архитектурой // Вычислительные технологии: сб. науч. тр. СО РАН. 1995. Т. 4. № 10. 344 с.

2. Кондратьев М.А., Ивановский Р.И., Цыбалова Л.М. Применение агентного подхода к имитационному моделированию процесса распространения заболевания // Науч.-технич. ведомости СПбГУ. 2010. Т. 2. № 2. С. 189-195.

3. Тарасевич Ю.Ю. Перколяция: теория, приложения, алгоритмы. М.: УРСС, 2002. 64 с.

4. Korneev V., Semenov D., Kiselev A., Shabanov B., Tele-gin P. Multiagent distributed Grid scheduler. Proc. Federated Conf. on Comp. Sc. and Inform. Syst., 2011, pp. 577-580.

5. Телегин П.Н. Настройка выполнения параллельных про-

грамм // Программные продукты и системы. 2012. № 4. С. 25-30.

6. Карпов Ю.Г. Имитационное моделирование систем. Введение в моделирование с AnyLogic 5. СПб: БХВ-Петербург. 2005. 400 с.

7. Утакаева И.Х. Имитационное моделирование распространения эпидемий на основе агентного подхода // Науч. журн. кУбГАУ. 2016. № 121. URL: http://ej.kubagro.ru/2016/07/pdf/ 85.pdf (дата обращения: 04.03.2018).

8. Боев Б.В. Прогнозно-аналитические модели эпидемий. М., 2005. 10 с.

9. Лапшина С.Ю. Высокопроизводительные вычисления в практике моделирования роста перколяционных кластеров // Программные продукты и системы. 2011. № 4. С. 75-79.

10. Клинов М.С., Лапшина С.Ю., Телегин П.Н., Шабанов Б.М. Особенности использования многоядерных процессоров в научных вычислениях // Вестн. УГАТУ. 2012. Т. 16. № 6. С. 25-31.

Software & Systems Received 31.05.18

DOI: 10.15827/0236-235X.031.3.640-644 2018, vol. 31, no. 3, pp. 640-644

Multi-agent simulation of epidemics' distribution on supercomputers S.Yu. Lapshina l, Head of the Scientific-organizational Department, [email protected] 1 Joint Supercomputer Center of RAS, Moscow, 119991, Russian Federation

Abstract. The paper considers the possibility of using modern supercomputers to solve resource-intensive problems of multi-agent simulation of the advance of mass epidemics based on the percolating cluster growth theory.

In the problems of determining quarantine zones in advance of epidemics a multi-agent percolation model supposes the formation of an interaction grid of population representatives, modeling of a disease distribution medium, the collection of information on the population size, the implementation of a parallel algorithm for multiple marking of percolating clusters with a tagging mechanism, and result visualization.

The article describes an improved variant of the algorithm of multiple marking of Hoshen-Kopelman percolation clusters for a multiprocessor system, as well as a working prototype of its implementation developed at the JSCC RAS (Branch of SRISA). This algorithm can be used in any area as a tool for differentiating large-size lattice clusters, since it has the input in a format that is independent of the application.

The paper demonstrates the possibility of revealing the dependencies of latent periods of epidemic spread on the probability of infecting aggregates of population representatives and the formation of threshold values for the transition of local epidemics into large-scale pandemics. After setting a latent period, the chance and the source of infection one can determine the range of cities where infection can be expected. This information is used to determine the radius of a quarantine zone. If a hotbed of disease is found in some city and the latent period has already ended, then this tool might help to determine a zone to be isolated from the outside world.

The article also provides estimates of the execution time of the multiple-labeling algorithm for Hoshen-Kopelman percolating clusters for different values of input parameters in two high-performance computing systems installed in the MSC RAS - MVS-100K and MVS-10P.

Keywords: multi-agent simulation, theory of percolation, percolating cluster, advance of an epidemic, high-performance computing systems.

Acknowledgements. The work has been done in the Joint Supercomputer Center ofRAS within the framework of the state assignment "Development of architectures, system solutions and methods for creating computational complexes and distributed environments of the multipetaflop performance range including non-traditional microprocessor architectures" (no. 0065-2018-0409).

References

1. Kalikhman R.S., Shebeko Yu.A. Modeling the growth of percolating clusters on computers with a strongly pronounced parallel architecture. Computational Technologies: Proc. SB RAS. 1995, vol. 4, no. 10, 344 p. (in Russ.).

2. Kondratev M.A., Ivanovsky R.I., Tsybalova L.M. Application of the agent approach to the simulation of the spread of the disease. Sci. and Tech. Reports of the Peter the Great St. Petersburg Polytechnic Univ. 2010. vol. 2, no. 2, pp. 189-195 (in Russ.).

3. Tarasevich Yu.Yu. Percolation: Theory, Applications, Algorithms. Moscow, URSS Publ., 2002, 64 p.

4. Korneev V., Semenov D., Kiselev A., Shabanov B., Telegin P. Multiagent Distributed Grid Scheduler. Proc. of the Federated Conf on Computer Science and Information Systems. 2011, pp. 577-580.

5. Telegin P.N. Configuring the Execution of Parallel Programs. Software & Systems. 2012, no. 4, pp. 25-30 (in Russ.).

6. Karpov Yu.G. System Simulation. Introduction to Modeling with AnyLogic 5. St. Petersburg, BHV-Peterburg Publ., 2005, 400 p.

7. Utakaeva I.Kh. Simulation modeling of distribution of epidemics on the basis of agent approach. Scientific J. of KubSAU. 2016, no. 121. Available at: http://ej.kubagro.ru/2016/07/pdf/85.pdf (accessed March 4, 2018).

8. Boev B.V. Predictive-Analytical Models of Epidemics. Moscow, 2005, 10 p.

9. Lapshina S.Yu. High-performance computing in the practice of modeling the growth of percolating clusters. Software & Systems. 2011, no. 4, pp. 75-79 (in Russ.).

10. Klinov M.S., Lapshina S.Yu., Telegin P.N., Shabanov B.M. Features of Using Multi-Core Processors in Scientific Computing. Bulletin of USATU. 2012, vol. 16, no. 6, pp. 25-31 (in Russ.).

i Надоели баннеры? Вы всегда можете отключить рекламу.