Научная статья УДК 004.5
doi:10.37614/2949-1215.2022.13.2.005
РАЗРАБОТКА МОДУЛЯ ФОРМИРОВАНИЯ ПРОФИЛЕЙ ПОЛЬЗОВАТЕЛЕЙ ДЛЯ СИСТЕМЫ ПОДДЕРЖКИ ПРИНЯТИЯ РЕШЕНИЙ В ОБЛАСТИ УПРАВЛЕНИЯ ПРОМЫШЛЕННО-ПРИРОДНЫМИ КОМПЛЕКСАМИ
Борис Михайлович ПилецкийАлександр Владимирович Вицентий2
12Институт информатики и математического моделирования имени В. А. Путилова Кольского научного центра Российской академии наук, Апатиты, Россия 1gideon.stl@gmail.com^, https://orcid.org/0000-0003-3141-9595 2alx_2003@mail.ru, https://orcid.org/0000-0003-1331-4749
Аннотация
Описывается обобщённая архитектура системы поддержки принятия решений в области управления промышленно-природными комплексами (ППК), особенностью которой является возможность учета специфических потребностей пользователей за счет интеграции модуля формирования профилей пользователей. Рассмотрены структура, взаимосвязь основных компонентов, информационные потоки и реализуемые в рамках данной архитектуры функции. В заключительной части статьи приводятся выводы, которые были сделаны при разработке обобщённой архитектуры системы, рассмотрены возможные пути дальнейшего исследования. Ключевые слова:
система поддержки принятия решений, профиль пользователя, архитектура СППР, картографический интерфейс, геовизуализация Для цитирования:
Пилецкий Б. М., Вицентий А. В. Разработка модуля формирования профилей пользователей для системы поддержки принятия решений в области управления промышленно-природными комплексами // Труды Кольского научного центра РАН. Серия: Технические науки. 2022. Т. 13, № 2. С. 59-65. doi:10.37614/2949-1215.2022.13.2.005
Original article
DEVELOPMENT OF A USER PROFILING MODULE FOR A DECISION SUPPORT SYSTEM FOR MANAGEMENT OF INDUSTRIAL AND NATURAL COMPLEXES
Boris M. PileckiyAleksander V. Vicentiy2
12Putilov Institute for Informatics and Mathematical Modeling of the Kola Science Centre of the Russian Academy of Sciences, Apatity, Russia 1gideon.stl@gmail.comhttps://orcid.org/0000-0003-3141-9595 2alx_2003@mail.ru, https://orcid.org/0000-0003-1331-4749
Abstract
This paper describes the generalized architecture of the decision support system in the field of management of industrial and natural complexes, the feature of which is the ability to take into account the specific needs of users through the integration of the module of formation of user profiles. The structure, the relationship of the main components, information flows and realized in the framework of this architecture functions are considered. In the conclusion the results, which were obtained during the development of the generalized architecture of the system, are presented and the possible directions of further research are considered. Keywords:
decision support system, user profile, DSS architecture, mapping interface, geo-visualization For citation:
Piletskii B. M., Vicentiy A. V. Development of a user profiling module for a decision support system for management of industrial and natural complexes // Transactions of the Kola Science Centre of RAS. Series: Engineering Sciences. 2022. Vol. 13, No. 2. P. 59-65. doi:10.37614/2949-1215.2022.13.2.005
Введение
В настоящее время промышленность переходит на новую ступень развития [1]. Цифровизация и внедрение технологий моделирования производственных процессов требуют пересмотра прежних подходов к организации управления. Сложность протекающих в промышленности процессов увеличивается, и всё более важным фактором становятся эффективные управленческие решения. Некоторые вопросы информационно-аналитического обеспечения управления ППК как сложной междисциплинарной области фундаментальных и прикладных исследований освещены в работах [2-4].
При решении задач по управлению ППК лицу, ответственному за принятие решений (ЛПР), необходимо учитывать ряд факторов, оказывающих существенное влияние на объекты управления. Поскольку ППК является сложной пространственно распределённой системой, учёт всех особенностей объекта управления требует наличия квалифицированных специалистов. Дополнительные сложности возникают из-за природно-климатических особенностей [5]. В связи с этим широкое распространение получили системы поддержки принятия решений (СППР). Данный инструмент позволяет облегчить принятие управленческих решений, помогает учесть различные факторы, связанные с потенциальным решением. В процессе управления сложными пространственно распределёнными системами решаются разноплановые задачи, поэтому разработка СППР, которая в автоматизированном режиме формирует адаптивный картографический интерфейс, учитывающий специфику задачи и потребности пользователя, является актуальной задачей.
Для СППР характерно, что в них поступают данные из различных источников. При этом эти данные, как правило, являются разнородными и поступают в систему в неформализованном виде, что повышает когнитивную нагрузку на ЛПР [6]. Одним из способов снижения такого типа нагрузки является визуализация. Получаемые данные представляют в виде наглядного изображения, картографического интерфейса, на котором отображены данные по текущей задаче.
В зависимости от задачи объёмы необходимых данных могут различаться, поэтому нет необходимости использовать для визуализации весь массив имеющихся данных. Учёт особенностей пользователей СППР является одним из способов повышения эффективности взаимодействия с системой, что, в свою очередь, позволяет более быстро принимать эффективные решения за счёт получения репрезентативного представления информации.
В рамках данной работы предложен модуль формирования профилей пользователей для СППР в области управления ППК, который интегрируется в структуру обобщенной архитектуры СППР и позволяет реализовать адаптивный подход к визуализации пространственной информации. Геоданные выбраны в качестве объекта визуализации, поскольку на сегодняшний день в большинстве документов, используемых в процессе принятия решений, в том или ином виде содержится географическая привязка [7].
Материалы и методы
Информация, которая необходима для принятия решений, зачастую представлена в виде текстовых документов на естественном языке. Поэтому для принятия решений, связанных с управлением пространственно распределенными объектами, к которым относится ППК, необходимо осуществлять лексико-синтаксический анализ текстов с целью выявления в них пространственных данных.
В данной работе мы используем подход Named Entity Recognitin (NER) — распознавание именованных сущностей [8]. В рамках предыдущего этапа исследования были предложены технологии лексико-синтаксического анализа текстов на естественном языке, позволяющие учитывать контекст решаемой пользователем задачи [9, 10]. В частности, для извлечения пространственных данных из текстов предлагается использовать возможности Томита-парсера, анализирующего тексты на основе правил (rule-based approach) [11, 12]. Базовый набор правил в виде контекстно-свободных грамматик для решения задачи NER был предложен в одной из предыдущих работ [10].
При разработке обобщённой архитектуры СППР для задач в области управления ППК используются методы системного анализа, функционально-целевого анализа. Для получения пространственных координат геообъектов, выявленных при анализе текстов, используются методы обратного геокодирования
с помощью клиента Python «geopy», который позволяет осуществлять взаимодействие с различными геоинформационными сервисами. Для решения задач построения картографических интерфейсов использованы возможности одной веб-версии географической информационной системы (ГИС).
Учет особенностей и информационных потребностей пользователей при работе с системой реализуется с помощью моделей пользователей. Синтез этих моделей осуществляется на основе применения метода стереотипов (профилей) [13]. Также при моделировании пользователей учитываются некоторые наработки из области когнитивной психологии и создания когнитивных интерфейсов, позволяющие повысить эффективность работы ЛПР в процессе принятия решений за счёт учёта его индивидуальных особенностей [14].
Обобщённая архитектура СППР
Разрабатываемая обобщённая архитектура СППР в области управления ППК состоит из нескольких уровней, на которых реализуются различные функции для решения ряда задач. Данная архитектура описывает общую концепцию, определяет структуру модулей и их взаимосвязи в рамках системы.
Для того чтобы разработка обобщённой архитектуры была эффективной, предварительно необходимо выделить основные функции СППР: 1) cбор и обработка информации из различных источников, первичный анализ получаемых данных; 2) обеспечение работоспособности хранилища данных, осуществляющее организацию хранения и предоставления данных в соответствии с запросами пользователей; 3) создание пользовательских профилей на основе анализа поведения пользователя и информации, используемой им для принятия решений (сведения об используемой пользователем информации формируются на основе анализа запросов пользователя к хранилищу данных); 4) обработка данных согласно пользовательским запросам (для работы используются методы интеллектуального анализа данных); 5) предоставление ЛПР релевантной информации в удобной для восприятия форме с учётом особенностей каждого конкретного пользователя (для этого используются методы динамической когнитивной визуализации данных в рамках построения когнитивных геоинтерфейсов, используемых в СППР в области управления ППК); 6) иные функции, к которым относятся поддержка целостности накопленных данных, мероприятия по обеспечению информационной безопасности, включая защиту персональных данных пользователей системы, и т. д.
Принимая во внимание вышеперечисленный список функций, разработана обобщённая архитектура СППР в области управления ППК (рис. 1).
Представленная архитектура с модулем формирования профилей пользователей состоит из нескольких модулей, в которых реализованы различные функции. Разнородная информация поступает в СППР из внешних источников.
В рамках модуля ввода данных осуществляется сбор, агрегирование, хранение разнородных данных в произвольных форматах, полученных из гетерогенных внешних источников. Затем проводится валидация, в ходе которой информация проходит несколько проверок на корректность, согласно установленным ограничениям и критериям. Проведение валидации на предварительном этапе позволяет избежать попадания невалидных данных в модуль хранения данных СППР в области управления ППК.
После проведения валидации по-прежнему требуется привести данные к общему виду, поскольку они всё ещё будут оставаться разнородными. Для этого обычно проводят гармонизацию, в ходе которой используются функции предварительной обработки данных, например согласование их формата или метрических систем. В результате получается согласованный набор данных, который направляется в блок агрегирования и записи, входящий в модуль ввода данных в систему, после чего они отправляются в хранилище.
После выполнения вышеописанных мероприятий заготовленные данные направляются в модуль доступа к хранилищу данных и работы с данными. Основу этого модуля составляет хранилище данных. С целью повышения эффективности взаимодействия с пользователями ведётся запись истории их взаимодействия с системой. Предлагаемая архитектура разграничивает обработку и хранение данных, что позволяет вносить корректировки в механизмы и процедуры работы с ними, при этом сохраняется целостность модуля доступа к хранилищу данных и работы с данными. К этому хранилищу поступают запросы на получение необходимых данных для последующей визуализации.
Рис. 1. Обобщённая архитектура СППР с модулем формирования профилей пользователей
Наиболее важным модулем в представленной обобщённой архитектуре является модуль анализа данных. В его состав включаются основные методы и инструменты для манипуляции с данными в рамках системы. В основе модуля лежат технологии, подходы, модели и методы, которые были разработаны в рамках предыдущих исследований [9, 10]. В результате работы модуля получаются подготовленные для визуализации данные.
Для взаимодействия с СППР в области управления ППК используется инструментарий для формирования и обработки пользовательских запросов к хранилищам данных системы, а также для анализа получаемой информации. Доступ пользователей к основному инструментарию системы осуществляется через веб-интерфейс. Это сделано с целью понижения когнитивной нагрузки на пользователя, поскольку устраняется необходимость осваивать новый интерфейс, предлагается работать в браузере, а большинство пользователей компьютером имеют опыт взаимодействия с аналогичными веб-интерфейсами в рамках иных систем и приложений. Помимо этого, использование веб-интерфейса понижает требования к аппаратному обеспечению и расширяет потенциальную пользовательскую базу. Это обуславливается тем, что веб-сервисы зачастую менее требовательные, чем полноценные приложения, реализованные на стороне клиента.
Учёт типов пользователей расширяет возможности по адаптации работы системы с целью повышения эффективности взаимодействия с пользователями. Наличие в представленной СППР хранилища профилей, в которое записывается информация о пользователях, позволяет обеспечить индивидуальный подход к ним. Учёт особенностей ЛПР повышает эффективность принимаемых решений при решении задач в области управления ППК за счёт корректирования работы системы согласно особенностям конкретного пользователя и, следовательно, предоставления ЛПР информации в наиболее доступной форме.
Запросы ЛПР проходят через модуль анализа запросов, откуда направляются в модуль доступа к хранилищу данных и в модуль формирования профилей.
Модуль формирования профилей записывает информацию о взаимодействии пользователя с системой в хранилище профилей. В результате формируются профили пользователей. Это позволяет на основе анализа данных сделать выводы о том, в каком наиболее предпочтительном для конкретного пользователя виде следует предоставлять информацию, например, в формате текстовых документов, видео или инфографики, а также позволяет адаптировать геоинтерфейсы согласно пользовательским предпочтениям. Для построения геоинтерфейсов в данной СППР предлагается использовать веб-технологии, что дает возможность оперативной адаптации изображений в соответствии с особенностями пользователя и контекста решаемой задачи.
В рамках данного исследования были определены некоторые типы пользователей (основой для классификации послужила их специализация): «промышленник», «эколог», «экономист», «кадастровый специалист», «универсальный», «базовый».
Пользователь типа «эколог» заинтересован в получении информации о различных объектах ППК и их влиянии на экологию, например уровень выброса предприятия и его близость к водоёмам. Пользователь типа «экономист» исследует влияние объектов ППК на экономику, собирает информацию о типах продукции и объёме производств, анализирует различные экономические показатели. Пользователю типа «кадастровый специалист» необходима информация о типе земель, представленных в ППК. Тип «базовый» присваивается пользователю при первом сеансе работы с системой, а тип «универсальный» предназначен для пользователей, которых нельзя отнести ни к одному из других типов.
Пользователь типа «промышленник» прежде всего заинтересован в получении геопространственной информации о расположении промышленных предприятий, их удалённости от ключевых объектов инфраструктуры (например, электростанций), наличии транспортной инфраструктуры вблизи предприятия. На рис. 2 представлен фрагмент прототипа картографического интерфейса для данного типа пользователей, на котором представлены некоторые промышленные объекты.
Iimbh
Шнлнлл ÉbinriHÍib ПАП *ТГК-1.
.............^IM.
Рис. 2. Фрагмент картографического интерфейса для пользователя типа «промышленник» Заключение
Предложенный в работе модуль формирования профилей пользователей для СППР в области управления ППК позволяет усовершенствовать процесс принятия решений и реализовать адаптивный подход к визуализации пространственной информации за счёт учета особенностей и информационных потребностей пользователей при работе с системой. Также предложено интегрировать в обобщенную архитектуру СППР дополнительные процедуры лексико-синтаксического анализа данных, используемых в процессе принятия решений, с целью выявления в них пространственных данных.
Направление дальнейших исследований может быть связано с расширением набора моделей пользователей СППР по управлению ППК, а также их формализованного описания, позволяющего реализовать функции когнитивной геовизуализации в рамках существующих ГИС.
Список источников
1. Santos B., Charrua-Santos F. et al. Industry 4.0: an overview // Proceedings of the World Congress on Engineering, 2018.
2. Yakovlev S., Shemyakin A., Oleinik A. Information and analytical support of the Arctic industrial-natural complexes safety // IOP Conference Series: Earth and Environmental Science: International Round Table "Industry 4,0 Technologies in the Arctic". 2021. P. 012015.
3. Fridman A., Oleinik A. Situational information system for decision-making support regarding industry-natural complexes // 17th International Industrial Simulation Conference. 2019. P. 41-45.
4. Fridman A., Kulik B. Situation Awareness in Modeling Industrial-Natural Complexes // Lecture Notes in Networks and Systems. 2020. Vol. 95. P. 247-256.
5. Bondareva N. N. Modern Approaches to Arctic Development in View of Synergy Potential in the New Risks and Challenges Environment // Modernization Innovation Research. 2021. № 12 (1). P. 23-33.
6. Solso R., Kimberly M., Maclin O. Cognitive Psychology 7/e: International edition, Boston, 2007. P. 624.
7. Hahmann S., Burghardt D. How much information is geospatially referenced? Networks and cognition // International Journal of Geographical Information Science. 2013. Vol. 27. P. 1171-1189.
8. Palshikar G. Techniques for Named Entity Recognition: A Survey // Collaboration and the Semantic Web: Social Networks, Knowledge Networks and Knowledge Resources. 2012. P. 191-217.
9. Vicentiy A. V., Dikovitsky V. V., Shishaev M. G. Automated Extraction and Visualization of Spatial Data Obtained by Analyzing Texts about Projects of Arctic Transport // Advances in Intelligent Systems and Computing. 2019. P. 419-433.
10. Pilecki B., Vicentiy A. Development of a method for extracting spatial data from texts for visualization and information decision-making support for territorial management // IOP Conference Series Earth and Environmental Science. Institute of Physics Publishing, 2020. Vol. 509.
11. Сулейманов Р. Извлечение метаданных из полнотекстовых электронных русскоязычных изданий при помощи Томита-парсера // Программные продукты и системы. 2016. № 29. С. 58-62.
12. Hardjojo A., Gunachandran A. Validation of a Natural Language Processing Algorithm for Detecting Infectious Disease Symptoms in Primary Care Electronic Medical Records in Singapore // JMIR Medical Informatics. 2018. № 6 (2). P. 36-51.
13. Kocsis O., Vildjiounaite E. User Modeling and Profiling: Stereotype-based and context-dependent modeling of individual and multi-user preferences. Amigo Project Workshop, Eindhoven, 2008.
14. Miller G. The magic number seven, plus or minus two: Some limits on our capacity for processing information // Psychological Review. 1956. № 63 (2) P. 81-97.
References
1. Santos B., Charrua-Santos F., Lima T. Industry 4.0: an overview. Proceedings of the World Congress on Engineering, 2018.
2. Yakovlev S., Shemyakin A., Oleinik A. Information and analytical support of the Arctic industrial-natural complexes safety. IOP Conference Series: Earth and Environmental Science: International Round Table "Industry 4,0 Technologies in the Arctic", 2021, pp. 012015.
3. Fridman A., Oleinik A. Situational information system for decision-making support regarding industry-natural complexes. 17th International Industrial Simulation Conference, 2019, pp. 41-45.
4. Fridman A., Kulik B. Situation Awareness in Modeling Industrial-Natural Complexes. Lecture Notes in Networks and Systems, 2020, vol. 95, pp. 247-256.
5. Bondareva N. N. Modern Approaches to Arctic Development in View of Synergy Potential in the New Risks and challenges Environment. Modernization Innovation Research, 2021, no. 12 (1), pp. 23-33.
6. Solso R., Kimberly M., Maclin O. Cognitive Psychology 7/e: International edition. Boston, 2007, p. 624.
7. Hahmann S., Burghardt D. How much information is geospatially referenced? Networks and cognition. International Journal of Geographical Information Science, 2013, vol. 27, pp. 1171-1189.
8. Palshikar G. Techniques for Named Entity Recognition: A Survey. Collaboration and the Semantic Web: Social Networks, Knowledge Networks and Knowledge Resources, 2012, pp. 191-217.
9. Vicentiy A V., Dikovitsky V. V., Shishaev M. G. Automated Extraction and Visualization of Spatial Data Obtained by Analyzing Texts About Projects of Arctic Transport. Advances in Intelligent Systems and Computing, 2019, pp. 419-433.
10. Pilecki B., Vicentiy A Development of a method for extracting spatial data from texts for visualization and information decision-making support for territorial management. IOP Conference Series Earth and Environmental Science. Institute of Physics Publishing, 2020, vol. 509.
11. Suleymanov R. Izvlechenie metadannix iz polnotekstovix electronnix rysskoyazichnix izdaniy pri pomoshi Tomita-parsera [Extracting metadata from full-text electronic Russian-language publications using tomita parser]. Programmnieprodykti i sistemi [Software Products and Systems], 2016, no. 29, pp. 58-62.
12. Hardjojo A., Gunachandran A. Validation of a Natural Language Processing Algorithm for Detecting Infectious Disease Symptoms in Primary Care Electronic Medical Records in Singapore. JMIR Medical Informatics, 2018, no. 6 (2), pp. 36-51.
13. Kocsis O., Vildjiounaite E. User Modeling and Profiling: Stereotype-based and context-dependent modeling of individual and multi-user preferences. Amigo Project Workshop, Eindhoven, 2008.
14. Miller G. The magic number seven, plus or minus two: Some limits on our capacity for processing information. Psychological Review, 1956, no. 63 (2), pp. 81-97.
Информация об авторах
Б. М. Пилецкий — аспирант;
A. В. Вицентий — кандидат технических наук, старший научный сотрудник.
Information about the authors
B. M. Pileckiy — post-graduate student;
A. V. Vicentiy — Candidate of Science (Tech.), Senior Research Fellow.
Статья поступила в редакцию 15.10.2022; одобрена после рецензирования 09.11.2022; принята к публикации 14.11.2022.
The article was submitted 15.10.2022; approved after reviewing 09.11.2022; accepted for publication 14.11.2022.