Научная статья на тему 'МЕТОД ПО СОВЕРШЕНСТВОВАНИЮ ИНФОРМАЦИОННО- АНАЛИТИЧЕСКОЙ РАБОТЫ НА ОСНОВЕ КОМПЛЕКСИРОВАНИЯ РЕЗУЛЬТАТОВ РАСПОЗНАВАНИЯ СОСТОЯНИЙ ОБЪЕКТОВ КОНТРОЛЯ С ИСПОЛЬЗОВАНИЕМ МЕТОДОВ МАШИННОГО ОБУЧЕНИЯ'

МЕТОД ПО СОВЕРШЕНСТВОВАНИЮ ИНФОРМАЦИОННО- АНАЛИТИЧЕСКОЙ РАБОТЫ НА ОСНОВЕ КОМПЛЕКСИРОВАНИЯ РЕЗУЛЬТАТОВ РАСПОЗНАВАНИЯ СОСТОЯНИЙ ОБЪЕКТОВ КОНТРОЛЯ С ИСПОЛЬЗОВАНИЕМ МЕТОДОВ МАШИННОГО ОБУЧЕНИЯ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
61
19
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ИДЕНТИФИКАЦИЯ СОСТОЯНИЙ ОБЪЕКТОВ / НЕЙРОННЫЕ СЕТИ / НЕЧЕТКАЯ ЛОГИКА / ВЕРОЯТНОСТНЫЙ АНАЛИЗ / КОМПЛЕКСНАЯ ОБРАБОТКА / МОДЕЛИРОВАНИЕ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Панков А.В., Крибель А.М., Лаута О.С., Васильев Н.А.

Введение: В настоящее время, в различных сферах государственного и регионального управления все более остро проявляются проблемы, связанные с необходимостью постоянного мониторинга ключевых параметров функционирования сложных объектов. Потребность в непрерывной актуализации знаний о функционировании объектов в виде формализованных моделей, в условиях непрерывно изменяющихся ситуационных условий исследуемых процессов, определяет необходимость использования новых технологий обработки данных при ведении информационно-аналитической работы. Цель работы заключается в разработке концептуального подхода к совершенствованию процессов информационно-аналитической работы при решении задач распознавания состояния частично наблюдаемых объектов управления с использованием методов машинного обучения. Используемые методы: реализованные в методах машинного обучения алгоритмы позволяют выявить в имеющихся исходных данных различные закономерности и отразить их в формируемой модели объекта контроля в виде параметров, а использование конечного автомата определяет содержание процессов проведения оперативных расчетов, реализуемых в раз личных ситуационных условиях, задаваемых текущей полнотой и достоверностью исходных данных. Научная новизна заключается в том, что предложенный метод определяет качественно новое содержание процессов обработки информации, а автоматизация процессов разработки и актуализации моделей объектов контроля создает условия для существенного расширения признакового пространства, учитываемого при ведении информационно-аналитической работы, а также обеспечивает возможность получения более достоверных результатов в интересах рационального управления сложными объектами и процессами. Результат: представленный метод позволяет оценить качество информационного решения при объединении результатов полученных с использованием методов машинного обучения. Основу предложенного подхода формирует способ агрегирования результатов неравноточного распознавания состояний объектов с использованием нескольких методов идентификации. Практическая значимость: представленный метод является универсальным и может быть применена в системах информационного обеспечения органов государственного управления при решении задач, связанных с обеспечением общественной безопасности.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Панков А.В., Крибель А.М., Лаута О.С., Васильев Н.А.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

METHOD FOR IMPROVING INFORMATION AND ANALYTICAL WORK BASED ON THE INTEGRATION OF THE RESULTS OF RECOGNITION OF THE STATES OF CONTROL OBJECTS USING MACHINE LEARNING METHODS

Introduction: Introduction: Currently, in various spheres of state and regional management, problems related to the need for constant monitoring of key parameters of the functioning of complex facilities are becoming more acute. The need for continuous updating of knowledge about the functioning of objects in the form of formalized models, in the conditions of continuously changing situational conditions of the processes under study, determines the need to use new data processing technologies when conducting information and analytical work. The purpose of the work is to develop a conceptual approach to improving the processes of information and analytical work in solving problems of recognizing the state of partially observed control objects using machine learning methods. Methods used: the algorithms implemented in machine learning methods allow us to identify various patterns in the available source data and reflect them in the generated model of the object of control in the form of parameters, and the use of a finite automaton determines the content of the processes of operational calculations implemented in various situational conditions set by the current completeness and reliability of the source data. The scientific novelty lies in the fact that the proposed method determines a qualitatively new content of information processing processes, and automation of the processes of developing and updating models of control objects creates conditions for a significant expansion of the feature space taken into account when conducting information and analytical work, and also provides the opportunity to obtain more reliable results in the interests of rational management of complex objects and processes. Result: the presented method makes it possible to evaluate the quality of the information solution when combining the results obtained using machine learning methods. The basis of the proposed approach is formed by the method of aggregating the results of non- precision recognition of the states of objects using several identification methods. Practical significance: the presented method is universal and can be applied in information support systems of public administration bodies in solving problems related to ensuring public safety.

Текст научной работы на тему «МЕТОД ПО СОВЕРШЕНСТВОВАНИЮ ИНФОРМАЦИОННО- АНАЛИТИЧЕСКОЙ РАБОТЫ НА ОСНОВЕ КОМПЛЕКСИРОВАНИЯ РЕЗУЛЬТАТОВ РАСПОЗНАВАНИЯ СОСТОЯНИЙ ОБЪЕКТОВ КОНТРОЛЯ С ИСПОЛЬЗОВАНИЕМ МЕТОДОВ МАШИННОГО ОБУЧЕНИЯ»

СЫ: 10.36724/2409-5419-2022-14-2-27-35

МЕТОД ПО СОВЕРШЕНСТВОВАНИЮ ИНФОРМАЦИОННО-АНАЛИТИЧЕСКОЙ РАБОТЫ НА ОСНОВЕ КОМПЛЕКСИРОВАНИЯ РЕЗУЛЬТАТОВ РАСПОЗНАВАНИЯ СОСТОЯНИЙ ОБЪЕКТОВ КОНТРОЛЯ С ИСПОЛЬЗОВАНИЕМ МЕТОДОВ МАШИННОГО ОБУЧЕНИЯ

ПАНКОВ

Алексей Владимирович1 КРИБЕЛЬ

Александр Михайлович2 ЛАУТА

Олег Сергеевич3

ВАСИЛЬЕВ Никита Алексеевич4

Сведения об авторах:

1старший преподаватель Военно-космической академии имени А.Ф.Можайского, кандидат военных наук, доцент, Санкт-Петербург, Россия, yvCspb55@yanCex.ru

2соискатель 32 кафедры Военной академии связи имени маршала Советского союза С.М. Буденного, Санкт-Петербург, Россия, nemc4ka74@gmail.ccm

3профессор кафедры Государственного университета морского и речного флота им. адмирала С.О. Макарова (ГУМРФ), д.т.н., Санкт-Петербург, Россия, lacs-82@yanCex.ru

4соискатель 32 кафедры Военной академии связи имени маршала Советского союза С.М. Буденного, Санкт-Петербург, Россия, vasn2020@mail.ru

АННОТАЦИЯ

Введение: В настоящее время, в различных сферах государственного и регионального управления все более остро проявляются проблемы, связанные с необходимостью постоянного мониторинга ключевых параметров функционирования сложных объектов. Потребность в непрерывной актуализации знаний о функционировании объектов в виде формализованных моделей, в условиях непрерывно изменяющихся ситуационных условий исследуемых процессов, определяет необходимость использования новых технологий обработки данных при ведении информационно-аналитической работы. Цель работы заключается в разработке концептуального подхода к совершенствованию процессов информационно-аналитической работы при решении задач распознавания состояния частично наблюдаемых объектов управления с использованием методов машинного обучения. Используемые методы: реализованные в методах машинного обучения алгоритмы позволяют выявить в имеющихся исходных данных различные закономерности и отразить их в формируемой модели объекта контроля в виде параметров, а использование конечного автомата определяет содержание процессов проведения оперативных расчетов, реализуемых в различных ситуационных условиях, задаваемых текущей полнотой и достоверностью исходных данных. Научная новизна заключается в том, что предложенный метод определяет качественно новое содержание процессов обработки информации, а автоматизация процессов разработки и актуализации моделей объектов контроля создает условия для существенного расширения признакового пространства, учитываемого при ведении информационно-аналитической работы, а также обеспечивает возможность получения более достоверных результатов в интересах рационального управления сложными объектами и процессами. Результат: представленный метод позволяет оценить качество информационного решения при объединении результатов полученных с использованием методов машинного обучения. Основу предложенного подхода формирует способ агрегирования результатов неравноточного распознавания состояний объектов с использованием нескольких методов идентификации. Практическая значимость: представленный метод является универсальным и может быть применена в системах информационного обеспечения органов государственного управления при решении задач, связанных с обеспечением общественной безопасности.

КЛЮЧЕВЫЕ СЛОВА: идентификация состояний объектов, нейронные сети, нечеткая логика, вероятностный анализ, комплексная обработка, моделирование

Для цитирования: Панков А.В., Крибель А.М., Лаута О.С., Васильев Н.А. Метод по совершенствованию информационно-аналитической работы на основе комплексирования результатов распознавания состояний объектов контроля с использованием методов машинного обучения // Наукоемкие технологии в космических исследованиях Земли. 2022. Т. 14. № 2. С. 27-35. Сок 10.36724/2409-5419-2022-14-2-27-35

В соответствии с реализуемой Стратегией развития информационного общества в Российской Федерации на 20172030 годы, информационные и коммуникационные технологии стали частью современных управленческих систем во всех сферах государственного управления, обороны страны, безопасности государства и обеспечения правопорядка [1].

В настоящее время, в различных сферах государственного и регионального управления все более остро проявляются проблемы, связанные с необходимостью постоянного мониторинга ключевых параметров функционирования сложных объектов. Специфика решаемых задач связана с обеспечением общественной безопасности, оперативным выявлением возможных угроз и принятием эффективных управленческих решений по разрешению возникших кризисных ситуации.

Так в интересах обеспечения комплексной безопасности Санкт-Петербурга с 2004 г. функционирует государственное казенное учреждение «Городской мониторинговый центр» (ГКУ ГМЦ), деятельность которого направлена на повышение уровня обеспечения общественной безопасности. Одним из основных направлений деятельности является круглосуточный мониторинг экстренных событий и нештатных ситуаций на объектах города и в местах проведения массовых мероприятий. Для решения задач идентификации состояний объектов контроля во всех 18 районах Санкт-Петербурга установлено более 30 тысяч камер. В «зону ответственности» которых включены: наиболее сложные перекрёстки автомобильных дорог и оживлённые магистрали, городские парки и дворы спальных районов [2, 3].

Увеличение объемов информации, подлежащей учету, анализу и обобщению в интересах повышения эффективности принимаемых информационных решений, определяет необходимость внедрения автоматизированных технологии интеллектуальной обработки разнородных данных, оперативного моделирования вариантов решений, быстрой настройки инструментария на предметную область.

Активное развитие технических средств автоматизированного сбора информации, формирует новые возможности непрерывной актуализацией оперативной информации, используемой для принятия управленческих решений. В настоящий момент на улицах Петербурга установлено более 150 камер с функционалом интеллектуальной видео аналитики, реализующих нейросетевые технологии, для обработки видеоизображений в реальном времени. Реализованные программно-аппаратные решения обеспечивают решение задач: идентификации лиц, с программированием их биометрических моделей, распознавания государственных номерных знаков автотранспорта, фиксации оставленных предметов, выявления фактов возникновения различных чрезвычайных ситуаций, в том числе пожаров, и дорожно-транспортных происшествий.

Уже в настоящее время объемы разно форматной информации, генерируемой техническими устройствами регистрации, (видеопотоки с камер наблюдения, данные от устройств радиочастотной идентификации, спутниковых систем навигации, различного рода сенсоров и многое другое.) поражают воображение.

По оценкам западных компаний, специализирующихся в сфере индустрии информационных технологий (EMC, Cisco, IBM, Google) в 2012 году в мире было сгенерировано 2 зетабайта (2 тысячи миллиардов гигабайтов информации), а в 2022 году эта величина превысит 40 зетабайтов [4].

Обработать такие объемы информации без использования автоматизированных систем стало практически невозможным. Данное обстоятельство, обусловило появление значительного числа экспертных систем, представляющих собой сложные программные комплексы, аккумулирующие знания специалистов в конкретных предметных областях и тиражирующих имеющийся эмпирический опыт.

Другой вызов процессам организации информационно-аналитической работы, определен существенной изменчивостью исследуемых процессов. Так, значительное влияние на работу, технических устройств регистрации, оказывают такие ситуационные условия, как время суток, метеорологические условия, а также активно реализуемые злоумышленниками меры противодействия техническим средствам контроля.

Потребность в непрерывной актуализации знаний о функционировании объектов контроля в виде формализованных моделей, в условиях непрерывно изменяющихся ситуационных условий исследуемых процессов, определяет необходимость использования новых технологий обработки данных при ведении информационно-аналитической работы.

Используемые в процессе ведения информационно-аналитической работы экспертные системы, основанные на четко заданной взаимосвязи исходных данных и формируемых решений о состоянии объектов контроля, становятся малоэффективными.

Необходимость оперативной аналитической обработки значительного объема информации, характеризующегося существенной неопределённостью, вызванной неполнотой и возможной недостоверность исходных данных, вследствие преднамеренных и непреднамеренных искажений, определяет потребность в использовании качественно новых интеллектуальных систем обработки информации.

В контексте современного восприятия, интеллектуальной является система, способная целеустремленно, в зависимости от состояния информационных входов, изменять не только параметры функционирования, но и сам алгоритм своего поведения, выбор которого зависит не только от текущего состояния информационных входов, но также и от предыдущих состояний системы [5,6].

В отличие от экспертных систем, позволяющих автоматизировать процедуры вывода на четко заданных логических правилах, современные информационные технологии определяют возможности реализации автоматизированных процедур приобретения знаний - машинного обучения.

Машинное обучение - раздел теории искусственного интеллекта, описывающий методы формирования алгоритмов и на их основе программ, способных «обучаться» (накапливать опыт и корректировать алгоритм решения заданной задачи, посредством подстройки используемой модели исследуемого объекта).

Теоретическая возможность реализации интеллектуальной системы в информационно-аналитической работе осно-

вана на использовании конечного автомата, определяющего содержание процессов проведения оперативных расчетов, реализуемых в различных ситуационных условиях, задаваемых текущей полнотой и достоверностью исходных данных.

В качестве основных направлений реализации систем искусственного интеллекта в информационно-аналитической работе органов государственного управления, предлагается рассматривать:

- автоматизацию процессов разработки и актуализации моделей объектов контроля;

- автоматизацию процессов ситуационной обработки данных в интересах повышения достоверности результатов информационно-аналитической работы.

Концептуальный подход к реализации методов машинного обучения, в интересах вскрытия (распознавания) состояний объектов контроля [7, 8], основывается на использовании эмпирических данных (прецедентов), в которых выявляются закономерности, позволяющие сформировать модели объектов.

Автоматизация процессов разработки и актуализации моделей объектов контроля формирует условия для существенного расширения признакового пространства, учитываемого при ведении информационно-аналитической работы. Определенная избыточность описания объекта в автоматически сформированных «образах» его состояний («эталонных образах состояний») реализуемая на этапе формирования модели объекта, определяет дополнительные возможности повышения результативности решения оперативных задач распознавания, осуществляемых в условиях высокой динамики изменения оперативной обстановки и определяемой ей неполнотой исходных данных.

Общую основу решения большинства задач распознавания состояния объекта определяет формализованная процедура сопоставления заданного множества возможных состояний объекта мониторинга {5,-}^ и Х^ = (хъх2, ■ ■■,х1) -

вектора признаков, используемых в модели для идентифи-

кации данных состояний, где ] - число состояний объекта, а Ь - число признаков.

Содержание процесса формирования модели объекта контроля, заключается в установлении функциональной взаимосвязи, обеспечивающей отображение

X,

•S,: d =

f К); A >)'

где d. - прогнозируемое значе-

ния меры «уверенности» в наблюдении 8^ -го состояния

объекта, определяемое на основе - функции,

символизирующая отображение аргумента Хщ при заданных А о параметрах модели в значение 5,. Сформированная модель объекта (х{ь) ^ SJ: с1. = /[х(ь); А >))' определяет

содержание расчетов проводимых при решении задач идентификации состояний (оперативных задач).

Общая схема этапов информационно-аналитической работы, связанных с реализацией методов машинного обучения в процессе идентификации состояний объектов контроля, представлена на рисунке 1.

Реализованные в методах машинного обучения алгоритмы позволяют выявить в имеющихся исходных данных различные закономерности и отразить их в формируемой модели объекта контроля в виде А@ параметров. В отдельных случаях, в качестве количественной величины значения прогнозируемой меры «уверенности» в наблюдении 8 -го

состояния объекта контроля, может использоваться вероятность нахождения объекта в заданном состоянии при регистрации системы информационных признаков.

Качество исходных данных, определяемое их полнотой и достоверностью, определяет различную адекватность формируемой модели, объекту контроля и решаемой задаче распознавания. Предварительное оценивание качества модели, сформированной на основе методов машинного обучения, производится в процессе обучения с использованием тестового набора данных, а окончательное - непосредственно при оценивании результатов прогнозирования (рис. 1).

ПРЕДВАРИТЕЛЬНОЕОЦЕНИВАНИЕ КАЧЕСТВА МОДЕЛИ

Прогнозные значения наблюдаемого состояния объекта

ПРОГНОЗИРОВАНИЕ

Рис. 1. Схема этапов информационно-аналитической работы, связанных с реализацией методов машинного обучения

в процессе идентификации состояний объектов контроля

Накопленный в органах управления массив информации, характеризующей результаты наблюдения объектов контроля, определяет возможности для формирования размеченного массива исходных данных для реализации контролируемых методов машинного обучения, ориентированных на решение задачи распознавания (классификации), таких как: байесовские сети, деревья принятия решений, нейронные сети, К-ближайших соседей и др. [7, 8].

Поскольку в соответствии с используемыми на практике моделями, количество возможных состояний объекта контроля ограничено (он может находиться в я у -х состояниях, у = 1(1)J) и результат идентификации данных состояний может быть оценен на основе прогнозируемого значения

меры «уверенности» в наблюдении я у -го состояния объекта, то результат реализации представленных методов может быть представлен в единой форме: ,^множества

возможных состояний объекта контроля и соответствующих им значений мер уверенности.

Единство формы представления результатов идентификации состояния объекта с использованием различных методов определяет возможности связанные с их комплексным использованием в интересах повышения достоверности информационно-аналитической работы.

Результаты идентификации возможных состояний объекта контроля, оцененные в виде с!]г - значения меры «уверенности» в наблюдении я у -го состояния объекта, полученные с использованием г -х методов идентификации (г=1(1)й) будут различны. Значения будут определяться содержанием реализованной в методе функции Так, различные параметры модели объекта, сформированные на основе слабо формализованных знаний экспертов и в результате реализации описанных выше процедур машинного обучения, при единых значениях исходных данных (Х^), обеспечат получение различных значений мер «уверенности» в наблюдении я у -го состояния.

Комплексный учет результатов неравноточной идентификации состояний объектов, полученных с использованием г -х методов, определяет условия для получения уточненного -агрегированного значения dу Е меры уверенности в достоверной идентификации возможных я у -х состояний объекта мониторинга (далее по тексту - достоверность). Агрегирование результатов неравноточной идентификации направлено на компенсацию ошибок, присущих отдельным методам [9].

При этом, учет результатов прогнозирования наблюдаемого состояния, полученным с использованием отдельных методов, при формировании агрегированного вывода, основывается на расчете соответствующих кг коэффициентов

доверия. В качестве основы для количественной оценки коэффициента доверия к результатам реализации г -ого метода предлагается использовать, р - статистическую вероят-

ность правильного распознавания состояния объекта, рассчитанную на основе тестовой выборки данных (рис. 1 -этап «предварительное оценивание качества модели»).

Формализованное выражение для расчета коэффициента доверия, может быть рассчитано, как нормированное значение статистической вероятности правильного распознавания состояния объекта на основе г -го метода:

к = -р- лг е[0,1].

(1)

I Рг

Так, чем больше значение статистической вероятности правильного распознавания состояния объекта мониторинга с использованием метода, тем с большим весом необходимо учитывать полученный с его использованием результат при формировании обобщенного вывода о состоянии объекта.

Уточненное значение достоверности состояния объекта мониторинга, рассчитанное по результатам комплексного применения нескольких методов идентификации, представлено следующим выражением:

= £ / Я dуЛe [0,1],

(2)

где dу х - уточненное значение достоверности текущего я у

состояния, объекта мониторинга на основе комплексного использования г -х методов идентификации;

кг - весовой коэффициент доверия результатам, полученным с использованием г -го метода идентификации; dj г - прогнозное значение достоверности нахождения

объекта в я у состоянии, полученное с использованием г -го

метода идентификации.

Обобщенная схема способа комплексирования результатов неравноточной идентификации состояний объектов контроля, представлена на рисунке 2.

Рассчитанное на основе комплексного применения методов идентификации Е} множество значений достоверности

возможных я у состояний объекта контроля, формируют новые

исходные данные для принятия решения о его текущем состоянии. Выражение, определяющее содержание принимаемого решения, может быть формализовано в следующем виде:

я, : у = а^тах^),

(3)

у = 1(1)^

Обобщенное решение о состоянии объекта контроля принимается в соответствии с максимальным значением достоверности распознанных состояний.

С целью апробации предложенного способа комплексирования результатов неравноточной идентификации состояний объектов контроля, проведена серия имитационных экспериментов, целью которой являлось оценивание результативности использования предложенного способа по отношению к результатам, полученных с раздельным использованием методов.

г=1

г=1

Исходные данные для решения

Множество признаков определяющих состояние объекта мониторинга

Методы идентификагщи состояния объектов

Модель объекта

Модель объекта

{X, Ьк I

Модель объекта

{ xr 1

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Оценки вероятности нахождения объектов в заданных состояниях

{(81Л> а^ Д' ^ д)}

Весовой коэффициент доверия к результатам реализации метода

К

(Sl,2> dU)>( S2,2> d2 SJ ,2 ' dJ,

{(Sl,R ' dl,R ) > (S2,R ' d2,R ) ' •• •> (SJ,R ' dJ,R )}

Метод комплексирования результатов неравноточной идентификагщи

1. Уточнение меры уверенности в достоверной идентификации 7-го состояния объекта

d.krd.,Г 1 R

2. Формирование обобщенного информационного решения о состоянии объекта

s.: j = arg max d.

j = 1(1)J

Рис. 2. Схема способа комплексирования результатов неравноточного распознавания состояния объекта контроля

Сравнению в ходе проведенного имитационного эксперимента подлежали следующие методы распознавания:

тх - метод распознавания, основанный на расчете меры

близости наблюдаемого образа объекта с эталонным образом, с использованием расстояния Хемминга [10] (без реализации процессов машинного обучения);

г2- метод распознавания, основанный на реализации

нейросетевой технологии идентификации состояния объекта [11] (машинное обучение);

тъ - метод распознавания, основанный на реализации

технологии идентификации состояния объекта с использованием «деревьев решений» [12] (машинное обучение);

тъ - метод распознавания, основанный на комплексиро-

вании результатов неравноточной идентификации состояний объекта контроля.

При проведении экспериментов использовались отчеты по результатам экологического мониторинга десяти объектов промышленности, на которых были выявлены нештатные и аварийные ситуации, определившие нарушения экологической обстановки [13].

На основе исследуемых отчетов, общий объём которых составил 1000 ед., сформирована выборка данных. Нарушения экологической обстановки фиксировались на основе замеров 26 параметров ДЗЗ. Множество состояний объектов

мониторинга включало три состояния: - «функционирование объекта, без нарушения экологических норм», 82 -«функционирование объекта, с нарушениями, определяющими угрозу экологии», 83 - «аварийное функционирование объекта, определяющего угрозу экологической безопасности».

Данная модель, определила основу для моделирования процессов интеллектуальной обработки данных при решении задачи идентификации состояния объекта контроля в условиях неполноты исходных данных. Поскольку значения фактических исходных данных, поступающих в систему обработки, представляют собой, некоторые искаженные образы представленных в модели эталонное состояний объекта. А доля (5), возможных искажений в наблюдаемом образе состояния от эталонного, по результатам проведенного анализа фактических данных составляет от 0 до 30%, то моделирование исходных данных для обучения, осуществлялось с учетом данного ограничения.

Так, формирование выборки данных для предварительного тестирования результативности методов распознавания в условиях неполноты данных, осуществлялось посредством случайного (рандомного) изменения заданной доли (0 < 5 < 30%) значений х1 элементов вектора признаков эталонных состояний объекта контроля, представленных в модели объекта. Выбор образа состояния и порядковые номера информационных признаков, подлежащих искажению, осуществлялись случайным образом, при этом значение образа состояния объекта сохранялось в качестве метки.

Состав сформированной выборки данных для тестирова-

ния может быть представлен множеством

X(26)> Si

100

включающим 100 векторов - образов, каждый из которых включает 26 значений информационных признаков, искаженных в соответствии заданной долей (5) значений и 1 метку состояния.

Результаты предварительного тестирования результативности метода распознавания, основанного на расчете меры близости наблюдаемого образа объекта, с эталонным обра-

S

k

k

R

зом, рассматриваемого в качестве основного метода, получившего практическую реализацию для решения рассматриваемой задачи, определили 100% значение доли верно распознанных состояний объектов на сформированной выборке данных.

В интересах, предварительного тестирования методов, основанных на машинном обучении, с учетом принятых ограничений (0<8<30%), осуществлено моделирование другой выборки данных. Общий объем, сформированной с использованием описанного способа «частично искаженных» (до 30%) векторов признаков ситуаций, составил 1000 значений. При этом, каждая моделируемая ситуация была размечена (проиндексирована) в соответствии с номером эталонного образа Яу состояния объекта, подвергшегося искажению.

Состав сформированной выборки данных для машинного

обучения может быть представлен множеством // X . Я ,

(\ <26>' '/) 1000

включающим 1000 векторов - образов, каждый из которых включает 26 значений информационных признаков, искаженных в соответствии заданной (5) долей значений и 1 метку состояния.

В дальнейшем, в соответствии с основными правилами реализации машинного обучения [4], данная выборка разделялась на два подмножества данных, в следующем соотношении: 90% - данные используемые в процессе обучения, 10% - данные для предварительного тестирования качества обучения.

Экспериментальная часть исследования, связанная с априорным оцениванием результативности решения рассматриваемой задачи идентификации состояний объекта, на основе сформированной выборки данных для машинного обучения, осуществлялись с использованием открытых программных кодов, реализующих рассматриваемые технологии [14-16].

Применительно к решаемой задаче, лучшие результаты были получены для реализованной в эксперименте, нейросе-тевой технологии обработки данных, основанной на использовании трехслойной персептронной сети, с 26 входными нейронами и тремя выходами, а также методе реализующим технологию построения «усеченных деревьев решений» («случайный лес») [13]. При этом, обучение нейросети, в интересах обеспечения устойчивого результата по решению рассматриваемой задачи распознавания на представленной выборке данных, осуществлялось в течении 60 эпох, а обучение в интересах реализации метода деревьев решений проводилось однократно.

Полученные результаты, также продемонстрировали высокую результативность решения задачи распознавания на тестовой выборке (99-100% - доля верно распознанных состояний).

Дальнейшее содержание проведенного имитационного эксперимента было направлено, на оценивание результативности рассматриваемых методов распознавания в условиях ухудшения качества исходных данных, а также оценивания возможностей комплексирования результатов неравноточной идентификации состояний объекта контроля.

Для этого, в соответствии с описанным выше подходом, основанном на внесении определенной 8 доли искажений в эталонные образы состояний, было осуществлено имитационное моделирование шести размеченных выборок данных для тестирования: 1 - соответствует ситуации, когда в моделируемый вектор - образ, может содержать от 0 до 40% (3 = 20%) искаженных значений; 2 - от 0 до 50% (б = 25% ); 3 - от 0 до 60% (5= 30%); 4 - от 0 до 70% (5= 35%); 5 - от 0до 80% (8 = 40%); 6-от 0до 90% (8= 45%).

Данные выборки, последовательно использовались для решения задачи распознавания на основе каждого из рассматриваемых методов. По результатам решения задачи распознавания состояний объектов, осуществлялось оценивание тг доли достоверно идентифицированных состояний

объектов контроля.

Проведенные на основе единых исходных данных расчеты, обеспечили различную результативность решения задачи распознавания состояний объектов (табл. 1).

Полученные результаты, характеризующие среднюю долю верно распознанных состояний объектов, в моделируемых условиях ухудшения качества исходных данных, определяют значения Рг статистической вероятностей правильного распознавания состояния объекта с использованием метода. Полученные вероятности, в дальнейшем, определили значения кг -х весовых коэффициент доверия результатам, полученным с использованием г-го метода идентификации, рассчитываемых в соответствии с выражением (1). В результате проведенных расчетов, коэффициенты приняли значения: к = 0,32, к = 0,34, к = 0,33.

1 г2 Г '

Таблица 1

Результаты оценивания достоверности распознавания состояний объекта контроля, в условиях моделируемой неполноты данных

Метод распознавания Средняя доля искажений, вносимые в эталонные образы состояний, при формировании выборки данных для тестирования Средняя доля верно распознанных состояний

В = 20% 5 = 25% В=30% 5= 35% В = 40% в = 45%

Г1 (мера близости Хеминга)) 100% 100% 86% 60% 33% 3% 63,7

г2 (машинное обучение, нейронная сеть) 100% 99% 92% 71% 37% 6% 67,5

г3 (машинное обучение, дерево решений) 99% 97% 85% 65% 34% 15% 65,8

Полученные при реализации каждого из методов прогнозные значения наблюдаемых состояний объектов и определенные кг-е весовые коэффициент доверия результатам, определили возможность реализации, описанного выше, ге метода распознавания, основанного на комплексировании результатов неравноточной идентификации состояний объекта контроля.

В ходе его реализации, для каждого из представленных для тестирования выборок данных, вектора-образа ^) в соответствии с выражением (2), осуществлен

перерасчет прогнозируемой л достоверности (меры уверенности) наблюдаемого состояния.

Результаты серии имитационных экспериментов по оцениванию результативности предложенных методов идентификации состояний объектов контроля, представлены на рисунке 3.

Полученные результаты свидетельствуют о реализуемости и практической значимости предложенного подхода для совершенствования информационно-аналитической работы. Результаты имитационного эксперимента, продемонстрировали высокую результативность (97-100% достоверной идентификации состояний объектов) в условиях достаточной полноты исходных данных (моделируемой 20-25% средней доли измененных значений признаков в тестовом наборе данных). Кроме того, полученные результаты демонстрируют, значительное снижение результативности каждого из методов, при их реализации в условиях возрастающей неполноты данных.

Доля достоверно идентифицированных состояний объектов

признаков в тестовом наборе данных

1 - метод распознавания, основанный на сравнении наблюдаемого образа с эталоном;

2 - метод распознавания, основанный на реализации НСТ обработки данных (машинное обучение);

| - метод распознавания, основанный на реализации дерева решений (машинное обучение};

4 - метод распознавания, основанный на комплексировании результатов распознавания.

Рис. 3. Результаты имитационных экспериментов по оцениванию качества методов идентификации состояний объектов контроля

Вместе с тем, на примере рассмотренной задачи, полученные результаты наглядно демонстрируют преимущества реализации подхода, связанного с комплексированием результатов неравноточной идентификации состояний объектов мониторинга. Так, результаты апробации предложенного гибридного метода, обеспечили 7-18% повышение доли верно идентифицированных состояний объектов контроля по отношению к результатам, полученным на основе традиционно используемых, при ведении информационно-аналитической работы, методов распознавания.

Заключение

Эффективная реализация осуществляемых в настоящее время преобразований системы информационного обеспечения органов государственного управления при решении задач, связанных с обеспечением общественной безопасности, в значительной степени связана с совершенствованием процессов информационно-аналитической работы.

Описанный в статье метод по совершенствованию информационно-аналитической работы на основе комплексирования результатов распознавания состояний объектов контроля с использованием методов машинного обучения определяет качественно новое содержание процессов обработки информации. Автоматизация процессов разработки и актуализации моделей объектов контроля создает условия для существенного расширения признакового пространства, учитываемого при ведении информационно-аналитической работы, а предложенный способ агрегирования результатов неравноточной идентификации состояний, обеспечивает возможность получения более достоверных результатов, в интересах рационального управления сложными объектами и процессами.

Литература

1. Указ Президента РФ от 9 мая 2017 г. № 203 "О Стратегии развития информационного общества в Российской Федерации на 2017-2030 годы".

2. Официальный сайт Санкт-Петербургского государственного казенного учреждение «Городской мониторинговый центр», интернетресурс: https://gu.spb.ru, датаобращения 15.07.2021 г.

3. Новостной сайт Санкт-Петербургского государственного казенного учреждение «Городской мониторинговый центр», Статья: В систему видеонаблюдения Петербурга внедрили технологию распознавания лиц, дата размещения 30.11.2018 г. интернет ресурс: https://spbll2.ru, дата обращения 15.07.2019 г.

4. Савельев А.И. Проблемы применения законодательства о персональных данных в эпоху «Больших данных» (Big Data) Il Право. Журнал Высшей школы экономики. 2015. №1. С. 43-66.

5. Замятин А.В. Интеллектуальный анализ данных: учеб. пособие. Томск: Издательский Дом Томского государственного университета, 2016. 120 с.

6. Смолин Д.В. Введение в искусственный интеллект: конспект лекций; под общ. ред. Е.Н. Глебова. М.: ФИЗМАТЛИТ, 2004. 208 с.

7. Ясницкий Л.Н. Искусственный интеллект. Электронный ресурс: учебное пособие. Эл. изд. М.: БИНОМ. Лаборатория зна-ний,2012. 197 с.

8. Воронина В.В., Михеев А.В., Ярушкина Н.Г., Святов К.В. Теория и практика машинного обучения: учебное. Ульяновск: Ул-ГТУ, 2017. 290 с.

9. Попело В.Д., Ванеева М.В. Теория математической обработки геодезических измерений. Ч 2. Оценивание результатов геодезических измерений и их погрешностей на основе вероятностных представлений /учебное пособие. Воронеж: ВГАУ, 2015. 138 с.

10. Лежких А.Е., Броневич А.Г. Математические методы распознавания образов: Курс лекций. Таганрог: Изд. ТТИ ЮФУ, 2009. 154 с.

11. Николенко С., Кадурин А., Архангельская Е. Глубокое обучение. Погружение в мир нейронных сетей. СПб: Питер, 2018. 480 с.

12. Штукатуров С. Реализация и разработка алгоритма «случайный лес» с использованием языка программирования Статья. Интернет ресурс: www.tproger.ru / translations/ python-random-forest-implementation/ Датаопубликования: 14.17.2019.

13. Панков А.В., Девяткин А.М. Комплексирование методов информационно-аналитической работы для повышения качества информационных решений II Труды ВКА А.Ф.Можайского, Выпуск 678. СПб.: ВКА им.А.Ф.Можайского, 2021. С. 78-87.

14. Официальный сайт ООО «Нейронные технологии», Интернетресурс: https:/neural-technologies.com, дата посещения: 21.12.21.

15. Официальный сайт ООО «BaseGroupPab», NeuralBase -нейронная сеть за 5 минут. Интернет ресурс: http:/basegroup.ru, дата обращения: 21.12.21.

16. Открытый интернет ресурс облачного сервиса «Google Colaboratory». Интернетресурс: https://colab.research.google.com, датаобращения: 25.12.21.

METHOD FOR IMPROVING INFORMATION AND ANALYTICAL WORK BASED ON THE INTEGRATION OF THE RESULTS OF RECOGNITION OF THE STATES OF CONTROL OBJECTS USING MACHINE LEARNING METHODS

ALEXEY V. PANKOV

St. Petersburg, Russia, yvdspb55@yandex.ru

ALEXANDER M. KRIBEL

St. Petersburg, Russia, nemo4ka74@gmail.com

OLEG S. LAUTA

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

St. Petersburg, Russia, laos-82@yandex.ru NIKITA A. VASILIEV

St. Petersburg, Russia, vasn2020@mail.ru ABSTRACT

Introduction: Introduction: Currently, in various spheres of state and regional management, problems related to the need for constant monitoring of key parameters of the functioning of complex facilities are becoming more acute. The need for continuous updating of knowledge about the functioning of objects in the form of formalized models, in the conditions of continuously changing situational conditions of the processes under study, determines the need to use new data processing technologies when conducting information and analytical work. The purpose of the work is to develop a conceptual approach to improving the processes of information and analytical work in solving problems of recognizing the state of partially observed control objects using machine learning methods. Methods used: the algorithms implemented in machine learning methods allow us to identify various patterns in the available source data and reflect them in the generated model of the object of control in the form of parameters, and the use of a finite automaton determines the content of the processes of operational calculations implemented in

KEYWORDS: identification of object states, neural networks, fuzzy logic, probabilistic analysis, complex processing, modeling

various situational conditions set by the current completeness and reliability of the source data. The scientific novelty lies in the fact that the proposed method determines a qualitatively new content of information processing processes, and automation of the processes of developing and updating models of control objects creates conditions for a significant expansion of the feature space taken into account when conducting information and analytical work, and also provides the opportunity to obtain more reliable results in the interests of rational management of complex objects and processes. Result: the presented method makes it possible to evaluate the quality of the information solution when combining the results obtained using machine learning methods. The basis of the proposed approach is formed by the method of aggregating the results of non-precision recognition of the states of objects using several identification methods. Practical significance: the presented method is universal and can be applied in information support systems of public administration bodies in solving problems related to ensuring public safety.

REFERENCES

1. Decree of the President of the Russian Federation No. 203 dated May 9, 2017 "On the Strategy for the Development of the Information Society in the Russian Federation for 2017-2030". (In Russian)

2. Official website of the St. Petersburg State State Institution "City Monitoring Center", URL: https://gu.spb.ru , (date of access 15.07.2021) (In Russian)

3. News site of the St. Petersburg State-owned institution "City Monitoring Center", Article: Face recognition technology was introduced into the video surveillance system of St. Petersburg, date of placement 30.11.2018 Internet resource: https://spb112.ru , accessed 15.07.2019.

4. Saveliev A.I. (2015). Problems of application of legislation on personal data in the era of "Big Data" (Big Data). Pravo. Journal of the Higher School of Economics. No. 1, pp. 43-66. (In Russian)

5. Zamyatin A.V. (2016). Intellectual data analysis: textbook.

stipend. Tomsk: Publishing House of Tomsk State University. 120 p. (In Russian)

6. Smolin D.V. (2004). Introduction to artificial intelligence: lecture notes. under the general editorship of E.N. Glebova. Moscow: FIZMATLIT. 208 p. (In Russian)

7. Yasnitskiy L.N. (2012). Artificial intelligence. Electronic resource: textbook. Moscow: BINOM. Laboratory of Knowledge. 197 p.

8. Voronina V.V., Mikheev A.V., Yarushkina N.G., Svyatov K.V. (2017). Theory and practice of machine learning: a textbook. Ulyanovsk. 290 p. (In Russian)

9. Popelo V.D., Vaneeva M.V. (2015). Theory of mathematical processing of geodetic measurements. H 2. Evaluation of the results of geodetic measurements and their errors based on probabilistic representations. Voronezh: VGAU. 138 p. (In Russian)

10. Lepskikh A.E., Bronevich A.G. (2009). Mathematical methods of pattern recognition: A course of lectures. Taganrog: Publishing House of TTI SFU. 154 p. (In Russian)

11. Nikolenko S., Kadurin A., Arkhangelskaya E. (2018). Deep learning. Immersion into the world of neural networks. St. Petersburg: Peter. 480 p. (In Russian)

12. Plasterers With the implementation and development of the algorithm "random forest" using the programming language Article. Online resource: www.tproger.ru / translations/ python-random-forest-implementation. Publication date: 14.17.2019. (In Russian)

13. Pankov A.V., Devyatkin A.M. (2021). Integration of methods of information and analytical work to improve the quality of information solutions. Proceedings of A.F. Mozhaysky Military-Space

Academy, Issue 678. St. Petersburg: A.F. Mozhaysky MilitarySpace Academy, pp. 78-87. (In Russian)

14. Official website of Neural Technologies LLC", URL: https:/neural-technologies.com (date of access: 12.21.21).

15. Official website of BaseGroupLab LLC, NeuralBase - neural network in 5 minutes. URL: http:/basegroup.ru (date of access: 21.12.21).

16. Open Internet resource of the cloud service "Google Colaboratory". URL: https://colab.research.google.com (date of access: 25.12.21).

INFORMATION ABOUT AUTHORS:

Pankov A.V., lecturer at the Military Space Academy named after A.F.Mozhaisky, œandidate of military sciences, associate professor, St. Petersburg, Russia

Kribel A.M., candidate of the 32 department of the Military Academy of Communications named after Marshal of the Soviet Union S.M. Budyonny, St. Petersburg, Russia

Lauta O.S., professor of the Department of Admiral S.O. Makarov State University of Marine and River Fleet, Doctor of Technical Sciences, St. Petersburg, Russia

Vasiliev N.A., candidate of the 32 department of the Military Academy of Communications named after Marshal of the Soviet Union S.M. Budyonny, St. Petersburg, Russia

For citation: Pankov A.V., Kribel A.M., Lauta O.S., Vasiliev N.A. Method for improving information and analytical work based on the integration of the results of recognition of the states of control objects using machine learning methods. H&ES Research. 2022. Vol. 14. No. 2. Pp. 27-35. doi: 10.36724/2409-5419-2022-14-2-27-35 (In Rus)

•V\A

AAV]

26-29

Российская неделя высоких технологий

www.hi-techweek.ru

Тгййн^Н

Россия, Москва,

, ' -V ЦВК «ЭКСПОЦЕНТР»

■ ' У J 11

связь

34-я международная выставка информационных и коммуникационных технологий

www.sviaz-expo.ru

НАВИТЕХ

Экспозиция 4 «Навигационные 0 системы,

технологии и услуги*

www.rtavitech-expo.ru

■ Форум «СВЯЗЬ-2022»

■ Форум «Российский софт: эффективные решения»

i Надоели баннеры? Вы всегда можете отключить рекламу.