Научная статья на тему 'ИНТЕЛЛЕКТУАЛЬНЫЙ АНАЛИЗ ДАННЫХ ДЛЯ ЗАДАЧ ИДЕНТИФИКАЦИИ СОСТОЯНИЙ ОБЪЕКТОВ КОНТРОЛЯ В УСЛОВИЯХ НЕОПРЕДЕЛЕННОСТИ'

ИНТЕЛЛЕКТУАЛЬНЫЙ АНАЛИЗ ДАННЫХ ДЛЯ ЗАДАЧ ИДЕНТИФИКАЦИИ СОСТОЯНИЙ ОБЪЕКТОВ КОНТРОЛЯ В УСЛОВИЯХ НЕОПРЕДЕЛЕННОСТИ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
108
38
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
НЕЙРОННАЯ СЕТЬ / РАСПОЗНАВАНИЕ СИТУАЦИИ / ОБРАБОТКА ИНФОРМАЦИИ / РАССТОЯНИЕ ХЕММИНГА / BIG DATA / OLAP / АНАЛИТИЧЕСКИЕ СТРУКТУРЫ ВЕДОМСТВ / NEURAL NETWORK / SITUATION RECOGNITION / INFORMATION PROCESSING / HAMMING DISTANCES / ANALYTICAL STRUCTURES OF DEPARTMENTS

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Панков А.В., Дашкевич Я.В.

Рассмотрена возможность реализации методов интеллектуального анализа данных для совершенствования информационно-аналитической работы в деятельности органов государственного и регионального управления. Основная идея предлагаемого подхода заключается в реализации нейросетевых моделей обработки информации для идентификации кризисных состояний при решении задач, связанных с обеспечением общественной безопасности, в условиях неполноты и частичной недостоверности исходных данных. Представленный имитационный эксперимент описывает особенности подготовки исходных данных для обучения нейросетевой модели на основе частичной рандомизации эталонных векторов признаков ситуаций. Обоснованность применения нейросетевых методов для идентификации состояний объектов контроля определена на основе сравнительного анализа результативности их применения по отношению к традиционно используемым методам, основанным на установлении метрического расстояния между выявленным по результатам оперативного мониторинга и эталонным состоянием объекта контроля.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Панков А.В., Дашкевич Я.В.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

DATA MINING FOR THE TASKS OF IDENTIFYING THE STATES OF OBJECTS CONTROL IN CONDITIONS OF UNCERTAINTY

The article proposes the ways to improve information analysis conducted by national and regional government bodies for public security tasks. The proposed approach is based on the idea of possible adaptation of artificial neural networks for identifying critical states of subject areas in conditions of incomplete or partially invalid input data. The presented simulation experiment describes the particular steps for the preparation of initial data to study a neural network model based on the situation of partial randomization of reference vectors of signs. The validity of using neural network methods for identifying the control objects state is determined by a comparative analysis between the effectiveness of their use and traditionally used methods that are based on the establishment of a metric distance between the results of operational monitoring and the reference state of the control object.

Текст научной работы на тему «ИНТЕЛЛЕКТУАЛЬНЫЙ АНАЛИЗ ДАННЫХ ДЛЯ ЗАДАЧ ИДЕНТИФИКАЦИИ СОСТОЯНИЙ ОБЪЕКТОВ КОНТРОЛЯ В УСЛОВИЯХ НЕОПРЕДЕЛЕННОСТИ»

Интеллектуальный анализ данных для задач идентификации состояний объектов контроля в условиях неопределенности

А. В. Панков, Я. В. Дашкевич Военно-космическая академия имени А. Ф. Можайского Санкт-Петербург, Россия yvdspb55@yandex.ru

Аннотация. Рассмотрена возможность реализации методов интеллектуального анализа данных для совершенствования информационно-аналитической работы в деятельности органов государственного и регионального управления. Основная идея предлагаемого подхода заключается в реализации нейросетевых моделей обработки информации для идентификации кризисных состояний при решении задач, связанных с обеспечением общественной безопасности, в условиях неполноты и частичной недостоверности исходных данных. Представленный имитационный эксперимент описывает особенности подготовки исходных данных для обучения нейросетевой модели на основе частичной рандомизации эталонных векторов признаков ситуаций. Обоснованность применения нейросетевых методов для идентификации состояний объектов контроля определена на основе сравнительного анализа результативности их применения по отношению к традиционно используемым методам, основанным на установлении метрического расстояния между выявленным по результатам оперативного мониторинга и эталонным состоянием объекта контроля.

Ключевые слова: нейронная сеть, распознавание ситуации, обработка информации, расстояния Хемминга, Big Data, OLAP, аналитические структуры ведомств.

Введение

Многофакторность и высокая неопределенность возникновения угроз безопасности определяют ситуационные условия функционирования информационно-аналитических структур ведомств, деятельность которых направлена на предотвращение кризисных ситуаций (МЧС, ГИБДД, органы здравоохранения, полиция и т. д.). Сложнопрогнозируемые ситуационные условия, связанные с неполнотой и, возможно, недостоверностью исходных данных, формируют дополнительные требования к процессам обработки информации, обеспечение которых может быть реализовано на основе активно развивающихся информационных технологий, реализующих новые методы интеллектуального анализа данных.

В соответствии с реализуемой Стратегией развития информационного общества в Российской Федерации на 2017-2030 годы, информационные и коммуникационные технологии становятся частью современных управленческих систем во всех сферах государственного управления, обороны страны, безопасности государства и обеспечения правопорядка [1].

В настоящее время в различных сферах государственного и регионального управления все более остро проявляются проблемы, связанные с необходимостью постоян-

ного мониторинга ключевых параметров функционирования сложных объектов. Специфика решаемых задач связана с обеспечением общественной безопасности, оперативным выявлением возможных угроз и принятием эффективных управленческих решений по разрешению возникших кризисных ситуаций.

Так, в интересах обеспечения комплексной безопасности Санкт-Петербурга с 2004 года функционирует государственное казенное учреждение «Городской мониторинговый центр» (ГКУ ГМЦ), деятельность которого направлена на повышение уровня обеспечения общественной безопасности. Одним из основных направлений его деятельности является круглосуточный мониторинг экстренных событий и нештатных ситуаций на объектах города и в местах проведения массовых мероприятий. Для решения задач идентификации состояний объектов контроля во всех 18 районах Санкт-Петербурга установлено более 30 тысяч камер. В поле зрения которых включены наиболее сложные перекрестки автомобильных дорог и оживленные магистрали, городские парки и дворы спальных районов [2].

Активное развитие технических средств автоматизированного сбора информации формирует дополнительные возможности, связанные с непрерывной актуализацией оперативной информации, используемой для принятия управленческих решений. Уже сейчас СПб ГКУ «ГМЦ» совместно с Комитетом по информатизации завершил реализацию первого этапа проекта «Умный город», в рамках которого создана интеллектуальная система обработки данных с городских видеокамер [3]. Реализовано специальное мобильное приложение, обеспечивающее оперативный сбор видеоинформации с мест происшествий.

В настоящий момент на улицах Петербурга установлено более 150 камер с функционалом интеллектуальной видеоаналитики, реализующих нейросетевые технологии, для обработки видеоизображений в реальном времени. Реализованные программно-аппаратные решения обеспечивают решение задач идентификации лиц, с программированием их биометрических моделей, распознавания государственных номерных знаков автотранспорта, фиксации оставленных предметов, выявления фактов возникновения различных чрезвычайных ситуаций, в том числе пожаров и дорожно-транспортных происшествий. В ближайшей перспективе данные системы будут способны вести учет интенсивности движения транспорта и пешеходов в интересах эффективного и безопасного управле-

ния дорожным движением и общественным правопорядком.

Аналогичные способы интеллектуализации процессов обработки информации востребованы и в сфере обороны государства. В интересах концепции развития системы управления Вооруженными силами Российской Федерации (ВС РФ) до 2025 года, одной из главных целей реализации которой является гарантированное управление войсками (силами) и оружием в едином информационном пространстве (ЕИП), осуществляется разработка и модернизация автоматизированных систем военного и специального назначения. Создание ЕИП ВС должно способствовать эффективному использованию информационных ресурсов государства для решения задач в сфере военного строительства и управления войсками (силами). Так, с 1 декабря 2014 года на боевое дежурство заступил Национальный центр управления обороной Российской Федерации (НЦУО). Сформированная структура предназначена для обеспечения централизованного управления боевой и повседневной деятельностью ВС РФ. НЦУО реализует функции оперативной координации деятельности Министерства обороны РФ и 73 федеральных органов исполнительной власти, органов власти всех субъектов РФ, 1 320 государственных корпораций и предприятий оборонно-промышленного комплекса России [4]. Функции контроля и управления основаны на существенном увеличении объемов данных (включая видеоматериалы), используемых в ходе взаимодействия указанных элементов информационной системы.

Процессы, происходящие в сфере военного управления, в полной мере соотносятся с изменениями, происходящими и в других сферах информатизации общества, как в России, так и за рубежом. Статистика объема данных, создаваемых на протяжении последних лет, поражает воображение. По оценкам западных компаний, специализирующихся в сфере индустрии информационных технологий (ЕМС, Cisco, IBM, Google) в 2012 году в мире было сгенерировано 2 зетабайта (2 тысячи миллиардов гигабайтов) информации, а в 2020 году эта величина достигнет 35-40 зетабайтов [4]. При этом большая часть данной информации будет сгенерирована различного рода техническим устройствами регистрации (видеопотоки с камер наблюдения, данные от устройств радиочастотной идентификации, спутниковых систем навигации, различного рода сенсоров и многое другое).

Обработать такие объемы информации без использования автоматизированных систем становится практически невозможным. Резкое увеличение объемов информации требует поиска новых методов их обработки. Ответом на этот вызов стали технологии, получившие в технической и информационной среде обобщенное название «Большие данные» (Big Data).

Стратегия развития отрасли информационных технологий в Российской Федерации на 2014-2020 годы и на перспективу до 2025 года определяет технологии обработки Big Data в числе «прорывных для мировой индустрии, на основе которых в перспективе 10-15 лет с высокой вероятностью может быть обеспечена глобальная технологическая конкурентоспособность России» [5].

Обработка больших объемов данных — совокупность подходов, инструментов и методов автоматической обра-

ботки структурированной и неструктурированной информации, поступающей из большого количества различных, в том числе разрозненных или слабосвязанных, источников информации, в объемах, которые невозможно обработать вручную за разумное время [1].

Необходимость оперативной аналитической обработки значительного объема информации, характеризующегося существенной неопределенностью, вызванной неполнотой и возможной недостоверностью исходных данных, вследствие преднамеренных и непреднамеренных искажений, определяет потребность в использовании методов искусственного интеллекта в процессах обнаружения новых знаний.

На фоне активного внедрения интеллектуальных информационных систем, ориентированных на распознавание образов ситуаций, регистрируемых техническими устройствами сбора данных, интеллектуализация процессов, связанных с поддержкой принятия решений при оценивании состояний сложных объектов контроля, существенно отстает. В качестве причин данного отставания чаще всего выступает высокая ответственность за принимаемые информационные решения и недостаточная фор-мализованность используемых моделей. Недостаточная формализованность моделей принятия решений приводит к тому, что зачастую отдельные эксперты по-разному оценивают ситуацию, сформированную на основе одинаковых исходных данных. Проблемы агрегирования знаний из нескольких источников различной типологии (эксперты, естественно-языковые тексты, базы данных), а также вопросы создания эффективных технологий автоматизированного приобретения знаний находятся в центре внимания разработчиков современных интеллектуальных систем [6].

В соответствии с традиционно используемым подходом к организации информационно-аналитической работы для идентификации состояний объектов контроля используются детерминированные модели эталонных состояний объектов контроля. В общем виде модель, описывающая возможные варианты состояний объекта контроля, в большинстве случаев определяется конечным множеством состояний и идентифицирующих их признаков, и может быть представлена в виде матрицы, общий вид которой представлен в таблице 1.

Таблица 1

Модель состояний объекта контроля в матричном виде

Признаки, определяющие возможное состояние (pi)

Pi P2 Vi Pi

Состояния Si Ьц ¿21 bi 1 bn

bl2 ¿22 bs2 b,2

Sr V ¿2r bir bIr

Kr b2R bsR blR

Здесь ¿¿г— весовой коэффициент, определяющий значение признака для идентификации состояния.

В ходе решения задач идентификации состояний объектов контроля по результатам оперативного мониторинга

параметров, производится соотнесение значений выявленных системой сбора параметров с эталонными образами возможных состояний. Сходство между выявленным и эталонным состоянием объекта контроля устанавливается в зависимости от выбранного метрического расстояния между ними. Если возможное состояние объекта контроля описывается r-м числом признаков, то он может быть описан как некоторая точка в N-мерном пространстве, а его сходство с эталонными состояниями будет определяться в соответствии с используемой мерой близости. Наиболее известными мерами близости, образов N-мерных векторов, являются следующие расстояния: Евклидово, Хемминга, Минковского, Махаланобиса [7].

Выражение для расчета показателя близости образов состояний, с использованием расстояния Хемминга (citi-block, или Манхэттенское) может быть представлено следующим выражением:

т

dij ^ '|

r=1

где dij — расстояние между i-м и j-м образом состояний объектов;

X[r, Xjr — значение r-го признака соответственно у i- и j-го образа состояний объектов.

Описанный подход долгое время обеспечивал требуемое качество решения информационно-аналитических задач. Но традиционная математическая статистика, претендовавшая на роль основного инструмента анализа данных и создавшая основу оперативной аналитической обработки данных (online analytical processing, OLAP), не обеспечивает решение задач связанных с необходимостью оперативной адаптации к изменяемым условиям ведения информационно-аналитической работы, связанных со значительным объемом подлежащей обработке информации в условиях ее высокой изменчивости и неопределенности.

Анализ моделей, используемых специалистами аналитических органов при решении задач, связанных с идентификацией состояний объектов контроля, свидетельствует о том, что в большинстве случаев эталонные образы возможных состояний исследуемых объектов основаны на усредненных (среднестатистических) значениях учитываемых параметров. В силу чего формируемые на их основе модели эталонных состояний содержат не фактические, а «обобщенные» образы реальных процессов, очищенные от специфики реальных возможных ситуаций в предметной области. Данные «усредненные» значения в значительной степени опираются на экспертные знания об исследуемых процессах, которые нередко являются субъективными. Кроме того, сформированные значения зачастую нуждаются в своевременной адаптации к изменениям, происходящим в исследуемой предметной области, что представляет серьезную практическую проблему.

Предполагается, что в ближайшем будущем в основу современных подходов к организации и ведению информационно-аналитической работы будут положены методы интеллектуального анализа данных (discovery-driven data mining, Data Mining), ориентированные на выявление и отражение многоаспектных взаимоотношений в данных.

Ожидается, что работы в области искусственного интеллекта и моделирования когнитивных процессов приведут к созданию принципиально нового поколения интеллектуальных технологий обнаружения новых фактов, закономерностей и связей в данных [6].

Для демонстрации потенциальных возможностей реализации интеллектуальных методов в интересах повышения качества решения задач информационно-аналитической работы, связанных с достоверной идентификацией состояний объектов контроля в условиях неполноты и неопределенности исходных данных, проведен имитационный эксперимент. При его реализации осуществлено сравнение результативности решения задачи распознавания образа состояния объекта контроля с использованием традиционных методов расчета, описанных выше мер близости и реализации нейросетевых методов распознавания.

Формирование исходных данных для эксперимента

В ходе эксперимента для подготовленной модели эталонных состояний объектов контроля, представленной в матричном виде (см. таблицу), содержащей пять возможных эталонных состояний (Я = 5), представленных 16 признаками (I = 16). Каждый признак дискретен и бинарен. Основываясь на предположении о том, что доля возможных искажений исходных данных, поступающих в систему обработки, может составлять до 30 % (5 < 30) от истинных исходных данных, была осуществлена генерации тестовой выборки данных {Р(12), ^¿}100 с использованием генератора случайных чисел.

Сформированная выборка данных представляет собой модель «допустимых мутаций» (5 < 30) относительно эталонных значений вектора признаков состояния . Она отражает возможные значения векторов, описывающих текущие значения параметров, поступающих в систему обработки информации. Предположение о менее 30 % доли возможных искажений исходных данных основано на исследовании особенностей функционирования существующих информационно-аналитических систем.

Схема формирования тестовой выборки требуемого объема N иллюстрирующая реализацию рандомизации эталонных значений признаков, представлена на рисунке 1.

На первом этапе эксперимента осуществлялось распознавание образов моделируемых ситуаций на основе традиционно реализуемых методов распознавания. После чего для каждого из сформированного множества векторов тестовой выборки данных {Р(12)}100 посредством последовательного сравнения с каждым из эталонных наборов векторов {Р(12), ^^ осуществлен расчет показателя близости образов состояний с использованием нормированного расстояния Хемминга, которое может быть представлено следующим выражением:

В качестве наиболее вероятного вывода о наблюдаемом состоянии формируемого в результате оценивания значений показателя близости рассматривалось значение , соответствующее максимальному значению показателя близости (тах( й^ )).

Ыtettectual Technologies on Transport 2019. N 4

После чего производилось оценивание соответствия распознанного (случайного) состояния §1 и эталонного значения состояния &■, используемого при мутации г-го

ситуаций 10- для - о г 1 , 2 . ,-' ,- I '-; Задание доли — мутаций; Задание исходных значений индекса генерируемого вектора данных г = 0; Задание объема обучающей выборки N.

Реализация счетчика индексов генерируемых векторов г = г + 1

Ослучаивание выбора ситуации при генерации векторов для обучающей выборки ■ = гпЫ()

Формирование случайного вектора / , = (/,, /_,. мутаций где независимые случайные величины, принимающие значение 1 с вероятностью р — 0- 0 , а значение 0 - с вероятностью - — /-> = 11 "

Л в)

Рандомизированные данные

КОНЕЦ

Рис. 1. Схема рандомизации эталонных векторов признаков ситуаций для формирования обучающей выборки потребного объема N.

вектора тестовой выборки данных {Р(±в)' . Результаты

реализации предложенного метода распознавания образа состояния объекта контроля, представленного описанной моделью, представлены на рисунке 2.

| 5з%

-доля верно идентифицированных состояний; -доля ошибочно идентифицированных состояний; -доля идентифицированных состояний.

Рис. 2. Результаты реализации традиционных методов распознавания образа состояния объекта контроля

На втором этапе эксперимента осуществлялось распознавание образов моделируемых ситуаций на основе реализации нейросетевых технологи обработки данных.

Исходные данные для обучения нейросети были представлены сформированным множеством векторов признаков Р(р>) = {рг, р2, ■■■, Рр> ), описывающих возможные состояния Б^ исследуемых объектов. При реализации нейросеть формирует зависимости для отображения Р(к) ^ §\ § = Агде Я — прогнозируемое

нейросетью состояние объекта, А ^ — параметры модели нейросети, /(Р^у, А(-)) — функция, символизирующая отображение аргумента при заданных параметрах А/) в значение . В процессе обучения используемые

в нейросети алгоритмы адаптируют параметры А()} для снижения среднеквадратического расхождения между £¡1 и Б^ состояниями объектов.

В случае недостаточного объема обучающей выборки возникает задача увеличения ее объема. Возможным методом увеличения объема обучающей выборки является рандомизация значений векторов P(R)j из имеющихся

пар (P(R)j, Б^). Суть метода заключается в присвоении случайных значений заданной доли элементов Р^). Реализация данного подхода основана на учете возможных искажений в регистрации данных значений системой наблюдения.

При проведении эксперимента объем сформированной обучающей выборки составил 1 000 вариантов. Обучение проводилось методом Ф. Розенблата: проводилась итерационная подстройка матрицы весов для уменьшения ошибки выходных значений. Для оценивания качества распознавания состояний объектов с использованием обученной нейросети сформированная выборка разделена на обучающую и тестовую выборки в соотношении 80/20. Данная выборка использовалась для обучения 4 нейросе-тей с 1, 2, 3 и 10 слоями по 16 нейронов в каждом.

Полученные вероятности правильного распознавания ситуаций Si на тестовой выборке в зависимости от числа эпох обучения и используемых параметров модели нейросети представлены на рисунке 3.

Р, ед. Доля правильно распознанных состояний тестовой выборки о.ео» '

1 слойная НС

0Г7000

2 слойная НС

/

У

3 слойная НС

10 слойная НС

. Эффект переобучения

-: г, ::: ■:■. " .■::. -л м, ед.

Количество эпох обучения нейросети

Рис. 3. Графики вероятностей правильного распознавания ситуаций Si в зависимости от числа эпох обучения

Полученные графические зависимости определяют практическую пригодность выбранной структуры нейросети для решения описанной в эксперименте задачи. В соответствии с полученными результатами, реализованные на основе 1-3-уровневой структуры нейросети модели демонстрируют более высокую скорость обучения и более точное качество идентификации состояний объектов. Представленный на графике, демонстрирующем возможность реализации 10-уровневой нейросети, характерный спад показателя правильности идентификации состояний определяется эффектом переобучения нейросети [8]. Учет данного эффекта является важным фактором, подлежащим учету при выборе структуры нейросети.

Результаты имитационного моделирования демонстрируют достаточно высокий практический потенциал, связанный с использованием нейросетевых технологий

НАЧАЛО

для решения задач идентификации состояний объектов мониторинга в условиях неполноты и частичной недостоверности исходных данных. Представленные значения (~0,67) вероятности правильного распознавания состояний объекта контроля, демонстрируют преимущества использования описанного подхода для совершенствования информационно-аналитической работы в деятельности органов государственного и регионального управления.

Заключение

Результаты проведенного анализа современных ситуационных условий функционирования информационно-аналитических структур ведомств, деятельность которых направлена на предотвращение кризисных ситуаций, демонстрируют потребность в формировании и реализации новых интеллектуальных методов обработки данных, призванных обеспечить помощь специалистам информационно-аналитических подразделений органов государственного и регионального управления в обработке существенно увеличившегося объема информации, характеризующегося высокой степенью неопределенности.

Результаты проведенного имитационного эксперимента свидетельствуют о реализуемости и потенциальной эффективности реализации предложенного подхода к совершенствованию информационно-аналитической работы посредством применения методов интеллектуального анализа данных для решения задач, связанных с идентификацией состояний объектов контроля в условиях неопределенности исходных данных. Общий прирост результативности решения рассмотренной задачи составил более 14 %.

Литература

1. Стратегия экономического и социального развития Санкт-Петербурга на период до 2030 года. URL: http://spbstrategy2030.ru (дата обращения 15.07.2019).

2. В систему видеонаблюдения Петербурга внедрили технологию распознавания лиц // Официальный сайт СПб ГКУ «ГМЦ». URL: http://spb112.ru/news/193/detail/ (дата обращения 15.07.2019).

3. Савельев А. И. Проблемы применения законодательства о персональных данных в эпоху «Больших данных» (Big Data) // Право. Журнал Высшей школы экономики. 2015. № 1. С. 43-66.

4. Об утверждении Стратегии развития отрасли информационных технологий в Российской Федерации на 2014-2020 годы и на перспективу до 2025 года: распоряжение Правительства Российской Федерации от 01.11.2013 № 2036-р. URL: http://government.ru/docs/8024. (дата обращения 15.07.2019).

5. Поллак Г. А. Интеллектуальные информационные системы: Учебное пособие. — Челябинск: Издательский центр ЮУрГУ, 2011. — 141 с.

6. Николенко С. Глубокое обучение. Погружение в мир нейронных сетей / С. Николенко, А. Кадурин, Е. Архангельская — СПб.: Питер, 2018. — 480 с. — (Библиотека программиста).

7. Google Colaboratory. URL: http://colab.re-search.google.com (дата обращения 25.05.2019).

8. Теория и практика машинного обучения: Учебное пособие / В. В. Воронина, А. В. Михеев, Н. Г. Ярушкина, К. В. Святов. — Ульяновск: УлГТУ, 2017. — 290 с.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Data Mining for the Tasks of Identifying the States of Objects Control in Conditions of Uncertainty

A. V. Pankov, J. V. Dashkevich A. F. Mozhaisky Military Space Academy Saint Petersburg, Russia yvdspb55@gmail.ru

Abstract. The article proposes the ways to improve information analysis conducted by national and regional government bodies for public security tasks. The proposed approach is based on the idea of possible adaptation of artificial neural networks for identifying critical states of subject areas in conditions of incomplete or partially invalid input data. The presented simulation experiment describes the particular steps for the preparation of initial data to study a neural network model based on the situation of partial randomization of reference vectors of signs. The validity of using neural network methods for identifying the control objects state is determined by a comparative analysis between the effectiveness of their use and traditionally used methods that are based on the establishment of a metric distance between the results of operational monitoring and the reference state of the control object.

Keywords: neural network, situation recognition, information processing, Hamming distances, Big Data, OLAP, analytical structures of departments.

References

1. The Strategy of Economic and Social Development of St. Petersburg for the Period Until 2030 [Strategiya ekonomicheskogo i sotsial'nogo razvitiya Sankt-Peterburga na period do 2030 goda]. Available at: http://spbstrategy2030.ru (accessed 15 July 2019).

2. Face Recognition Technology Implemented in St. Petersburg Video Surveillance System [V sistemu videona-blyudeniya Peterburga vnedrili tekhnologiyu raspoznavaniya lits], Official website St. Petersburg State-Funded Institution «City monitoring center» [Ofitsial'nyy sayt Sankt-Peterburgskogo gosudarstvennogo kazennogo uchrezhdeniya «Gorodskoy monitoringovyy tsentr»]. Available at: http://spb112.ru/news/193/detail/ (accessed 15 July 2019).

3. Savelyev A. I. The Issues of Implementing Legislation on Personal Data in the Era of Big Data [Problemy primeneni-ya zakonodateF stva o personal'nykh dannykh v epokhu «BoFshikh dannykh» (Big Data)], Law. Journal of the Higher School of Economics [Pravo. Zhurnal Vysshey shkoly ekonomiki], 2015, No. 1. Pp. 43-66.

4. On Approval of the Strategy for the Development of the Information Technology Industry in the Russian Federation for 2014-2020 and for the Future Until 2025: Order of the Government of the Russian Federation [Ob utverzhdenii Strategii razvitiya otrasli informatsionnykh tekhnologiy v Rossiyskoy Federatsii na 2014-2020 gody i na perspektivu do 2025 goda: rasporyazhenie Pravitel'stva Rossiyskoy Feder-atsii] from 01.11.2013 No. 2036-r. Available at: http://government.ru/docs/8024. (accessed 15 July 2019).

5. Pollak G. A. Intelligent information systems: Study guide [Intellektualnye informatsionnye sistemy: Uchebnoe posobie], Chelyabinsk, Publishing center of South Ural State University, 2011, 141 p.

6. Nikolenko S., Kadurin A., Arkhangelskaya E. Deep learning. Immersion in the world of neural networks [Glubokoe obuchenie. Pogruzhenie v mir neyronnykh setey], St. Petersburg, Piter Publishing House, 2018, 480 p.

7. Google Colaboratory. Available at: http://colab.re-search.google.com (accessed 25 May 2019).

8. Voronina V. V., Mikheev A. V., Yarushkina N. G., Svyatov K. V. Theory and practice of machine learning: Study guide [Teoriya i praktika mashinnogo obucheniya: Uchebnoe posobie], Ulyanovsk, Ulyanovsk State Technical University, 2017, 290 p.

i Надоели баннеры? Вы всегда можете отключить рекламу.