Научная статья на тему 'МЕТОД ОЦЕНКИ СОСТОЯНИЯ НЕЛИНЕЙНОЙ СИСТЕМЫ НА ОСНОВЕ ЛОГИЧЕСКОГО АНАЛИЗА ДАННЫХ'

МЕТОД ОЦЕНКИ СОСТОЯНИЯ НЕЛИНЕЙНОЙ СИСТЕМЫ НА ОСНОВЕ ЛОГИЧЕСКОГО АНАЛИЗА ДАННЫХ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
47
14
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
НЕЛИНЕЙНАЯ СИСТЕМА / ОЦЕНКА СОСТОЯНИЯ / ПРОГНОЗ ПОВЕДЕНИЯ / ПРИНЯТИЕ РЕШЕНИЯ / ЛОГИЧЕСКИЙ АНАЛИЗ ДАННЫХ / ЗАКОНОМЕРНОСТИ / КЛАССИФИКАТОРЫ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Шевнина Юлия Сергеевна

При исследовании реальных систем из различных предметных областей кроме вопросов, связанных с классификацией и интерпретируемостью полученных результатов и обоснованностью предлагаемых решений, возникают вопросы получения комплексной оценки состояния нелинейной системы с учетом значений всех ее характеристик и их совокупностей. Точность оценки состояния нелинейной системы позволит повысить точность прогноза ее поведения и получить интерпретируемые результаты для составления рекомендаций и принятия решений. В работе рассмотрен метод оценки состояния нелинейной системы на основе метода машинного обучения - логического анализа данных. Метод основан на поиске закономерностей и построении классификаторов и дает возможность учитывать все характеристики нелинейной системы, их совокупность и связи между ними. Показано, что метод оценки состояния нелинейной системы позволяет анализировать и получать закономерности для неполных и неточных данных, это достаточно частое явление в реальных сложных нелинейных системах. Метод может быть использован при проектировании и реализации интеллектуальных сред прогнозирования, формировании рекомендаций и принятии решений для автоматизации процессов медицинской диагностики, исследовании поведения биологических, экономических и социальных нелинейных систем. Предлагаемая редукция закономерностей на основе их рекуррентной конъюнкции позволяет получать оптимальные классификаторы с высокой интерпретируемостью и обобщенностью, что повышает точность оценки состояния нелинейной системы и, как следствие, точность прогноза поведения, рекомендаций и принятия решений.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Шевнина Юлия Сергеевна

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

METHOD FOR ESTIMATING THE STATE OF A NONLINEAR SYSTEM BASED ON LOGICAL DATA ANALYSIS

Through studies of real systems from various application domains there are, besides the issues related to obtained results interpretability and classification, the issues of obtaining complex evaluation of nonlinear system state with account for values of all its characteristics and their totality. The correctness of nonlinear system state evaluation allows improvement of its behavior prediction accuracy and obtainment of interpretable results for recommendations and decision making. In this work, a nonlinear system state evaluation method based on machine learning method, logical data analysis, is considered. The proposed method is based on the search for patterns and the construction of classifiers and allows consideration of all the characteristics of a nonlinear system, their totality and the relationship between them. It has been demonstrated that this nonlinear system state evaluation method makes it possible to analyze and obtain patterns for incomplete and inaccurate data, which is a common occurrence in real complex nonlinear systems. This method can be used in the design and implementation of intelligent forecasting environments, the formation of recommendations and decision making for automating the processes of medical diagnostics, the study of the behavior of biological, economic and social nonlinear systems. The proposed reduction of patterns based on their recurrent conjunction allows obtaining optimal classifiers with high interpretability and generalization, which increases the correctness of nonlinear system state evaluation and, as a result, the accuracy of behavior prediction, recommendations and decision making.

Текст научной работы на тему «МЕТОД ОЦЕНКИ СОСТОЯНИЯ НЕЛИНЕЙНОЙ СИСТЕМЫ НА ОСНОВЕ ЛОГИЧЕСКОГО АНАЛИЗА ДАННЫХ»

ИНФОРМАЦИОННО-КОММУНИКАЦИОННЫЕ

ТЕХНОЛОГИИ INFORMATION-COMMUNICATION TECHNOLOGIES

Научная статья УДК 004.9

doi:10.24151/1561-5405-2022-27-3-407-415

Метод оценки состояния нелинейной системы на основе логического анализа данных

Ю. С. Шевнина

Национальный исследовательский университет «МИЭТ», г. Москва, Россия

yusm@rambler.ru

Аннотация. При исследовании реальных систем из различных предметных областей кроме вопросов, связанных с классификацией и интерпретируемостью полученных результатов и обоснованностью предлагаемых решений, возникают вопросы получения комплексной оценки состояния нелинейной системы с учетом значений всех ее характеристик и их совокупностей. Точность оценки состояния нелинейной системы позволит повысить точность прогноза ее поведения и получить интерпретируемые результаты для составления рекомендаций и принятия решений. В работе рассмотрен метод оценки состояния нелинейной системы на основе метода машинного обучения - логического анализа данных. Метод основан на поиске закономерностей и построении классификаторов и дает возможность учитывать все характеристики нелинейной системы, их совокупность и связи между ними. Показано, что метод оценки состояния нелинейной системы позволяет анализировать и получать закономерности для неполных и неточных данных, это достаточно частое явление в реальных сложных нелинейных системах. Метод может быть использован при проектировании и реализации интеллектуальных сред прогнозирования, формировании рекомендаций и принятии решений для автоматизации процессов медицинской диагностики, исследовании поведения биологических, экономических и социальных нелинейных систем. Предлагаемая редукция закономерностей на основе их рекуррентной конъюнкции позволяет получать оптимальные классификаторы с высокой интерпретируемостью и обобщенностью, что повышает точность оценки состояния нелинейной системы и, как следствие, точность прогноза поведения, рекомендаций и принятия решений.

Ключевые слова: нелинейная система, оценка состояния, прогноз поведения, принятие решения, логический анализ данных, закономерности, классификаторы

© Ю. С. Шевнина, 2022

Для цитирования: Шевнина Ю. С. Метод оценки состояния нелинейной системы на основе логического анализа данных // Изв. вузов. Электроника. 2022. Т. 27. № 3. С. 407-415. doi: https://doi.org/10.24151/1561-5405-2022-27-3-407-415

Original article

Method for estimating the state of a nonlinear system based on logical data analysis

Ju. S. Shevnina

National Research University of Electronic Technology, Moscow, Russia yusm@rambler.ru

Abstract. Through studies of real systems from various application domains there are, besides the issues related to obtained results interpretability and classification, the issues of obtaining complex evaluation of nonlinear system state with account for values of all its characteristics and their totality. The correctness of nonlinear system state evaluation allows improvement of its behavior prediction accuracy and obtainment of interpretable results for recommendations and decision making. In this work, a nonlinear system state evaluation method based on machine learning method, logical data analysis, is considered. The proposed method is based on the search for patterns and the construction of classifiers and allows consideration of all the characteristics of a nonlinear system, their totality and the relationship between them. It has been demonstrated that this nonlinear system state evaluation method makes it possible to analyze and obtain patterns for incomplete and inaccurate data, which is a common occurrence in real complex nonlinear systems. This method can be used in the design and implementation of intelligent forecasting environments, the formation of recommendations and decision making for automating the processes of medical diagnostics, the study of the behavior of biological, economic and social nonlinear systems. The proposed reduction of patterns based on their recurrent conjunction allows obtaining optimal classifiers with high interpretability and generalization, which increases the correctness of nonlinear system state evaluation and, as a result, the accuracy of behavior prediction, recommendations and decision making.

Keywords: nonlinear system, state estimation, behavior prediction, decision making, logical data analysis, regularities, patterns, classifiers

For citation: Shevnina Ju. S. Method for estimating the state of a nonlinear system based on logical data analysis. Proc. Univ. Electronics, 2022, vol. 27, no. 3, pp. 407-415. doi: https://doi.org/10.24151/1561-5405-2022-27-3-407-415

Введение. В настоящее время прогнозирование поведения сложных биологических, экономических или социальных систем, подбор рекомендаций и принятие решений при медицинской диагностики особенно актуальны. Последствия неверного прогноза в подобных нелинейных системах крайне негативны. При исследовании реальных систем из различных предметных областей кроме вопросов, связанных с классификацией и интерпретируемостью полученных результатов, обоснованностью предлагаемых решений, возникают вопросы получения комплексной оценки состояния нелиней-

ной системы с учетом значений всех ее характеристик и их совокупностей. Точность оценки состояния нелинейной системы позволит повысить точность прогноза ее поведения и получить интерпретируемые результаты для составления рекомендаций и принятия решений. Для этого важно учесть не только все возможные значения характеристик нелинейной системы, но и логические связи между ними. Эффективным методом анализа данных с целью выделения логических связей и их классификации является логический анализ данных. Цель настоящей работы - разработка метода оценки состояния нелинейной системы.

Поиск закономерностей и построение классификаторов. Одна из основных проблем логического анализа данных при оценке состояния нелинейной системы и прогнозе его изменения - построение закономерностей и классификаторов, на основе которых принимается решение или строятся выводы. Состояние нелинейной системы определяется значениями ее характеристик в конкретный момент времени:

Е =< (аи,),...,{ап1,ут) >,

где («, у ) - упорядоченная пара характеристики и ее значения.

Закономерность или логическое правило являются конъюнкцией значений характеристик, описывающих нелинейную систему. Классификатор есть совокупность закономерностей, достаточно представляющих поведение нелинейной системы. На основном этапе предлагаемого метода оценки состояния нелинейной системы осуществляется последовательный поиск однородных закономерностей, сводящийся к многокритериальной оптимизационной задаче. Решением задачи является закономерность, покрывающая наибольшее число наблюдений по одному признаку при отсутствии покрытий наблюдений по другому признаку. Рекуррентная организация поиска позволяет определять закономерности как по отдельным признакам, так и по их совокупности, представленной в виде и-мерного вектора. Такой подход дает возможность повысить точность определения закономерностей и классификаторов, их информативность (качество логического правила), интерпретируемость и обобщенность. Редукция закономерностей в данном подходе основана на рекуррентной конъюнкции получаемых классификаторов.

Для поиска закономерностей в различных состояниях нелинейной системы по одному признаку рассмотрим выборку данных из непересекающихся множеств наблюдений положительного класса К+ (состояние соответствует выделенному признаку) и отрицательного класса К (состояние не соответствует выделенному признаку) характеристик нелинейной системы в виде и-мерных векторов (рис. 1).

Для наглядности объекты представляются бинарными признаками х. е {0,1}У1,7 . При такой формализации данных закономерностью является предикат ф: Н ^ {0,1} на множестве наблюдений Н, покрывающий наблюдения одного класса и не покрывающий наблюдения другого с учетом погрешности:

Г1, если наблюдение И покрывается,

ф(Н) = \

[0, если наблюдение И не покрывается.

Пусть 2к - число наблюдений положительного класса К+ в выборке Н1, где 2к > 1, 2к + Мк = I. Тогда гк (ф) - число наблюдений, для которых выполняется условие ф(И) = 1; Мк - число наблюдений всех остальных классов в выборке Н1, Мк > 1; тк (ф) - число наблюдений из Мк, для которых выполняется условие ф(И) = 1.

Рис. 1. Множество наблюдений по различным признакам Fig. 1. A multitude of observations for various features

Рис. 2. Закономерности для исследуемого класса наблюдений Fig. 2. Regularities for the studied class of observations

Fk (Ф, Hl) = ■

^ (Ф)

Таким образом, задача поиска информативной закономерности состоит в оптимизации по двум критериям: (ф) ^ max и

mk (ф) ^ min (рис. 2). Погрешность поиска

определяется достаточным для классификации количеством покрываемых наблюдений. Классификация не выполняется для закономерностей, покрывающих недостаточное количество наблюдений, и для закономерностей, покрывающих количество наблюдений, близкое к значению погрешности. Следовательно, доля наблюдений положительных покрываемых F и отрицательных Ек среди всех покрываемых наблюдений равны:

mk (ф)

Ек (Ф, H ) = ■

(ф) + тк (ф) (Ф) + Мк (ф)

Закономерность информативна, если Ек (ф, И1) >8 и Ек (ф, И1) <8 при достаточно

большом значении 8 и достаточно малом 8 из отрезка [0,1]. Полученные закономерности объединяются в классификаторы с максимальной интерпретируемостью и обобщенностью. Для доказательства этого рассмотрим оптимизационные модели положительных закономерностей (для отрицательных закономерностей рассуждения аналогичны).

Положительная у-закономерность для уе{0,1} - это закономерность, построенная на основе наблюдения у. Для каждого наблюдения формируется максимально инфор-

мативная у-закономерность. Введем бинарную переменную Р = (р, р2,..., р ) для описания информативности закономерности:

Г1, если к-й признак в закономерности, [0 в противном случае.

Для закономерностей, полностью покрывающих наблюдение, тк (ф) = 0. Следовательно, для каждого наблюдения отрицательного класса ^еК- бинарная переменная рк = 1 хотя бы для одного к : ^ ^ ук :

г

^ Рк > е К .

к=1 ^к *Ук

Значение бинарной переменной рк = 0 для к, не определенных в у-закономер-

ности, покрывающей наблюдение положительного класса ше К+ . Тогда целевая функция оптимизационной модели представляет собой суммарное количество наблюдений положительного класса, покрываемых у-закономерностью:

г

Е П (1 - Рк).

шеК+ 7=1

шк *Ук

Оптимизационная модель для поиска закономерностей с учетом условий оптимизации имеет вид

£ П(1 - Pk) ^ max'

ше К + j=1

t

£ Pk > 1V^G K-, p G{0,1}t .

k=1

Данная модель позволит получать полностью покрывающие наблюдения закономерности с т (ф) = 0 и формировать из них классификаторы с максимальной интерпретируемостью и обобщенностью.

Формирование классификаторов для неполных и неточных данных. Как правило, состояние экономических, медицинских, биологических нелинейных систем характеризуется неполными и неточными данными. В таких случаях для построения классификаторов и оценки состояния нелинейной системы следует использовать закономерности с частичным покрытием наблюдений с тк (ф) > 0. Функция ограничения модели оптимизации примет вид

£ >v< s, где y =

цеК -

0, если £ Pk >1,

j=1

V-k *Tk

1 в противном случае, где Б - число наблюдений противоположного класса.

С учетом функции ограничения и полученной ранее оптимизационной модели получим закономерности с небольшой степенью и максимальным покрытием, для которых m (ф) > 0. Увеличение тк (ф) приводит к снижению информативности формируемых закономерностей. Решить эту проблему позволяет максимальное увеличение степени уже сформированных закономерностей при сохранении количества покрываемых наблюдений своего класса:

t

£ pk ^ max, r(P) = r \P),

k=1

где r(P) - покрытие наблюдений своего класса для закономерности до применения процедуры увеличения степени; r'(P) - покрытие наблюдений своего класса для закономерности после процедуры увеличения степени.

В результате применения процедуры увеличения степени закономерностей для неполных и неточных данных получается классификатор, состоящий из логических правил с максимальным покрытием и степенью выше исходной. Обобщающая способность полученного классификатора выше исходной, что связано с сокращением значения

mk (Ф).

Редукция построенного классификатора производится на основе рекуррентной конъюнкции закономерностей с учетом погрешностей 5 и в. Закономерности, для которых Ек (ф, H1) >в, удаляются из классификатора. Закономерности, для которых значение Sk ниже, чем у оставшихся в классификаторе,

также удаляются (рис. 3). Таким образом, редукция классификатора заключается:

- в определении значения S для каждой закономерности в исходном классификаторе;

- сортировке закономерностей в порядке убывания значения S для каждого класса;

- удалении закономерностей из классификатора с учетом погрешности и формировании из оставшихся новых классификаторов;

- проверке оптимальности классификатора. Увеличение количества непокрытых наблюдений множества данных свидетельствует о недостаточности закономерностей в классификаторе.

Высокая точность классификации при редукции путем рекуррентной конъюнкции закономерностей обусловлена уменьшением среднего значения показателя тк (ф) и увеличением среднего значения

показателя ^ (ф) для набора закономерностей каждого класса. Повышение интерпретируемости классификатора происходит за счет редукции, критерием остановки которой является увеличение количества непокрытых наблюдений множества данных.

Рис. 3. Редукция классификатора Fig. 3. Classifier reduction

Определение весовых коэффициентов закономерностей из наборов классификаторов. Для повышения точности оценки состояния нелинейной системы предлагается для каждой закономерности из полученных классификаторов определять весовой коэффициент a. Физический смысл весового коэффициента заключается в воздействии

выбранной закономерности при ее наступлении на общее состояние нелинейной системы:

N

a =—'-, г M

где N - количество совпадений выделенной закономерности в классификаторах;

M - общее количество классификаторов.

Весовой коэффициент принимает значение от 0 до 1 (1 - наиболее значимая закономерность при оценке состояния нелинейной системы, 0 - закономерность не имеет значения для определения состояния системы).

Оценка состояния нелинейной системы и формирование рекомендаций. После определения весовых коэффициентов для каждой закономерности строится граф связанности D = (V, E) для классификаторов, в котором вершинами V будут закономерности, а ребрами E = (u, v): u, v е V, - связи между ними, вес ребра равен значению весового коэффициента закономерности (рис. 4). Граф, где вершины соответствуют объектам представляемой системы, - упорядоченная пара вершин (дуга).

Далее строится аналогичный по структуре граф связанности D' = (V, E) критериев оценки состояния нелинейной системы. С учетом положений нечеткой логики происходит сравнение вершин двух графов (рис. 5):

V с V' ^Vv eV : (v) <^.(v), l(V с V') = min ^V-(v) : T = {v e V; ^(v) < Mv); ^v(v) > 0}.

veT

В случае положительного сравнения закономерности и соответствующего ему критерия происходит маркирование узла графа классификаторов. Затем рассчитывается путь между маркированными узлами, который используется при расчете комплексной оценки состояния нелинейной системы. Если e . - ребро, соединяющее

две вершины v; и v., и весовая функция f: Е —» R, путь G между маркированными узлами рассчитывается как

n—1

g = Z f (e, e+i).

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

i=1

Особенность рассматриваемого метода заключается в поочередном сравнении закономерностей с учетом их значимости и соответствующих им критериев, что позволяет уменьшить нечеткость сравниваемых множеств. Значение комплексной

Рис. 4. Граф связанности

для классификатора Fig. 4. Connectivity graph for the classifier

Рис. 5. Процесс сравнения графов связанности классификаторов и критериев состояния Fig. 5. Comparison process of classifiers connectivity graphs and state criteria

оценки состояния нелинейной системы находится в диапазоне 0-1. При необходимости данный диапазон может быть разделен на конечное число диапазонов, каждому из которых ставится в соответствие набор рекомендаций, решений или действий для исследуемой нелинейной системы.

Заключение. Предложенный метод позволяет получить точную оценку состояния нелинейной системы, что повышает точность прогноза, рекомендаций и принимаемых решений, в частности при проектировании и реализации интеллектуальных сред прогнозирования поведения сложных биологических, экономических или социальных систем, подборе рекомендаций и принятии решений для автоматизации процессов медицинской диагностики. В процессе построения закономерностей и формирования классификаторов для оценки состояния системы учитываются все возможные характеристики нелинейной системы, их совокупности и связи между ними. Редукция закономерностей в данном методе основана на рекуррентной конъюнкции получаемых классификаторов, что позволяет повысить их интерпретируемость и обобщенность.

Литература

1. Shevnina Ju. S., Gagarina L. G., Chirkow A. V. On the issue of modeling complex nonlinear systems // II International Conference on Advances in Materials Science and Technology (CAMSTech-II), Krasnoyarsk, 29-31 July 2021. Krasnoyarsk: Institute of Physics; IOP Publ., 2021. Vol. 920. P. 323-328.

2. Лекун Я. Как учится машина: революция в области нейронных сетей и глубокого обучения / при участии К. Бризар; пер. с фр. Е. Арсеновой. М.: Альпина ПРО, 2021. 334 с.

3. Шевнина Ю. С. Метод декомпозиции сложной нелинейной системы на основе процессного подхода // Системы управления и информационные технологии. 2021. № 3 (85). С. 24-29. doi: https://doi.org/ 10.36622/VSTU.2021.85.3.005

4. Шевнина Ю. С. Иерархическая модель нелинейной динамической системы // Современная наука: актуальные проблемы теории и практики. Серия: Естественные и технические науки. 2021. № 8. С. 135-139. doi: https://doi.org/10.37882/2223-2966.2021.08.40

5. Кузьмич Р. И., Масич И. С., Ступина А. А. Модели формирования закономерностей в методе логического анализа данных // Системы управления и информационные технологии. 2017. № 1 (67). С. 33-37.

6. Furnkranz J., Gamberger D., Lavrac N. Foundations of rule learning. Berlin; Heidelberg: Springer, 2012. XVIII, 334 p. doi: https://doi.org/10.1007/978-3-540-75197-7

7. Zimmermann A., De RaedtL. Cluster grouping: from subgroup discovery to clustering // Mach. Learn. 2009. Vol. 77. Iss. 1. P. 125-159. doi: https://doi.org/10.1007/s10994-009-5121-y

Статья поступила в редакцию 14.02.2022 г.; одобрена после рецензирования 20.02.2022 г.;

принята к публикации 04.05.2022 г.

Информация об авторе

Шевнина Юлия Сергеевна - кандидат технических наук, доцент Института системной и программной инженерии и информационных технологий Национального исследовательского университета «МИЭТ» (Россия, 124498, г. Москва, г. Зеленоград, пл. Шокина, 1), yusm@rambler.ru

References

1. Shevnina Ju. S., Gagarina L. G., Chirkow A. V. On the issue of modeling complex nonlinear systems.

II International Conference on Advances in Materials Science and Technology (CAMSTech-II), Krasnoyarsk, 29-31 July 2021. Krasnoyarsk, Institute of Physics, IOP Publ., 2021, vol. 920, pp. 323-328.

2. LeCun Y., Brizard C. How a machine learns: a revolution in neural networks and deep learning. Moscow, Al'pina PRO Publ., 2021. 334 p. (In Russian).

3. Shevnina Ju. S. Decomposition method for a complex nonlinear system based on a process approach. Sistemy upravleniya i informatsionnyye tekhnologii = Automation and Remote Control, 2021, no. 3 (85), pp. 24-29. (In Russian). doi: https://doi.org/10.36622/VSTU.2021.85.3.005

4. Shevnina Ju. S. Hierarchical model of a nonlinear dynamic system. Sovremennaya nauka: aktual'nye problemy teorii i praktiki. Seriya: Estestvennye i tekhnicheskie nauki = Modern Science: Actual Problems of Theory and Practice, Series of Natural and Technical Sciences, 2021, no. 8, pp. 135-139. (In Russian). doi: https://doi.org/10.37882/2223-2966.2021.08.40

5. Kuzmich R. I., Masich I. S., Stupina A. A. Models for formation of patterns in the method of logical analysis of data. Sistemy upravleniya i informatsionnyye tekhnologii = Automation and Remote Control, 2017, no. 1 (67), pp. 33-37.

6. Furnkranz J., Gamberger D., Lavrac N. Foundations of rule learning. Berlin, Heidelberg, Springer, 2012. xviii, 334 p. doi: https://doi.org/10.1007/978-3-540-75197-7

7. Zimmermann A., De Raedt L. Cluster grouping: from subgroup discovery to clustering. Mach. Learn., 2009, vol. 77, iss. 1, pp. 125-159. doi: https://doi.org/10.1007/s10994-009-5121-y

The article was submitted 14.02.2022; approved after reviewing 20.02.2022;

accepted for publication 04.05.2022.

Information about the author

Julia S. Shevnina - Cand. Sci. (Eng.), Assoc. Prof. of the Institute of System and Software Engineering and Information Technology, National Research University of Electronic Technology (Russia, 124498, Moscow, Zelenograd, Shokin sq., 1), yusm@rambler.ru

i Надоели баннеры? Вы всегда можете отключить рекламу.