Нейросетевая оценка предметных рисков принятия решений по величине прогноза предотвращенного ущерба

Алёшин С.П.; Ляхов А.Л.; Бородина Е.А.

УДК: 004.8.032.26; 57.007

НЕЙРОСЕТЕВАЯ ОЦЕНКА ПРЕДМЕТНЫХ РИСКОВ ПРИНЯТИЯ РЕШЕНИЙ ПО ВЕЛИЧИНЕ ПРОГНОЗА ПРЕДОТВРАЩЕННОГО УЩЕРБА

С.П. АЛЁШИН А.Л. ЛЯХОВ Е.А. БОРОДИНА

Полтавский национальный технический университет имени Юрия Кондратюка

е-mail:

aleshsp@ukr.net lal0220@ukr.net lena_borodina@ukr.net

В работе представлен подход к решению задачи инвариантности критерия принятия решений в задачах распознавания образов к особенностям предметной области объекта исследования. Принятие решений по классическому критерию среднего риска позволяет найти порог разделения классов минимизируя общую вероятность ошибки. Однако в ряде предметных областей ошибки первого и второго рода вносят существенно различный вклад в ожидаемый ущерб от их реализации. Предложена нейросетевая технология принятия решений по величине предотвращенного ущерба на основе выбора порога разделения классов в пространстве их информативных признаков с учетом дифференциации потерь от ошибок первого и второго рода. Представлена методика и алгоритмы построения разделяющей поверхности классов, обеспечивающие не критичность критериев качества к особенностям предметной области.

Ключевые слова: предотвращенный ущерб, статистические ошибки, порог принятия (отвержения) гипотезы, критическая область, классификатор, нейронная сеть, матрица потерь, риски.

Введение.

Разделение ошибочных решений на ошибки первого и второго рода вызвано тем, что последствия от разного рода ошибочных решений принципиально различаются в части того, что упущенный выигрыш оказывает меньшее влияние на ситуацию, чем реализованный проигрыш и наоборот [1]. Таковы особенности современных производственных, коммерческих, финансовых инфраструктур различного предназначения (экономика, экология, медицина, оборона и др.). Например, для биржевого брокера последствия того, что акции не были куплены, когда их следовало покупать, отличаются от последствий ситуации, когда акции были куплены, но покупать их не следовало [2]. Первая ситуация может означать упущенную выгоду, вторая — прямые потери вплоть до разорения брокера. Аналогично для врача отказ от лечения при ошибке в диагнозе отличается по последствиям от назначения неадекватного лечения. Подобные примеры можно продолжить. Вместе с тем, классификация ошибок первого и второго рода при принятии решений не позволяет напрямую оценить возможные материальные потери, если не учесть особенности исследуемой предметной области. При этом следует учесть возможность программной и инструментальной реализации алгоритмов принятия решений в режиме реального времени [3,4,5,6], что не позволит обесценить полученный результат в условиях высокой динамики исследуемых объектов и процессов. Таким образом, несмотря на то, что современные методы и модели принятия оптимальных решений отличаются универсальностью, их продуктивное применение зависит от степени учета специфики особенности исследуемого объекта.

Постановка задачи

Определимся с ошибками, которые следует учесть. Это статистические ошибки первого и второго рода. Ошибка первого рода заключается в том, что отвергают нулевую гипотезу, в то время как в действительности эта гипотеза верна. Ошибка второго рода состоит в том, что принимают нулевую гипотезу, в то время как в действительности эта гипотеза неверна. В нашем случае формализуем задачу в виде вероятность ошибки первого рода, когда нулевая гипотеза отвергается, хотя на самом деле она верна:

« = Р{Т (1)

где Т - функция от репрезентативной выборки (или сама выборка);

}— необходима критическая область значений выборки с заданным уровнем значимости;

{а}- критическая область значений выборки с заданным уровнем значимости (или максимально допустимой ошибкой первого рода); Ио}— основная (или нулевая) гипотеза, которая исследуется.

Будем считать, что наша статистика Т принимает числовые значения (пространство признаков (Х1, Х2, ..., Хп)) и через них связана с критической областью соотношением вероятностно-статистических методов принятия решений, статистические критерии, как правило, основаны на статистиках и, принимающих числовые значения, и критические области имеют вид:

Оа={(х1 )> с}, (2)

где с - совокупность некоторых чисел;

{и0} - основная (или нулевая) гипотеза, которая исследуется; (х1;х2,..., х„) - пространство признаков.

Вероятность ошибки второго рода, когда нулевая гипотеза принимается, хотя на самом деле она не верна, представлена в виде:

Р =Р{т Ша\И,} (3)

где т - функция от репрезентативной выборки (или сама выборка);

{оа} - необходима критическая область значений выборки с заданным уровнем значимости;

{Н} - гипотеза альтернативная основной гипотезе.

В пространстве значений статистики Т выделяют критическую область , т.е. область со следующим свойством: если значения применяемой статистики принадлежат данной области, то отклоняют нулевую гипотезу, в противном случае - принимают.

Задача процесса моделирования принятия решения с учетом предметных рисков формализуется выражением:

ио& = 4 (а, р/Xпор) • А]т (4)

при условии, что а = Р{Т е Оа \И0}, Р = Р{т \Н} где хпор - порог раздела признаковых пространств классов; Ат е Мпт, где ипт - матрица потерь.

Поиск функционала ф (4) как совокупности экспертных, математических, алгоритмических и программных процедур составляет суть задачи исследования. Решение задачи

В основу решения стоящей задачи положена нейросетевая технология принятия решений по величине предотвращенного ущерба на основе выбора порога разделения классов в пространстве их информативных признаков с учетом дифференциации потерь от ошибок первого и второго рода. Рассмотрим методику и алгоритмы построения разделяющей поверхности классов, обеспечивающие не критичность критериев качества к особенностям предметной области. Экспертная составляющая в решении поставленной задачи направлена на построение матрицы потерь (рис.1). Весовой коэффициент стоящий на пересечении п-го столбца и т-й строки есть цена соответствующих ошибок распознавания состояний объекта.

т/п К1 К2 Кз

К1 Ац А12 А13

К2 А21 А22 А23

Кз А31 А32 А33

Рис. 1. Матрица потерь

Так как изначально установлено, что предметные риски от ошибок первого и второго рода различны согласно особенностям предметной области, то необходимо рассчитывать и вероятности появления этих ошибок, что позволяет оценивать их последствия, выраженные в терминах и количественных шкалах физических потерь. При этом порог принятия решения играет ключевую роль и в простом случае должен быть связан с точкой (или областью), которая делит величину ущерба пополам. Очевидно, что при этом будут отражены особенности предметной области, которые учтены в элементах матрицы потерь (рис.1). Выбор порога для разделения пространства признаков разных классов требует пояснений (рис.2). На рисунке качественно показан случай, когда при пороговом значении х1пор плотности распределения признаков равны (т.3), а уровни ожидаемых

ущербов (а, Ь) не совпадают (т.1,2). Нужна методика расчетов и алгоритм получения текущей оценки ущербов с поиском порога принятия решения в точке (некоторой окрестности) их равенства.

Чтобы определить порог разделения классов в точке равенства ущербов от ошибок первого и второго рода, следует разработать алгоритм, позволяющий в динамике оценивать вероятности ошибок первого и второго рода, рассчитывать весовые коэффициенты потерь при достоверных событиях (гипотезах) и0 и и1.

При этом интервал интегрирования должен изменяться, чтобы можно было варьировать абсолютной величиной вероятности ошибок. Тогда весовые коэффициенты потерь будут реализованы с вероятностями соответствующих ошибок. Следовательно, произведение максимально возможных потерь на вероятность появления этих потерь позволяет количественно оценить ожидаемый материальный ущерб. А возможность изменения порога (одного из пределов интегрирования) в пространстве значений признаков, должна позволить подобрать такой порог, при котором ущербы от ошибок сравняются или будут отличаться в допустимых пределах.

Расчет осуществляется по известным соотношениям[1], с особенностями выбора интервалов интегрирования (рис.2):

1. Ошибка 1-го рода для интервала А - В:

Г М

Ща-ь =|/ (х^хр ■ х - соответственно для непрерывных и дискретных случайных вели-

8, ¡=1

чин

2. Ошибка 2-го рода для интервала о - А:

81 N

^ = { / (х ух=£ р. • х1

0 1=1

3. Ошибка 1-го рода для интервала В - С:

» н

Щ ь-с = { /2 (х )гх= £ Р. • х1

82 г»1

4. Ошибка 2-го рода для интервала 0 - В:

82 Я

^2 0-Ь =1 /з (х У1х = £ р. х;

0 1=1

Здесь индексы M, N5 Н, S - размерность выборок измеренных случайных величин, попавших в соответствующий интервал (о-А, 0-В, А-В, В-С).

Величины ожидаемых ущербов для различных ошибок по определению не равноценны, поэтому схематично показываем их уровнями (а) и (Ь) над соответствующими распределениями. В реальной ситуации прогнозируемый ущерб в точке, например, порога х , будет определяться произведением вероятности ошибки на соответствующий

максимальный ущерб от реализованной на практике ошибки.

С вероятностью ошибки второго рода р{и гт \н1} связана вероятность правильного распознавания ситуации, которая в данном контексте именуется как мощность критерия, обычно представленная в виде:

р{и гт\д}=1 -р{и гт\д}, (5)

где и - консолидированный ущерб от (иа,ир); иа - ущерб от допущенных ошибок 1 рода; и - ущерб от допущенных ошибок 2 рода.

Задача оценки плотности вероятности по данным относится к области байесовой статистики, которая дает возможность оценивать плотность вероятности распределений параметров модели по имеющимся данным. Для того чтобы минимизировать ошибку, выбирается модель с такими параметрами, при которых вероятности правильной оценки класса (2) будет наибольшей.

Реализуем процедуру классификации уровней всех состояний исследуемого объекта на основе известного статистического правила проверки гипотез [1].

По обучающей последовательности /выборке/ апостериорных данных следует определить вид плотности распределения значений признаков рабочего словаря. Данные для этого, наряду с текущими, взяты из предыстории контроля исследуемого процесса (объекта). В этих условиях не представляет труда по эмпирическим данным построить соответствующие распределения признаков в классах /(хих2,..., хя).

Пусть алфавит классов обозначен как Щ,г = 1,2,..., т; априорная вероятность существования классов - р(щ). Рабочий словарь признаков обозначим как х = Х,х2,...,хм); условную плотность вероятности появления 1-го класса после оценки вектора ая -р[ —ам = (хо,х„,..., Хм,) - апостериорные значения признаков. Тогда апостериор-

ная вероятность отнесения объекта (состояния процесса) к 1-му классу равна:

р( ЩП Р Щ ^ / (Х1'Х2о кN о ) (6)

тр Щ > / к )

1=1

Решающее правило классификации выглядит: ЩеЩ, где Щ- объект, отнесенный

к 1-му объекту или состоянию предмета исследования, если р| — | = тахР\ — I, г = 1,2,..., г,..., г.

От этой вероятности переход к вероятностям ошибкам простой: р{и гт\н1 }=1-р{и гт\н} или р{и гт\н0 }=1 - р{и гт\н0}.

Достоверность результатов анализа оценивается суммой возможных ошибочных выводов, которые зависят от этих величин и однозначно влияют на ожидаемый ущерб, который может допустить созданная система поддержки принятия решений.

Предлагаемый подход к задаче состоит в том, чтобы построить оценку для плотности вероятности по имеющимся обучающим примерам. Следует учесть, что простой выбор порога разделения классов при равенстве ожидаемых ущербов, может быть дополнен более строгим построением разделяющей классы поверхности. Это зависит от особенностей предметной области. При этом используются два порога: порог принятия и порог отвержения гипотезы. А промежуток между ними - область неопределенности. При наличии времени неопределенность в этой области может быть преодолена использованием дополнительных информативных признаков, увеличением размерности обучающей выборки, увеличением времени анализа и др. В случае отсутствия такой возможности решение принимается исходя из простого критерия.

Инструментальная реализация оценки ожидаемого ущерба успешно выполняется в формате пакета технического анализа данных STATISTICA [5]. Нейронная сеть обучена с таким расчетом, чтобы выходные значения были оценками вероятностей (3). Модуль STATISTICA Neural Network настраиваем так, чтобы учитывать матрицу потерь Mnm, которая представляет собой квадратную матрицу, коэффициентами которой являются относительные цены различных ошибок классификации. Она составляется экспертным способом предварительно и алгоритмически умножается на вектор оцененных вероятностей. В результате получается вектор оценок ожидаемого ущерба, элементами которого является результат умножения вероятности ошибок на соответствующие весовые коэффициенты матрицы Mnm. Матрица потерь строится с помощью линейной сети, имеющей такое же число элементов во входном и выходном слоях, как у исходной сети в выходном слое. Сеть для матрицы потерь должна иметь числовые входные переменные и одну номинальную выходную переменную, соответствующую выходу сети, к которой добавляется матрица потерь[5].

При этом массив измерений достигает числа:

N K H

M = Ш Xjh, (7)

г=1 j=1 h=1

где х^ - элемент полного вектора измерений;

N - количество видов деятельности; к - число реализаций;

H - количество информативно-временных интервалов.

Таким образом, интеллектуальная система поддержки решений на основе учета особенностей ошибок в данных условиях обеспечивает:

- формирование вектора информативных признаков при описании классов состояния на языке пространства информативных признаков с наилучшими дифференцирующими свойствами;

- формирование матрицы потерь с обоснованием выбора её элементов;

- расчет вероятностей ошибок первого и второго рода;

- выбор порога (порогов) разделения классов в пространстве информативных признаков с учетом особенностей предметной области;

- синтез оптимального классификатора в рамках реальных ограничений;

- оценку качества распознающей системы с точки зрения мощности решающего правила по величине предотвращенного ущерба;

- продуктивный набор обученных моделей удобный для реализации в практических задачах.

Выводы

1. Разработанный методический, алгоритмический и программный аппарат позволяет инструментально оценить предметные риски при поддержке принятия решений и учесть их лицом, принимающим решения.

2014. №21 (192). Выпуск 32/1

2. Инвариантность процесса синтеза моделей к особенностям предметной области обеспечивается учетом этих особенностей величинами значений элементов матрицы потерь.

3. Функционально предлагаемая технология реализована как программный блок анализа данных для принятия решений по величине предотвращенного ущерба на основе выбора порогов разделения классов в пространстве их информативных признаков с учетом дифференциации потерь от ошибок первого и второго рода. Синтезированные нейросетевые модели показали адекватность реакции на тестовых выборках, что позволяет признать практическую пользу данного подхода к использованию интеллектуальных технологий в построении систем поддержки принятия решений.

Список литературы

1. Барабаш Ю. Л. Коллективные статистические решения при распознавании. - М.: Радио и связь , 1983.- 224с.

2. Хайкин С. / Нейронные сети: полный курс - [2-е изд.]; пер. с англ. / Хайкин С. - М.: Издательский дом «Вильямс», 2006. - С. 1104.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

3. Алёшин С.П., Бородина Е.А. Нейросетевое распознавание классов в режиме реального времени. Инженерный вестник Дона. - 2013. - №1 [Электронный ресурс]. - Режим доступа: http://www.ivdon.ru/ magazine/archive/n1y2013/1494.

4. Алёшин С.П., Бородина Е.А. Нейросетевой базис ситуационного центра опережающего реагирования. Научные ведомости БелГУ - 2013. - №1 (144) - Выпуск 25/1 - С. 101-111.

5. Боровиков В.П. STATISTICA Neural Networks - Техническое описание. М.: Мир, 1999. -

239 с.

THE NEURAL SITUATIONAL CENTER OF THE OUTPACING RESPONSE

S.P. ALESHIN A.L. LYAKHOV ЕА. BORODINA

Poltava National Technical Yuri Kondratyuk University

e-mail:

aleshsp@ukr.net lal0220@ukr.net lena_borodina@ukr.net

In work is represented the approach to the solution of an invariance problem of decision-making criterion in recognition images problems to domain subject features of research object. The decision-making by classical criterion of average risk allows to find a division threshold of classes minimizing the general mistake probability. However in a number of subject domains of an error of the first and second sort make significantly various contributions to the expected damage from their realization. It is offered the neural network technology of decision-making in size of the prevented damage on the basis of a choice of a threshold of division of classes in space of their informative signs taking into account differentiation of losses from errors of the first and second sort. It is presented the technique and algorithms of creation of the dividing surface of classes providing not criticality of criteria of quality to features of subject do-

Keywords: the prevented damage, statistical errors, hypotheses (rejection) threshold, critical area, classifier, neural network, loss matrix, risks.

Нейросетевая оценка предметных рисков принятия решений по величине прогноза предотвращенного ущерба Текст научной статьи по специальности «Математика»

Аннотация научной статьи по математике, автор научной работы — Алёшин С.П., Ляхов А.Л., Бородина Е.А.

Похожие темы научных работ по математике , автор научной работы — Алёшин С.П., Ляхов А.Л., Бородина Е.А.

Текст научной работы на тему «Нейросетевая оценка предметных рисков принятия решений по величине прогноза предотвращенного ущерба»