НАУЧНЫЕ СООБЩЕНИЯ
С.В. Бухарин, С.А. Мальцев, А.В. Мельников
ПРОГНОЗИРОВАНИЕ ОБОБЩЕННОГО ПОКАЗАТЕЛЯ ПРИЕМНО-КОНТРОЛЬНЫХ ПРИБОРОВ МЕТОДОМ ОБУЧЕНИЯ
НЕЙРОННОЙ СЕТИ
FORECASTING OF GENERALIZED INDICATOR RECEPTION AND CONTROL DEVICES BY METHOD OF TRAINING NEURAL
NETWORK
Рассматривается многомерная калибровочная модель обобщенного показателя качества приемно-контрольных приборов. Для предсказания значений показателя нового прибора используются методы нейронного моделирования. Сравниваются нейронные сети с различным объемом референтных данных, показано решение проблемы мультиколлинеарности.
The multidimensional calibration model of the generalized indicator of quality of reception and control devices is considered. For a prediction of values of an indicator of the new device methods of neural modeling are used. Neural networks are compared to various volume of reference data and the solution of the problem of a multicollinearity is shown.
Введение. При сопоставлении характеристик нескольких приемно-контрольных приборов охранно-пожарной сигнализации (ППКОП) и введении комплексного показателя «качество-цена» математическая модель сводится к модели множественной линейной регрессии [1].
В работе [2] показано решение обратной задачи экспертизы: зная обобщенные показатели качества объемных извещателей J и их значения признаков Xj, найдено
множество весовых коэффициентов V }. На основании нейронного моделирования
проведена оценка показателей новых приборов, т.е. осуществлен их прогноз.
Целью данной статьи является прогнозирование обобщенного показателя нового тестового ППКОП на основе предварительного обучения нейронной сети с известной архитектурой [2], а также решение проблемы мультиколлинеарности в случае ограниченного количества доступных приборов к, меньшего числа признаков т.
Формирование референтных данных. Подробные характеристики трех известных промышленных приемно-контрольных приборов сигнализации «Тандем-IP», «Приток-GSM», «Hunter-PRO» приведены в работе [3]. После выделения количе-
ственных, качественных признаков и признаков наличия и цены, нормировки и использования метода анализа иерархий там же получена референтная матрица
"0,584 1,000 0,892 0,562"
X =
0,600 1,000
(1)
0,447 0,250 0,762 0,796 0,250 0,807 и вектор обобщенных показателей качества
3 = (1,273 1,044 1,681)г. (2)
На основе референтных данных (1), (2) в работе [3] для нового ППКОП «Юпи-тер-1Р/ОРК8-8» был определен вектор признаков
XЮпигер =(0,771 1,000 0,929 0,548) (3)
и определено значение обобщенного показателя качества
3 Юпитер = 1,388. (4)
При расчетах обобщенных показателей (2) и (4) использовался найденный методом анализа иерархий вектор весовых коэффициентов
V = (0,662 0,213 0,125 1,000)т. (5)
Сформируем расширенную матрицу референтных данных для пяти образцов «Тандем-1Р», «Притокам», «НиПег^О», «Юпитер-1Р/ОРК8-8», «Тандем-1Р-М»), используя выражения (1), (3):
X =
0,584 1,000 0,892 0,562
0,447 0,250 0,762 0,600
0,796 0,250 0,807 1,000
0,771 1,000 0,929 0,548
0,634 0,250 0,931 0,570
(6)
а также расширим вектор обобщенных показателей качества (2):
J =(1,273 1,044 1,681 1,389 1,159)г. (7)
Обучение нейронной сети по 5 известным образцам. Воспользуемся результатами, полученными в работе [2], и сформируем двухслойную нейронную сеть (рис.1).
Здесь первый слой — скрытый (hidden), второй слой — выходной (output)., W1,2 — матрицы весов первого и второго слоя; Ь1'2 — постоянные сигналов смещений первого и второго слоя. Как показано на рисунке, в обоих слоях выбраны линейные функции активации purelin.
Hidden Layer Output Layer
Рис. 1. Символическая схема двухслойной нейронной сети
Для обучения сети используем сформированные выше референтные данные (6), (7). При калибровке нейронной модели могут применяться два подхода: обучение с учителем (train) и последовательная адаптация (adapt). В данной статье выберем первый метод.
Для обучения сети используем алгоритм Левенберга — Маркуардта (Levenberg — Marquardt). После 5 шагов обучения квадрат среднеквадратической погрешности калибровки модели
1 m
квадрат СКО = — £ (ö J i )2 (8)
mi=1
снижается до пренебрежимо малой величины (рис. 2). При этом градиент принимает значение 2,27 • 10"9, а коэффициент детерминации R2 = 0,994.
Рис. 2. Качество обучения двухслойной нейронной сети с линейными
функциями активации
Оценка обобщенных показателей отдельных образцов после настройки весовых коэффициентов и смещений нейронов имеет вид
3 = (1,2305 1,0438 1,6811 1,3898 1,1592)т. (9)
Соответствующие абсолютные погрешности оценки обобщенных показателей - 35 равны:
5 3Х = 4,251 • 10-2, 5 32 = 2,201 • 10-4, 5 33 = 2,294-10-5,
534 = 1,775 •Ю-4, 535 = 1,942 •Ю-4. (10)
После выполненной настройки веса и смещения нейронной сети примут вид:
1Жп =[2,7352 0,9511 - 3,2819 2,9019], = 0,1917,
Ь1 = 0,9051, Ь 2 =-0,1018.
Оценим обобщенный показатель 3 т «качество-цена» нового тестового прибора, используя полученную после калибровки оценку весов и смещений двухслойной нейронной сети (11), с помощью процедуры моделирования пакета пПоо1 языка MATHLAB. Характеристический вектор ХТ этого прибора рассчитан по той же методике, которая применялась при определении матрицы (6), и имеет вид
Хт = (0,646 0,550 0,864 0,656)т . (12)
С учетом выражений (5), (12) вычислим значение показателя
3Т = Хт •V = 1,309. (13)
Сравнивая прогнозируемое в результате применения процедуры значение
3 т = 1,3005 с точным значением (13), убедимся, что относительная ошибка предсказания обобщенного показателя тестового ППКОП 53 = 0,00649, или менее 1 %.
Нейронные сети являются мощным вычислительным инструментом для моделирования многих классов технических задач. Однако их серьезным недостатком является неоднозначность решений, обусловленная рядом причин (структура референтных данных, неправильный выбор вида сети, случайный выбор начальных условий) и приводящая иногда к заведомо неверным результатам. Поэтому в работе [4] сделан однозначный вывод о том, что при использовании нейронных сетей всегда необходимо иметь дополнительную тестовую программу, позволяющую хотя бы грубо оценить результаты моделирования. Для нашего класса задач наиболее надежным для проверки представляется применение метода гребневой регрессии.
В рассматриваемом же случае мы имеем редкую для практики экспертизы
удачную ситуацию, когда число доступных для обучения образцов (к = 5) больше
числа признаков (т = 4 ). Поэтому можно непосредственно воспользоваться методом наименьших квадратов (МНК), согласно которому весовые коэффициенты
V = (хт • XУ ХТ3 . (14)
Используя референтные данные (6), (7), получим
V = (0,665 0,213 0,123 0,999f (15)
и найдем оценку показателя JT
JT = XT -V = 1,3087, (16)
что подтверждает правильность результатов нейронного моделирования.
Проблема мультиколлинеарности. Проблема мультиколлинеарности векторов, входящих в матрицу референтных данных X, возникает в случае недостатка известных образцов для обучения калибровочной модели (k < m). Покажем, что использование нейронной сети позволяет преодолеть эту проблему.
В отличие от предыдущего случая используем ограниченное количество образцов k = 3, т.е. референтные данные (1), (2).
Для обучения сети используем алгоритм Левенберга — Маркуардта (Levenberg — Marquardt). После 4 шагов обучения квадрат среднеквадратической погрешности калибровки модели, определенный формулой (8), снижается до пренебрежимо малой
величины (рис. 3). При этом градиент принимает значение 7,82 -10 11, а коэффициент детерминации ^2=1,000.
Рис. 3. Качество обучения двухслойной нейронной сети в условиях
мультиколлинеарности
Оценка обобщенных показателей отдельных образцов после настройки весовых коэффициентов и смещений нейронов имеет вид
З = (1,273 1,044 1,681)^. (17)
Соответствующие абсолютные погрешности оценки обобщенных показателей — Зз равны:
5 Зх = 2,329-10—10, 5 З2 = 1,565 • 10—10, 5 З3 = 9,090-10—11. (18) После выполненной настройки веса и смещения нейронной сети примут вид
(19)
IW11 = [0,8546 - 0,0504 0,4416 0,8781], IW21 = 0,5526, Ъ1 = 0,2748, Ъ2 =-0,0623.
Оценим обобщенный показатель J у «качество-цена» нового тестового прибора, используя полученную после калибровки оценку весов и смещений двухслойной нейронной сети (19), с помощью процедуры моделирования sim пакета nntool языка MATHLAB. Характеристический вектор Ху этого прибора имеет вид (12). В результате моделирования прогнозируемое значение J у = 1,3701.
Сравнивая прогнозируемое в результате применения процедуры sim значение J у = 1,3701 с точным значением (13), убедимся, что относительная ошибка предсказания обобщенного показателя тестового ППКОП 8j = 0,0467, или 4,7 %.
Проверим полученный результат. В условиях недостатка образцов для обучения (k < m) уже нельзя воспользоваться формулой МНК (14), поскольку определитель
XT • X = 0
и вычислить даже первый сомножитель (15) невозможно. Поэтому применим метод гребневой (ridge) регрессии [3], согласно которому используется модифицированная формула
V = (xt • X + oI)-1 XT J , (20)
где I — единичная диагональная матрица, o — параметр регуляризации.
Последовательно уменьшая величину О, будем вычислять вектор весовых коэффициентов V и оценивать относительную погрешность
(21)
SV = - JjV - V f (V - V)] /VV
и результаты сведем в таблицу.
Относительная погрешность оценки вектора весовых коэффициентов
О 0,1 0,01 0,001 10-6 10-9
Sv 0,382 0,191 0,156 0,156 0,155
Соот-
Как видим, наименьшее значение погрешности достигается при а = 10 ветствующий этому а вектор весовых коэффициентов имеет вид
V = (0,801 0,177 0,152 0,878)т. (22)
Перемножив характеристический вектор тестового ППКОП (12) и найденный методом гребневой регрессии вектор весов (22), получим
3т = Хт •V = 1,315, (23)
что дает по сравнению с точным значением (13) относительную погрешность 0,9%.
Выводы. Двухслойная нейронная сеть позволяет эффективно прогнозировать значение обобщенного показателя качества ППКОП после обучения по 5 известным образцам с погрешностью 0,67%, а после обучения по 3 образцам — 4,7%.
Результаты численного моделирования дают возможность сделать следующие выводы: 1) использование нейронных сетей позволяет преодолеть проблему мульти-коллинеарности, возникающую в случае недостатка известных образцов для обучения сети; 2) результаты нейронного моделирования всегда должны проверяться альтернативным способом, например, методом гребневой регрессии.
ЛИТЕРАТУРА
1. Дрейпер Н., Смит Г. Прикладной регрессионный анализ. Множественная регрессия: монография: пер. с англ. — 3-е изд. — М.: Диалектика, 2007. — 912 с.
2. Бухарин С.В., Мельников А.В., Навоев В.В. Архитектура нейронной сети решения обратной задачи экспертизы объемных извещателей // Вестник Воронежского института МВД России. — № 4. — 2014. — С. 204—211.
3. Бухарин С.В., Волков Д.А., Мельников А.В., Навоев В.В. Статистические методы экспертизы технических и экономических объектов: монография. — Воронеж: Научная книга, 2013. — 276 с.
4. Бухарин С.В., Навоев В.В. Методы теории нейронных сетей в экспертизе технических и экономических объектов: монография. — Воронеж: Научная книга, 2015. — 274 с.
REFERENCES
1. Dreyper N., Smit G. Prikladnoy regressionnyiy analiz. Mnozhestvennaya regressi-ya: monografiya: per. s angl. — 3-e izd. — M.: Dialektika, 2007. — 912 s.
2. Buharin S.V., Melnikov A.V., Navoev V.V. Arhitektura neyronnoy seti resheniya obratnoy zadachi ekspertizyi ob'emnyih izveschateley / S.V. Buharin, // Vestnik Voronezh-skogo instituta MVD Rossii. — # 4. — 2014. — S. 204—211.
3. Buharin S.V., Volkov D.A., Melnikov A.V., Navoev V.V. Statisticheskie metodyi ekspertizyi tehnicheskih i ekonomicheskih ob'ektov: monografiya. — Voronezh: Nauchnaya kniga, 2013. — 276 s.
4. Buharin S.V., Navoev V.V. Metodyi teorii neyronnyih setey v ekspertize tehnicheskih i ekonomicheskih ob'ektov: monografiya. — Voronezh: Nauchnaya kniga, 2015. — 274 s.
СВЕДЕНИЯ ОБ АВТОРАХ
Бухарин Сергей Васильевич. Профессор кафедры экономической безопасности и финансового мониторинга. Доктор технических наук, профессор.
Воронежский государственный университет инженерных технологий.
E-mail: [email protected]
Россия, 394000, г. Воронеж, проспект Революции, 19. Тел (473) 255-37-51.
Мальцев Сергей Александрович. Старший преподаватель кафедры автоматизированных информационных систем органов внутренних дел.
Воронежский институт МВД России. E-mail: [email protected]
Россия, 394065, г. Воронеж, проспект Патриотов, 53. Тел. (473) 200-56-46.
Мельников Александр Владимирович. Профессор кафедры автоматизированных информационных систем органов внутренних дел. Доктор технических наук. Воронежский институт МВД России. E-mail: [email protected]
Россия, 394065, г. Воронеж, проспект Патриотов, 53. Тел. (473) 200-55-00.
Bukcharin Sergey Vasilievich. Professor of the chair of economic security and financial monitoring. Doctor of technical sciences, professor.
Voronezh State University of Engineering Technologies. E-mail: [email protected]
Work address: Russia, 394000, Voronezh, Revolution Avenue, 19.
Maltsev Sergey Alexandrovich. Senior lecturer of the chair of automated information systems of law-enforcement bodies.
Voronezh Institute of the Ministry of the Interior of Russia. E-mail: [email protected]
Work address: Russia, 394065, Voronezh, Prospect Patriotov, 53.
Melnikov Alexander Vladimirovich. Professor of the chair of automated information systemsof law-enforcement bodies. Doctor of technical sciences.
Voronezh Institute of the Ministry of the Interior of Russia. E-mail: [email protected]
Work address: Russia, 394065, Voronezh, Prospect Patriotov, 53.
Ключевые слова: нейронные сети; мультиколлинеарность; прибор приемно-контрольный охранно-пожарный.
Key words: neural modeling; multicollinearity; reception and control device.
УДК 004.896