Научная статья на тему 'Искусственная нейронная сеть как измерительный инструмент адекватности модели с адаптивным классом точности'

Искусственная нейронная сеть как измерительный инструмент адекватности модели с адаптивным классом точности Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
317
57
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ИСКУССТВЕННЫЕ НЕЙРОННЫЕ СЕТИ / СЛОЖНЫЕ СИСТЕМЫ / МОДЕЛИРОВАНИЕ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Ляхов А. Л., Алешин С. П.

Работа посвящена проблеме количественной оценки надежности и точности функционирования модели сложной социотехнической системы с адаптивным выбором класса точности на основе учета особенностей предметной области. Показано, что интегральную ошибку на выходе искусственной нейронной сети (ИНС) в процессе обучения целесообразно измерять в каждой эпохе и, используя критерий согласия Смирнова, ставить в соответствие со статистическим уровнем значимости. В этой ситуации ИНС приобретает свойство измерительного инструмента с изменяемым классом точности. Это позволяет учесть особенности предметной области системы, автоматизировать расчет признака окончания обучения и распространить область применения статистических критериев на выбор параметров обучения искусственной нейронной сети

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Ляхов А. Л., Алешин С. П.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Искусственная нейронная сеть как измерительный инструмент адекватности модели с адаптивным классом точности»

УДК 004.8.032

А.Л. ЛЯХОВ, С.П. АЛЕШИН

ИСКУССТВЕННАЯ НЕЙРОННАЯ СЕТЬ КАК ИЗМЕРИТЕЛЬНЫЙ ИНСТРУМЕНТ АДЕКВАТНОСТИ МОДЕЛИ С АДАПТИВНЫМ КЛАССОМ ТОЧНОСТИ

Abstract. The work is devoted to the problem of quantitative estimation of reliability and exactness of functioning of model of the Complex Socio Technical System with the adaptive choice of the class of exactness on the basis of accounting of features of subject domain. It was established that the integral error at the output of Artificial Neuron Network (ANN) during training should be measured in each epoch, using the Smirnov's consent criterion, and assigned the statistical level of meaningfulness. In this situation the ANN acquires a feature of measuring instrument with the changeable class of exactness. It allows features of the subject domain of the system to be taken into account, a calculation of sign of completion of teaching to be automated, and an application domain of statistical criteria to be spread at choice of the parameters of teaching of the Artificial Neural Network.

Key words: artificial neural networks, complex systems, modeling.

Анотація. Робота присвячена проблемі кількісної оцінки надійності і точності функціонування моделі складної соціотехнічної системи з адаптивним вибором класу точності з урахуванням особливостей предметної галузі. Установлено, що інтегральну помилку на виході штучної нейронної мережі (ШНМ) під час навчання доцільно вимірювати у кожній епосі, використовуючи критерій згоди Смирнова, і ставити відповідно до статистичного рівня значимості. У даному випадку ШНМ набуває властивості вимірювального інструменту зі змінним класом точності. Це дозволяє враховувати особливості предметної області системи, автоматизувати розрахунок ознаки закінчення навчання і поширити область застосування статистичних критеріїв на вибір параметрів навчання штучної нейронної мережі.

Ключові слова: штучні нейронні мережі, складні системи, моделювання.

Аннотация. Работа посвящена проблеме количественной оценки надежности и точности функционирования модели сложной социотехнической системы с адаптивным выбором класса точности на основе учета особенностей предметной области. Показано, что интегральную ошибку на выходе искусственной нейронной сети (ИНС) в процессе обучения целесообразно измерять в каждой эпохе и, используя критерий согласия Смирнова, ставить в соответствие со статистическим уровнем значимости. В этой ситуации ИНС приобретает свойство измерительного инструмента с изменяемым классом точности. Это позволяет учесть особенности предметной области системы, автоматизировать расчет признака окончания обучения и распространить область применения статистических критериев на выбор параметров обучения искусственной нейронной сети.

Ключевые слова: искусственные нейронные сети, сложные системы, моделирование.

1. Введение

Построение адекватных моделей сложных социотехнических систем (ССТС) [1] в плохо формализуемых областях деятельности таких, как экология, экономика, образование, медицина, геология, финансы и др., как правило, связано со значительными трудностями при:

- сборе репрезентативных данных;

- масштабировании, нормализации и фильтрации данных;

- выборе математического аппарата для моделирования;

- построении алгоритмов как детерминированных, так и обучающихся;

- обосновании метода обучения и обеспечении его качества;

- исследовании и контроле адекватности модели и др.

Представляется перспективным использовать при моделировании ССТС известный подход на основе нейросетевых технологий, широко применяемый к сложным системам. Вместе с тем, как показано в работе [1], непосредственное применение этого подхода к ССТС также связано со значительными трудностями при:

- выборе топологии сети и ее характеристик;

- подборе параметров обучения;

- обосновании метода обучения и обеспечении его качества;

© Ляхов А.А., Алешин С.П., 2010

ISSN 1028-9763. Математичні машини і системи, 2010, № 2

- контроле адекватности обучения;

- выборе условий окончания обучения сети.

Существенной при этом является и проблема количественной оценки надежности и точности работы обученной нейронной сети, связанная с выбором значения допустимой ошибки обучения нейронной сети. При полимодальной форме поверхности ошибки, что характерно для ССТС [1], время обучения сети становится случайной величиной без гарантии сходимости итерационного процесса за конечное число циклов.

Приемлемый уровень уверенности в истинности сделанных выводов о поведении исследуемой системы по наблюдению ее модели требует строгого теоретического и количественного обоснования. Согласно существующим принципам и правилам моделирования сложных систем [2-4], адекватность модели достигается корректностью исходных предпосылок для построения модели, выбором списка переменных и гипотез вида взаимосвязи управляющих факторов с состояниями, ограничениями и ресурсами системы.

При этом, как правило, оцениваются такие характеристики модели, как работоспособность, непротиворечивость, реалистичность, чувствительность и др.

Важным аспектом моделирования является обоснованность степени доверия к оценкам решений, полученным на основе нейросетевых моделей.

В случае ССТС моделью исследуемой системы может быть искусственная нейронная сеть с несколькими скрытыми слоями нейронов и модификацией синаптического пространства по методу обратного распространения ошибки. Величина этой ошибки отображает инструментальную точность сети и находится в противоречии с временем итерационного процесса и с самим фактом его успешной сходимости [5]. Выбор допустимой величины ошибки является прерогативой самого исследователя, который в каждой конкретной задаче задает ее субъективно, руководствуясь особенностями предметной области [6].

В данной работе предлагается подход к нейросетевому моделированию ССТС, содержащий, в частности, способ выбора величины приемлемой ошибки обучения ИНС и возможность, используя статистические критерии согласия при проверке гипотез близости эмпирических распределений [7, 8], обеспечить инвариантность похода относительно предметной области.

2. Моделирование состояний ССТС

Целевое состояние ССТС представляем некоторым набором измеряемых признаков (индикаторов) в виде вектора ё в евклидовом пространстве соответствующей размерности. Текущее состояние ССТС представляем вектором признаков у той же размерности. Считаем, что значение вектора у определяется набором значений управляющих факторов х, который рассматривается как векторный аргумент целевой функции:

Цель - найти такие наборы х0, при котором целевая функция Е(х) , интегральная невязка всей совокупности индикаторов, удовлетворяет условию

(1)

в некоторой окрестности, заданной требованиями конкретной предметной области.

Как сказано выше, одним из основных факторов сложности ССТС является проблематичность построения адекватных математических моделей. В данной работе предлагается заменить математическую модель информационной, построенной на основе нейросетевых технологий.

Согласно теореме Колмогорова - Арнольда о представлении функции нескольких аргументов через сумму композиций функций одной переменной [9, 10] и ее адаптации к нейросетевому формату Хехт-Нильсеном [11], вектор признаков у текущего состояния ССТС

можно представить в виде

где Н - мощность обучающей выборки, а,V - параметры нейросети, п - количество нейронов, н’ц,н,12,...,- весовые коэффициенты нейронов.

На этом основании можно утверждать, что существует такой набор чисел Н,п,а,уг-,иг-,

при которых функция (1) аппроксимируется рядом (2) на всей области ее определения и может быть реализована с помощью трехслойной нейронной сети с любой наперед заданной погрешностью.

При таком подходе решение задачи оптимального управления ССТС сводится к минимизации функции ошибки нейронной сети при ее обучении, например, по методу обратного распространения ошибки.

3. Адекватность моделирования ССТС на основе нейронной сети

Принципиальным вопросом предлагаемого подхода является количественная оценка адекватности такого моделирования.

Вопросы о топологии и количественных характеристиках нейронной сети (достаточное количество п нейронов в (2), число синаптических связей, вид сигнальных функций и др.) являются следующим этапом исследований и здесь не рассматриваются.

Для моделирования ССТС используется нейросеть с несколькими скрытыми слоями и возможностью измерять ошибку обучения лишь на последнем слое. При этом ключевым аспектом адекватности модели является выбор способа определения и критериев оценки приемлемости величины ошибки обучения.

Функции ошибки обучения описываются соотношениями (1-2). При этом вектор у(х) следует рассматривать как величину, значения которой формируются по окончании каждой эпохи обучения нейросети случайным образом и представляются как реализации набора конкретных значений индикаторов состояния ССТС с неизвестным законом распределения У (х).

Вектор ё следует также считать случайной величиной, поскольку на практике, как правило, под целевым состоянием понимается некоторое множество подобных состояний системы

Н

(2)

(состояние здоровья человека, кредитоспособное предприятие, отлично успевающий студент и т.п.). При этом считаем, что функция распределения F этой величины также неизвестна.

Исходя из случайного характера реализаций результатов обучения на выходе сети, логично применить известные статистические критерии оценки близости рассеяния случайных величин ё и у(х ) [12]. Для моделирования ССТС воспользуемся статистическим критерием Смирнова [13], который максимально чувствителен к величине рассогласования текущих значений величин и инвариантен к виду распределений этих величин.

Задача проверки статистической близости, в данном случае, может быть представлена следующим образом. Пусть имеются две выборки значений признаков состояний системы размера

M и J из наборов индикаторов ССТС для текущих и целевых состояний соответственно.

Считаем, что функции распределения У (х ) и F (х) являются непрерывными.

Статистика критерия Смирнова измеряет степень различия между двумя функциями распределения, полученными в результате опыта. Проверяется гипотеза о том, что для двух любых выборок, извлеченных из одной и той же генеральной совокупности, т.е. описывающих текущие значения индикаторов одной и той же ССТС, имеет место

У (х ) = F (х) (3)

при любом значении аргумента. Невязка двух распределений (в нашем случае, текущего и

целевого состояний) определяется через статистику, построенную по выборкам, следующим

образом [13]:

Вт = эир | ут (х)- F (х ), (4)

х

где т - мощность выборки индикаторов текущего состояния, а Ут(х) - эмпирическая функция распределения этой выборки, которая находится известным способом:

1 т Ь

Ут(X) = — Ц/(и > х Ц), (5)

тЬ 1=11= 1

Т(( > ) I1, если Хп > х1 - ^ 7 ГГ *

где I [X 11 > х11) = < , г = 1, т , I = 1, Ь - номер управляющего фактора;

^ если Хц < хц

Ь - количество управляющих факторов;

X = {X г1} - наблюдаемые значения I-го управляющего фактора для г-й выборки.

Функцию распределения целевого состояния определим следующим образом:

Fm (х )=11 №» > ёт-)-1 )Хк < ёг)], (6)

тК г=1 к=1

где ё™11 и ёт™ - границы интервалов допустимых значений индикаторов вектора целевого

состояния.

Согласно теореме Смирнова [13], имеем

> 0: НшР „I—В < I

V 2 J

где - значения квантиля Колмогорова при выбранном уровне значимости I.

Критерий согласия Смирнова проверяет, согласуется ли заданная выборка (совокупность индикаторов текущего состояния) с заданным фиксированным распределением (совокупность индикаторов целевого состояния), т.е. насколько они близки. В практических задачах, если статистика

Ь''

2 mJ

(8)

превышает квантиль распределения Колмогорова ^(^) заданного уровня значимости /, то нулевая гипотеза Н0 (об однородности выборок) отвергается. В противном случае, принимается на уровне ^ [13].

Таким образом, количественное значение ошибки в выражении (1) через статистику Смирнова (8) и квантиль распределения Колмогорова ^(¿) установленного уровня значимости имеет детерминированную (в данном случае табличную) связь с ошибками первого и второго рода при проверке статистической близости текущего и целевого состояний исследуемой ССТС. Это позволяет корректно количественно оценивать допустимые риски с учетом особенностей предметной области. Корректность выражается в детерминированной связи статистических критериев с приемлемым (допустимым) ущербом при принятии решений, что позволяет в выражении (1) количественно установить верхнюю границу допустимой ошибки с учетом традиционно принятых в математической статистике ошибок 1-го и 2-го рода, отображающих реальный ущерб системе. Это обстоятельство автоматически устанавливает условие окончания итерационного процесса (окончание обучения нейронной сети), что следует рассматривать как адаптацию точности модели ССТС к допустимым рискам для различных предметных областей деятельности [14].

4. Выводы

1. Существующие статистические подходы к оценке адекватности модели на основе анализа доверительных интервалов при выбранных уровнях доверительных вероятностей характеризуют точность и надежность принятых решений [7]. Недостатком такого подхода является простая констатация факта и степени адекватности [8, 9], что для моделирования процесса управления сложными социотехническими системами является недостаточным.

2. В данной статье предлагается комплексирование процессов обучения нейронной сети и расчета статистических ошибок 1-го и 2-го рода, что обеспечивает достижение адекватности модели при модификации пространства синаптических весов искусственной нейронной сети. Кроме того, при этом сокращается время принятия решения, снижается степень субъективизма в выборе уровня значимости и учитываются особенности предметной области исследуемого объекта.

3. При таком подходе проявляется детерминированная взаимосвязь трех важных параметров модели: величины допустимой ошибки (возможного ущерба в системе); времени обучения сети (оперативности принятия решения); степени адекватности модели (надежности принимаемых решений), что объективно повышает возможности менеджера по принятию продуктивных решений в управлении ССТС.

СПИСОК ЛИТЕРАТУРЫ

1. Ляхов А.Л. Проблема моделирования сложных социотехнических систем / А.Л. Ляхов, С.П. Алешин // Збірник доповідей науково-практичної конференції за міжнародною участю «Системи підтримки прийняття рішень. Теорія і практика. СППР'2009» (Київ, 8 червня 2009 р.). - Київ: Інтертехнодрук, 2009. - С. 31 - 34.

2. Леонов А.Н. Моделирование в радиолокации / Леонов А.Н., Васенев В.Н. [и др.]. - М.: Советское радио, 1979. - 264 с.

3. Бусленко Н.П. Моделирование сложных систем / Бусленко Н.П. - [2-е изд.]. - М.: Наука, 1978. - 400 с.

4. Хайкин С. Нейронные сети: Полный курс / Хайкин С. - [2-е изд.]. - М.: Вильямс, 2006. - 1104 с.

5. Галушкин А.И. Нейрокомпьютеры и их применение на рубеже тысячелетий в Китае / Галушкин А.И. - М., 2004. - Т. 1. - 367 с.; Т. 2. - 464 с.

6. Вентцель Е.С. Теория вероятностей. Учебник для вузов / Вентцель Е.С. - М.: Наука, 1969. - 576 с.

7. Лемешко Б.Ю. Исследование критериев проверки гипотез, используемых в задачах управления качеством / Б.Ю. Лемешко, Е.П. Миркин // Материалы VII междунар. конф. “Актуальные проблемы электронного приборостроения” АПЭП-2004. - Новосибирск, 2004. - Т. 6. - С. 269 - 272.

8. Орлов А.И. О проверке однородности двух независимых выборок / А.И. Орлов // Заводская лаборатория. -2003. - Т. 69, № 1. - С. 55 - 60.

9. Колмогоров А.Н. О представлении непрерывных функций нескольких переменных в виде суперпозиций непрерывных функций одного переменного и сложения / А.Н. Колмогоров // Докл. АН СССР. - 1957. - Т. 114. -С. 953 - 956.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

10. Арнольд В.И. О представлении непрерывных функций трёх переменных суперпозициями непрерывных функций двух переменных / В. И. Арнольд // Доклады АН СССР. - 1957. - Т. 114, № 4. - С. 679 - 681.

11. Hecht-Nielsen R. Kolmogorov's Mapping Neural Network Existence Theorem / R. Hecht-Nielsen // IEEE First Annual Int. Conf. on Neural Networks. -1987. - Vol. 3. - Р. 11 - 13.

12. Кобзарь А.И. Прикладная математическая статистика: Справочник для инженеров и научных работников / Кобзарь А.И. - М.: Физматлит, 2006. - 816 с.

13. Большев Л.Н. Таблицы математической статистики / Л.Н. Большев, Н.В. Смирнов. - М.: Наука, 1983. -416 с.

14. Алешин С. П. Технологии построения модели менеджмента качества образовательного процесса в ВУЗе / С.П. Алешин // Международная научно-методическая конференция «Высшее образование в контексте Болонского процесса»: Сб. науч. мат. - Полтава: Полтавский национальный технический университет, 2008 . -С. 68 - 71.

Стаття надійшла до редакції 25.11.2009

i Надоели баннеры? Вы всегда можете отключить рекламу.