Научная статья на тему 'Варианты построения алгоритма поиска решения обратных задач с применением нейронных сетей'

Варианты построения алгоритма поиска решения обратных задач с применением нейронных сетей Текст научной статьи по специальности «Математика»

CC BY
341
81
i Надоели баннеры? Вы всегда можете отключить рекламу.
Область наук
i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Варианты построения алгоритма поиска решения обратных задач с применением нейронных сетей»

кладываемые операциями над нечеткими числами и переменными. При этом реализуется единый подход к совместному анализу как четких, так и нечетких параметров в полумарковской модели системы.

Применение предложенной методики в АК «Транснефть» (г. Москва) позволило повысить эффективность системы технического обслуживания и ремонта оборудования для трубопроводной транспортировки нефти за счет рационализации сроков проведения ремонтных мероприятий и выбора видов ТО. Следует отметить, что методика допускает программную реализацию, которая может использоваться как компонент ПО информа-

ционных систем ТО и ремонта оборудования сложных технологических систем.

Литература

1. Bhattacharyya M. Fuzzy Markovian decision process // Fuzzy Sets and Systems. 1998. Vol. 99, pp. 273-282.

2. Praba B., Sujatha R., Srikrishna S. Fuzzy reliability measures of fuzzy probabilistic semi-Markov model // Int. Journal of Recent Trend in Engineering. 2009. Vol. 2. No 2, pp. 25-29.

3. Praba B., Sujatha R., Srikrishna S. A study on homogeneous fuzzy semi-Markov model // Applied Mathematical Sciences. 2009. Vol. 3. No 50, pp. 2453-2467.

4. Метод построения нечеткой полумарковской модели функционирования сложной системы / Ю.Г. Бояринов [и др.] // Программные продукты и системы. 2010. № 3 (91). С. 26-31.

УДК 004.032.26

ВАРИАНТЫ ПОСТРОЕНИЯ АЛГОРИТМА ПОИСКА РЕШЕНИЯ ОБРАТНЫХ ЗАДАЧ С ПРИМЕНЕНИЕМ НЕЙРОННЫХ СЕТЕЙ

Д.А. Павлов; А.Ю. Пучков, к.т.н.

(Смоленский филиал Национального исследовательского университета «МЭИ»,

putchko v63@ma^l■ги)

Рассмотрены два варианта построения алгоритма численного решения обратных задач с помощью искусственных нейронных сетей и предварительной обработки измерений дискретным фильтром Калмана. Ключевые слова: обратные задачи, нейронные сети, фильтр Калмана.

Перспективным направлением развития современных информационных технологий являются разработка и внедрение систем поддержки принятия решений. Такие системы используются в различных сферах деятельности, но особенно востребованы там, где решаемые задачи плохо структурированы и трудно формализуемы. Для решения задач подобного рода применяются методы искусственного интеллекта: продукционные модели, нечеткая логика, искусственные нейронные сети и их комбинации [1]. Все эти задачи условно можно разделить на две группы:

- прямые задачи, в которых по входным данным модели процесса надо определить выходные значения используемой модели (в частности, задачи планирования, оценки альтернативных решений);

- обратные задачи с известными выходными значениями модели, на основании которых проводится поиск входных данных, приводящих к появлению имеющихся выходных; с точки зрения математики обратные задачи часто являются плохо поставленными, относящимися к классу некорректных задач [2].

Расширение сферы применения систем поддержки принятия решений делает востребованным

поиск новых подходов к решению обратных задач, базирующихся на увеличивающихся возможностях средств вычислительной техники. Эти возможности позволяют разрабатывать и применять новые методики, например, методы на основе искусственных нейронных сетей, ранее считавшиеся чрезмерно затратными с точки зрения машинных ресурсов.

Методы решения прямых задач достаточно хорошо разработаны и изучены как соответствующие привычной постановке проблемы: есть данные на входе объекта и надо определить, что будет на его выходе, если модель объекта известна. Этого нельзя сказать про обратные задачи, методы решения которых чаще всего базируются на учете специфики предметной области. В то же время необходимость решения обратных задач (например, задач диагностики) на практике возникает достаточно часто, поэтому актуальным становится поиск новых методов и подходов к их решению.

Для обратных задач характерна ситуация, когда незначительные изменения исходных данных могут приводить к произвольно большим изменениям решений. В этих условиях для решения обратной задачи предложено использовать искусственную нейронную сеть, но на вход ей подавать

данные, прошедшие процедуру фильтрации. Нейронные сети для решения обратных задач уже успешно применялись [3]. Фильтр помогает снизить уровень шумовых составляющих измерений и, как следствие, их влияние на результат решения. Из многообразия алгоритмов фильтрации был выбран фильтр Калмана, так как он позволяет использовать часть априорной информации, снижая тем самым неопределенность данных для решения обратной задачи нейронной сетью. Кроме этого, алгоритм фильтра может записываться в форме разностных уравнений, что особенно ценно при реализации их в вычислительных устройствах.

В общем случае обратную задачу можно описать следующим образом. Пусть x=G(v), где входной вектор V принадлежит множеству V, оператор G, описывающий отношения между данными и параметрами модели, представляет собой физическую систему, выходной вектор хе(К). В случае линейной обратной задачи, описывающей линейную систему, x=Gv. Для нелинейной обратной задачи G представляет собой нелинейный оператор, который не может быть приведен к виду линейного отображения, переводящего в данные. Задача состоит в том, чтобы по информации о векторе х определить вектор V.

Применение нейронных сетей позволяет получать решение обратных задач как для линейного, так и для нелинейного оператора G. Однако оператор G-1 должен удовлетворять требованиям теоремы о полноте, то есть быть непрерывным на замкнутом ограниченном множестве данных. В этом случае он может быть равномерно приближен функциями, вычисляемыми нейронными сетями, если функция активации нейрона дважды непрерывно дифференцируема [1]. Тогда, выбрав искусственную нейронную сеть с соответствующей структурой, можно найти решение задачи v=G-1(x) с точностью, определяемой точностью задания вектора х и оператора G.

Рассмотрим предлагаемый метод решения линейных обратных задач в постановке, характерной для теории автоматического управления. Уравнение, связывающее входной и выходной вектор,

x=Gv, (1)

имеет решение V на V только для таких элементов х, которые принадлежат множеству GV. Предполагается, что оператор G известен точно, а вектор х обычно известен приближенно, так как представляет собой результат измерений, для которых характерно наличие векторного шума измерения N вызывающего неточность определения х. Если и=Сх+^ - это измеренное значение х, где С - матрица измерений соответствующего размера, то речь может идти лишь о нахождении приближенного к V решения уравнения C-1u=Gv, при этом и не принадлежит множеству GV. Кроме наличия шума измерений, оператор G, будучи сам непрерывным, во многих случаях не позволяет полу-

чить непрерывный обратный оператор G- . В сложившейся ситуации в качестве приближенного решения нельзя брать точное решение (1) с приближенно заданным и, так как

- решение может не существовать на множестве V, поскольку и может не принадлежать множеству GV;

- решение не будет устойчивым, так как обратный оператор G-1 может не быть непрерывным. В то же время условие единственности решения обычно является следствием физической детерминированности задачи (1), и решение должно обладать этим свойством.

С другой стороны, в практических приложениях обычно требуется знать решение с некоторой точностью, поэтому можно применить метод подбора решения некорректно поставленных задач [2]: полагая, что x известен точно для элементов v некоторого заданного подкласса возможных решений VB, (VBeV), вычисляется оператор Gv, то есть решается прямая задача. За приближенное решение принимается такой элемент vn из множества VB, который минимизирует невязку p(Gvn, x)=min p(Gv, x).

Построение устойчивого к малым изменениям и приближенного решения уравнения (1) по формуле v=G-1 С-1и возможно в тех случаях, когда это решение ищется на компакте Me V и C-1ueH=AM Эффективных критериев, позволяющих установить принадлежность С-1и множеству H, обычно не существует, это приходится предполагать априори [2].

Устранение затруднений, связанных с неточным знанием x, осуществляется путем поиска квазирешения vKB, минимизирующего на M функционал p(GvKB., C-1u)=inf p(Gv, С-1и), где inf - нижняя граница возможных значений функционала. Квазирешение может быть и не одно, в этом случае под ним будем подразумевать любой элемент из множества квазирешений.

Объединение приближенного метода нахождения решения обратной задачи и метода поиска квазирешения приводит к приближенному нахождению квазирешений [2], позволяющему перейти от бесконечного пространства квазирешений к пространству, содержащему конечное число приближенных квазирешений vKB.n. Квазирешение уравнения (1) может быть не единственным, а представлять собой совокупность квазирешений Т. В качестве приближения к квазирешению vKB на множестве M можно брать любой элемент vKBn из Т, при этом lim p(vKBn, vm ) = 0.

Для применения фильтра Калмана необходимо представить вектор х в виде векторно-матричного дифференциального уравнения dx/dt=Ax+s, где А -матрица системы; s - случайный процесс типа белого шума, называемый порождающим процессом. Должны быть также известны статистические

характеристики процессов Ы, s и соответствующие начальные условия. В результате расчета фильтра определяется его коэффициент усиления К.

В предлагаемом подходе структура алгоритма решения обратной задачи будет изменяться в зависимости от того, задан оператор преобразования G точно или он точно неизвестен. Структура решения, соответствующая первому варианту, показана на рисунке 1, второму - на рисунке 2. Представленные схемы реализуют приближенный метод поиска квазирешения обратной задачи.

На рисунках введены обозначения: х - оценка вектора х; INT - интегратор; BIC (Block of an indistinct conclusion) - блок нечеткого вывода, обеспечивающий формирование матрицы А на основании внешней информации I о преобразовании G; хи, уи - значения векторов x и v, полученные на модели оператора G. Пунктирные линии обозначают, что эти связи используются на начальном этапе реализации алгоритма для обучения нейронной сети и подстройки матрицы А.

Обработка результатов измерения и проводится с применением фильтра Калмана: этот алгоритм позволяет оценивать весь вектор состояния, в то время как в результатах измерений могут присутствовать лишь некоторые его компоненты. На вход гибридной нейронной сети поступает уже не измерение и, а оценка х. Выбор гибридных сетей обосновывается тем, что в них допускается не только автоматическое приобретение знаний

на основе обучающих выборок, но и коррекция БЗ на основании априорной информации, которой располагают эксперты соответствующей предметной области.

Если оператор G известен точно, то, используя значения у,- из заданного подкласса возможных решений ¥в, (Уве V), и решая прямую задачу, можно получить наборы соответствующих х,. Для обучения нейронной сети используется множество пар {х,, у,}, где /-1, ..., т (т - объем обучающей выборки), но на вход сети подаются наборы х,, а с выхода снимаются у,. Особенностью предложенного подхода к нахождению приближенного квазирешения уквп обратных задач является применение гибридной нейронной сети для аппроксимации поверхности квазирешений на основании оценки х вектора х.

Если оператор G задан неточно или неизвестен, возникает проблема формирования обучающей выборки. При неточно заданном операторе можно попробовать применить описанный выше подход к формированию обучающей выборки и провести на ней обучение нейронной сети. Ответ на вопрос о допустимости неточности задания G можно будет получить после тестовых расчетов, и, если результаты устраивают исследователя, можно рекомендовать практическое применение.

Если же оператор G неизвестен, предлагается формирующий фильтр, который в данном случае будет использоваться как модель преобразования, описываемого оператором G, на входе которого вектор уи, а на выходе вектор хи. Структура формирующего фильтра известна, а значения параметров определяются на основе процедуры нечеткого логического вывода в блоке В1С, БЗ которого заполняется знаниями экспертов той предметной области, для которой решается обратная задача [4].

Математически строгое обоснование такого подхода весьма громоздко, поэтому критерием допустимости его применения вновь может служить получение результатов, ценных с практической точки зрения. Рассмотрим иллюстративный пример решения обратной задачи, в котором объектом исследования будет сервомотор на постоянном токе. Входным сигналом для него выступает прилагаемое к обмоткам напряжение у(/). Ток /(/) в цепи ротора описывается соотношением у(0= =R/(t)+Ld/(t)/dt+s(t), где R, L - активное сопротивление и индуктивность ротора

-►

x

G

K

BIC

I

INT

A

Тг

JE

A

__Il

с 4

GNN

Уи ^ j-

INT

I I I

* J

I- _________I

Рис. 2. Схема решения при точно неизвестном операторе G

N

x

u

C

Укв.п

I

V

соответственно; £(/) - обратная электродвижущая сила. Эта сила, обусловленная вращением схемной рамки в магнитном поле, подчиняется зависимости где п(0 - угол поворота оси мотора. Вращающий момент на оси мотора, создаваемый током, описывается уравнением Твр(0=ад0. В данных формулах ^ - коэффициенты пропорциональности соответствующих размерностей.

На ось также действует момент нагрузки Тнагр(0, тогда в соответствии с третьим законом Ньютона можно записать J d2n(t)/d2/=Tвр(t)--Т^ДО-к^ где J - момент инерции ротора

и нагрузки; - вязкое трение. Пренебрегая индуктивностью схемной рамки, L=0, можно преобразовать последнее уравнение к форме пространства состояний:

dt

n2 (t)

v d 2t у ' 0 Y / т

1

-1/т

n(t) ^

n(t)

dt

0

р / т

'С) +

THarp (t),

(2)

где т =

Y = ■

JR

М + ка к

в=

KR + ка к

R

М+k k

(3)

Полученные уравнения отражают зависимость сигналов в непрерывном времени. Но, как уже отмечалось, вычислительные алгоритмы удобнее реализовывать для дискретного времени. Поэтому осуществляется переход от описания в непрерывном времени (2) к описанию в дискретном времени. Приложим кусочно-постоянный входной сигнал и дискретизируем выходной с интервалом T. Тогда, полагая момент нагрузки равным нулю и

rn(t) ^ n(t)

<(t)=

вводя вектор

V dt у

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

дискретного времени запишем как x(t+T)=4T (т, в) x(t)+BT (т, P)v(t),

уравнение (2) для

где AT (т,в) = e

1 т

—тЛ ^

1 - e

(4)

(5)

вт (т, в)=¡e

T (0 1 1т i

0 -1/т|

в / т

d т =

Л

в(те т -т + T)

-T

т

.(6)

р(1 - е т )

Далее введем оператор q сдвига вперед на Т единиц времени и перепишем (4) с учетом этого оператора:

№-Лт(т, Р)]х^Т)=£х(т, Р^^Т), (7)

где Е - единичная матрица.

Формула (7) позволяет окончательно записать модель в виде, соответствующем (1):

v(kT), (8)

где в данном случае GT=[qE-Ax(т, Р)]-1 Вх(т, Р).

Фактическое измерение величины угла п(0 осуществляется с ошибкой А(/), обусловленной ограниченной точностью, например, из-за градуировки шкалы измерительного прибора. Эта ошибка может быть описана последовательностью независимых случайных величин А^Т) с нулевым средним и известной дисперсией, рассчитанной по ошибкам округления в процессе измерений. Тогда модель измерений принимает вид

и^Т)=Сх^Т)+А^Т), (9)

где С=(1 0).

Для проведения численного эксперимента зададимся численными значениями параметров: Я=10, kv=2,5, ka=1,7, kxp=0,9, J=1,5, Т=0,5. В результате расчетов по формулам (3), (5) и (6) полу-

чаем т=1,132, в=0,128, Ат =

0,404 0,643

BT =

0,012 0,046

G =

0,234 -0,32

Для реализации численных расчетов использовалась среда Ма^АВ. Сформировав в ней вектор значений сигнала v(kT) и используя (8), рассчитывается обучающая выборка для гибридной нейронной сети. Выборка содержит пары значений векторов {х^Т), v(kT)}, £=1, ..., т. Имитация процесса измерений проводилась в соответствии с (9), при этом для моделирования шума А^Т) использовался генератор псевдослучайных равномерно распределенных на интервале [0, 1] чисел. Результаты моделирования показаны на рисунке 3.

Рисунок отражает ожидаемую ситуацию, когда приближенное квазирешение ^в.п обратной задачи без предварительной фильтрации имеет большую дисперсию, чем решение, найденное при использовании фильтра Калмана. В данном примере без

Рис. 3. Графики результатов моделирования процессов

+

к

а

0 1

T

0 — 1/т

T

0

х

e

T

использования фильтрации среднеквадратичная ошибка составляет 0,21, а с фильтром получено значение 0,1657, что показывает эффективность применения предложенного подхода. Влияние относительных уровней шумов и сигналов на величину среднеквадратичной ошибки требует дополнительных исследований и экспериментов.

Предложенный подход к нахождению решений обратных задач может использоваться в различных практических ситуациях, когда достаточно получить численное, а не аналитическое решение задачи.

Литература

1. Круглов В.В., Дли М.И., Голунов Р.Ю. Нечеткая логика и искусственные нейронные сети. М.: Изд-во Физматлит, 2001. 224 с.

2. Тихонов А.Н., Арсенин В.Я. Методы решения некорректных задач. М.: Наука, 1979.

3. Новые возможности в решении обратных задач лазерной спектроскопии с применением искусственных нейронных сетей / И.В. Гердова [и др.] // Изв. РАН: Сер. Физическая. 2002. Т. 66.

4. Абраменкова И.В., Пучков А.Ю., Павлов Д.А. Нейро-нечеткий метод снижения чувствительности решения обратных задач к вариациям данных // Программные продукты и системы. 2011. № 4 (96).

УДК 378.146: 519.67

ЭКСПЕРИМЕНТАЛЬНОЕ ПОДТВЕРЖДЕНИЕ СОСТОЯТЕЛЬНОСТИ ОЦЕНОК ТРУДНОСТИ ЗАДАНИЙ ТЕСТА

И.Н. Елисеев, к.т.н.

(Южно-Российский государственный университет экономики и сервиса, г. Шахты, ет(а^вв;и.ги)

Состоятельность оценок максимального правдоподобия латентного параметра «трудность задания» однопара-метрической дихотомической модели Раша при фиксированном числе одинаковых по трудности заданий теста Ь и неограниченно возрастающем объеме выборки студентов N подтверждена результатами вычислительного эксперимента. Показано, что при этих же условиях оценки 9* уровня подготовки г'-го студента, рассчитанные по допустимой дихотомической матрице ответов, стремятся по вероятности к их первоначальным оценкам 9°.

Ключевые слова: дихотомическая матрица, тест, состоятельность оценок, задание теста, латентный параметр, модель Раша.

Для независимой оценки состояния учебной работы образовательного учреждения в качестве входных данных используются результаты тестирования учебных достижений обучаемых с помощью педагогических тестов. При прочих равных условиях надежность этих результатов будет определяться качеством тестов и входящих в них заданий. Одним из важных показателей качества последних является точность определения латентного параметра «трудность задания» теста в/ (точность калибровки задания). Чем точнее определены значения в/, тем с меньшей погрешностью будут найдены значения 9, латентного параметра «уровень подготовки» студента.

Оценки р* и 9* латентных параметров в/ и 9,

рассчитываются по результатам тестирования, которые представляются в виде дихотомической матрицы ответов Х=(х,/) [1]. Расчет оценок осуществляется численными методами на основе итера-ционых выражений [1, 2], полученных с использованием метода максимального правдоподобия:

Е Р = X: 1=1

N

Е р = у

1 = 1, 2,

, N,

(1)

] = 1, 2,..., Ь,

У,

N

= Е

¿=1

х - столбцо-

где х = ^ ху - строчные,

у=1

вые суммы элементов матрицы X. Вероятности р/ правильного выполнения /-м студентом с уровнем подготовленности 9, '-го задания трудностью в/ определяются дихотомической моделью Раша:

Р =■

1 + е

в,-в,

(2)

Важным требованием к оценкам максимального правдоподобия р* и 9* латентных параметров

однопараметрической дихотомической модели Раша является наличие у них свойства состоятельности. Традиционное определение состоятельности к оценкам этих параметров неприменимо, поэтому в работе [3] предложено следующее условие состоятельности для оценок латентных параметров модели Раша.

Пусть (9,, (Р} )™=1 - числовые последовательности. При всех N £>2 рассмотрим оценки 9* параметров 9,, /=1, 2, ..., N и оценки р* параметров в/, '=1, 2, ..., рассчитанные по формулам (1), для дихотомической матрицы ответов X размера полученной в результате ответа N тес-

ь

ь

i Надоели баннеры? Вы всегда можете отключить рекламу.