УДК 621.373.826:315.61
И. В. Денисов
НЕЙРОИТЕРАЦИОННЫЙ МЕТОД РЕКОНСТРУКЦИИ РАСПРЕДЕЛЕННЫХ ФИЗИЧЕСКИХ ПОЛЕЙ
Предложенный в работе нейроитерационный алгоритм реконструкции, основанный на широком использовании математической модели измерительной системы, совмещает в себе способность искусственных нейронных сетей к учету априорных знаний с надежностью и простотой алгебраических методов. Численным моделированием показано, что предложенный алгоритм обеспечивает лучшие характеристики по точности реконструкции воздействий на распределенные физические поля.
In this paper call attention to the neuro-iterative reconstruction algorithm based on the mathematical model of the measuring system. It combines the positive features of artificial neural networks and algebraic methods. Numerical simulation shows the characteristics of the reconstruction of influene for distributed physical fields.
Ключевые слова: обработка информации, распределенные поля, системы искусственного интеллекта, итерационные методы, волоконно-оптическая томография.
Key words: information processing, distributed physical fields, artificial intelligence systems, iterative methods, fiber-optical tomography
Вестник Балтийского федерального университета им. И. Канта. 2012. Вып. 4. С. 155—160.
156
Решение задачи реконструкции данных в измерительных системах от распределенных физических полей на практике осложнено ограниченным числом измерительных каналов, что ведет к неполноте проекционных данных, недостаточных для однозначной реконструкции распределения внешнего воздействия. При реконструкции распределений по неполным проекционным данным получаемая система линейных алгебраических уравнений (СЛАУ) оказывается недоопреде-ленной. С практической точки зрения это означает, что одному и тому же вектору проекционных данных у в общем случае соответствует бесконечное число распределений х:
Ах1=Ах2=... Ахт = у, где х ^ х2 ^ ••• ^ х«.
Однако, если известно, что все распределения х принадлежат одному классу, ограниченному множеством X так, что для Ух є X существует единственное обратное преобразование
х = О (у), (1)
то однозначная реконструкция распределений этого класса теоретически возможна с любой заданной точностью. В таких условиях важную роль играет возможность учета на этапе реконструкции априорных знаний о характере распределения, выраженных в виде признаков, ограничивающих множество решений X.
Однако задача выявления и аналитического представления этих признаков в рамках традиционных методов вычислительной томографии зачастую сложно формализуется.
В существенной степени лишены отмеченного недостатка нейросе-тевые методы реконструкции, подразумевающие прямую реализацию преобразования (1), получаемую путем обучения искусственных нейронных сетей (ИНС) на примерах распределений х, ограниченных классом X и соответствующих им проекций у, снимаемых с реальной измерительной системы. Но применение нейросетевого подхода на практике ограничено рядом принципиальных недостатков [1; 2].
Предлагаемый нейроитерационный метод реконструкции (НИМР) показан на рисунке и направлен на устранение указанных недостатков нейросетевого подхода. Метод основан на широком использовании математической модели измерительной системы и совместном применении нейросетевого и алгебраического подходов, где первый учитывает априорные знания и используется для выбора начального приближения решения, а второй обеспечивает соответствие решения исходной системе алгебраических уравнений.
Алгоритм реконструкции в представленной схеме рассматривается как инверсная реализация математической модели измерительной системы (информация распространяется в обратном направлении). Здесь
функции /вх (-), (') и их инверсные реализации /Вх1(-), /;ь11Х (•) учи-
тывают передаточные характеристики отдельных измерительных преобразователей (функции с индексом «вх») и измерительных каналов целиком (функции с индексом «вых»). Кроме того, с помощью этих
функций выполняется нормирование данных X и у, относительно которых в выполняется основная часть вычислений. Обучение ИНС на модельных данных снимает необходимость проведения большого числа натурных экспериментов, а его выполнение на примерах нормированных данных, из которых исключены индивидуальные особенности технической реализации измерительной сети, снижает зависимость нейросетевого решения от аппаратной платформы, на которой эти данные были получены. Дополнительную эффективность прием приобретает в случае нелинейности функций /ех (•), (•), поскольку при
этом дополнительно достигается упрощение используемых структур ИНС и сокращение вычислительных затрат на итерации.
Рис. Нейроитерационный метод реконструкции
В качестве итерационной части в предлагаемом решении может применяться любой итерационный алгоритм, допускающий возможность использования начального приближения. Здесь необходимо отметить, что активизация итерационной части предлагаемого метода обработки может выполняться только в том случае, если результат ней-росетевой реконструкции оказывается неудовлетворительным, что может произойти при реконструкции распределения, чей класс отличается от используемого при обучении ИНС.
В качестве итерационного алгоритма для алгоритмической реализации предлагаемого метода выбран метод MART [3]. В нем все компоненты начального приближения х(0) > 0, а итерации имеют следующий вид:
г(*+1) _
3
(
Уг
v <г(*) ,
Л *)
157
где g = 1, если у-я компонента х входит в г-е измерение у1, и g = 0 в противном случае.
158
Распространение метода MART (ограниченный вариант по аналогии с ART2 назовем MART2) и на случай решения систем нелинейных алгебраических уравнений приводит к формуле:
x(k+D
Уг
xf^ i = 1, m, j = 1, n,
j
где y — г-й элемент вектора измерений y, H{x(k)} — расчетное значение уг относительно текущего решения x(k(оператор H{•} реализует нелинейное отображение y = H{x} ); g = 1/ h, если j = 1, в противном случае g = 0, h — число компонент x, участвующих в формировании г-го измерения у. Таким образом, если в линейном варианте MART все компоненты вектора х, аддитивно участвующие в образовании проекции у, корректируются кратно ошибке, то в нелинейном варианте, имеющем мультипликативную форму, корректировка выполняется пропорционально корню степени h из этой ошибки. В обоих случаях после каждой г-й корректировки достигается равенство фактически измеренной проекции у и ее расчетного значения H{x(k)}i.
Во всех экспериментах в качестве нейросетевой части НИМР используются линейные сети, параметризуемые аналитически с помощью метода наименьших квадратов, что снимает проблему их обучения. Необходимые в НИМР функции обратных передаточных характеристик измерительных преобразователей f 1 (•) получены путем аппроксимации соответствующих закономерностей степенными полиномами шестого порядка.
Обучение нелинейных ИНС (персептроны), представляющих традиционный нейросетевой подход к задаче реконструктивной томографии, выполнено с помощью алгоритма Левенберга — Марквардта. Особенностью нейросетевой реконструкции является то, что она, в отличие от алгебраических методов, может быть выполнена независимо для отдельных точек распределения. С целью упрощения численные эксперименты выполнены на примере реконструкции единственной точки распределения. Данное упрощение не оказывает принципиального влияния на объективность проведенного исследования, позволяя при этом существенно сократить его время. Для объективности сравнения различных методов реконструкции, рассматриваемых в работе, этот способ оценки качества применялся во всех численных экспериментах. Активационная функция — гиперболический тангенс. Для оценки качества реконструкции в исследовании используются среднее (абсолютное) и максимальное отклонения температуры по независимой тестовой выборке, записанные через дробь в форме: среднее/максимальное (Q^ /Е^).
На первом этапе исследования как обучающие, так и тестовые выборки формируются с помощью нелинейной модели измерительной
системы, из которой для чистоты сравнительного эксперимента исключен шум. Все тестовые выборки содержат 5000 примеров распределений.
Результаты показали, что топология ИНС усложняется скачкообразно с возрастанием объемов обучающих выборок уже при переходе от одной до двух точек одновременного воздействия. При этом получаемые результаты оказываются хуже теоретически ожидаемых [4] и не только уступают результатам НИМР, но и в большинстве рассмотренных случаев не превосходят результаты классического метода МЛКТ2, полученные на основе линеаризованной модели измерительной системы. Возникшие трудности обучения ИНС можно объяснить тем, что реализуемый ими класс функций слабо пересекается с классом функций, необходимым для представления решения задачи реконструкции точечных распределений. Полученные результаты позволяют делать вывод о том, что применение ИНС для целей томографической реконструкции этого класса распределений теоретически возможно, но практически непродуктивно.
Результаты реконструкции гладких распределений как с точки зрения качества, так и с точки зрения сложности обучения ИНС принципиально отличаются от результатов реконструкции точечных распределений. Здесь реализуемый ИНС тип нелинейности более эффективно учитывает априорные признаки реконструируемого вида распределений, чем это достигается при использовании линейных сетей, применяемых в НИМР.
При тестировании рассматриваемых решений на типах распределений, отличных от используемых при обучении, снижение качества реконструкции регистрируется в обоих случаях (ИНС и НИМР). Однако в случае НИМР это снижение оказывается меньше, а итоговое качество реконструкции выше, чем достигаемое при использовании исключительно нелинейных ИНС.
Недостаток информации при решении исходно недоопределенной задачи реконструкции компенсируется априорными знаниями о классе реконструируемых распределений. Чем сильнее эти знания, тем меньше неопределенность и выше качество реконструкции. В случае нейросетевой реконструкции эти знания «впитываются» ИНС в процессе ее обучения. Их распространение на другие классы распределений, для которых эти знания ложны, наоборот, может привести к появлению дополнительных ошибок. Наличие в НИМР итерационной части, приводящей в случае необходимости реализуемое нейронной сетью начальное приближение решения к его соответствию исходной СЛАУ, существенно снижает этот недостаток. Не вошедшие в настоящее изложение эксперименты показали, что на примерах гладких распределений итерационная часть НИМР в среднем снижает среднее и максимальное отклонение на 37 и 44 % соответственно. Таким образом, в режиме обобщения НИМР на базе линейных нейросетей превосходит результаты, получаемые в этих же условиях с помощью исключительно нелинейных ИНС.
159
Список литературы
1. Галушкин А. И. Нейрокомпьютеры. Кн. 3 : учеб. пособие для вузов. М.,
2. Калан Р. Основные концепции нейронных сетей. М., 2001.
3. Терещенко С. А. Методы вычислительной томографии. М., 2004.
4. Kulchin Yu.N., Denisova E. V., Denisov I. V. Application of algebraic and neural-like methods for reconstruction of distribution functions of physical fields // Optical Memory & Neural Networks. 2003. Vol. 12, № 4. P. 283 — 297.
2000.
Об авторе
160
Игорь Викторович Денисов — канд. физ.-мат. наук, доц., Балтийский военно-морской институт им. Ф. Ушакова, Калининград.
E-mail: [email protected]
About author
Igor Denisov — PhD, associate professor, lecturer, BMMI, Kaliningrad. E-mail: [email protected]