Научная статья на тему 'Применение приближенных алгебраических и нейросетевых методов решения томографической задачи'

Применение приближенных алгебраических и нейросетевых методов решения томографической задачи Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
76
15
i Надоели баннеры? Вы всегда можете отключить рекламу.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Денисова Е. В., Денисов И. В.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Применение приближенных алгебраических и нейросетевых методов решения томографической задачи»

Применение приближенных алгебраических и нейросетевых методов решения томографической задачи

Денисова Е.В., Денисов И.В. ([email protected] )

Морской государственный университет им. адм. Г.И. Невельского,

г. Владивосток

Введение

Решение целого ряда задач теоретического и практического характера требует восстановления функций распределения физических полей, параметры которых регистрируются измерительными линиями или некоторым проникающим излучением. При этом характеристики распространяющегося по исследуемой области излучения изменяются в зависимости от характеристик внешних физических полей, а сигнал на выходе измерительной линии представляет собой линейный интеграл от функции распределения исследуемого параметра физического поля. Математически - это классическая томографическая задача, т.к. для больших исследуемых полей количество информационных каналов меньше, чем число неизвестных в уравнениях [1, 2]. Поэтому для решения данной некорректной задачи требуется применение специальных методов обработки информации (итерационных или нейроподобных).

Такая задача представима в следующем виде. Пусть Х1=С, Х2=Ь2 -метрические пространства и пусть А: Х1 ^ Х2 - интегральный оператор, переводящий непрерывную на компакте функцию / во множество ее интегральных проекций к. В общем виде требуется решить уравнение А/ = к. Задача сводится к отысканию, вообще говоря, приближенного решения в восстановлении искомой функции / по конечному числу интегральных данных. Величина на выходе представляется следующим интегралом:

/ = $/(х,у)йЬ, (1)

Ь

где Ь - прямая, вдоль которой проложена измерительная линия.

Пусть все измерительные линии Ь (I =1, 2, ..., т) лежат в одной плоскости (например, ХОУ), в соответствии с параллельной схемой сканирования. Такая схема представляет собой систему равноудаленных друг от друга параллельных прямых, заданных в нескольких направлениях. В соответствии с этим, можно считать, что функция распределения / является функцией от двух переменных в некоторой области £ с Я2. Тогда значения интегральных данных примут вид gi - $/(х,у№Ц.

В результате дискретизации [2], интегральные уравнения преобразуются в систему т линейных уравнений с п неизвестными, которая в матричной форме имеет вид:

АХ = В, (2)

где А - матрица размера тхп, В - столбец высоты т, X- столбец высоты п.

Таким образом, требуется найти решения системы (2), что в случае томографической задачи можно выполнить приближенными алгебраическими или нейроподобными методами. В настоящее время, при решении томографической задачи восстановления физических полей, распределенных на протяженной области, посредством нейронных сетей наибольшее распространение получило применение нейронных сетей типа персептрон [3, 4]. Причем для однозначного восстановления параметров физического поля размерностью п=кх1 требуется использовать т=2к+21-1 информационных каналов измерительных линий или излучений (рис. 1).

Необходимость введения третьего, диагонального, направления сканирования обусловлена неоднозначностью восстановления параметров физических полей при использовании только двух направлений [5]. Однако для протяженных физических полей, имеющих большую размерностью п, число информационных каналов т значительно возрастает с увеличением п. Это служит препятствием для практической реализации вычислительных систем на основе схемы сканирования физического поля по трем направлениям.

Наряду с этим, существует большое число случаев, когда воздействие на исследуемую область является одиночным или саму исследуемую область можно разделить на несколько малых участков, с решением задачи восстановления в каждом из них отдельно. С целью решения таких задач достаточно применять взаимно-перпендикулярную схему укладки информационных каналов.

Ь,

к

I

Рис. 1. Схема сканирования физического поля по трем направлениям

Причем их число существенно меньше числа информационных каналов т при использовании схемы сканирования физического поля по трем направлениям и не так сильно зависит от размерности п. Более того, в этом случае представляется возможным решить задачу восстановления функции распределения одиночного воздействия с использованием приближенных алгебраических методов решений [6, 7].

В данной работе рассматриваются приближенные алгебраические методы решения томографической задачи восстановления характеристик протяженных физических полей в сравнении с нейросетевым методом решения такой задачи.

Приближенные алгебраические методы

В качестве приближенных методов решения томографической задачи рассмотрим такие наиболее употребительные алгебраические методы как метод псевдорешения и псевдообратных матриц, метод регуляризации и метод Гревиля

1. Псевдорешение и псевдообратные матрицы.

Если система (2) несовместна, естественно постараться найти столбец X, который дает невязку и = В - АХ с минимальной нормой, и если такой столбец найдется, считать его обобщенным решением системы [7].

В общем случае неизвестно, существует ли решение системы (2). Поэтому представляет интерес столбец, дающий минимальную по норме невязку.

Норма вектора X минимальна тогда и только тогда, когда он удовлетворяет уравнению:

АТАХ = АТВ, (3)

которое носит название нормальной системы [7]. Система (3) всегда является совместной [7].

Под нормальным псевдорешением системы линейных уравнений понимается столбец с минимальной нормой среди всех столбцов, дающих минимальную по норме невязку при подстановке в эту систему. Под псевдообратной матрицей для матрицы А, размером тхп понимается матрица А+, столбцы которой являются псевдорешениями систем линейных уравнений вида АХ = еи где в1 - столбцы единичной матрицы порядка т.

Каждая матрица имеет одну и только одну псевдообратную. Таким образом, псевдорешение системы линейных уравнений (2) может быть записано в виде:

Х0 = А+В. (4)

2. Регуляризация.

Будем считать, что вместо точных значений элементов матрицы А и вектора В заданы приближенные значения А и В .

Составим регуляризующий функционал [1, 5]

I ~ ~ 2 2

Еа(Х)= АХ - В +у||Х||2. (5)

Его значения на всем евклидовом пространстве достигают своего минимума в единственной точке пространства. Так как выполняется необходимое условие минимума, то З^у = 0 . Это условие в матричной форме имеет вид:

(АТА + у ■ ЕX = Атв. (6)

Уравнение (6) является нормальной системой, которая всегда совместна. Для нахождения ее нормального решения необходимо устремить у ^ 0.

2. Метод Гревиля.

Метод Гревиля основан на дописывании к исходной матрице А дополнительного столбца или строки в зависимости от того, АА+а равно а или нет [6]. Данный метод можно использовать для построения псевдообратной для данной матрицы А последовательными вычислениями следующей серии

А1 'А2 ,А+-\,А+ = А .

Нейросетевой метод

В настоящее время существует большое количество разработанных и хорошо изученных нейросетевых алгоритмов [3, 8, 9]. Как отмечалось в работах [5, 10 - 12], для решения томографической задачи восстановления характеристик протяженных физических полей по интегральным данным (1) задачи (2) наиболее перспективным является использование нейронных сетей типа персептрон. Его использование позволяет производить параллельную обработку информации за один проход от входа к выходу нейронной сети. Это открывает перспективу обработки информации с высокой скоростью, вплоть до скорости света для оптической информации.

В случае томографической задачи схема укладки линий или других информационных каналов представлена на рис. 1. Как видно из рисунка, для физического поля размерностью п=кх1 требуется использовать т=2к+21-1 информационных каналов измерительных линий или излучений. Это означает, что при использовании простейшего линейного двухслойного персептрона число нейронов в слоях нейронной сети будет равно п и т, соответственно.

Для однозначного решения томографической задачи (2) по данным (1) необходимо ввести априорную информацию о характере исследуемой функции, дискретную выборку значений которой представляет вектор Х. Разработанный для ЭВМ традиционный итерационный алгоритм предполагает поиск такой дискретной выборки Xв представляемых нейросети для обучения парах (X, В), которая описывает наиболее гладкую функцию из всех возможных для данного набора томографических данных В [5].

Выполнение этого условия требует при формировании обучающих пар применения итерационного алгоритма, аналогичного традиционным алгоритмам обработки томографических данных. Как показали результаты численных экспериментов, количество шагов в таком алгоритме должно быть не менее 100 для точного определения вектора В, отвечающим указанным требованиям, иначе нейросеть не сможет обучиться.

Применение такого алгоритма на каждом шаге обучения увеличит время обучения, по крайней мере, в 100 раз, что неприемлемо с точки зрения эффективности обучения. Поэтому необходимо заранее формировать обучающую страницу с ограниченным набором обучающих пар. Очевидно, что при ограниченной обучающей странице большое значение приобретает способ подбора векторов В.

Достаточно высокой точности обучения, при небольшом количестве обучающих пар, удается достичь при таком методе подбора векторов В, когда в качестве функций описываемых этими векторами выбираются такие, которые отражают все возможные формы поверхности функции восстанавливаемого физического поля. Как показали последующие эксперименты, только в этом случае возможно обучение нейросети.

Численное моделирование

Для проведения сравнительного анализа приближенных алгебраических и нейросетевых методов решения была рассмотрена одна из простейших томографических задач восстановления информации с п=9 и т=6 от информационно-измерительного поля с укладкой информационных линий по двум направлениям и к=1=3 (рис. 2). Эталонное воздействие на поле предполагается одиночным и имеет вид гладкой функции, распределенной некоторым образом по пространству так, что на всех измерительных линиях возникают сигналы о воздействии, отличные от нуля (рис. 3 а).

При моделировании были рассмотрены три возможных случая воздействия на поле - в углу, в середине стороны и в центре поля из которых, для примера, показан первый случай (рис. 3). В качестве приближенного метода был выбран метод нахождения псевдорешения.

ь,

/1

/9

Ьб

Рис. 2. Схема сканирования моделируемого физического поля

Как показали результаты моделирования, восстановление функции распределения физического поля (вектор В) по томографическим данным (вектор X) с помощью нейросетевого метода (рис. 3б) и посредством приближенного метода нахождения псевдорешения (рис. 3в) дают практически одинаковые результаты. Причем дисперсии воздействий, восстановленных с помощью данных методов, отличаются от эталонных воздействий на десятые доли процентов, а друг от друга на сотые доли процентов.

Это говорит о том, что задачу восстановления полей малой размерности при одиночном воздействии или когда саму исследуемую область можно разделить на малые участки, представляется возможным решить с использованием приближенных алгебраических методов решений. В связи с тем, что зачастую на практике требуется определить всего лишь место одиночного воздействия (например, место обвала внутри туннеля, определение места повреждения корабля и т.д.), то данный метод решения не утрачивает своей реальной практической значимости.

Однако нейросетевой подход по сравнению с другими методами имеет основное преимущество, состоящее в том, что нейронные сети обладают способностью к обучению. За счет усложнения конфигурации нейронной сети (увеличения числа нейронов сети, плотности связи между ними, выделения дополнительных слоев нейронов, использования сложных алгоритмов функционирования сети) можно существенно повысить вычислительную мощность всей сети, способность ее решать более сложные задачи. При этом восстанавливаемые функции физических полей теперь уже необязательно должны быть гладкими. Поэтому применение нейронных сетей является наиболее перспективным и оправданным при решении сложных вычислительных задач, требующих гибкости и адаптивности самой вычислительной системы.

а)

б)

в)

Рис. 3. Моделирование физического воздействия на угол измерительного поля: а - оригинал воздействия, б - воздействие, восстановленное нейронной сетью, в - воздействие, восстановленное методом нахождения псевдорешения

Заключение

Как видно из полученных результатов, приближенные алгебраические методы позволяют производить восстановление информации, поступающей от измерительных сетей при одиночном воздействии на сеть или когда саму исследуемую область можно разделить на малые участки, даже при взаимно перпендикулярной укладке измерительных линий на исследуемом физическом поле. Подобная схема укладки линий играет весьма существенную роль при больших размерностях информационно-измерительных полей. Это существенно расширяет круг решаемых некорректных задач, решение которых на практике является сложной задачей, требующей привлечения специальных методов обработки, например, нейроподобных методов обработки информации.

Литература

1. Тихонов А.Н., Арсенин В.Я. Методы решения некорректных задач. - М.: Наука, 1980.

2. Натеррер Ф. Математические аспекты компьютерной томографии. - М.: Мир, 1990.

3. Muller B., Reinhardt J. Neural Networks. - Berlin, Heidelberg, 1990.

4. Rumelhart D.E. and MacClelland J.L. Parallel Distributed Processing: Explorations in the Microstructure of cognition, V. 1, MIT Press, Cambridge, MA, 1986.

5. Kulchin Yu., Denisov I., Obuh V., Kamenev O., Vitrik O., Petrov Yu., Romashko R. Computer neural networks for processing of optical tomography information // Pacific Science Review. - 1999. V. 1. - P. 1-4.

6. Ильин В.А., Поздняк Э.Г. Линейная алгебра. - М.: Наука, 1974.

7. Беклемишев Д.В. Дополнительные главы линейной алгебры. - М.: Наука, 1983.

8. Wasserman P.D., Advanced Methods in Neural Computing, New York: Van Nostrand Reinhold, 1993.

9. Handbook of Neural Network signal processing, Edeted by Yu Hen Hu, Jeng-Neng Hwang. - CRC Press, Boca Raton, London, New York, Washington, D.C., 2002.

10. Kulchin Yu., Vitrik O., Petrov Yu., Kirichenko O., Kamenev O., Romashko R., Denisov I. Holographic neural network for processing of signals of distributed optical fiber measuring networks with the tomography principle of data gathering// Optical Memory and Neural Networks. Allerton Press, Inc. -1997. - V. 6. - № 2. - P. 149-156.

11. Kulchin Yu., Kamenev O., Denisov I. Neural processing system for optical information measuring systems Distributed fiber optical sensors and measuring networks. Proc. of SPIE. - 2001. - V. 4357. - P. 109-117.

12. Denisov I., Kulchin Yu., Obuh V., Kamenev O. Principales of organization of neural-like system on the basis of a matrix of photoelectric cells Optoelectronic Information Systems and Processing. Proc. of SPIE. - 2001. - V. 4513. - P. 52-57.

i Надоели баннеры? Вы всегда можете отключить рекламу.