_____________УЧЕНЫЕ ЗАПИСКИ КАЗАНСКОГО УНИВЕРСИТЕТА
Том 154, кн. 1 Физико-математические пауки
2012
УДК 53.087/.088
НЕКОТОРЫЕ МЕТОДЫ РЕШЕНИЯ ОБРАТНЫХ НЕКОРРЕКТНЫХ ЗАДАЧ В ФИЗИЧЕСКОМ ЭКСПЕРИМЕНТЕ
Д.З. Галимуллип, М.Э. Сибгатуллип, Д. И. Камалова, М.Х. Салахов
Аннотация
В статье описываются предложенные в последние годы па кафедре оптики и папофо-тоїшки Казанского федерального университета методы математической обработки данных. полученных в результате физического эксперимента. Методы пригодны для применения не только в прикладной спектроскопии, по и в других областях физических исследований, где решаются обратные некорректные задачи.
Ключевые слова: вейвлет-апализ, статистика высших порядков, пейроппые сети, вейвлет-производпая спектрометрия, эволюционные алгоритмы, фрактальные характеристики, цветной шум.
Введение
Методы математической обработки данных эксперимента представляют собой активно развивающееся направление современной науки, которое находит применение в самых разных областях естествознания. Разработка новых и привлечение существующих математических подходов для решения обратных некорректных задач, таких как сглаживание данных и удаление шума, улучшение разрешения спектров, разделение сложных сигналов на элементарные составляющие, является актуальной проблемой в прикладных научных исследованиях.
Рассмотрим некоторые методы решения наиболее важных задач прикладной спектроскопии, к числу которых относятся сглаживание данных и удаление шума из экспериментальных данных, дифференцирование спектров, решение задачи Абеля, учет аппаратной функции прибора, определение формы элементарных компонент в сложных спектрах. Специфика этих задач состоит в обращении хода причинно-следственной связи, когда по наблюдениям определяются физические характеристики объекта. Такие задачи принадлежат к классу обратных задач математической физики [1 6]. постановка которых может быть представлена в виде
К<р + £ = I, (1)
где I интерпретируется как искаженный случайным шумом £ выходной сигнал прибора, на вход которого поступил сигнал К - непрерывный, чаще всего линейный оператор, моделирующий прибор. Основная проблема состоит в том, чтобы извлечь из измерения I как можно более точные значения параметров объекта, невозмущенные измерением. Этим уравнением может быть описан достаточно широкий класс задач математической обработки результатов эксперимента [1 3].
Обратные задачи обычно оказываются некорректными. Понятие корректности ввел французский математик Ж. Адамар [1, 6]: задача решения уравнения (1)
называется корректно поставленной, если 1) решение уравнения существует. 2) решение определено однозначно. 3) решение уравнения устойчиво. Позднее А.Н. Тихоновым [1] была математически доказана принципиальная невозможность получения точного решения (1) и подчеркнута особая роль третьего условия корректности Адамара.
Вычислительная схема решения подобных задач очень чувствительна к небольшим ошибкам в исходных данных, а в экспериментальных данных всегда присутствует случайный шум. что проводит к неустойчивости решения уравнения (1). Малое, обычно неконтролируемое изменение исходных данных или наличие ошибок вычислений приводит к значительному изменению решения, в связи с этим некорректную задачу можно считать эффективно недооиределенной.
Вследствие некорректности обратной задачи нельзя получить решение основного интегрального уравнения (1), устойчивое к малым изменениям исходных данных, и поэтому приходится искать некоторое приближенное решение. Анализ конкретных приемов решения некорректных задач показывает, что в основе многих методов лежит идея привлечения дополнительной априорной информации о решении идея регуляризации решения [1 6]. Учитываемая при решении задачи априорная и апостериорная информация может быть весьма разнообразной и включать в себя как знания о физических свойствах исследуемого объекта, так и общие соображения о возможных характеристиках решения. Разным способам задания априорной информации соответствуют различные способы регуляризации. Строго говоря, регуляризация подменяет исходную задачу другой. Необходимо, чтобы регуляризация, не меняя физического содержания задачи, только избавляла нас от ее вычислительной неустойчивости. Наиболее распространенные методы регуляризации решения некорректных задач подробно изложены в [5, 6].
В общем случае решение обратных некорректных задач сводится к предварительной обработке сигнала с целыо уменьшения влияния случайных помех. Для этого существуют два основных подхода: удаление шума (денойзинг) и сглаживание данных. Разница между этими подходами заключается в выборе области, в которой идет обработка частотной или временной. Если обработка сигнала идет в частотной области, то это фурье-фильтрация или другие частотные фильтры. Сглаживающие и регуляризующие процедуры осуществляются во временной области.
Методам и алгоритмам решения обратных задач посвящено большое количество работ и монографий [1 6]. Наиболее общий подход к решению обратных некорректных задач заключается в минимизации функционала, представленного в виде;
Ф(р|1) = Фь(Кр - I) + аО(р, А) + С(р), (2)
где Фь - функционал-критерий в некоторой метрике Ь, О, - стабилизирующий функционал, зависящий от набора параметров А, а параметр регуляризации, С(р) - априорные ограничения, накладываемые на решение. Задавая функционал-критерий, вид стабилизирующего функционала и априорные ограничения, на основе подхода (2) можно построить большинство методов решения обратных задач, таких как метод Савицкого Голея, фильтры Кайзера и Винера, регуляризация по Тихонову, метод статистической регуляризации (МСР) и многие другие. В [1 3] показано, что наиболее эффективными являются алгоритмы решения обратных задач, основанные на МСР и обеспечивающие иаилучшее восстановление исходной функции р(х). МСР относится к линейным методам решения обратных задач. Основной положительной чертой линейных методов является в первую очередь относительная простота их реализации, однако в рамках линейных методов невозможно учесть важные при обработке данных ограничения на неотрицательность,
монотонность и т. д. Использование линейных методов оправдано в случае не слишком сильных искажений и невысокой зашумленности сигналов. Когда речь идет о решении существенно некорректных задач, необходимы другие методы, позволяющие в полной мере учесть всю априорную информацию о решении. Однако методов получения аналитических решений общего вида не существует, поэтому обычно их решают приближенными численными методами.
При обработке экспериментальных данных в прикладной спектроскопии часто используются итерационные алгоритмы, в общую схему которых можно ввести некоторые нелинейные ограничения. Основная идея итерационных алгоритмов сводится к построению по найденному приближению р1 последующего приближения рг+1 при помощи поправок, вычисленных разложением р в некоторый ряд. Общая схема итерационного алгоритма может быть представлена в виде [7]:
рт = АI + (Е - А К) Ср1,
где А - параметр, управляющий сходимостью процесса, Е - единичный оператор, С
широко используемую итерационную схему Ван-Циттерта [1].
Общим недостатком итерационных алгоритмов с ограничениями является то обстоятельство, что в них не учитывается влияние шумов. Для того чтобы получить устойчивый к шумам итерационный алгоритм, в его схему вводят регуляризацию. При использовании итерационного алгоритма исследователь должен сам решать, когда прервать процесс итераций, руководствуясь теми или иными соображениями о реальной или шумовой природе деталей решения, возникающих после каждой новой итерации. Критерием остановки итерационного процесса является близость значения функционала ошибки к минимальному.
Наиболее эффективные оценки решения обратных некорректных задач можно получить только с учетом всей возможной априорной информации об исследуемых объектах. Например, при обработке экспериментальных спектров необходимо учесть информацию о гладкости спектра, ограниченности, неотрицательности, принадлежности отдельных контуров к одному из известных профилей полос. В случае импульсных сигналов следует учесть принадлежность сигнала к финитным функциям, включить в алгоритм априорные знания о форме импульса или фронтов, отсутствие сигнала в некоторой части данных и т. д. При обработке совокупности молекулярных спектров, например при исследовании кинетики конфор-мационного перехода или зависимости параметров полос от температуры, в качестве дополнительной априорной информации можно учесть гладкость или линейность изменения координат контуров полос н изменения оптической плотности полос, постоянство формы элементарных компонент. Эффективность получаемых оценок повышается с полнотой использования имеющейся физической априорной информации об исследуемых процессах.
При всех своих преимуществах метод статистической регуляризации обладает рядом недостатков, таких как неустойчивость при сложном характере случайного шума нлн искажения при обработке сложных и нестационарных сигналов. Отдельной проблемой является выбор одного или нескольких параметров регуляризации. К тому же в рамках МСР возможно использовать далеко не всю априорную информацию, известную из физики исследуемых процессов. Использование МСР оправдано в случае не слишком сильных искажений и зашумления сигналов, а также в тех случаях, когда существуют строгие ограничения на время вычислений. В случаях, когда исходные сигналы нестационарны, имеют разрывы в производных, пропуски данных, а также когда шум обладает сложной спектральной структурой, необходимо применение других методов, которые позволяют наиболее полно
использовать все имеющиеся априорные сведения о решении. Поэтому возникает необходимость в разработке новых методов решения обратных некорректных задач прикладной спектроскопии, позволяющих получать эффективную оценку решения в сложных случаях. Предлагается преодолеть некоторые ограничения, присущие статистическим методам регуляризации, с помощью вейвлет-преобразования и нейронных сетей с регуляризацией, а для получения предварительной априорной информации об исследуемом процессе использовать фрактальные характеристики объекта.
1. Фрактальные характеристики в исследованиях структуры сигналов
Для получения дополнительной информации при решении обратных некорректных задач могут быть использованы фрактальные характеристики, такие как характеристическая фрактальная размерность, размерность Ричардсона, размерность Хаусдорфа Безиковича. показатель Херста, относительная дисперсия [8. 9].
Фрактальные измерения имеют своей целыо количественно оценить структуру поверхности или сигнала, определить масштабную инвариантность и самоподобие формы, меру хаотичности структуры. Первая из характеристик характеристическая фрактальная размерность дает оценку степени, с которой траектория в произвольном пространстве отличается от прямолинейного пути. Характеристическая фрактальная размерность больше или равна единице, причем равенство соответствует прямолинейному пути. Вторая характеристика размерность Ричардсона. которая также дает понятие о степени отклонения сигнала от прямой. Нужно заметить, что размерность Ричардсона оказывается более чувствительной к изменениям в структуре сигнала, чем характеристическая фрактальная размерность. Размерность Хаусдорфа является обобщением обычной геометрической размерности. позволяющей характеризовать фрактальные объекты. Расчет наиболее просто произвести по методу “Box counting” [10].
Показатель Херста указывает на степень персистентности или антиперсистентности н принимает значения от 0 до 1. Чем он ближе к единице, тем более персистентным является поведение сигнала. Последняя характеристика относительная дисперсия говорит о величине разброса значений сигнала в зависимости от длины набора данных. При обработке одномерных сигналов они могут быть использованы для получения информации о структуре шумов, искажающих экспериментальный сигнал. При анализе двумерных сигналов (изображений различных поверхностей) данные характеристики используются для количественной оценки структурных и морфологических изменений поверхности и позволяют получить дополнительную информацию об упорядоченности структуры поверхности, которые визуально не определяются [11. 12].
Подобные исследования особенно важны при изучении ианоразмериых структур. так как в связи с масштабным переходом науки и технологии к манипуляции наноразмерными объектами и усложнением методов анализа результатов проблема количественного определения степени упорядоченности таких объектов является в последние годы весьма актуальной. Несмотря на существующие методы контроля качества поверхностей с учетом нанометрового диапазона, в котором проводятся работы, даже две поверхности, созданные из одного и того же атомарно гладкого материала, могут существенно отличаться по своим характеристикам. В результате появляется принципиально новая возможность проводить не только сравнение различных поверхностей между собой, но и анализировать распределение неоднородностей на поверхности каждого конкретного образца. Можно также проводить
классификацию поверхности с выделением областей, наиболее подходящих для решения тех нлн иных конкретных задач, что позволит давать практические рекомендации о возможности их использования в качестве подложек, материалов для нанобиологии и иаиомедицииы [11].
2. Регуляризация нейросетевого решения обратной некорректной задачи в прикладной спектроскопии
Для решения обратных некорректных задач в случае сложных спектров в [13] предложено применять нейронные сети с регуляризацией весов по правилу Байеса. Нейронные сети дают возможность обобщить входную информацию, что позволяет выделять в исследуемых сигналах основные закономерности и удалять случайный шум. неизбежно присутствующий в результатах эксперимента. Однако во многих сигналах, полученных в результате эксперимента, уровень случайных помех бывает слишком высоким для корректной нейросетевой обработки. При решении некоторых некорректных обратных задач прикладной спектроскопии, таких как дифференцирование спектров, уровень шума может возрастать настолько, что обучение сети может зайти в тупик либо сеть «научится» воспроизводить ложные закономерности.
Простота и открытость алгоритмов обучения сетей позволяют использовать имеющуюся априорную информацию об исследуемых сигналах, поэтому в ряде работ предложен метод включения априорной информации о гладкости сигнала в алгоритм обучения сети. С помощью регуляризации задачи обучения нейронной сети удалось избежать переобучениости сети и сохранить ее способность к обобщению. Это позволяет с успехом решать некорректные обратные задачи обработки экспериментальных данных с высоким уровнем случайных шумов.
С
преобразование входного вектора р € Р в выходные значения а € А, то есть а = Ср.
Наиболее простой и доступной для модификации архитектурой является многослойная сеть с обратным распространением ошибки. Обучение сетей такого типа производится с учителем, при этом обучающий набор входов и целевых значений задается в форме {р1, , {р2^2} , ■ ■ ■, {рп, ^} ■ Предположим, что целевые значе-
ния генерируются как а* = д ^*) + &, где д — неизвестная функция, & - случайный шум. Исходной целыо процесса обучения является минимизация среднеквадратичной ошибки в виде
п
Еп = ^(^ - а*)2. (3)
1=1
Использование целевой функции такого вида часто приводит к переобучениости сети и слабой устойчивости решения по отношению к случайному шуму в данных. В этом случае минимизация функции вида (3) не приводит к достоверным результатам на выходе сети.
В [14] был предложен байесовский подход для решения задачи интерполяции зашумленных данных, основные идеи которого могут быть полезны при решении многих задач обработки экспериментальных данных. Байесовские стратегии позволяют включать в решение задачи субъективные предположения относительно исследуемого сигнала, что дает возможность значительно улучшить обобщающие свойства сети и означает увеличение устойчивости к случайному шуму. Основная идея регуляризации сводится к ограничению величин весов сети, что, в свою очередь, приводит к повышению степени гладкости получаемых на выходе значений.
Цель обучения нейронной сети уменьшение суммы среднеквадратичных ошибок E = Ed - Регуляризация добавляет к выражению (3) дополнительный член, и, таким образом, целевая функция принимает вид
E = @Ed + aEw •
где EW - сумма абсолютных значений весов сети, а и в """"" параметры целевой функции. Отношение между значениями параметров целевой функции определяет основной акцент при обучении. Если а ^ в, то обучающий алгоритм дает малую ошибку. В случае, когда а ^ в-, обучение направлено па уменьшение весов; тогда ошибка сети будет велика, и отклик сети будет сильно сглаженным. Методы оценки ав
При каждой итерации обучения они рассчитываются как
мр _ 7 ,эмр _ п ~ 7
2Ew (wMP) ’ ' 2Ed(wmpУ
где w - вектор сетевых весов, индекс МР (most probable) означает наиболее вероятные значения весов, n - размерность выходного сигнала. Число y = N — — 2амрtr (HMP)-1, где N - общее число параметров в сети, H - матрица Гессе, называется эффективным числом параметров. Оно определяет количество параметров сети, которые эффективно используются для уменьшения функции ошибки
N
H = e'^2ED + aV‘2Ew в [16] предлагается использовать гаусс-ньютоновскую аппроксимацию, которую можно вычислить как
H = V2F (w) « 2в JTJ + 2а IN,
где J - якобиан ошибок на обучающей выборке.
В данной постановке под регуляризацией понимается введение априорной информации об ограниченности функционала весов, что подразумевает локальную гладкость, непрерывность сигнала и способность сети обрабатывать входные сигналы разного типа. Однако это не приводит к ограничениям на стационарность сигнала и шума, что позволяет обрабатывать сложные и нестационарные сигналы с цветным шумом. В преобразовании входного сигнала участвуют несколько нейронов, каждый из которых может отвечать за конкретные участки сигнала, на которых поведение сигнала стационарно. Чем больше количество нейронов, тем более сложным н нестационарным может быть входной сигнал. Регуляризация в этом случае означает лишь сохранение высоких обобщающих свойств сети, благодаря чему эффективно выделяется полезный сигнал из шума.
3. Вейвлет-производная спектрометрия
Деконволюция аналитического сигнала на элементарные составляющие представляет одну из важных обратных задач прикладной спектроскопии и позволяет провести дальнейшую идентификацию компонент контура. Хорошие возможности для анализа структуры сложных линий предоставляет спектроскопия производной [17]. Значительное усиление контрастности дифференциальных кривых позволяет фиксировать даже малые изменения монотонности исходного контура, обеспечить более точное определение числа и положений максимумов перекрывающихся полос. С помощью этого метода достаточно просто осуществляется подсчет числа компонент контура.
Рис. 1. Вейвлет-преобразование контура Гаусса для различных масштабов а
Дальнейшим развитием метода производной спектрометрии является вейвлет-производная спектрометрия [18.19]. Поскольку операция дифференцирования коммутативна с операцией вейвлет-преобразования, то в вейвлет-пространстве дифференцирование иррегулярного сигнала / можно свести к дифференцированию вейвлета ф, который задается в аналитическом виде:
{а, Ъ) [д^ [/ (ж)]] = (-1)” У I (х)дХ [ф*аь (х)] Лх-
— ою
Таким образом, задача дифференцирования становится корректной в вейвлет-области. и регуляризация полученного решения заключается в выборе граничного масштаба, позволяющего разделить шумовую компоненту и компоненту, описывающую структуру сигнала. Вся информация о белом шуме будет находиться в ограниченном диапазоне малых масштабов, который можно удалить, поскольку он не содержит информации о сигнале.
4. Идентификация формы линии с использованием непрерывного вейвлет-анализа
В практике спектроскопических исследований часто встречаются спектральные контуры с неразрешенной внутренней структурой, обусловленной перекрытием соседних линий. Характерны в этом отношении спектры многокомпонентных систем, спектры инфракрасного поглощения и комбинационного рассеяния света. Такие спектры малоинформативны, так как необходимую информацию можно получить, только определив параметры отдельных индивидуальных полос, входящих в состав сложного спектра. В связи с этим разложение сложного контура на составляющие и идентификация каждой из них является важной задачей прикладной спектроскопии. В данном разделе кратко рассмотрен алгоритм определения формы линии на основе вейвлет-производной спектрометрии.
Поведение особых точек вейвлет-проекций (рис. 1) используется для расчета спектральных параметров и позволяет провести идентификацию составляющих контура. Методика аналогична алгоритму определения формы линии методом дробной производной [20]. но использует только одну особую точку и не требует сложных процедур регуляризации при наличии искажений в исходных данных [21, 22].
Рис. 2. Зависимость динамики нулевой точки х0 от масштаба а для гауссиана и лорен-цпапа, рассчитанная при помощи вейвлета Гаусса 2-го порядка
Рассмотрим поведение особых точек (абсциссы нулевой точкн и максимальной амплитуды) проекций непрерывного вейвлет-преобразования для контура, описываемого распределением Гаусса (рис. 1)
д(х) = А ехр ^ •
Воспользуемся подходом, предложенным в [19. 21. 22]. и исследуем динамику нулевой точки хо в зависимости от различных масштабов а с использованием вейвлета Гаусса 2-го порядка
^(2)(а,6) д1ь=Хо =0. (4)
Решая уравнение (4). получим следующее соотношение:
х2 = а2 + а2, (5)
которое однозначно позволяет оценить полуширину контура Гаусса в координатах (.х2, а?). Угол наклона прямой х0 [а2) составляет с осью абсцисс 45°, что делает соотношение (5) полезным для идентификации спектральной линии. Величина отрезка. отсекаемого прямой от оси ординат, равна квадрату полуширины контура
ке
При анализе экспериментальных данных угол наклона прямой х0 (а2) , боль-45°
более высокий масштаб, мы устраняем воздействие шума на проекцию непрерывного вейвлет-преобразования и тем самым можем получить более точные оценки параметров контура.
Аналогичные соотношения можно привести для контура Лоренца. При использовании вейвлета Лоренца 2-го порядка получим
а + а
ха (а
В данном случае нет необходимости вводить новые координаты. Форма линии бу-
хо (а)
отсекаемым от оси ординат (рис. 3).
Рис. 3. Зависимость динамики нулевой точки х0 от масштаба а для гауссиана и лорен-циапа, рассчитанная при помощи вейвлета Лорепца 2-го порядка
Таким образом, разработанный алгоритм расчета параметров составляющих спектрального контура на основе непрерывного вейвлет-преобразования позволяет получить соотношения, связывающие поведение особых точек н значения полуширины н амплитуды. Численные эксперименты показали эффективность и удовлетворительную точность предложенного алгоритма для сигнала, искаженного белым гауссовым шумом [19. 23. 24].
5. Эволюционные алгоритмы в решении обратных некорректных задач
Генетический алгоритм как один из видов эволюционных алгоритмов представляет адаптивный метод поиска, который в последнее время часто используется для решения задач функциональной оптимизации [25. 26]. Мы разработали новый вариант использования генетического алгоритма для математической обработки ИК-фурье спектров, при этом последовательность действий состоит в следующем [27]. Создается начальный набор параметров составляющих спектра, вводится их количество и положение центров. На первом этапе производится оценка ошибки между входным контуром н экспериментальным в каждом интервале, центром которого является элементарная составляющая спектра. Далее с использованием оператора направленной «мутации» производится формирование промежуточного «поколения». На этапе второго отбора снова вычисляется покомпонентная ошибка на каждом интервале, но уже между промежуточным и входным контурами. Применением оператора «скрещивания» к промежуточному и входному контурам получают новый контур с наименьшей разницей между восстановленным и реальным спектрами. Сохраняя параметры лучшего набора в процессе каждой итерации, в конце цикла выбирают наилучший набор (с наименьшей ошибкой восстановления) и выводят его как ответ. При наличии нескольких локальных экстремумов такой тип генетического алгоритма позволяет выбрать иаилучший вариант решения.
6. Детектирование нелинейных эффектов с использованием статистики высших порядков на основе биспектрального вейвлет-анализа
Большинство процессов, описывающих динамику и взаимодействие локальных подструктур в общей системе, являются нелинейными и достаточно сложными [28 30]. Это связано с тем. что целое в таком случае является чем-то большим.
нежели просто объединение составляющих частей. Когерентные эффекты приводят к взаимосвязанному поведению и перераспределению общей энергии между основными и возникающими дополнительно частотными составляющими. Изучение поведения одного нелинейного осциллятора или их ансамбля традиционно основано на полиспектралыгом фурье-анализе [29. 30]. Спектр высшего порядка позволяет получить необходимую фазовую информацию, провести различие между независимыми и возникающими вследствие нелинейных взаимодействий частотными компонентами сложного спектра. Этот подход применим к большинству исследуемых систем, но только в том случае, если они считаются стационарными в течение некоторого промежутка времени. Значительное количество работ посвящено применению полиспектрального анализа для изучения нелинейных взаимодействий в различных областях науки. Разработан ряд статистических тестов. позволяющих оценить стационарность, асимметрию и эксцесс исследуемого процесса [29. 31].
Для реальных систем взаимодействие между локальными подсистемами приводит к временной зависимости характеристических частот. Фазовая связь между когерентными модами осциллятора может значительно изменяться с течением времени. При исследовании таких данных полисиектральный фурье-анализ с использованием усредняющего по временной нлн пространственной координате «окна» не является эффективным. Это связано с тем. что моменты высших порядков исследуемого сигнала характеризуют общие, а не локальные характеристики процесса. Необходим метод, позволяющий учесть временную эволюцию коррелированных структур.
Ряд научных работ направлен на развитие метода по расчету полиспектров с использованием частотно-временного динамического окна [32. 33]. Однако существует несколько ограничений на использование таких алгоритмов, в частности требуется точное определение характерного временного масштаба с учетом неизменности его во времени. Возникает и значительная сложность при нормировке полученного полиспектра, поскольку влияние дискретизации и случайных ошибок приводит к необходимости проведения регуляризации [29]. Для преодоления указанных недостатков в работах [34, 35] были введены вейвлетный бисиектр и бикогерентность для исследования взаимодействий между отдельными осцилляторами. Обобщение бисиектра на вейвлетное преобразование дает возможность анализировать такие принципиально нелинейные явления, как временная динамика фазовой связи между различными гармониками в сигнале, а также выделять в наборах пространственно-временных данных короткоживущие структуры. В [36, 37] предложена методика, основанная на биспектральном вейвлет-анализе, позволяющая детектировать взаимодействие двух и более компонент системы, оценивать величину коэффициента нелинейности и временной интервал, на котором бикогерентность любой пары частотных мод становится ненулевой. Влияние искажающих факторов устраняется пороговым фильтром. Показано, что статистика высших порядков, основанная на вейвлет-анализе, может быть с успехом использована для изучения поведения систем, обладающих нелинейной динамикой, и выделения когерентных структур. Эффективность бисиектрального анализа продемонстрирована на данных, описывающих колебания кантилевера атомно-силового микроскопа в динамическом режиме [36].
7. Учет влияния шума в физическом эксперименте
При обработке результатов измерений в физическом эксперименте одной из проблем является учет влияния шума, искажающего экспериментальные данные. Использование математических методов позволяет значительно повысить
характеристики приборов и производить учет этих искажений. При обработке экспериментальных данных в прикладной спектроскопии наибольшее распространение получили метод Савицкого Голея. фильтр Кайзера, метод статистической регуляризации и др. Область применения данных методов ограничивается предположениями о стационарности сигнала, некоррелированной природе шума, высоком отношении сигнал/шум в экспериментальных данных. Однако в случае, когда оптические спектры характеризуются малым отношением сигнал/шум. сложной формой профилей спектральных линий и коррелированной структурой шума, требуется разработка и привлечение новых математических методов для решения задачи обработки оптических спектров.
Эффективность обработки экспериментальных сигналов будет зависеть от количества и качества привлекаемой априорной информации об экспериментальных данных, а также от используемого метода математической обработки. Улучшить качество обработки оптических спектров возможно с помощью привлечения в качестве количественных характеристик шума размерности Ричардсона, показателя Херста, относительной дисперсии, позволяющих дать количественную оценку II провести классификацию шумов, искажающих экспериментальные данные [12].
Благодаря высокой избирательности полосовой фильтрации сигнала, возможности обработки сложных и нестационарных сигналов вейвлет-анализ является удобным инструментом при математической обработке результатов спектроскопического эксперимента. При этом совместное использование размерности Ричардсона, показателя Херста, относительной дисперсии и вейвлет-анализа позволяет проводить эффективный анализ оптических спектров с целыо получения дополнительной информации о природе экспериментальных шумов в случае малого отношения сигнал/шум.
Наиболее простым способом учета влияния шума является удаление определенных масштабов, которые содержат шумовую компоненту сигнала [38, 39]. В этом случае оценка решения $ запишется следующим образом:
Где / _ обрабатываемый сигнал, Ш - дискретное вейвлет-преобразование, Ш-1 - обратное дискретное вейвлет-преобразование, зд - граничный масштаб, К (З,Зд, к) - функция аподизацпп, зависящая в общем случае от масштаба з и сдвига к вейвлет-преобразования сигнала и определяемая в следующем виде:
Параметр зд в данном случае определяет граничный масштаб, который разделяет полезную составляющую сигнала и его шумовую компоненту. Фактически это означает, что восстановление сигнала производится в ограниченной полосе масштабов з = зд,..., з. Изменяя значение зд, можно менять соотношение между качеством восстановления сигнала и величиной удаляемого шума. От выбора значения параметра зд будет сильно зависеть результат удаления шума. При заниженном значении в обрабатываемом сигнале будут оставаться высокочастотные шумовые составляющие, при завышенном есть риск исказить форму полезного сигнала. Масштаб, на котором спектр мощности достигает минимума, используется в качестве границы, разделяющей вклады полезного сигнала и шума:
Граничный масштаб зд, таким образом, можно определить, анализируя спектр мощности вейвлет-преобразования сигнала. При этом в качестве исходных данных
для всех к, к.
Зд = штРа (з).
используется сигнал, искаженный шумом, и не требуется дополнительного анализа экспериментальных данных.
Критерий удаления шума, основанного на анализе спектра мощности вейвлет-преобразования. позволяет учесть влияние высокочастотных шумов при малом отношении сигнал/шум. В случае низкочастотной природы шума на основе предложенного критерия будет удаляться высокочастотная компонента шума, но будут оставаться низкочастотные колебания, искажающие форму сигнала. Однако при малом относительном уровне шуме п ^ 5% возможно использование предлагаемого критерия. Можно рассматривать подобный способ удаления шума либо как самостоятельный аппарат для учета влияния высокочастотного шума, либо как инструмент предварительной обработки, позволяющий удалить высокочастотные составляющие из исследуемого сигнала, и. таким образом, подготовить его для последующего удаления низкочастотного шума.
Для учета низкочастотного шума может быть применена итерационная схема [40]:
Р(0) =
= ш-1Шр(€), г = 0,1, 2,...,
где в качестве нулевого приближения используется экспериментальный сигнал Р(0) = /, 9 - оператор ограничения вейвлет-коэффициентов:
к т: юз к ^ т:
+ т, -ю^к < -т,
0, -т < Юзк < т.
Здесь т - величина порога, = Шр - коэффициенты дискретного вейвлет-преобразования сигнала р. Увеличение на каждом шаге итерации величины порога па некоторое значение 5 позволяет проводить операцию последовательного удаления шума.
Для принятия решения об остановке итерационного процесса предлагается использовать априорную информацию о шуме. Производится процедура вычисления количественной характеристики М3 па каждом масштабе для удаляемого шума. В качестве параметра М^ могут выступать показатель Херста, относительная дисперсия и размерность Ричардсона. После этого производится сравнение величины Мз с априорно известным значением Мза, рассчитываемым по записанной в эксперименте шумовой дорожке. Если М3 « М^а, то итерационный процесс прерывается и производится восстановление сигнала:
р = Ш — 1 'IV з к .
При данном подходе появляется возможность учета влияния низкочастотного шума.
Заключение
В настоящей статье рассмотрен ряд методов математической обработки и интерпретации данных физических экспериментов, разработанных и апробированных на кафедре оптики и нанофотоники Казанского федерального университета. Методы основаны на привлечении знаний о фрактальных характеристиках структуры сигналов, нейронных сетях, вейвлет-анализе и вейвлет-производной спектрометрии, генетических алгоритмах, а также о биспектральном вейвлет-анализе. Рассмотренные методы применимы для решения многих обратных некорректных задач физического эксперимента.
Summary
D.Z. Galimullin, М.Е. Sibgatullin, D.I. Kamalova, M.Kh. Salakhov. Some Methods of Solving Inverse Incorrect. Problems in a Physical Experiment.
In this paper, some mathematical methods for processing and interpreting data obtained from a physical experiment are considered. These methods have been developed at the Department of Optics and Nanopliotonics of Kazan Federal University. They are based 011 the use of knowledge about signal structure fractal characteristics, neural network, wavelet transform analysis and wavelet-based derivative spectrometry, genetic algorithms, and wavelet bispectra. The methods under study are suitable for solving many inverse incorrect problems of a physical experiment.
Key words: wavelet transform analysis, statistics of higher orders, neural networks, wavelet-based derivative spectrometry, evolutionary algorithms, fractal characteristics, colored noise.
Литература
1. Тихонов A.H., Арсении В.Я. Методы решения некорректных задач. М.: Наука,
1974. 286 с.
2. Преображеисклм Н.Г., Пикалов В.В. Неустойчивые задачи диагностики плазмы.
Новосибирск: Наука, 1982. 236 с.
3. Макс Ж. Методы и техника обработки сигналов при физических измерениях. М.:
Мир, 1983. 311 с.
4. Василенко Г.И. Теория восстановления сигналов. М.: Сов. радио, 1979. 272 с.
5. Салахов М.Х., Хариицев С. С. Математическая обработка и интерпретация спектроскопического эксперимента. Казань: Изд-во Казап. уп-та, 2001. 238 с.
6. Турчии В.Ф., Козлов В.П., Малкевич М.С. Использование методов математической статистики для решения некорректных задач // Усп. физ. паук. 1970. Т. 102, Вып. 3. С. 348 385.
7. Huang Т.S., Barker D.A., Berger S.P. Iterative image restoration // Appl. Optics.
1975. V. 14, No 5. P. 1165 1168.
8. Федер E, Фракталы М.: Мир, 1991. 254 с.
9. Rapp Р.Е., Watanabe T.A.A., Faure P., Cellucci C.J. Nonlinear signal classification //
Int. J. Bifurc. Chaos. 2002. V. 12, No 6. P. 1273 1293.
10. Арутюиов П.А., Толстихии A.JI., Демидов В.FI. Система параметров для анализа шероховатости и микрорельефа поверхности материалов в сканирующей зопдовой микроскопии // Заводская лаборатория. Диагностика материалов. 1998. Т. 65,
9. С. 27 37.
11. Маркеева А.В., Шаймухаметова Э.Р., Коновалова О.А., Сибгатуллии М.Э., Гали-муллии Д.З., Салахов М.Х. Подходы к исследованию структуры слоев биологических папосепсоров с применением фрактального анализа // Учен. зап. Казап. уп-та. Сер. Физ.-матем. пауки. 2008. Т. 150, кп. 2. С. 178 184.
12. Сибга,туллии М.Э., Галимуллии Д.З., Хариицев С.С., Викмаев И.Ф., Салахов М.Х. Исследование аппаратных шумов в оптической астрономии // Электр, жури. «Исследовано в России». 2006. .V 67. С. 668 676. URL: http://zhurnal.ape.relEiru.ru/ articles/2006/067.pdf.
13. Севастьянов А.А., Хариицев С.С., Салахов М.Х. Нейросетевая регуляризация решения обратных некорректных задач прикладной спектроскопии // Электр, жури. «Исследовано в России». 2003. У> 189. С. 2254 2256. URL: littp:// zliurual.ape.rel£iru.ru/£irticles/2003/189.pdf.
14. МасКау D.J.C. Bayesian interpolation // Neural Computation. 1992. V. 4. No 3.
P. 415 447.
15. Круглов В.В., Борисов В.В. Искусственные нейронные сети. Теория и практика.
М.: Горячая липия-Телеком. 2002. 382 с.
16. Charalwmbous С. Conjugate gradient algorithm for efficient training of artificial neural networks // IEEE Proc. 1992. V. 139, No 3. P. 301 310.
17. Дубровкии И,М., Беликов В.Г. Производная спектрометрия. Ростов: Изд-во Рост,
ун-та, 1988. 156 с.
18. Kharintsev S.S., Kamalova D.I., Salakhov M.Kh., Sevastianov A.A. Resolution enhancement. of composite spectra using wavelet-based derivative spectrometry // Spect.rocliim. Acta A. 2005. V. 61. P. 149 156.
19. Galimullin D.Z., Sibgatullin M.E., Sevastianov A.A., Kharintsev S.S., Kamalova D.I., Salakhov M.Kh. FTIR absorption spectra of polyet.herimides and their interpretation with new mathematical methods // Asian J. Spect.r. 2006. V. 10, No 3 4. P. 83 105.
20. Kharintsev S.S., Salakhov M.Kh. A simple method to extract, spectral parameters using fractional derivative spectrometry//Spect.rocliim. Act.a A. 2004. V. 60. P. 2125 2133.
21. Kharintsev S.S., Galimullin D.Z., Vorob’ev A.Yu., Salakhov M.Kh. Band shape determination with robust, estimator based on continuous wavelet, transform // Spect.rocliim. Act.a A. 2006. V. 65. P. 292 298.
22. Galimullin D.Z., Sibgatullin M.E., Vorob’ev A. Yu., Kamalova D.I., Kharintsev S.S., Salakhov M.Kh. Spectral line shape identification with continuous wavelet, transform // Proc. SPIE. 2006. V. 6181. P. 618118-1 618118-9.
23. Галимуллии Д.З., Камилова Д.И., Колядко И.М., Ремизов А.Б., Салахов М.Х. Изучение внутреннего вращения полиэфиримидов по ИК-Фурье-спектрам // Учен. зап. Казап. уп-та. Сер. Физ.-матем. пауки. 2006. Т. 148, кп. 1. С. 99 109.
24. Камалова, Д.И., Ремизов А.Б., Салахов М.Х. Копформациоппые зопды в изучении
локальной подвижности полимеров. М.: Физматкпига, 2008. 160 с.
25. Вороповский Г.К., Махотило К.В., Петра,шее С.Н., Сергеев С.А. Генетические алгоритмы, нейронные сети и проблемы виртуальной реальности. М.: ОСНОВА, 1997. 112 с.
26. Kim D.H., Abraham A., Cho J.H. A hybrid genetic algorithm and bacterial foraging approach for global optimization // Information Sciences. 2007. V. 177. P. 3918 3937.
27. Шаймухаметова Э.Р., Галимуллии Д.3., Сибга,туллии М.Э., Камалова, Д.И., Сала-
хов М.Х. Применение генетического алгоритма и вейвлет-апализа для интерпретации ИК-Фурье-спектров разветвленных полиметилметакрилатов // Изв. РАН. Сер. физ. 2010. Т. 74, Л» 7. С. 1002 1005.
28. Kerschen G., Worden К., Vakakis A.F., Golinval J.C. Past., present, and future of
nonlinear system identification in structural dynamics // Mecli. Syst.. Signal Process. 2006. V. 20, No 3. P. 505 592.
29. Nikias Ch.L., Petropulu A.P. Higher-Order Spectral Analysis. Englewood Cliffs, NJ:
PTR Prentice Hall, 1993. 528 p.
30. Collis W.B., White P.R., Hammond J.K. Higlier-order spectra: the bispect.rum and
t.rispect.rum // Mecli. Syst.. Signal Process. 1998. V. 12, No 3. P. 375 394.
31. Persson L. Statistical tests for regional seismic phase characterizations // J. Seismology. 2003. V. 7. P. 19 33.
32. Helbig М., Gricssbach G., Schock В., Witte Н. Application of time-variant bispectrum in biosignal analysis // Med. Biol. Eng. Comput. 1999. V. 37, No 2. P. 392 393.
33. Jwmsck J., Stcfanovska A., McGlintock P., Khovanov I. Time-pliase bispect.ral analysis // Pliys. Rev. E. 2003. V. 68. P. 016201-1 016201-12.
34. Короиовский А.А., Храмов A.E. Исследование когерентных структур в электронном пучке со сверхкритическим током с помощью вейвлетиой бикогерептиости // Физика плазмы. 2002. Т. 28, Л» 8. С. 722 737.
35. Короиовский А,А, Храмов А.Е. Непрерывный вейвлетпый анализ и его приложения. М.: Физматлит, 2003. 176 с.
36. Галимуллии Д.З., Сибга,туллии М.Э., Салахов М.Х., Чуклаиов А.П., Бухараев А.А. Виспектральпый анализ нелинейных эффектов при исследовании движения капти-левера в динамическом режиме // Электр, жури. «Исследовано в России». 2006.
.Vs 125. С. 1188 1197. URL: http://zhurnal.ape.relarn.ru/art.icles/2006/125.pdf.
37. Kharintscv S.S., Galimullin D.Z., Salakhov M.Kh. Nonlinear prediction of chaotic time series using wavelet-based bicolierence // Dynamics Days 2003, XXIII Annual Conf. Palma de Mallorca, Spain, 2003. P. 59.
38. Sibgatullin M.E., Gallimullin D.Z., Kharintscv S.S., Bikmacv I.F., Salakhov M.Kh. Noise elimination from stellar spectra // Proc. SPIE. 2006. V. 6181. P. 618119-1 618119-7.
39. Sibgatullin M.E., Kharintscv S.S., Il’in G.G., Salakhov M.Kh. A wavelet-based technique for eliminating noise from optical spectra // Asian J. Spect.r. 2005. V. 9, No 4.
P. 43 48.
40. Сибга,туллии М.Э., Хариицев С.С., Бикмаев И.Ф., Салахов М.Х. Удаление экспериментального шума из оптических спектров с использованием итерационной схемы па основе вейвлет-анализа // Учеп. зап. Казап. уп-та. Сер. Физ.-матем. пауки. 2006.
Т. 148, кп. 1. С. 179 184.
Поступила в редакцию 13.05.10
Галимуллин Дамир Зиннурович кандидат физико-математических паук, ассистент кафедры оптики и папофотопики Казанского (Приволжского) федерального университета.
Е-шаіІ: даІітиІІіп_й.гвтаі1.ги
Сибгатуллин Мансур Эмерович кандидат физико-математических паук, ассистент кафедры оптики и папофотопики Казанского (Приволжского) федерального университета.
Е-шаіІ: sibmans втаіі. ги
Камалова Дина Илевна доктор физико-математических паук, профессор кафедры оптики и папофотопики Казанского (Приволжского) федерального университета.
Е-шаіІ: Dina.Kamalovaeksu.ru
Салахов Мякзюм Халимуллович доктор физико-математических паук, профессор, заведующий кафедрой оптики и папофотопики, президент Казанского (Приволжского) федерального университета.