Научная статья на тему 'Об одном подходе к решению нелинейных параметрических задач'

Об одном подходе к решению нелинейных параметрических задач Текст научной статьи по специальности «Математика»

CC BY
122
28
i Надоели баннеры? Вы всегда можете отключить рекламу.
Область наук

Аннотация научной статьи по математике, автор научной работы — Фрумин Л. Л.

Рассмотрен метод получения линейных оценок параметров функции, аппроксимирующей данные эксперимента, основанный на рассмотрении уравнений, решением которых она является. Если искомые параметры, от которых зависит эта функция, линейно входят в уравнение, то их можно найти с помощью линейного метода НК, путем минимизации невязки конечноразностной аппроксимации этого уравнения на множестве экспериментальных данных. Приводятся примеры параметрических задач, в том числе задача оценки параметров некоторых специальных функций.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Фрумин Л. Л.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

One approach to solution of nonlinear parametric problems

An approach to obtaining linear estimations of parameters of the function, which approximates an experimental data, is presented. The approach is based on the consideration of the equations, with this function as the solution. The examples of parametric problems, including problem of estimation of parameters of some higher transcendental functions, are presented.

Текст научной работы на тему «Об одном подходе к решению нелинейных параметрических задач»

Вычислительные технологии

Том 7, № 5, 2002

ОБ ОДНОМ ПОДХОДЕ К РЕШЕНИЮ НЕЛИНЕЙНЫХ ПАРАМЕТРИЧЕСКИХ ЗАДАЧ

Л. Л. Фрумин Новосибирский государственный университет, Россия e-mail: frumin@phys.nsu.ru

An approach to obtaining linear estimations of parameters of the function, which approximates an experimental data, is presented. The approach is based on the consideration of the equations, with this function as the solution. The examples of parametric problems, including problem of estimation of parameters of some higher transcendental functions, are presented.

1. Постановка задачи

Обработка экспериментальных данных имеет особое значение для практики естественных наук и часто приводит к обратным задачам определения параметров некоторой функции по экспериментально измеренным ее значениям.

Интерес к параметрическим задачам в последнее время во многом обусловлен прогрессом аппаратных цифровых методов и устройств, которые позволяют проводить быструю, массовую и эффективную обработку данных эксперимента уже на этапе сбора и первичной обработки информации.

Параметрические задачи обычно трактуют в следующей математической постановке.

Пусть А = (Aj},j = 1, 2, ..., m — искомый вектор параметров определенной функции y = f (А, t), где t — сканируемая переменная. Имеется набор экспериментальных точек ti,i = 1, 2,...,N, N > m, в которых с некоторой погрешностью, присущей данному эксперименту, измерены значения функции y^ = f (А, t). Требуется по данным эксперимента найти вектор параметров А.

Традиционный и наиболее распространенный способ оценки параметров основан на методе наименьших квадратов и сводится к задаче минимизации функционала наименьших квадратов (НК) M[f ], который, вообще говоря, нелинейно зависит от вектора параметров. Численные реализации такого подхода, как правило, приводят к сравнительно громоздким итерационным численным методам минимизации [1-3]. Обширный объем вычислений в нелинейном методе НК обычно не допускает аппаратной реализации таких алгоритмов. Еще более серьезное ограничение нелинейного метода НК связано с тем, что случайная погрешность эксперимента в нелинейных задачах приводит к появлению побочных локальных минимумов функционала НК. При этом уравнения Эйлера для задачи минимизации уже не имеют единственного решения. Поиск глобального минимума функционала НК не только усложняет задачу, но и не гарантирует состоятельности получаемых оценок параметров.

© Л. Л. Фрумин, 2002.

Недостатки нелинейного метода НК стимулируют поиск и развитие других, в особенности линейных, подходов в задаче оценки параметров. Среди последних прежде всего отметим простой, но весьма распространенный подход, основанный на сведении задачи к линейной путем использования обратной функции. Этот подход обычно ограничен сравнительно узким классом задач, где вектор параметров входит в качестве линейных коээфи-циентов некоторого полинома. Причем этот полином является единственным аргументом измеряемой функции, монотонно зависящей от своего аргумента.

Следует отметить также метод моментов, в котором т моментов функции связывают с искомым вектором параметров и затем решают получившуюся систему алгебраических уравнений. И в этом случае имеются существенные ограничения, заметно сужающие область применимости метода. Искомые моменты далеко не всегда можно найти в явном виде, а система уравнений для моментов часто сама оказывается нелинейной. Заметим, наконец, что метод моментов не приводит к вариационной задаче поиска минимума функционала НК и получаемые с его помощью оценки трудно назвать оптимальными.

Настоящая работа посвящена новому способу решения параметрических задач, использующему некоторое операторное обобщение линейного метода НК и его разностную аппроксимацию. Отсутствие итераций и сложных алгоритмов принятия решения допускает аппаратную реализацию этого подхода, что может представлять значительный интерес для практики.

2. Метод решения

Идея предлагаемого метода оценки параметров основана на том, что для любой функции f (Л, £) всегда существует (и не одно!) уравнение, решением которого она является. Если искомые параметры, от которых зависит эта функция, линейно входят в уравнение, то их можно найти с помощью линейного метода НК путем минимизации невязки конечно-разностной аппроксимации этого уравнения на множестве экспериментальных данных.

Прототипом этого метода послужил алгоритм барона де Прони 1795 года [4]. Де Прони заметил, что решением линейных разностных уравнений с постоянными коэффициентами является сумма экспонент. В алгоритме де Прони показатели экспонент отыскиваются непосредственно из разностного уравнения. В последнее время метод де Прони был обобщен на случай комплексных экспонент [5]. В современном варианте метода де Прони для учета избыточной информации используется метод наименьших квадратов.

Рассмотрим класс функций, описываемых операторным уравнением довольно общего вида, в которое вектор параметров Л входит в качестве вектора коэффициентов:

т

^Р3и\г] = ди,г], 3 = 1,2,...,т. (1)

3 = 1

Входящие в уравнение операторы Р3 и Q зависят от сканируемой переменной £ как от параметра и могут быть линейными или нелинейными алгебраическими, дифференциальными или интегральными, скалярными или векторными операторами.

Операторы Р3 должны быть линейно независимы. Это условие необходимо для разрешимости задачи поиска параметров. Для частного случая линейных операторов оно является и достаточным.

Для всех операторов Р3 и Q потребуем существование разностных аппроксимаций их термов Р3 №,и] и Q[f, ¿¿], которые мы будем обозначать как Д и Яг соответственно. Эти

аппроксимации определены на некотором подмножестве в множества дискретных значений сканируемой переменной {¿г}. Подмножество в — область определения дискретной аппроксимации уравнения, зависит от вида операторов и схемы их дискретизации и может не совпадать со всем сеточным множеством, состоящим из N точек, но должно содержать, по крайней мере, N9 > т значений.

Кроме того, будем предполагать невырожденность симметричной т х т-матрицы А, компоненты которой даются суммой попарных произведений разностных аппроксимаций термов Д:

3 = £ ДДк. (2)

г

Сумма здесь берется по дискретной области определения разностной аппроксимации уравнения в. Разностную аппроксимацию уравнения (1) можно теперь представить в виде

т

Д = Яг. (3)

3 = 1

Для определения оценок вектора параметров А потребуем минимума функционала НК (невязки) для уравнения (3):

/ т \ 2

М = £(£ Аз Д - • (4)

Минимизация функционала НК (4) требует обращения в нуль производных дЫ/дХк и приводит к следующим уравнениям Эйлера для определения вектора А:

т

ЕЕД3 Д Д = Е Д Яг, к = 1 •••, т. (5)

г 3=1 г

Решение системы уравнений (5) можно представить в матричном виде

А = А-1 Ь. (6)

Здесь симметричная и невырожденная по предположению матрица А дается уравнением (2), а вектор Ь описывется следующим выражением:

Ък = £ ДкЯг. (7)

Соотношение (6) и дает решение задачи нахождения оценок параметров.

Что касается точности полученых оценок параметров, то она зависит от ряда факторов, таких как уровень погрешности эксперимента и ее статистика, свойства операторов задачи и порядок их конечно-разностной аппроксимации. Вероятно, наиболее общий подход в исследовании точности состоит в численном моделировании задачи.

В том случае, когда операторы Р представляют собой алгебраические (полиномиальные) выражения, решение (6) совпадает с методом де Прони [5]. Наше обобщение этого решения на случай дифференциальных или интегральных операторных уравнений существенно расширяет класс задач, где можно использовать простые линейные оценки метода НК. Чтобы убедиться в этом, изучим далее ряд примеров.

Пример 1. Рассмотрим задачу определения частоты П гармонических колебаний по экспериментально полученному ряду значений синусоидальной функции / = / (¿¿) = А8т(Ш^ + ф), г = 1, 2,..., N. Нелинейный метод НК для определения частоты потребовал бы решения 3-параметрической задачи поиска сразу трех параметров — П,А,ф. Однако во многих прикладных задачах амплитуда колебания А и фаза ф не представляют интереса для исследователя. Модуль или квадрат частоты П часто и есть та единственная величина, оценку которой требуется найти.

Функция /(¿, П) = А 8т(Ш + ф), очевидно, удовлетворяет следующему дифференциальному уравнению:

ж+V = »• (8>

где Л = П2 и есть параметр, подлежащий определению. Сравнивая это уравнение с общим уравнением (1), мы видим, что оператор Р1 представляет собой единичный оператор (умножение функции / на 1), а оператор Q есть дифференциальный оператор второй производной.

Предположим для простоты равномерность сетки {ti = гт}, г = 1, 2,..., N, с шагом т и рассмотрим на этой сетке некоторую конечно-разностную аппроксимацию уравнения (8). Эта аппроксимация определяется, в первую очередь, аппроксимацией дифференциального оператора второй производной, которую мы пока не будем конкретизировать и обозначим как /'. Разностную аппроксимацию уравнения (8) запишем в виде

Л' + Л/ = 0. (9)

Далее запишем функционал наименьших квадратов, представляющий собой сумму квадратов отклонений (невязки) разностного уравнения (9) по области определения разностной аппроксимации:

м = Е(Л' + ЛЛ)2. (10)

г

Минимизируя М по параметру Л, получим следующее уравнение Эйлера:

Е //' + л Е л2 = о- (и)

г г

Решение уравнения (11) нетрудно представить в виде

/ / ••

Л=-Ьт • (12)

г

Последнее выражение показывает, что оценка квадрата частоты определяется конечно-разностной аппроксимацией второй производной. Точность получаемых оценок зависит от выбранного способа численного дифференцирования. При численном дифференцировании функции с шумами погрешность результата может сильно возрасти.

Задача численного дифференцирования давно и хорошо изучена. Разработано несколько подходов решения этой задачи на основе интерполяционных формул или путем предварительного сглаживания или фильтрации высокочастотной компоненты шума. Известно, что при данном уровне шумов существут оптимальная реализация численного дифференцирования, дающая минимальную погрешность решения [6].

3. Численное моделирование

Для проверки подхода проводилось численное моделирование задачи определения частоты на основе выражения (12). Моделирование осуществлялось по так называемой схеме "замкнутого цикла". При этом для заданных частоты, фазы и амплитуды строилась синусоидальная функция. Затем к ней добавлялся гауссов случайный шум с постоянной дисперсией, имитирующий ошибку эксперимента. Полученные "данные эксперимента" сглаживались с помощью прямоугольного фильтра шириной р точек. Для оценки частоты использовались выражение (12) и простейшая центрированная разностная аппроксимация второй производной второго порядка точности — /' = (/+1 — 2/ + ¡г-\)/т2 .

В ходе численного моделирования исследовался вопрос выбора оптимального размера прямоугольного фильтра. Для заданного размера фильтра р определялось стандартное отклонение в для ошибки оценки частоты О = л/Л. В численном моделировании использовался один период синусоидальной функции. Расчетная сетка содержала 250 узлов.

Результат такого моделирования в виде графика зависимости стандартного отклонения ошибки оценки частоты от ширины фильтра для 50 % уровня шумов эксперимента представлен на рисунке. Из графика видно, что существует набор оптимальных ширин фильтра в интервале р £ [40 — 100]. Оценка стандартного отклонения ошибки определения частоты проводилась по выборке из 400 независимых статистических реализаций "случайного" шума.

Расчеты показали, что численная реализация алгоритма для задачи оценки частоты на основе выражения (12) и подходящего алгоритма численного дифференцирования не представляет особых трудностей. Алгоритм содержит только простейшие арифметические операции, и его можно использовать для построения аппаратных способов оценки частоты с помощью простого программного автомата.

Еще раз подчеркнем, что полученная оценка (квадрата) частоты О не требует одновременной оценки амплитуды А и фазы ф, что заметно отличает предложенный подход от нелинейного метода НК.

Возможность исключить лишние параметры из рассмотрения связана с тем, что мы исследуем операторное, дифференциальное, а не алгебраическое уравнение и "лишние" параметры являются просто его константами интегрирования.

Выбор подходящего уравнения для искомой функции позволяет включить или исключить из рассмотрения некоторые из параметров, понижая тем самым сложность или размерность задачи. Например, предположим, что нас интересует одновременное определение

Рис. 1. Зависимость относительного стандартного отклонения в оценки частоты для уравнения (12) от ширины прямоугольного фильтра р.

частоты и амплитуды синусоиды.

Рассмотрим следующее нелинейное уравнение первого порядка, которому удовлетворяет синусоидальная функция

+(I) 7 =А2 (13)

Вводя вектор параметров Л с компонентами А1 = А2 и А2 = 1/^2, представим уравнение (13) в виде

А1 - А^Ц2 = /2. (14)

Л,

/2

Сравнивая уравнение (14) и уравнение (1), мы видим, что Р1 = 1, Р2 = ( — ) , Q = /2,

\аЬ J

и решение задачи оценки параметров дается уравнением (6).

Приведенный пример демонстрирует гибкость и эффективность нашего обобщения метода НК. В то же время он показывает, что этот подход требует известной изобретательности при поиске подходящего уравнения в рутинной, по сути, задаче оценки параметров.

Пример 2. Другой интересный пример представляет популярная в приложениях задача восстановления параметров положения центра А2 и квадрата ширины А1 функции Гаусса

/ (¿) = А ехр

(* - А2) 2А1

(15)

Дифференциальное уравнение, которому удовлетворяет эта функция, можно получить, дифференцируя функцию (15) по параметру В результате мы приходим к уравнению

А1 / - А2/ = (16)

Обозначим / разностную аппроксимацию первой производной и запишем дискретный аналог уравнения (16) в виде

А/ - А2/ = -¿г/г, (17)

а функционал наименьших квадратов — в виде

£ [А/ + & - А2)/г]2 . (18)

г

Минимизация функционала (18) приводит к следующим выражениям для параметров:

Е ¿-¿Уг2 Е /к /к - Е ¿г/г/£ Е /к А1 = ^-к-2-г-к-, (19)

Е /г/г ) Е ^ Е У

г к

12

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

к

Е ¿¿Л2 Е Ук Е и/г/- Е УкУк

А2 = -к х2 г-к-. (20)

Е /г/г ) Е ^ Е У

к к

Пример 3. Особый интерес для практических приложений имеет оценка параметров специальных функций, которые нередко встречаются в практике обработки эксперимента. Параметрические задачи, приводящие к специальным функциям, таким как функции Бесселя, гипергеометрические функции и другим, часто остаются без ответа в силу относительной сложности их свойств. Ниже будет показано, что предложенный метод решения параметрических задач позволяет оценивать параметры специальных функций с помощью простейших арифметических операций, которые могут быть реализованы аппаратно.

Рассмотрим в качестве примера произвольную цилиндрическую функцию f (¿) = («¿) порядка V. Требуется по множеству экспериментально полученных значений функции определить параметр А = к2.

Цилиндрическая функция удовлетворяет дифференциальному уравнению Бесселя

г2+ г| + (А,2 - Vу = 0. (2!)

Выбирая подходящую разностную схему и обозначая разностную аппроксимацию первой и второй производных функции как Л и Л, оценку параметра А, минимизирующую норму невязки разностной аппроксимации уравнения (21), можно получить по следующей формуле:

(ЕЛЛ + и3Л1Л - »и2у2

А = ---^^--. (22)

Е Л

г

Заметим также, что дифференциальное уравнение Бесселя (21) можно использовать и для двухпараметрической задачи одновременного поиска параметров А и V.

Аналогичное рассмотрение можно провести для гипергеометрической функции и целого ряда других специальных функций.

Заключительные замечания

В заключение коснемся вопроса о статистических свойствах получаемых оценок. Эти свойства определяются, в первую очередь, точностью разностных аппроксимаций операторов задачи. В случае дифференциальных операторов, которые в основном и рассматривались выше, их разностные аппроксимации приводят к смещенным оценкам искомых параметров. Это можно показать, воспользовавшись дифференциальным приближением Шо-кина — Яненко [7]. Действительно, пусть для некоторого дифференциального оператора задачи Р используется разностная аппроксимация О порядка к. Разлагая эту аппроксимацию в ряд и переходя к дифференциальному оператору, в первом дифференциальном приближении мы получим добавку к исходному оператру Р порядка к. Даже если погрешность эксперимента будет равна нулю, полученная нами оценка будет смещенной ввиду неточности разностной аппроксимации дифференциального оператора.

Проведенное схематическое рассмотрение показывает, что по крайней мере для дифференциальных уравнений получаемые оценки оказываются смещенными. Это смещение определяется шагом дискретизации и уменьшается с увеличением числа экспериментальных точек и уменьшением шага дискретной сетки. Вместе с тем, точность получаемых оценок, безусловно, зависит от качества аппроксимации. Более высокий порядок аппроксимации, разумеется, повышает точность оценок, однако при этом может уменьшиться

объем статистической выборки, так как чем выше порядок аппроксимации, тем больше точек на границах перестают участвовать в оценке параметров. К примеру, первый порядок аппроксимации приводит к потере минимум одной граничной точки, где дискретная аппроксимация не определена. Второй порядок может приводить уже к потере не менее двух граничных точек и т. д.

Несмотря на смещенность получаемых оценок, в целом предложенный подход представляет собой хорошее дополнение к существующим методам оценки параметров и может найти широкое применение в прикладных задачах автоматизации сбора и обработки данных.

Автор благодарит А. Г. Игнатенко, обратившего внимание на первые приложения представленного подхода и отметившего его сходство с алгоритмом де Прони, а также В. В. Пая и Л. Б. Чубарова за полезные обсуждения, ценные советы и интерес к этой работе.

Список литературы

[1] Лоусон Ч., ХЕнтон Р. Численное решение задач метода наименьших квадратов. М.: Наука, 1986.

[2] Ортега Д., Рейнболдт В. Итерационные методы решения систем уравнений со многими неизвестными. М.: Мир, 1975

[3] Васильев Ф. П. Методы решения экстремальных задач. М.: Наука, 1981

[4] De Prony (Gaspar Rische). Essay expérimental et analitique: sur les luis de la dilaltabilitè de fluides elasiques et sur celles de la force expansive de la vapeur de l'eau et de la vapeur de l'alkool, à differentes temperatures // J. E. Polytech. 1795. Vol. 1, No. 2. P. 24-76.

[5] Марпл мл. С. Л. Цифровой спектральный анализ и его приложения. М.: Мир, 1990 (гл. 11).

[6] Бахвалов Н.С., Жидков Н.П., Кобельков Г. М. Численные методы. М., СПб.: Физматлит, 2001.

[7] Шокин Ю. И. Метод дифференциального приближения. Новосибирск: Наука, 1979.

Поступила в редакцию 18 апреля 2002 г., в переработанном виде — 7 мая 2002 г.

i Надоели баннеры? Вы всегда можете отключить рекламу.