Научная статья на тему 'Использование нейронных сетей для восстановления концентраций газов поданным трассового газоанализатора на С02-лазере'

Использование нейронных сетей для восстановления концентраций газов поданным трассового газоанализатора на С02-лазере Текст научной статьи по специальности «Математика»

CC BY
234
48
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по математике, автор научной работы — Катаев М. Ю., Суханов А. Я.

Рассматриваются аспекты построения нейронной сети и ее обучения для повышения точности восстановления концентраций газов по данным измерений С02 -лазерного трассового газоанализатора. Приводится точность восстановления концентрации атмосферных газов (Н20, С02 и 03) методом нейронных сетей в сравнении с традиционно используемым методом наименьших квадратов.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Использование нейронных сетей для восстановления концентраций газов поданным трассового газоанализатора на С02-лазере»

УДК 551.576

ИСПОЛЬЗОВАНИЕ НЕЙРОННЫХ СЕТЕЙ ДЛЯ ВОССТАНОВЛЕНИЯ КОНЦЕНТРАЦИЙ ГАЗОВ ПО ДАННЫМ ТРАССОВОГО ГАЗОАНАЛИЗАТОРА НА С02-ЛАЗЕРЕ

М.Ю. Катаев, А.Я. Суханов

Томский государственный университет систем управления и радиоэлектроники E-mail: saysandr@sibmail.com

Рассматриваются аспекты построения нейронной сети и ее обучения для повышения точности восстановления концентраций газов по данным измерений С02 -лазерного трассового газоанализатора. Приводится точность восстановления концентрации атмосферных газов (Н2 О, С02 и О-J методом нейронных сетей в сравнении с традиционно используемым методом наименьших квадратов.

Трассовый газоанализатор на основе С02-лазе-ра для концентрационного анализа состава воздуха давно применяется в исследовательских и экологических целях [1-5] и позволяет восстанавливать среднее значение концентрации исследуемого газа (или газов) вдоль трассы зондирования. Традиционно для решения обратной задачи применяется метод наименьших квадратов (МНК) [6, 7]. Однако в ходе эксперимента возникают нештатные ситуации, всегда присутствуют ошибки измерений различной природы, что приводит к неустойчивости решения системы линейных алгебраических систем уравнений. Неустойчивость проявляется либо в отрицательных или значительно завышенных величинах восстановленных концентраций газов. Поэтому построение более устойчивого метода решения обратной задачи является актуальной проблемой. Одним из таковых подходов к решению обратной задачи, на наш взгляд и взгляд других авторов [8-14], является метод нейронных сетей.

Интенсивность сигнала трассового газоанализатора на С02-лазере, работающего на длине волны v;, можно записать как [1-7]:

^O,.)=/0(v,.)-?7(v,.)x

n

хехр{-1-£>.(у,.)-х. + ctaer (v() + acont ))}, (1) j=i

где /0(v;) - интенсивность излучения, L - длина трассы зондирования, - коэффициент ослабления j'-ого газа для /-ой длины волны, Xj - концентрация у-ого газа, amr(v,) — коэффициент аэрозольного ослабления, асж,(у;) - коэффициент континуального поглощения водяного пара, r](v,) -чувствительность детектора.

Процедура восстановления концентрации газов Xj зависит от схемы измерений и может осуществляться с помощью метода дифференциального поглощения (выбор частот зондирования v0N, v0FF -в линии поглощения (ON) и вне ее (OFF)) или последовательного сканирования спектра атмосферы на выбранных частотах С02-лазера. Решение для первой схемы измерений заключается в том, что сравниваются сигналы на частотах v0N и v0FF. Можно выделить коэффициент поглощения исследуемого газа (или газов) из выражения:

— •In

L

f I(Уon) Л

ку off) j

aer V OA" ' OFF

-ba^tyoN^OFF

) = £a kj(vON,vOFF)-^

(2)

м

где Даш(у0ту0№), Щуок,уод) - раз-

ность коэффициентов аэрозольного ослабления, континуального поглощения и коэффициентов поглощения газов на частотах уодг и у0№

Представим отдельные части выражения (2) в виде

АУ, =- —-In 1 L

f

v7 (v uoff) j

~bccaer(v

aerj,ON ' j ,OFF

v..„,,)-Aacont(vt „„,v.

cont \'j ,ON ' j ,OFF

I

где}- номер пары уодги у0№для исследуемого набора газов и матрица разности коэффициентов поглощения ДК=К(уолг)-К(уод).

Тогда (2) преобразуется к матричному виду:

Ау = ДК • х. (3)

Неизвестный вектор концентраций х находится из уравнения (3):

х = (ДКгДК)-1ДКгД>'. (4)

Для второй схемы измерений решение находится из аналогичного выражения:

х = (КгК)~1Кг_у. (5)

Уравнения (3) можно решить и с помощью метода регуляризации, тогда:

х = (КГК + аА)~1Кг_у, (6)

где а - параметр регуляризации и А - единичная матрица.

Характеристики точности восстановления концентрации газов по данным трассового газоанализатора рассмотрены в работах [6, 7], где показано, что применение уравнений (4, 5) или (6) позволяет получать приемлемое решение вплоть до величины ошибки измерений 15 %. В некоторых измерительных случаях возникают ситуации, когда решение не может быть получено ни по одной из рассмотренных выше схем. Кроме того, решение суще-

ственно зависит от выбора параметра регуляризации, что при смене условий измерений заставляет находить новый параметр. Поэтому для решения обратной задачи предлагается применить в вычислительном плане современный и достаточно простой метод нейронных сетей.

Ранее рассматривалась возможность применения нейронных сетей для решения обратной задачи восстановления профиля концентрации озона в стратосфере по лидарным данным. Было показано [15, 16], что по точности и скорости нейросетевая методика не уступает известным подходам к решению обратной задачи, а по надежности превосходит. Используя полученные ранее результаты, метод нейронных сетей адаптирован нами применительно к задаче обработки данных трассового лазерного газоанализатора.

Можно представить нейронную сеть (НС) как «черный ящик», на входы которого будут поступать сигналы, полученные на каждой из частот генерации С02-лазера, а с выходов будут сниматься данные по концентрации изучаемых газов. Для того чтобы созданная таким образом нейронная сеть функционировала и решала поставленную задачу, ее необходимо обучить (подобрать алгоритм обучения, а также примеры для обучения, то есть пары вход -выход, связанные формулой (1), либо полученные на основе натурных экспериментов). После обучения данный метод предполагает подачу на вход НС модельных или измеренных сигналов и получение на выходе концентрации того или иного газа.

Обучение является ответственным этапом, от его успеха зависит работоспособность создаваемой НС. Для расчета пар примеров (сигнал - концентрация) генерировались сигналы для разных состояний атмосферы, которые связаны с изменением диапазона концентрации для каждого из исследуемых газов. Диапазон изменения концентрации выбирался на основе естественных изменений исследуемых газов в атмосфере [17].

Методы обучения нейронных сетей с учителем можно разделить на три больших класса: стохастические, детерминированные и эвристические [14].

Стохастический метод обучения, выполняет псевдослучайные изменения величин весов, сохраняя те изменения, которые ведут к улучшению результатов работы сети. Детерминированный метод обучения шаг за шагом осуществляет процедуру коррекции весов сети, основанную на использовании их текущих значений, а также величин входов (фактических выходов и желаемых выходов). К эвристическим алгоритмам обучения относится генетический алгоритм поиска, моделирующий процессы природной эволюции и позволяющий из множества решений (популяций) выбрать наилучшее решение.

Самым часто используемым [12-14] на практике подходом к обучению является детерминированный подход, для которого разработаны различные варианты алгоритма обратного распростране-

ния ошибки. Для стохастического подхода известны методы обучения: машина Больцмана и машина Коши. Выбор между этими подходами определяется, как правило, предпочтением автора или требованием решаемой задачи. Жестких рекомендаций по однозначному выбору того или иного подхода нет. Поэтому нами было решено использовать несколько алгоритмов обучения для сравнения их работы, а также выбора максимально эффективного алгоритма обучения нейронной сети для решения данной конкретной задачи.

Рассмотрим кратко эти подходы:

1. Модифицированный метод обратного распространения ошибки.

Классический метод основан на том, что вычисляется градиент ошибки функционирования сети для одного примера, весовые множители сети корректируются в направлении обратном вектору градиента. В модифицированном методе предлагается подавать все примеры, вычислять градиенты, затем усреднить значения градиентов и только потом скорректировать веса в направлении, противоположном среднему градиенту.

2. Генетический алгоритм.

Генетический алгоритм поиска минимума основан на моделировании процесса природной эволюции и относится к так называемым эволюционным методам поиска. При практической реализации данного метода используют стандартные операции, изменяющие решение. Поиск оптимального решения основан на оптимизации множества решений.

Для минимизации ошибки работы нейронной сети алгоритм генетического поиска можно определить следующим образом. Определяется множество векторов весовых коэффициентов - возможных оптимальных решений. Каждое решение представляет собой хромосому; для каждого решения вычислена функция пригодности к тому, что решение может быть оставлено в выборке. В качестве такой функции обычно используется функция ошибки работы сети. Множество решений называется популяцией. Из популяции выбирается два или более решений, и они скрещиваются между собой в одно, образуя потомка. Скрещивание - это процесс перемешивания хромосом родителей. Его можно осуществить различными способами: путем переноса одной части хромосомы от одного родителя и другой части хромосомы от другого родителя и так далее, причем участки можно выбирать любым способом.

На основе генетического алгоритма нами разработан алгоритм, который, в отличие от известного, позволяет использовать для обучения сети не всю обучающую выборку сразу, а только ее часть.

Шаг 1. Задается число копий весовых коэффициентов (число особей в популяции). Весовые коэффициенты в копиях заполняются случайными значениями.

Шаг 2. С заранее заданной малой вероятностью проверяется возможность события смены комплекта обучения, при незначительном расхождении комплектов. Если данное событие произошло, то случайным образом выбирается комплект обучения. Для каждого решения в популяции определяется суммарная ошибка обучения и записывается в массив ошибок обучения каждой особи. Суммарная ошибка определяется из уравнения

ж ¡=1

где Ж - количество примеров в комплекте обучения, Е] - суммарная ошибка для /-ого решения (особи) в популяции, щ - /-ый входной пример, к-ото комплекта, Щ - весовые коэффициенты/ого решения, гы - выходной пример,/ - результат работы сети.

Шаг 3. Определяется минимальная величина в массиве ошибок.

Шаг 4. Для скрещивания выбираются два решения из популяции для особей с самой малой ошибкой.

Шаг 5. Из двух выбранных особей путем операции скрещивании получается потомок. Осуществляется проход по всем нейронам сети, весовые коэффициенты в нейроне разделяются на две части, точка раздела выбирается случайным образом, в одну часть записываются весовые коэффициенты от первого родителя, в другую часть - от второго.

Шаг 6. Осуществляется мутация. Случайным образом происходит выбор весового коэффициента. Затем к значению весового коэффициента прибавляется случайная величина, максимальное отклонение которого выбирается случайным образом из массива (1; 0,1; 0,01; 0,001).

Шаг 7. Вычисляется ошибка полученного решения. Если она меньше максимальной ошибки в массиве ошибок, то данная особь записывается вместо самой неприспособленной особи. Переход на Шаг 2.

3. Метод покоординатного спуска.

Метод покоординатного спуска основан на том, что из какой-то начальной точки (случайные значения концентраций газов из заранее подготовленной обучающей выборки) начинается поиск точки минимума ошибки сети. Из начальной точки делается шаг вдоль одной из осей, если функция ошибки уменьшилась, увеличиваем шаг в два раза и снова осуществляем шаг, если при этом ошибка увеличилась, уменьшаем шаг в два раза, если функция ошибки все равно не уменьшилась, делаем шаг в другом направлении. Если ошибка больше не уменьшается, и все возможные направления испытаны, делаем переход к новой координате и шаг вдоль соответствующей оси.

Для реализации описанного выше подхода к решению обратной задачи концентрационного анализа по данным С02-лазерного трассового газоана-

лизатора на основе НС было создано программное обеспечение, которое позволяет проводить расчет сигнала трассового газоанализатора на основе уравнения (1) для заданного набора газов (И,О, С02, 0„ N,0, СН4, 802, N0,, Щ, С2Н4, С2Н6", С6Н6), учитывать аэрозольное ослабление и континуальное поглощение паров Н20. Для имитации погрешности измерений рассчитанный сигнал искажается датчиком случайных чисел.

Последовательность работы программы такова:

1) выбирается один газ из списка, как измеряемый,

2) остальные газы учитываются и считаются мешающими, 3) проводится выбор типа нейронной сети, 4) проводится обучение нейронной сети и 5) непосредственно решение обратной задачи для модельных условий измерений (например, длина трассы, концентрации газов, учет аэрозоля), определяемых пользователем. На данном этапе возможна обработка реатьных сигналов трассового газоанализатора.

7' Set NeuroNets ■JIÜIJI

Examples Number of examples N el Parameters Present Neuronets

|1000 Size of learn set □ Modified Back Propogation 0 Genetic □ Coordinate raising □ Matrix Parameters of layers

|1000 Number of tests

|300 Set examples Layer's number t

Layer 1 3

Layer 2 100

Activate function

[Sigmoid

Рис. 1. Окно для установки параметров сети

После того, как определен исследуемый газ, необходимо указать тип нейронной сети. При установке параметров нейронной сети необходимо определить число слоев, количество нейронов в слое (рис. 1), вид активационной функции. Дапее устанавливается один из видов обучения нейронной сети (обратного распространения, генетический, покоординатного спуска или матричный), число примеров обучающей выборки, число одновременно используемых примеров в одном цикле обучения и размер тестовой выборки (рис. 1). Далее для выбранного газа, в качестве измеряемого, проводится генерация обучающей выборки и обучение определяемой пользователем вида нейронной сети. Для выбранного списка газов, составляющих модельную атмосферную смесь, обучающая выборка строится из диапазона изменений концентраций газов, согласно [17]. Например, для С02 приземная концентрация может в течение дня варьироваться до 10 % (в естественных условиях), что учитывается при определении диапазона изменений концентрации в обучающей выборке для

Погреиносгь измерена, % Погрешность измерена, % Погрешность измерен^ %

а б в

Рис. 2. Относительные ошибки восстановления концентрации: а) 03; б) С02 и в) Н20

данного газа. При выборе большого размера обучающей выборки и медленном обучении, можно установить размер обучающего пакета в несколько раз меньше обучающей выборки (назовем эту часть - пакет). Данный пакет используется в одном цикле обучения нейронной сети.

После того, как все параметры установлены, происходит обучение НС, погрешность которого выводится для каждого газа индивидуально. Необходимо подбирать соответствующие параметры НС для достижения минимальной погрешности обучения для каждого из выбранных газов.

На основе массовых модельных расчетов возможности решения обратной задачи концентрационного анализа были рассмотрены несколько алгоритмов обучения нейронных сетей. Наиболее эффективным (достигались в среднем минимальные погрешности восстановления газов) оказался генетический алгоритм в сочетании с сигмоидаль-ной функцией активации. Для определения преимуществ и недостатков метода НС при решении обратной задачи было проведено сравнение с традиционно используемым в задачах концентрационного газоанализа методом наименьших квадратов. Моделирование включало три этапа. На первом этапе работы программы задавались параметры атмосферы (модель атмосферных газов, аэрозольная модель согласно [18]), параметры нейронной сети (число слоев: три слоя, количество нейронов в слое: в первом слое 3 нейрона, во втором 100, в третьем 1 выходной нейрон (значение концентрации исследуемого газа). На втором этапе проходило обучение сети и на третьем - решение обратной задачи, когда на вход НС подавались модельные сигналы с различным уровнем шума, имитирующего погрешности измерений.

На рис. 2 приведены результаты решения обратной задачи для 03, С02 и Н20. На рис. 2, а, приведены графики, показывающие относительную ошибку восстановления концентрации озона методом НС (рис. 3, а, - углекислого газа и рис. 3, б, - водяного пара) в сравнении с методом наименьших квадратов.

Из рис. 2 видно, что вплоть до погрешности измерений 3...5 % точность восстановления концентраций газов практически одинакова. Далее, с ростом погрешности измерений точность восстановления концентраций газов методом нейронных сетей выше. Наиболее ярко это проявляется при восстановлении концентрации озона, что обусловлено малой концентрацией озона (около 20 ррЬ) в приземном слое атмосферы. Для газов, концентрации которых достаточно велики в приземном слое атмосферы, например, Н20 (в летних условиях около 1500 ррш) и С02 (около 330 ррш), решение обратной задачи НС мало отличается от традиционного метода МНК (см. рис. 2, б, в).

Заключение

Рассмотрено применение метода нейронных сетей для решения обратной задачи концентрационного анализа по данным измерений трассового газоанализатора на С02-лазере. Результаты решения обратной задачи сравнивались с традиционно применяемым методом наименьших квадратов. Показано, что для некоторых газов (Н20, С02, 03) решение обратной задачи с помощью нейронных сетей при ошибке измерений, превышающей 5 %, более оправдано, чем применение метода наименьших квадратов. Результаты, полученные в статье, подтверждают целесообразность применения нейронных сетей для решения обратной задачи по данным измерений трассовым газоанализатором на С02-лазере.

СПИСОК ЛИТЕРАТУРЫ

1. Лазерный контроль атмосферы / Под ред. Э.Д. Хинкли, В.Е. Зуева. - М.: Мир, 1979. - 416 с.

2. Межерис Р. Лазерное дистанционное зондирование. - М.: Мир, 1987. - 550 с.

3. Применение лазеров для определения состава атмосферы / Под ред. В.М. Захарова. - Л.: Гидрометеоиздат, 1983. - 216 с.

4. Самохвалов И.В., Соснин А.В., Хмельницкий Г.С. К вопросу дистанционного определения температуры атмосферы С02-лазером // V Всес. Симп. по лазерному и акустич. зондир. атмосферы. - Томск, 1978. - Ч. 2. - С. 151-153.

5. Зуев В.Е., Зуев В.В. Дистанционное оптическое зондирование атмосферы. - СПб.: Гидрометеоиздат, 1992. - 232 с.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

6. Быков И.В., Катаев М.Ю., МицельАА, Холодных А.И. Программное обеспечение лазерного газоанализатора с непрерывной перестройкой частоты для многокомпонентного газоанализа атмосферы // В сб. трудов: Автоматизированные системы управления экспериментом / Под ред. Г.С. Шарыгина. -Томск: ТУСУР, 1999. - Т. 2. - С. 59-65.

7. Катаев М.Ю. Методические основы обработки данных лазерного трассового газоанализа // Оптика атмосферы и океана. -2001.-Т. 14,-№9.-С. 1-6.

8. Aires F., Prigent С. A new neural network approach including first guess for retrieval of atmospheric water vapor, cloud liquid water path, surface temperature, and emissivities over land from satellite microwave observations // Journal of Geophysical Research. -2001. -V. 106. - № D14. - P. 14887-14907.

9. Aires F., Chedin A., Scott N. A regularized neural network approach for retrieval of atmospheric and surface temperatures with the IASI

instrument // Journal of Applied Meteorology. - 2002. - V. 41. -P. 144-159.

10. Martin D., Kaifel A., Weber M. Neural network scheme for the retrieval of total ozone from Global Ozone Monitoring Experimental data //Applied Optics. - 2002. - V. 41. - P. 5051-5058.

11. Jimenez C., Eriksson P. A neural network technique for inversion of atmospheric observation from microwave limb sounders // Radio Science. - 2001. - V. 36. - № 5. - P. 941-945.

12. Уоссермен Ф. Нейрокомпьютерная техника. - M.: Мир, 1992. - 334 с.

13. Горбань А.Н., Россиев ДА. Нейронные сети на персональном компьютере. - Новосибирск: Наука, 1996. - 276 с.

14. Горбань А. Н., Дунин-Барковский В.Л., КирдинА.Н. идр. Ней-роинформатика. - Новосибирск: Наука, 1998. - 296 с.

15. Катаев М.Ю., Суханов А.Я. Возможности метода нейронных сетей для восстановления профиля концентрации озона из ли-дарных данных // Оптика атмосферы и океана. - 2003. - Т. 16. -№12.-С. 1115-1119.

16. Катаев М.Ю., Суханов А.Я. Оптимизация нейронной сети в задаче восстановления профиля концентрации озона из лидар-ных данных//Доклады ТУСУР. - 2004. - № 1. - С. 14-21.

17. Зуев В.Е., Комаров B.C. Статистические модели температуры и газовых компонент. - Л.: Гидрометеоиздат, 1985. - 199 с.

18. Зуев В.Е., Креков Г.М. Оптические модели атмосферы. - Л.: Гидрометеоиздат, 1986. - 225 с.

Поступила 20.03.2007г.

i Надоели баннеры? Вы всегда можете отключить рекламу.