Научная статья на тему 'Применение метода Левенберга-Марквардта для анализа данных бортовой диагностической системы локомотива'

Применение метода Левенберга-Марквардта для анализа данных бортовой диагностической системы локомотива Текст научной статьи по специальности «Математика»

CC BY
829
90
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ЭКСПЕРИМЕНТАЛЬНЫЕ СТАТИСТИЧЕСКИЕ ДАННЫЕ / ДИАГНОСТИРОВАНИЕ / АППРОКСИМАЦИЯ / МАТРИЦА / МЕТОД НАИМЕНЬШИХ КВАДРАТОВ / МЕТОД ЛЕВЕНБЕРГА-МАРКВАРДТА / СРЕДНЯЯ ОШИБКА АППРОКСИМАЦИИ

Аннотация научной статьи по математике, автор научной работы — Четвергов В.А., Бочаров В.М., Мишин А.И., Сиряк П.А., Мельниченко В.А.

Для создания автоматизированных информационных систем необходимы формирование информационных потоков и разработка методик и алгоритмов обработки этой информации. По результатам исследования предложена методика аппроксимации диагностических параметров, измеренных бортовой системой АПК «Борт», на примере тока тягового генератора в режиме разгона тепловоза методом наименьших квадратов с использованием нелинейных моделей. Изложенная методика ориентирована на применение в области диагностирования тягового подвижного состава по результатам анализа информации, получаемой от бортовых систем.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Четвергов В.А., Бочаров В.М., Мишин А.И., Сиряк П.А., Мельниченко В.А.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Levenberg-Marquardt method application for data analysis of locomotive on-board diagnostic system

It is necessary for creation of automated information systems the formation of streams of information and the development of methods and algorithms for processing of these data. The article describes the proposed method, based on the results of the study, for approximation of diagnostic parameters, measured by APK «Bort» on-board system, through the example of traction generator in acceleration mode of diesel-powered locomotive by the method of least-squares, using non-linear models. Described method is focused on application in diagnostic of traction rolling stock, based on the results of data analysis, obtained from on-board systems.

Текст научной работы на тему «Применение метода Левенберга-Марквардта для анализа данных бортовой диагностической системы локомотива»

Современные технологии - транспорту

41

УДК 629.488

В. А. Четвергов

Омский государственный университет путей сообщения

В. М. Бочаров, А. И. Мишин, П. А. Сиряк, В. А. Мельниченко

ООО «Производственное конструкторско-технологическое предприятие «Транспорт»

ПРИМЕНЕНИЕ МЕТОДА ЛЕВЕНБЕРГА-МАРКВАРДТА ДЛЯ АНАЛИЗА ДАННЫХ БОРТОВОЙ ДИАГНОСТИЧЕСКОЙ СИСТЕМЫ ЛОКОМОТИВА

Для создания автоматизированных информационных систем необходимы формирование информационных потоков и разработка методик и алгоритмов обработки этой информации. По результатам исследования предложена методика аппроксимации диагностических параметров, измеренных бортовой системой АПК «Борт», на примере тока тягового генератора в режиме разгона тепловоза методом наименьших квадратов с использованием нелинейных моделей. Изложенная методика ориентирована на применение в области диагностирования тягового подвижного состава по результатам анализа информации, получаемой от бортовых систем.

экспериментальные статистические данные, диагностирование, аппроксимация, матрица, метод наименьших квадратов, метод Левенберга-Марквардта, средняя ошибка аппроксимации.

Введение

1 Методика применения метода Левенберга-Марквардта

Целью данной работы является разработка методики аппроксимации результатов измерения бортовой диагностической системой тока тягового генератора, в режиме разгона тепловоза, методом наименьших квадратов с использованием нелинейных моделей. Данная методика может быть использована для автоматизации процессов оценки технического состояния локомотивов и формирования рекомендаций по объему и периодичности технического обслуживания и ремонта на основе результатов измерения диагностических параметров бортовой системой.

Изложенная в настоящей статье методика ориентирована на применение в области диагностирования тягового подвижного состава по результатам анализа информации, получаемой от бортовых систем. При разработке использовались исходные экспериментальные данные из архивов результатов измерений аппаратно-программным комплексом «Борт» (АПК «Борт»).

В статье [1] описана методика оценки неизвестных параметров регрессионных моделей по выборочным данным методом наименьших модулей (далее - МНМ). Выборками являлись результаты измерения АПК «Борт» тока тягового генератора в режиме разгона маневрового тепловоза. Данные одного переходного процесса были названы реализацией, требования к которой были определены. В качестве модели использовалась функция:

Fi (t,, w) = Уп

(Утах - У min ) Уmax

at,3 + bt,2 + ct, + ym

(1)

где F1 (t,, w) - аппроксимирующая функция; t - время измерения тока в реализации; у , у - наименьшее и наибольшее значения тока в одной реализации; i = 1, 2, ..., n - номер измерения в одной реализации; w = (a, b, c) - вектор неизвестных коэффициентов.

ISSN 1815-588Х. Известия ПГУПС

2014/1

42

Современные технологии - транспорту

Далее по тексту обозначение w1 соответствует a, w1 - b и т. п.

Модель (1) подбиралась экспериментально. С учетом особенностей полиномов 3-й степени возможно наличие локальных экстремумов в области определения (t е [0, t ]). Поэтому для дальнейших исследований дополнительно подобраны функции:

F2 (t t, w) = exP

V W1t f + W2ti2 + W3t , + W4 J

; (2)

F3 (ti, ) = WieXP (w2ti ) + W4; (3)

F4 (ti, w) = wi exp (tlWw - ) + w4; (4)

F5 (ti, W) =

: W1 eXP (W2ti ) (W3ti3 + W4ti2 + W5ti + 1) .

(5)

Регрессионный анализ в основном выполняется методом наименьших квадратов (далее - МНК), основанным на минимизации суммы квадратов некоторых функций искомых переменных.

С этой точки зрения измерения тока тягового генератора локомотивов образуют генеральную совокупность A. Переходный процесс представляет собой выборку D = = { tl, y l } .=p где D e A, t. е N - время измерения тока в реализации D, у. е Z - соответствующее времени значение тока. Целью статистической обработки этих данных является нахождение коэффициентов функции регрессии Fz (t t, w). При таких условиях формализация задачи о МНК имеет вид:

S(w) = Z(Fz (t i,w)-У imin, (6)

=i

dS dw1 dS dw0

0,

0,

dS

dwk

0,

(7)

где к - количество коэффициентов w.

Если в формуле (6) функция S (w) линейна или сводится к этому виду, то система уравнений (7) также будет линейной (функции (1), (2)). Такую систему можно решить любым численным прямым методом. Для функций (3), (4), (5) необходимо применять итерационные методы решения.

После анализа существующих методов многомерной оптимизации (градиентный спуск, покоординатный спуск, метод Ньютона и т. п.) выбран метод Левенберга-Марквардта (МЛМ), сочетающий методы наискорейшего спуска (т. е. минимизации вдоль градиента) и Ньютона (т. е. использование квадратичной модели для ускорения поиска минимума функции). От метода наискорейшего спуска МЛМ позаимствовал стабильность работы, от метода Ньютона -ускоренную сходимость [2].

Для реализации МЛМ вычисляется начальный вектор коэффициентов w0. Общего правила нахождения w0 для функций (3), (4), (5) не существует [3], поэтому для определения w0 в функцию (3), в частности, подставляются значения (0, ymax). Получается условие w1 + w4 = ymax, которое можно использовать для подбора начального значения коэффициентов.

Приняты следующие значения начальных коэффициентов:

где z = 1, ..., 5 - номер функции.

То есть требуется найти такие параметры w, при которых функция S (w) достигает минимального значения. Для этого решается система уравнений (7), где частные производные функции (6) приравниваются к нулю:

W40 = Уmin , w0 = Ушах - W2 ■■ (8)

Коэффициенты w0 и w^ находятся из системы уравнений (9) по двум совокупностям данных (t, у), равномерно взятым из выборки D:

2014/1

Proceedings of Petersburg Transport University

Современные технологии - транспорту

43

у = ( У - У ■ ) exp (w2t w3 ) + y ■ ,

✓ p у-'тах SmmJ rl 2 p ) -'min’

0( (9)

Уд = (Утах - Ут1п ) eXP () + Ут1п ,

где p, q - числа из ряда 1, 2, ..., n, делящие отрезок [1, n] на равные интервалы.

Выражая коэффициенты из системы (9), получаем уравнения для вычисления w0 и

w30 =

ln

f - ln V yq - w0 3' 3 - ln у f - ln V f 0\ 3 У, - w

w l 0 V wi

ln (tq )-ln (tp )

ln

Ч - Ч

W0 = ^

w,

tw3

p

(10)

В результате начальный вектор w0 для функции (3) определяется выражениями (8), (10).

Для функции (4) применялся иной подход нахождения компонентов вектора w0. Коэффициенты w0, w0 подбирались вручную и равны соответственно:

w0 = 0 8Утах , w0 = 0 2Утах • (11)

Такие соотношения взяты из результата работы МЛМ по обучающей выборке .Ообуч, являющейся одним из характерных переходных процессов.

Для нахождения w0 и w0 использовался метод секущих, применяемый после определенных преобразований [4]. После выбора p, q и подстановки w0, w4 в (4) была получена система:

Она (12) приводится к виду:

ln

Ур - w0 3

w,

ln

Уд - W4

w

J о Л

= tw2 - tw3 р р >

= ,w<0 - tw3

lq lq ■

(13)

Заменим переменные следующим обра-

tW3 = vm. Это

_ vWo -/W-о >Wo „ m

зом: tp2 = U , tp3 = v , tq2 = U ^

позволит вычислить показатель степени m, используя систему уравнений:

tW2 = U,

tf = um

(14)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

откуда m =

ln (tq )

ln (tp )

Система (13) принимает вид:

ln

'у, - >4

w

= tf0 - tw3

р р ■

ln

Уд - >0 3

ln(tq ) ln(tq )

(twp2) Чч) -(t;3) Чс).

(15)

Результатом преобразований является уравнение с одной переменной:

ln

С

УЧ - w

о 3

4

V

w

у

0

ln У p w4 - tw

w0 l

p

Чч)

ln(tp)

(16)

Функция (16) нелинейная и является гладкой на отрезке [-1, 1], то есть она имеет непрерывную первую производную на этом отрезке (рис. 1). Решение данного уравнения выполняется итерационным численным методом, который должен обладать устойчивостью (нечувствительностью к неточностям в исходных данных) и сходимостью (близостью получаемого численного решения задачи к истинному решению) [5]. Рас-

ISSN 1815-588Х. Известия ПГУПС

2014/1

44

Современные технологии - транспорту

Рис. 1. Зависимость f (w2) от w2:

1, 2, 3, 4, 5 - реализации с n равным соответственно 8, 11, 16, 24, 32

ширенным понятием сходимости является порядок сходимости а. Для наиболее распространенных одинаково устойчивых методов хорд, дихотомии, секущих а имеет значение 1, 1, 1,618 соответственно. Поэтому в данной работе предпочтение отдано последнему методу, итерационная формула которого имеет вид [6]:

W:

J+1 = w2 -

w2- w2-1

f ( W2 )- f ( W2-1)

A f (W2J ) , (17)

где j = 1, 2, ... - номер итерации.

Метод секущих является модификацией метода Ньютона. Суть модификации заключается в замене производной f (w2j) на конечно-разностную аппроксимацию

f (W2 )- f (W2-1)

W2 - W2-1 вое приближение w

. В процессе итераций но-

2j+1 определяется двумя - [6].

предыдущими значениями w2j и w2

На основе анализа совокупности A начальные значения w2j-1 и w2j принимались равными 0 и 0,5. Критерий остановки ите-

рационного процесса

f (w2 )

< 0,0001.

После нахождения w2 значение w3 равно:

Таким образом, начальный вектор w0 для функции (4) определяется выражениями (11), (17), (18).

Для функции (5) длительность переходного процесса приведена к единому отрезку времени t е [0, 1]. Коэффициенты w0 = = [1, -1.5, 1, 1.5, 0.5] подобраны экспериментально.

Далее вектор начального приближения w0 заменяется на вектор w0 + Aw и реализация итерационной формулы МЛМ имеет вид:

wJ+1 = wJ +AwJ, (19)

где j = 1, 2, . - номер итерации.

Приращение Aw находится по формуле [2]:

Aw =

= ( JTJ + X • diag ( JTJ))-1 JT (y - F), (20)

где J - матрица Якоби; X > 0 - параметр регуляризации; diag (JTJ) - диагональная матрица с элементами JTJ; y, I7 - векторы экспериментальных и регрессионных значений.

Матрица J составляется из частных производных функции Fz (tt, w) по всем компонентам вектора w:

J

dFz (tj, w) dw1

dFz (tn, w )

dw1

dFz (^ w )

dwk

dFz (tn , w )

dWk

. (21)

Для вычисления частных производных используется центральная конечно-разностная аппроксимация [6]:

dFz (l,, w ) =

dWk

= Fz (t,, w + n)-Fz (ti, w-n) (22)

2n ’

W

0

3

■" (y. + d)

^n(tp )

где n - конечно-разностный интервал.

Значение n определяется методом подбора для каждой конкретной функции. При отладке программной реализации МЛМ использо-

2014/1

Proceedings of Petersburg Transport University

Современные технологии - транспорту

45

ваны значения n3 = 10-6, n4 = 10-6, П5 = 10-3 для функций (3), (4), (5) соответственно.

Матрица частных производных J транспонируется в JT. Результатом произведения JTJ является прямоугольная матрица размером кхк. Сумма JTJ + X-diag (JTJ) представляет собой матрицу Гессе H. Обращение H выполняется методом Гаусса-Жордана [7], он заключается в том, что если с единичной матрицей E провести элементарные преобразования, которыми невырожденная матрица H приводится к E, то получается обратная матрица H-1.

Наличие параметра регуляризации X является отличительной особенностью МЛМ от прочих методов многомерной оптимизации. Монотонное убывание минимизируе-

мой функции S(w) достигается в МЛМ за счет подбора значений X [6].

Критерием оценки качества аппроксимации и окончания итерации принимается средняя ошибка аппроксимации:

s =

Е У г - (hW)|/Уi

П

100%.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

При исследовании пяти реализаций (1... 5) с использованием функций (3), (4), (5) сделан вывод, что зависимость s = f (X) нелинейная (рис. 2). Различные значения s на начальной стадии адаптивной коррекции объясняются особенностями (в частности, точностью) определения w0.

а)

б)

в)

X------—

Рис. 2. Зависимость s от коэффициента регуляризации (X) для функций:

а) - (3), б) - (4), в) - (5)

ISSN 1815-588Х. Известия ПГУПС

2014/1

46

Современные технологии - транспорту

2 Адаптивная коррекция

s/ < s2, (24)

Цель адаптивной коррекции - найти значение X на текущем шаге итерации, при котором s ^ min. Так как аналитическое выражение s = f (X) отсутствует, необходимо реализовывать алгоритм итерационного метода подбора соответствующего значения X (рис. 3).

Для решения этой задачи начальное X 0 принимается равным максимальному значению из элементов матрицы JTJ (блок 7). Это приводит к тому, что МЛМ ведет себя как метод градиентного спуска с медленной сходимостью. При таких условиях начинается внешний цикл по j, вычисляются поправки Awj вектор Wjj (блок 11) и средняя ошибка аппроксимации (далее - СОА) s/ (блок 12).

Полученное значение s/ сравнивается с S0 (блок 14). При увеличении СОА X0. последовательно уменьшается в 1,618 и повторно выполняются действия блоков 8-15.

Если в результате достигается состояние, при котором

где s/ - СОА при wj которому соответствует Xjk; s2 - СОА при w2j, которому соответствует Xk = Xjk/1,618; продолжается уменьшение параметра регуляризации (блок 25) для отыскания минимального значения s 2 (блоки 17-25). Уменьшение X j и окончание цикла по к происходит по двум критериям:

1) выполнение условия X }к < т, при этом программа завершается, а w^ считается лучшим приближением;

2) увеличение s{ по сравнению с предыдущим s/ (блок 23), при этом wj считается лучшим приближением на текущем j шаге и выполняются завершающие операции цикла j.

Критерием окончания внешнего итерационного процесса по j, то есть нахождения наилучшего приближения вектора w, является выполнение условия |s0 -^|<Ю 6 в течение трех итераций (блок 27). В этом случае w = w^ и МЛМ считается реализованным.

Xj <Т

(23)

Заключение

(где т - заданное малое число), то программа завершается, w0j считается лучшим приближением, а коэффициенты - найденными (блок 30). Выход из цикла по i осуществляется при выполнении условия s0 > s/ .

Цикл по k начинается после присвоения Xk = X./1,618 (блок 16). При неверности неравенства (блок 23):

Аппроксимация переходных процессов D функциями (3), (4), (5) методом наименьших квадратов с применением МЛМ обеспечивает получение значений искомых коэффициентов, при которых средняя ошибка аппроксимации не превышает 1,4 %, (рис. 4). Такие значения меньше рекомендуемых предельных значений [8].

я ^

н о

2 О

■в*

я

&

я

ч

<L>

&

и

Позиция

Рис. 3. Среднее значение СОА функции аппроксимации (3), (4), (5) в зависимости от номера позиции контроллера машиниста

2014/1

Proceedings of Petersburg Transport University

Современные технологии - транспорту

47

ISSN 1815-588Х. Известия ПГУПС

2014/1

48

Современные технологии - транспорту

На позициях 1-5 контроллера машиниста заметна менее качественная аппроксимация, чем на позициях 6-8. Влияние выбросов и их конкретные причины можно установить после статистического анализа и проведения эксперимента.

В работе описана методика аппроксимации получаемых с бортовой системы АПК «Борт» данных изменения тока тягового генератора в режиме разгона тепловоза. Методика распространена на линейные и нелинейные аппроксимирующие функции. Полученные результаты свидетельствуют о приемлемой погрешности аппроксимации и возможности использования их для контроля технического состояния локомотивов.

Библиографический список

1. Математическое описание экспериментальных данных контроля технического состояния локомотивов / В. А. Четвергов, В. М. Боча-

ров, А. И. Мишин, О. В. Гателюк, П. А. Сиряк // Современные проблемы науки и образования. -2013. - № 4. [Электронный ресурс]. - Режим доступа: http://www.stience-education.ru/110-9767.

2. Метод Левенберга-Марквардта [Электронный ресурс]. - Режим доступа: http: //alglib. sources.ru/optimization/levenbergmarquardt.php.

3. Прикладная статистика / С. А. Айвазян, И. С. Енюков, Л. Д. Мешалкин - Москва : Финансы и статистика, 1985. - 487 с., ил.

4. Численные методы безусловной оптимизации и решения нелинейных уравнений / Дж. мл. Деннис, Р. Шнабель ; пер. с англ. - Москва : Мир, 1988. - 440 с., ил.

5. Основы численных методов : учеб. пособие / Л. И. Турчак. - Москва : Наука, 1987. - 320 с.

6. Практическая оптимизация / Ф. Гилл, У. Мюррей, М. Райт ; пер. с англ. - Москва : Мир, 1985. - 509 с., ил.

7. Метод Гаусса-Жордана [Электронный ресурс]. - Режим доступа: http://goo.gl/r1RtpQ.

8. Метод наименьших модулей / В. И. Мудров, В. Л. Кушко. - Москва : Знание, 1971. - 61 с.

УДК 629.45/.46.02 Н. А. Чурков

Петербургский государственный университет путей сообщения Императора Александра I

О ПЕРСПЕКТИВНОМ ГРУЗОВОМ ВАГОНЕ

Перевод экономики на рыночные отношения сформировал новые условия хозяйствования, которым должен удовлетворять и железнодорожный транспорт. Концепция грузовых вагонов, сформулированная в 20-х гг. ХХ в. и с тех пор не изменявшаяся, устарела, в связи с чем в статье поставлен вопрос о необходимости создания новой концепции. Показана целесообразность использования специализированных контейнеров, созданных на базе универсальных крупнотоннажных ISO контейнеров. Перевозку грузов в контейнерах предложено организовать в грузовых нерасцепляемых поездах, курсирующих по определенным направлениям и по расписанию, подобно пассажирским. В качестве перспективного грузового вагона предложена платформа для специализированных контейнеров.

товарные вагоны, перспективы развития, контейнеры, железнодорожный транспорт.

Введение наций и народностей СССР - была преоб-

разована в Российскую Федерацию - феВ 1991 г. наша страна - социалистическое деративное государство с республиканской общенародное государство трудящихся всех формой правления. В результате изменилось

2014/1

Proceedings of Petersburg Transport University

i Надоели баннеры? Вы всегда можете отключить рекламу.