Научная статья на тему 'Оптимизация коэффициента размытости ядра в задаче непараметрической идентификации'

Оптимизация коэффициента размытости ядра в задаче непараметрической идентификации Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
65
14
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
непараметрическая модель / непараметрические алгоритмы / коэффициент размытости / оптимизация / nonparametric model / nonparametric algorithms / core smooth coefficient / optimization

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Е Д. Михов, Н Д. Иванов

Исследуется проблема моделирования дискретно-непрерывных процессов. Рассматривается достаточно общая схема исследуемого процесса, включающая в себя не только входные-выходные переменные, но и промежуточные. Кратко анализируется вопрос идентификации в «узком» и «широком» смысле. Приводится рекуррентный алгоритм оценки параметров адаптивных моделей, основанной на методе стохастических аппроксимаций. При построении модели объекта при помощи ядерных оценок важным параметром является вектор коэффициентов размытости ядра. От выбранного вектора коэффициента размытости напрямую зависит качество построенной модели. Данный коэффициент определяет степень участия элементов выборки в оценке. Исходя из большого влияния вектора коэффициента размытости ядра на качество построенной модели у исследователей часто возникает задача оптимизации данного вектора. В статье рассмотрены алгоритмы оптимизации вектора коэффициентов размытости ядра. Рассмотрены следующие алгоритмы оптимизации: метод перебора, метод деформируемого многогранника и генетический алгоритм. В качестве критерия оптимизации была выбрана среднеквадратичная ошибка построенной модели, которая вычислялась при помощи скользящего экзамена. Представлена таблица, в которой отображена точность построенной модели после оптимизации вектора коэффициентов размытости ядра (для каждого входного воздействия), а также после оптимизации одного общего коэффициента размытости ядра, который назначается для всех входных переменных.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

OPTIMIZATION OF THE CORE SMOOTH COEFFICIENT IN THE PROBLEM OF THE NONPARAMETRIC IDENTIFICATION

The problem of modeling discrete-continuous processes is investigated. The general scheme of the investigated process is considered. The considered scheme includes input, output intermediate variables. The issue of identification in the «narrow» and «broad» sense. Analyzed Briefly. A recurrent algorithm for estimating the parameters of adaptive models based on the method of stochastic approximations. The vector of the blurring coefficients of the nucleus is an important parameter when constructing an object model using nuclear estimates. The quality of the constructed model depends on the selected vector of the blur factor. The blurring factor determines the degree of participation of the sampling elements in the evaluation. Researchers often face the task of optimizing this vector, since the vector of the kernel blur factor affects the quality of the constructed model. Algorithms for optimizing the vector of the kernel blur coefficients are considered in the article. The following algorithms for optimization are considered: the method of search, the method of a deformable polyhedron and the genetic algorithm. The root-mean-square error of the constructed model was chosen as an optimization criterion. The root-mean-square error was calculated using a sliding exam. The table in which the accuracy of the constructed model is displayed after the optimization of the vector of the kernel blur factors (for each input effect), and also after optimization of one common blur factor of the kernel, which is assigned to all input variables, is presented.

Текст научной работы на тему «Оптимизация коэффициента размытости ядра в задаче непараметрической идентификации»

КОСМИЧЕСКОЕ ПРИБОРОСТРОЕНИЕ

УДК 519.87

DOI 10.26732/2618-7957-2018-2-95-99

ОПТИМИЗАЦИЯ КОЭФФИЦИЕНТА РАЗМЫТОСТИ ЯДРА В ЗАДАЧЕ НЕПАРАМЕТРИЧЕСКОЙ ИДЕНТИФИКАЦИИ

Е. Д. Михов, Н. Д. Иванов

Сибирский федеральный университет, г. Красноярск, Российская Федерация

Исследуется проблема моделирования дискретно-непрерывных процессов. Рассматривается достаточно общая схема исследуемого процесса, включающая в себя не только входные-выходные переменные, но и промежуточные. Кратко анализируется вопрос идентификации в «узком» и «широком» смысле. Приводится рекуррентный алгоритм оценки параметров адаптивных моделей, основанной на методе стохастических аппроксимаций. При построении модели объекта при помощи ядерных оценок важным параметром является вектор коэффициентов размытости ядра. От выбранного вектора коэффициента размытости напрямую зависит качество построенной модели. Данный коэффициент определяет степень участия элементов выборки в оценке. Исходя из большого влияния вектора коэффициента размытости ядра на качество построенной модели у исследователей часто возникает задача оптимизации данного вектора. В статье рассмотрены алгоритмы оптимизации вектора коэффициентов размытости ядра. Рассмотрены следующие алгоритмы оптимизации: метод перебора, метод деформируемого многогранника и генетический алгоритм. В качестве критерия оптимизации была выбрана среднеквадратичная ошибка построенной модели, которая вычислялась при помощи скользящего экзамена. Представлена таблица, в которой отображена точность построенной модели после оптимизации вектора коэффициентов размытости ядра (для каждого входного воздействия), а также после оптимизации одного общего коэффициента размытости ядра, который назначается для всех входных

переменных.

Ключевые слова: непараметрическая модель, непараметрические алгоритмы, коэффициент размытости, оптимизация.

Идентификация многих стохастических объектов часто сводится к идентификации статических систем. Наиболее общая схема исследуемого дискретно-непрерывного процесса может быть представлена на рис. 1 [1-3; 5].

Рис. 1. Общая схема исследуемого процесса

На рис. 1 приняты обозначения: А - неизвестный оператор объекта; х(1) - выходной век-

© Михов Е. Д., Иванов Н. Д., 2018

тор процесса; и(1) - вектор управляющих воздействий; /¿(7) - вектор входных не управляемых, но измеряемых переменных процесса; /1(7) - вектор входных неуправляемых и неизмеряемых переменных процесса; ¿;(0 - случайное воздействие; юг'(0: 7=1, 2, ..., к - переменные процесса, контролируемые по длине объекта; ^ - непрерывное время; №, Ни, Нх, Н2, Нч, Нт - каналы связи, соответствующие различным переменным и включающие в себя средства контроля, приборы для измерения наблюдаемых переменных; /л , и, х, - означает измерение в дискретное время; /л(^), и(0, х(0: ю(0, №(0, Ли(0, кх(0, кт(?) - случайные помехи измерений соответствующих переменных процесса. Процессы с дискретным снятием измерений часто встречаются в различных технических областях. С помощью подобных моделей проводится диагностирование компонентов электроники (диодов, резисторов и т.д.) на предмет брака. Подобная диагностика проводится при анализе компонентов элементной базы, используемых для сборки космических летательных аппаратов.

[осмичЕскиЕ

АППАРАТЫ И

№ 2 (24) 2018

ТЕХНОЛОГИИ t

m

Уровни идентификации

Рассмотрим системы с различным уровнем априорной информации [4-6]:

• системы с параметрической неопределенностью. Параметрический уровень априорной информации предполагает наличие параметрической структуры модели и некоторых характеристик случайных помех, обычными из них являются нулевое математическое ожидание и ограниченная дисперсия. Для оценивания параметров используются чаще всего разноо-

96 бразные итеративные вероятностные процеду-

ры. При этих условиях также решается задача идентификации в узком смысле, как и во всех предыдущих случаях;

• системы с непараметрической неопределенностью. Непараметрический уровень априорной информации не предполагает наличие модели, но требует наличие некоторых сведений качественного характера о процессе, например, однозначность, либо неоднозначность его характеристик, линейность для динамических процессов, либо характер его нелинейности. Для решения задач идентификации на этом уровне априорной информации (идентификация в широком смысле) применяются методы непараметрической статистики;

• системы с параметрической и непараметрической неопределенностью. Важными с точки зрения практики являются задачи идентификации многосвязных систем в условиях, когда объем исходной информации не соответствует ни одному из вышеописанных типов. Например, для отдельных характеристик многосвязного процесса на основании физико-химических и энергетических закономерностей, закона сохранения массы, балансовых соотношений, могут быть выведены параметрические закономерности, а для других нет. Таким образом, мы находимся в ситуации, когда задача идентификации формулируется в условиях и параметрической, и непараметрической априорной информации. Тогда и модели представляют собой взаимосвязанную систему параметрических и непараметрических соотношений.

Уровни идентификации

Непараметрическая идентификация представляется в виде моделирования при помощи ядерных оценок [7]:

к (и*, - и Л

п, 5+1 п,г

XS+1 = ■

X )1 П Ф

i=1 j=1

, f * \ k u ^ - u .

n,s+\ n л

(1)

ХП Ф

i=1 j=l

Том 2

где Ф(*) - это ядерная «сглаживающая» функция (2), а csx - коэффициент размытости ядра. il - loi, если loi < 1,

Ф(°) Hn 11 (2)

10 , если1 < |o|.

Стоит сказать, что от выбранного вектора коэффициента размытости напрямую зависит качество построенной модели. Данный коэффициент определяет степень участия элементов выборки в оценке.

Коэффициент размытости ядра определяет степень участия элементов выборки в вычислении xs+1 в точке uM (рис. 2).

80 50 40 30 20 10 О ■ 10

.«А

10

15

20

Рис. 2. Определение коэффициента размытости ядра

Как видно на рис. 2 участвуют в оценке в точке им только те элементы выборки, у которых \п - пм\ < cs.

Исходя из большого влияния вектора cs на качество построенной модели у исследователей часто возникает задача оптимизации данного вектора (в качестве критерия оптимизации имеется ввиду точность построенной модели).

В настоящее время существуют множество методов оптимизации как для нахождения локальных экстремумов, так и для нахождения глобальных (хотя стоит сказать, что методы для нахождения глобальных экстремумов - вероятностные).

Ход исследования

Смысл исследования заключается в выяснении вопроса о необходимости оптимизации коэффициента размытости для каждого входного воздействия.

Для начала оптимизируем вектор коэффициента размытости ядра при помощи метода деформируемых многогранников. Слабостью данного метода можно считать то, что при нахождении минимума, он может «застрять» в локальном экстремуме. Для того чтобы определить, применим ли данный метод для оптимизации cs, построим графики зависимости среднеквадратичной ошибки б от cs (рис. 3, 4).

В первую очередь были построены графики зависимости между коэффициентом размытости

*

Оптимизация коэффициента размытости ядра в задаче непараметрической идентификации

ядра и среднеквадратичной ошибкой для двухмерного случая для различных процессов.

Характер данных зависимостей не изменялся. В качестве примера приведем один из графиков (рис. 3).

б 7

Рис. 3. Зависимость среднеквадратичной ошибки от коэффициента размытости ядра (2-мерный случай)

На рис. 3 отображено, что для 2-мерного случая зависимость является плавной и в ней не прослеживаются локальные минимумы.

На рис. 4 отображено, что для 3-мерного случая зависимость также является плавной и без локальных минимумов.

В связи с этим можно проводить оптимизацию cs при помощи метода деформируемого многогранника [8; 9].

После процесса оптимизации вектора коэффициентов размытости ядра при помощи метода деформируемого многогранника будет проведена оптимизация вектора коэффициентов размытости ядра при помощи генетического алгоритма [10].

Вычислительный эксперимент

Моделируемый процесс имеет два входных воздействия и один выходной параметр. Обучающая выборка была взята в количестве 300. Помеха, воздействующая на объект, была равна 7%. Критерием оптимизации была выбрана среднеквадратичная ошибка б.

1

П,1

£ (- *)2

(3)

Рис. 4. Зависимость среднеквадратичной ошибки от коэффициента размытости ядра (3-мерный случай)

Также были построены графики зависимости между коэффициентом размытости ядра и среднеквадратичной ошибкой для трехмерного случая для различных процессов.

Характер данных зависимостей также не изменялся. В качестве примера приведем один из графиков (рис. 4).

Выведем результаты в виде табл. 1. Как мы можем видеть из табл. 1, оптимизация вектора коэффициента размытости занимает во много раз больше времени, чем оптимизация скалярного значения, при этом модель практически не становится лучше.

Также стоит отметить, что оптимизация при помощи метода деформируемых многогранников действует гораздо быстрее, чем оптимизация при помощи стандартного перебора или генетического алгоритма.

Было проведено сравнение между оптимизацией при помощи метода деформируемых многогранников, генетического алгоритма и оптимизацией при помощи стандартного перебора, где было доказано превосходство первого в задаче оптимизации вектора cs.

Таблица 1

97

Результаты оптимизации вектора cs

Метод оптимизации Оптимизируемый параметр Время нахождения оптимального с', мс Среднеквадратичная ошибка б

Метод деформируемого многогранника Вектор а' 1118 0,750869

Метод деформируемого многогранника Скаляр с' 100 0,755853

Перебор возможных значений Вектор с' 26808 0,780678

Перебор возможных значений Скаляр с' 934 0,78102

Генетический алгоритм Вектор с' 39067 0,758035

Генетический алгоритм Скаляр с' 37028 0,761118

[осмичЕскиЕ

АППАРАТЫ И

№ 2 (24) 2018

ТЕХНОЛОГИИ t

m

Заключение

Была рассмотрена общая схема исследуемого процесса. Был кратко проанализирован вопрос идентификация в «узком» и «широком» смыслах. Был рассмотрен вопрос оптимизации вектора коэффициентов размытости ядра. В статье были рассмотрены следующие алгоритмы оптимизации: метод перебора, метод деформиру-

Том 2

емого многогранника и генетический алгоритм. Перечисленные методы оптимизации были использованы для оптимизации вектора коэффициентов размытости ядра. Продемонстрировано, что нет необходимости в оптимизации коэффициента размытости ядра для каждого входного воздействия. Также продемонстрировано, что методы локальной оптимизации успешно решают задачу подбора коэффициентов размытости ядра.

Исследование выполнено за счет гранта Российского научного фонда (проект №16-19-10089).

98

Список литературы

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

1. Tweedle V, Smith R. A mathematical model of Bieber Fever // Transworld Research Network, 2012, vol. 37/661, no. 2, pp. 157-177.

2. Антонов А. В. Системный анализ : учебник. М. : Высшая школа, 2004. 454 с.

3. Введение в математическое моделирование : учеб. пособие / под ред. П. В. Трусова. Москва : Логос, 2005. 440 с.

4. Медведев А. В. Анализ данных в задаче идентификации // Сборник научных статей Международной конференции «Компьютерный анализ данных и моделирование». Минск : БГУ, 1995. С. 201-207.

5. Советов Б. Я, Яковлев С. А. Моделирование систем : учебник для вузов. М. : Высшая школа, 2001. 343 с.

6. Теория систем и системный анализ : учеб. пособие / под ред. А. Н. Тырсина. Челябинск : Знания, 2002. 128 с.

7. Медведев А. В. Некоторые замечания к Н-моделям безынерционных процессов с запаздыванием // Вестник СибГАУ 2014. №2 (54). С. 24-34.

8. Рубан А. И. Методы анализа данных : учеб. пособие / изд. 2-е, испр. и доп. Красноярск : ИПЦ КГТУ 2004. 319 с.

9. Курейчик В. М., Лебедев Б. К., Лебедев О. К. Поисковая адаптация: теория и практика. М. : Физматлит, 2006. 272 с.

10. Kumsawat P. A Genetic Algorithm Optimization Technique for Multiwavelet - Based Digital Audio Watermarking // EURASIP Journal on Advances in Signal Processing, 2010, vol. 1, pp.15-25.

История статьи

Поступила в редакцию 17 апреля 2018 г.

Принята к публикации 21 мая 2018 г.

OPTIMIZATION OF THE CORE SMOOTH COEFFICIENT IN THE PROBLEM OF THE NONPARAMETRIC IDENTIFICATION

E. D. Mikhov, N. D. Ivanov

Siberian Federal University, Krasnoyarsk, Russian Federation

The problem of modeling discrete-continuous processes is investigated. The general scheme of the investigated process is considered. The considered scheme includes input, output intermediate variables. The issue of identification in the «narrow» and «broad» sense. Analyzed Briefly. A recurrent algorithm for estimating the parameters of adaptive models based on the method of stochastic approximations. The vector of the blurring coefficients of the nucleus is an important parameter when constructing an object model using nuclear estimates. The quality of the constructed model depends on the selected vector of the blurfactor. The blurring factor determines the degree of participation of the sampling elements in the evaluation. Researchers often face the task of optimizing this vector, since the vector of the kernel blur factor affects the quality of the constructed model. Algorithms for optimizing the vector of the kernel blur coefficients are considered in the article. The following algorithms for optimization are considered: the method of search, the method of a deformable polyhedron and the genetic algorithm. The root-mean-square error of the constructed model was chosen as an optimization criterion. The root-mean-square error was calculated using a sliding exam. The table in which the accuracy of the constructed model is displayed after the optimization of the vector of the kernel blur factors (for each input effect), and also after optimization of one common blur factor of the kernel, which is assigned to all input variables, is presented.

Keywords: nonparametric model, nonparametric algorithms, core smooth coefficient, optimization.

Оптимизация коэффициента размытости ядра в задаче непараметрической идентификации

References

1. Tweedle V., Smith R. A mathematical model of Bieber Fever // Transworld Research Network, 2012, vol. 37/661, no. 2, pp. 157-177.

2. Antonov A.V. Sistemnyj analiz [The system analysis]. Moscow, Higher School, 2004, 454 p. (In Russian)

3. Trusov P. V Vvedenie v matematicheskoe modelirovanie [Introduction to mathematical modeling]. Moscow, Logos, 2005, 440 p. (In Russian)

4. Medvedev A. V Analiz dannyh v zadache identifikacii [Analysis of data in the identification problem] // International conference «Computer-aidd data analysis and modeling», 1995, Vol. 2, pp. 201-207. (In Russian)

5. Sovetov B. Ya., Yakovlev S. A. Modelirovanie sistem [Modeling of systems]. Moscow, Higher School, 2001, 343 p. (In Russian)

6. Tirsina A. N. Teoriya sistem i sistemnyj analiz [Theory of systems and systems analysis]. Chelyabinsk, Znanie, 2002,

128 p. (In Russian) 99

7. Medvedev A. V. Nekotorye zamechaniya kN-modelyam bezynercionnyhprocessov szapazdyvaniem [Some remarks to the H-models of inertial-free processes with delay] // Bulletin of Siberian State University of Economics, 2014, no. 2 (54), pp. 24-34. (In Russian)

8. Ruban A. I. Metody analiza dannyh [Methods of data analysis]. Krasnoyarsk, IPC KSTU, 2004, 319 p. (In Russian)

9. Kureichik V M, Lebedev B. K., Lebedev O.K. Poiskovaya adaptaciya: teoriya ipraktika [Search adaptation: theory and practice]. Moscow, Fizmatlit, 2006, 272 p. (In Russian)

10. Kumsawat P. A Genetic Algorithm Optimization Technique for Multiwavelet - Based Digital Audio Watermarking // EURASIP Journal on Advances in Signal Processing, 2010, vol. 1, pp.15-25.

Article history

Received 17 April 2018 Accepted 21 May 2018

i Надоели баннеры? Вы всегда можете отключить рекламу.