О применении метода генетического программирования для решения задач символьной регрессии

Камшилова Ю.А.

I

D Столбец C Линейная регрессия доя Столбец C

О I-il-il-il-1 I-1 I-1 о

19,36 34,07 48,79 63,5 78,21 92,93 107,64 1697

2389 3080 3771

4463 5154

Рис. 2. Линия регрессии

Рис. 3. Гистограмма площади

Рис. 4. Гистограмма цены

Коэффициент корреляции равен 0,83, что свидетельствует о наличии прямой и тесной связи. Средняя квадратическая ошибка коэффициента корреляции:

or = (1 - r2) / V(n - 1) = (1 - 0,832)/V(68 - 1) = = 0,04 | r |/or = 0,83/0,04 = 20,75.

По справочной таблице [2] определяется t - критерий Стьюдента при Р = 0,95 и к = 68-2; ^абл = 1,96 (| r |/or) > ^абл (20,75 > 1,96). Следовательно, можно утверждать существенность коэффициента корреляции. Далее определяем модель связи. График линии средних показывает наличие линейной связи, поэтому используем функцию у = a + bx. Используя метод наименьших квадратов, получаем следующую модель: у = 494,08 + 37,63x (рис. 2). Построим гистограмму частот распределения площади (рис. 3) и цены (рис. 4).

Проведенный корреляционный анализ показал, что зависимость между площадью и ценой квартир существенна. Следовательно, использование линейного коэффициента корреляции оправдано. Анализ регрессионных остатков показал следующее: а) сумма остатков (у-у) равна (-1,54), т. е. близка к нулю относи-

тельно значений выборки; б) эти остатки носят практически случайный характер и не имеют явно выраженного тренда. Эти два результата говорят в пользу построенной модели. В дальнейшем планируется провести регрессионный анализ более объемной выборки с применением как линейных, так и нелинейных моделей.

Библиографические ссылки

1. Елисеева И. И. Общая теория статистики : учебник. М. : Финансы и статистика, 2004. 656 с.

2. Ефимова М. Р. Практикум по общей теории статистики : учеб. пособие. М. : Финансы и статистика, 2000. 280 с.

References

1. Eliseeva I. I. Obshhaja teorija statistiki : Uchebnik. Moskva : Finansy i statistika, 2004. 656 s.

2. Efimova M. R. Praktikum po obshhej teorii statistiki: Ucheb. posobie. Moskva : Finansy i statistika, 2000. 280 s.

25

20

15

10

100

УДК 519.6

О ПРИМЕНЕНИИ МЕТОДА ГЕНЕТИЧЕСКОГО ПРОГРАММИРОВАНИЯ ДЛЯ РЕШЕНИЯ ЗАДАЧ СИМВОЛЬНОЙ РЕГРЕССИИ

Ю. А. Камшилова

Сибирский государственный аэрокосмический университет имени академика М. Ф. Решетнева Россия, 660014, г. Красноярск, просп. им. газ. «Красноярский рабочий», 31 E-mail: [email protected]

Рассматривается схема алгоритма метода генетического программирования для решения задач аппроксимации и символьной регрессии.

Ключевые слова: генетическое программирование, символьная регрессия.

Решетневскуе чтения. 2013

ON SOLVING SYMBOLIC REGRESSION PROBLEM USING GENETIC PROGRAMMING

Y. A. Kamshilova

Siberian State Aerospace University named after academician M. F. Reshetnev 31, "Krasnoyarsky Rabochy" Av., Krasnoyarsk, 660014, Russia. E-mail: [email protected]

The scheme of genetic programming algorithm for solving the approximation and symbolic regression is considered.

Keywords: genetic programming, symbolic regression.

Задача регрессии решается путем выбора параметрической модели и последующего нахождения коэффициентов выбранной модели. Задача символьной регрессии заключается в нахождении математического выражения в символьной форме, аппроксимирующего исследуемый процесс. Метод генетического программирования (ГП) широко применяется при решении различного рода задач, в том числе для задач символьной регрессии.

Генетическое программирование - это разновидность эволюционных алгоритмов и, по сути, является модификацией генетического алгоритма. Основное отличие заключается в представлении решений: строки фиксированной длины в генетическом алгоритме и в виде деревьев в генетическом программировании.

Пример решения в методе ГП

Дерево - направленный граф, в котором каждая последующая вершина связана с одной и только одной предыдущей (см. рисунок). Вершины дерева являются элементами терминального или функционального множеств: в конечных вершинах расположены элементы терминального множества, в остальных вершинах - элементы функционального множества. Количество подвершин данной вершины может быть не больше п, в таком случае дерево называется унарным. Удобно использовать бинарные деревья, т. е. количество подвершин данной вершины не более двух. Дерево является удобной формой кодирования.

Представление решения в виде дерева должно удовлетворять двум условиям [1; 2]:

1. Замкнутость: любой элемент функционального множества должен принимать в качестве аргумента любой элемент универсального множества.

2. Достаточность: элементы универсального множества должны быть выбраны таким образом, чтобы можно было решить поставленную задачу.

Общая схема метода генетического программирования:

1. Сгенерировать начальную популяцию одним из методов выращивания: полный метод и метод роста.

2. Для каждого индивида вычисляется значение функции пригодности.

3. Применить оператор селекции.

4. Применить оператор скрещивания: одноточечное скрещивание и стандартное скрещивание.

5. Применить оператор мутации: точечная мутация и мутация деревьями [3].

6. Проверить условие остановки: если выполняется, завершить работу алгоритма, иначе перейти на шаг 2.

Рассмотрим некоторые генетические операторы подробнее.

Методы выращивания. Полный метод - метод, при котором все вершины глубины d-1 и меньше являются функциональными вершинами, а терминальные вершины располагаются только на глубине d. Метод роста - метод, при котором терминальные вершины могут располагаться на любой глубине, но максимальная глубина вершины в дереве равна ^

Оценка пригодности. Для решения задачи символьной регрессии предложена следующая функция пригодности:

,

■V

где - пригодность решения

- квадратичная ошибка аппроксимации,

вычисляемая по всем точкам обучающей выборки; 5 - объем обучающей выборки; -

значение полученного выражения А,- в точке

Скрещивание. Стандартное скрещивание - у обоих родителей выбирается точка скрещивания и родители обмениваются поддеревьями, расположенными ниже точки скрещивания. Одноточечное скрещивание -путем наложения деревьев друг на друга у родителей выбирается общая область, затем, в общей области, выбирается точка скрещивания, и родители обмениваются поддеревьями, расположенными ниже точки скрещивания.

Мутация. Точечная мутация - случайно выбирается вершина и элемент, находящийся в данной вершине, заменяется на случайный элемент того же множества. Мутация деревьями - выбранное поддерево заменяется поддеревом, выращенным методом роста,

которое имеет глубину не больше, чем глубина исходного поддерева.

Результаты исследования работы генетического программирования при решении задач символьной регрессии будут подробно изложены в докладе.

Библиографические ссылки

1. Koza John R. Genetic Programming: On Programming Computer by Means of Natural Selection and Genetics. Cambridge : The MIT Press, 1992.

2. Koza John R. Hierarchical genetic algorithms operating on populations of computer programs // Proceedings of the 11th Intern. Joint Conf. on Artificial Intelligence. San Mateo : Morgan Kaufman, 1989.

3. Banzhaf W., Francone F. D., Nordin P. The Effect of Extensive Use of the Mutation Operator on

Generalization in Genetic Programming / Department of Computer Science. Germany : Dortmund University,

References

1. Koza John R. Genetic Programming: On Programming Computer by Means of Natural Selection and Genetics. Cambridge, MA: The MIT Press, 1992.

2. Koza John R. Hierarchical genetic algorithms operating on populations of computer programs Proceedings of the 11th International Joint Conference on Artificial Intelligence. San Mateo : Morgan Kaufman, 1989.

3. Banzhaf W., Francone F. D., Nordin P. «The Effect of Extensive Use of the Mutation Operator on Generalization in Genetic Programming» Department of Computer Science. Germany : Dortmund University.

УДК 004.414.23

РАЗРАБОТКА ПРОЦЕДУР АВТОМАТИЗИРОВАННОЙ НАСТРОЙКИ НЕЧЕТКОГО КОНТРОЛЛЕРА

Ю. В. Климец, Л. В. Липинский

Сибирский государственный аэрокосмический университет имени академика М. Ф. Решетнева Россия, 660014, г. Красноярск, просп. им. газ. «Красноярский рабочий», 31 E-mail: [email protected]

Рассмотрены основные вопросы проектирования и настройки нечеткого контроллера. Предложен подход к автоматизированной настройке нечеткого контроллера методом перехода по первому улучшению и градиентным спуском.

Ключевые слова: управление, нечеткий контроль, оптимизация.

DEVELOPMENT OF PROCEDURES AUTOMATED TUNING FUZZY CONTROLLER

U. V. Klimec, L. V. Lipinskiy

Siberian State Aerospace University named after academician M. F. Reshetnev 31, "Krasnoyarsky Rabochy" Av., Krasnoyarsk, 660014, Russia. E-mail: [email protected]

The main issues of design and configuration of a fuzzy controller. An approach to automated tuning of fuzzy controller by the transition to the first improvement and gradient descent.

Keywords: management, indistinct control, optimization.

Создание прикладных интеллектуальных систем управления и их внедрение в различные сферы человеческой деятельности показали высокую эффективность использования современных информационных технологий при управлении слабо формализуемыми объектами и процессами [3]. Широкое развитие получили нечеткие системы, использующие средства нечеткого управления [5].

Нечеткие системы управления (НСУ) (нечеткие контроллеры) являются наиболее важным приложе-

нием теории нечетких множеств. Работа нечетких логических контроллеров сильно отличается от работы стандартных контроллеров. Это отличие состоит в том, что обычные контроллеры основаны на аналитическом выражении, описывающем объект управления, в то время как нечеткие контроллеры используют знания экспертов. Эти знания могут быть выражены естественным способом, использующим лингвистические переменные, которые описаны размытыми множествами [2].

2З

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Камшилова Ю. А.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Камшилова Ю. А.

ON SOLVING SYMBOLIC REGRESSION PROBLEM USING GENETIC PROGRAMMING

Текст научной работы на тему «О применении метода генетического программирования для решения задач символьной регрессии»