Научная статья на тему 'ПРИМЕНЕНИЕ САМОКОНФИГУРИРУЕМОГО МЕТОДА ГЕНЕТИЧЕСКОГО ПРОГРАММИРОВАНИЯ ДЛЯ ПОСТРОЕНИЯ ФОРМУЛЫ ЗАВИСИМОСТИ РАСХОДА ТОПЛИВА АВТОМОБИЛЯ'

ПРИМЕНЕНИЕ САМОКОНФИГУРИРУЕМОГО МЕТОДА ГЕНЕТИЧЕСКОГО ПРОГРАММИРОВАНИЯ ДЛЯ ПОСТРОЕНИЯ ФОРМУЛЫ ЗАВИСИМОСТИ РАСХОДА ТОПЛИВА АВТОМОБИЛЯ Текст научной статьи по специальности «Математика»

CC BY
4
0
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
символьная регрессия / эволюционные методы / генетическое программирование / аппроксимация / генетический алгоритм / symbolic regression / evolutionary methods / genetic programming / approximation / genetic algorithm

Аннотация научной статьи по математике, автор научной работы — П.А. Шерстнев, Л.В. Липинский

Рассматривается решение задачи символьной регрессии построения уравнения зависимости показателя расхода топлива автомобиля от технических параметров, таких как вес, объем двигателя и мощность. Полученные результаты планируется использовать для построения зависимости расхода авиационного топлива от технических характеристик самолета.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

APPLICATION OF A SELF-CONFIGURING METHOD OF GENETIC PROGRAMMING TO CONSTRUCT A FORMULA FOR THE DEPENDENCE OF CAR FUEL CONSUMPTION

The solution of the symbolic regression problem of constructing the equation of dependence of the car fuel consumption indicator on technical parameters, such as weight, engine capacity and power, is considered. The results obtained are planned to be used to construct the dependence of aviation fuel consumption on the technical characteristics of the aircraft.

Текст научной работы на тему «ПРИМЕНЕНИЕ САМОКОНФИГУРИРУЕМОГО МЕТОДА ГЕНЕТИЧЕСКОГО ПРОГРАММИРОВАНИЯ ДЛЯ ПОСТРОЕНИЯ ФОРМУЛЫ ЗАВИСИМОСТИ РАСХОДА ТОПЛИВА АВТОМОБИЛЯ»

Актуальные проблемы авиации и космонавтики - 2022. Том 2

УДК 519.7

ПРИМЕНЕНИЕ САМОКОНФИГУРИРУЕМОГО МЕТОДА ГЕНЕТИЧЕСКОГО ПРОГРАММИРОВАНИЯ ДЛЯ ПОСТРОЕНИЯ ФОРМУЛЫ ЗАВИСИМОСТИ РАСХОДА ТОПЛИВА АВТОМОБИЛЯ

П. А. Шерстнев Научный руководитель - Л. В. Липинский

Сибирский государственный университет науки и технологий имени академика М. Ф. Решетнева Российская Федерация, 660037, г. Красноярск, просп. им. газ. «Красноярский рабочий», 31

E-mail: sherstpasha99@gmail.com

Рассматривается решение задачи символьной регрессии построения уравнения зависимости показателя расхода топлива автомобиля от технических параметров, таких как вес, объем двигателя и мощность. Полученные результаты планируется использовать для построения зависимости расхода авиационного топлива от технических характеристик самолета.

Ключевые слова: символьная регрессия, эволюционные методы, генетическое программирование, аппроксимация, генетический алгоритм.

APPLICATION OF A SELF-CONFIGURING METHOD OF GENETIC PROGRAMMING TO CONSTRUCT A FORMULA FOR THE DEPENDENCE OF CAR FUEL

CONSUMPTION

P. A. Sherstnev Scientific supervisor - L. V. Lipinsky

Reshetnev Siberian State University of Science and Technology 31, Krasnoyarskii rabochii prospekt, Krasnoyarsk, 660037, Russian Federation E-mail: sherstpasha99@gmail.com

The solution of the symbolic regression problem of constructing the equation of dependence of the car fuel consumption indicator on technical parameters, such as weight, engine capacity and power, is considered. The results obtained are planned to be used to construct the dependence of aviation fuel consumption on the technical characteristics of the aircraft.

Keywords: symbolic regression, evolutionary methods, genetic programming, approximation, genetic algorithm.

Введение. Символьная регрессия представляет из себя процесс, в котором некоторые данные аппроксимируются с помощью математической формулы. Полученную формулу можно использовать в дальнейшем для расчета новых целевых значений, а также для лучшего понимания природы изучаемого процесса. Генетическое программирования является эффективным методом автоматического создания программ, разработанным американским математиком Дж. Коза [1]. Главная особенность генетического программирования состоит в том, что программы представляются в виде синтаксических деревьев, которые эволюционируют, используя принципы эволюционных методов [2]. В случае, когда элементами дерева являются математические операции и переменные, генетическое программирование решает задачу символьной регрессии.

Секция «Математические методы моделирования, управления и анализа данных»

Подход. Сложность использования эволюционных методов связана с необходимостью выбора операторов оптимизации (селекции, мутации, скрещивания). В данной работе эта проблема решается путем использования метода самоконфигурации эволюционных алгоритмов, описанного в [3]. Суть данного метода самоконфигурации заключается в увеличении вероятности выбора того оператора, который доставил наибольшую среднюю пригодность в данном поколении.

Следующим этапом будет выбор функционального и терминального множества алгоритма. В данной работе используются стандартные математические операции (сложение, минус, умножение, деление, синус), а в качестве термов используются переменные и константы (целые числа от 0 до 9).

Последним этапом необходимо выбрать условия эксперимента и параметры алгоритма. Для валидации модели набор данных был разделен на обучение и тест, где тестовая выборка составляла 0.33 от всего набора. Поскольку алгоритм имеет случайный характер, результаты усреднены по 25 запускам. Параметры генетического программирования следующие: Количество поколений: 500; Размер популяции: 500; Размер турнира: 5; Функция пригодности: Среднеквадратичная ошибка со штрафом за глубину дерева.

Набор данных. Auto MPG - это набор, содержащий данные о расходе топлива автомобилем в городских условиях и технические характеристики автомобиля [4]. Набор содержит 398 наблюдений. Полученные признаки: 1. Количество цилиндров; 2. Объем двигателя; 3. Количество лошадиных сил; 4. Вес авто; 5. Время разгона до 60 миль в час; 6. Год выпуска.

Результаты. В результате работы алгоритма было синтаксическое дерево с решением задачи символьной регрессии. На рис. 1 для примера представлено одно из 25 решений.

1 хЗ хЗ х5 х4 хЗ Рис. 1. Синтаксическое дерево - решение задачи

Для оценки валидации использовался коэффициент детерминации, который в среднем на тестовой выборке составил 0.81597. Формула, полученная из чтения дерева на рис. 1, после некоторых упрощений представлена ниже.

У =

sm( Хб) 1

3 Л4 1 Л3

Переменные пронумерованы в порядке их перечисления выше. Используя полученное выражение, можно делать выводы касательно того, какой вклад вносит каждая техническая характеристика отдельно и во взаимодействии в расход топлива автомобиля. Стоит отметить, что вторая переменная (количество цилиндров) не используется в выражении, что может говорить либо о наличии корреляции между другими переменными (комбинациями переменных), либо о том, что признак неинформативен.

Актуальные проблемы авиации и космонавтики - 2022. Тома 2

Рассмотрим далее статистику работы самоконфигурируемого генетического программирования. На рис. 2 представлены графики вероятности выбора оператора и номера поколения, усредненные по 25 запускам, а также средняя и лучшая пригодность на каждом поколении.

л 0.9 -

н

U и

5 0.8-о

о. 0.7 -IZ

0.6 -_

max median

400 600

Поколение

400 600

Поколение

Поколение

- uniformjow - uniform mean - uniform_5trong - pointjow

- point_strong

0 200 400 600 800 1000

Поколение

Рис. 2. Усредненные вероятности операторов и пригодность

Анализируя результаты самоконфигурации можно сделать вывод, что на данной задаче алгоритм отдавал предпочтение слабой мутации обоих типов и турнирной селекции, а также одноточечному скрещиванию.

Для данной задачи предпочтительными операторами оказались: турнирная селекция; одноточечное скрещивание; слабая мутация роста.

Выводы. Таким образом, использование самоконфигурируемого алгоритма генетического программирования позволяет избежать стадии выбора операторов. Полученное решение представляет из себя небольшое математическое выражение, которое можно использовать для дальнейших прогнозов или лучшего понимания изучаемого процесса. Дальнейшие работы будут посвящены применению описанного подхода к построению функций зависимости расхода авиационного топлива от технических самолета.

Библиографические ссылки

1. Koza J R. Genetic Programming, MIT Press, ISBN G-262-1 1189-б, 1998;

2. Koza J.R., Bennet F.H., Andre D., Keane M., Genetic Programming III, Morgan Kaufnamm pub., ISBN 1-5586G-543-6, 1999;

3. Семенкина М.Е. Самоадаптивные эволюционные алгоритмы проектирования информационных технологий интеллектуального анализа данных // Искусственный интеллект и принятие решений. - 2G13. - №1. - С. 13-23;

4. UCI Machine Learning Repository: Vertebral Column Data Set - Сайт: [Электронный ресурс]. URL: https://archive.ics.uci.edu/ml/datasets/Vertebral+Column (дата обращения 28.G1.2G22).

О Шерстнев П. А., 2G22

l00

i Надоели баннеры? Вы всегда можете отключить рекламу.