Научная статья на тему 'Алгоритм многокритериального генетического программирования в задачах извлечения знаний'

Алгоритм многокритериального генетического программирования в задачах извлечения знаний Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
55
11
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Гончар Т.Н., Сопов С.А.

Рассматривается проблема анализа данных в задачах поддержки принятия решений. Предложена эффективная методика извлечения знаний в виде символьных формул, легко интерпретируемых ЛПР и упрощающих принятие решений.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Гончар Т.Н., Сопов С.А.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

MULTIOBJECTIVE GENETIC PROGRAMMING FOR KNOWLEDGE EXTRACTION PROBLEM

The data analysis problem in a field of decision making support is discussed. The new knowledge extraction method with symbolic representation is proposed.

Текст научной работы на тему «Алгоритм многокритериального генетического программирования в задачах извлечения знаний»

Решетневские чтения

УДК 519.68

Т. Н. Гончар, С. А. Сопов

Сибирский государственный аэрокосмический университет имени академика М. Ф. Решетнева, Россия, Красноярск

АЛГОРИТМ МНОГОКРИТЕРИАЛЬНОГО ГЕНЕТИЧЕСКОГО ПРОГРАММИРОВАНИЯ

В ЗАДАЧАХ ИЗВЛЕЧЕНИЯ ЗНАНИЙ

Рассматривается проблема анализа данных в задачах поддержки принятия решений. Предложена эффективная методика извлечения знаний в виде символьных формул, легко интерпретируемых лицами, принимающими решения, и упрощающих принятие решений.

Задача анализа данных является краеугольным камнем в исследовании систем и управлении процессами, протекающими в этих системах, в любой сфере человеческой деятельности. При использовании традиционных методов анализа данных полученная информация обычно отличается низкой интерпретируемостью - такая информация понятна только исследователю, знакомому с соответствующей терминологией, и требует адаптации для лица, принимающего решения (ЛПР), не обладающего специальными знаниями о процессе анализа данных и не способного самостоятельно интерпретировать полученные результаты. Информация, которая была адаптирована под ЛПР, может считаться знанием о данной системе. Естественным образом возникает необходимость создания систем анализа данных, способных извлекать знания о системе - легко интерпретируемую, структурированную информацию о системе в доступной для ЛПР форме.

Одним из способов представления знаний, часто применяемых на практике, является символьный язык формул. Распространенным методом анализа и описания данных на таком языке является метод генетического программирования. Сочетая в себе эволюционные алгоритмы и широкие описательные возможности символьного языка, генетическое программирование является одним из актуальных и удобных средств символьного анализа и описания данных.

Как известно, цель генетического программирования - сгенерировать максимально точное, в смысле минимизации ошибки моделирования, описание данных символьной формулой. Зачастую реальные процессы при такой постановке задачи описываются сложно интерпретируемыми, громоздкими формулами. Оптимизация и адаптация для ЛПР таких формул часто является отдельной, сравнимой с исходной по сложности задачей.

В данной статье предлагается использовать инновационный подход к организации работы генетического программирования с целью получить знания о системе в виде легко интерпретируемых, понятных ЛПР символьных выражений.

Основу генетического программирования составляет эволюционный алгоритм, работающий не с бинарной строкой (классические генетические алгоритмы), а со специальным представлением в виде дерева, узлами которого являются математические функции, переменные и константы. Как и любой эволюционный алгоритм, генетическое программирование решает задачу прямого поиска. В данном случае критерием эффективности поиска является соответствие символьного выражения, закодированного деревом, и исследуемых данных. Особенностью генетического программирования в такой постановке задачи является увеличение структурной сложности формулы при повышении точности описания процесса.

Необходимо построить процесс формирования решений так, чтобы обеспечить легкую интерпретируемость и наглядность для ЛПР без потери необходимой точности. Данным требованиям отвечает многокритериальный подход к оценке эффективности работы алгоритма, который позволяет получить набор оптимальных, с точки зрения описания данных и восприятия ЛПР, альтернатив.

Важным преимуществом является наличие не одного, а множества альтернативных решений. Так как каждая альтернатива будет описывать реальную систему иначе (в смысле представления решения), чем остальные альтернативы, то полезными для ЛПР могут оказаться не одна, а многие или все из предложенных альтернатив, что позволит получить максимально полные и полезные знания об исследуемой системе.

В качестве критериев в данном подходе используются следующие:

- критерий соответствия полученного символьного выражения, закодированного деревом, и исследуемой системы, представленной исходными данными;

- критерий минимизации длины конечных формул (уменьшения глубины дерева);

- критерий согласования функционального множества с предпочтениями ЛПР (ЛПР может указать, какие функции и термы являются для не-

Математические методы моделирования, управления и анализа данных

го более предпочтительными в смысле интерпретации результатов).

Проведенные численные исследования показали, что задача многокритериального поиска эффективно решается с помощью метода многокритериальной оптимизации - SPEA (Strength Pareto Evolutionary Algorithm). Данный метод наиболее полно и равномерно описывает множество эффективных решений за счет применяемых механизмов кластеризации и ниширования, а также позволяет априорно задать предпочтительное для ЛПР число получаемых альтернатив. Такие свойства предложенного метода выгодно выделяют его на фоне множества других традиционных подходов к решению задачи многокритериальной оптимизации.

Работоспособность и эффективность предложенного подхода продемонстрирована на пред-

ставительном множестве тестовых задач и при решении практических задач.

Предложенный подход позволяет значительно увеличить интерпретируемость получаемых в ходе исследования решений, что достигается за счет введения множества дополнительных критериев, учитывающих предпочтения ЛПР. Как следствие -существенно повышается эффективность процесса принятия решения, так как легко интерпретируемая информация позволяет увеличить скорость и качество восприятия полученных о системе сведений. Более того, так как в ходе исследования получается не одно, а множество решений (Парето-оптимальных), ЛПР не ограничен описательными возможностями применяемого алгоритма анализа данных и получает различные представления знаний, потенциально отражающие разные аспекты исследуемой системы.

T. N. Gonchar, S. A. Sopov Siberian State Aerospace University named after academician M. F. Reshetnev, Russia, Krasnoyarsk

THE ALGORITHM OF MULTIOBJECTIVE GENETIC PROGRAMMING FOR KNOWLEDGE EXTRACTION PROBLEM

The data analysis problem in a field of decision making support is discussed. The new knowledge extraction method with symbolic representation is proposed.

© Гончар Т. Н., Сопов С. А., 2009

УДК 621.548.4

А. А. Горшкалев, С. А. Журавлев, А. В. Кривцов, Е. А. Сайгаков

Самарский государственный аэрокосмический университет имени академика С. П. Королева, Россия, Самара

ГАЗОВАЯ ВИХРЕВАЯ ВЕТРОЭНЕРГЕТИЧЕСКАЯ ЭНЕРГОСБЕРЕГАЮЩАЯ УСТАНОВКА ДЛЯ ЭЛЕКТРОСНАБЖЕНИЯ ПРИВОДА ГАЗОПЕРЕКАЧИВАЮЩЕГО АГРЕГАТА

В настоящее время для передачи газа по магистралям широко используются газотурбинные установки. Но для обеспечения их работы требуется электроэнергия. Поставлена задача создания энергосберегающей технологии обеспечения электроэнергией электропривода газоперекачивающего агрегата (ГПА). Для обеспечения постоянства работы ветроэнергетических установок необходимо обеспечение постоянного потока воздуха. Рассматривается возможность создания энергосберегающей технологии использования тепловой энергии выхлопных газов ГПА.

В настоящее время для передачи газа по магистралям широко используются газотурбинные установки. Такие газоперекачивающие агрегаты (ГПА) устанавливают на различных участках магистрали, и для обеспечения их работы требуется электроэнергия. Средняя потребляемая мощность одной установки составляет величину около 150 кВт.

В связи с постоянно растущими тарифами на энергоресурсы и необходимостью обеспечения автономной эксплуатации таких систем, встает задача создания энергосберегающей технологии обеспечения электроэнергией электропривода ГПА. Для решения данной задачи могут использоваться различные энергосберегающие технологии, среди которых в последнее время предпоч-

i Надоели баннеры? Вы всегда можете отключить рекламу.