Научная статья на тему 'Самоконфигурируемое генетическое программирование и алгоритм локального спуска'

Самоконфигурируемое генетическое программирование и алгоритм локального спуска Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
121
34
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ГЕНЕТИЧЕСКОЕ ПРОГРАММИРОВАНИЕ / GENETIC PROGRAMMING / ЛОКАЛЬНЫЙ СПУСК / LOCAL SEARCH / ИНТЕЛЛЕКТУАЛЬНЫЙ АНАЛИЗ ДАННЫХ / DATA MINING

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Семенкина М. Е.

Рассматриваются и тестируются самоконфигурируемый алгоритм генетического программирования для автоматического генерирования различных интеллектуальных информационных технологий и локальный спуск по деревьям.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

SELFCONFIGURING GENETIC PROGRAMMING AND LOCAL SEARCH ALGORITHM

A hybridization of self-configuring genetic programming algorithms with a local search in the space of trees is fulfilled to improve their performance for intellectual information technology automated design.

Текст научной работы на тему «Самоконфигурируемое генетическое программирование и алгоритм локального спуска»

Решетнеескцие чтения. 2015

5. Dorigo М., Gambardella L. M. Ant Colony System: A Cooperative Learning Approach to the Traveling Salesman Problem // Transactions on Evolutionary Computation. 1997. P. 53-66.

6. Ахмедова Ш. А. Particle Swarm Optimization Algorithms Development and Effectiveness Investigation // Вестник СибГАУ. 2012. Вып. 4 (44). С. 78-79.

7. Shah-Hosseini H. Problem solving by intelligent water drops // Proc. of IEEE Congresson Evolutionary Computation, Swissotel The Stamford, Singapore, 2007. P. 3226-3231.

8. Khritonenko D. I., Semenkin E. S. Distributed self-configuring evolutionary algorithms for artificial neural networks design // Вестник СибГАУ. 2013. Вып. 4 (50). С. 112-116.

9. Semenkin E., Stanovov V. Fuzzy rule bases automated design with self-configuring evolutionary algorithm // Proceedings of the 11th International Conference on Informatics in Control, Automation and Robotics ICINCO. 2014. Vol. 1. С. 318-323.

10. Brester C., Semenkin E., Sidorov M., Minker W. Self-adaptive multi-objective genetic algorithms for feature selection // Proceedings of Intern. Conf. on Engineering and Applied Sciences Optimization (4-6 June 2014, Kos Island, Greece). 2014. P. 1838-1845.

11. Семенкина О. Е., Семенкина О. Э. Исследование эффективности бионических алгоритмов комбинаторной оптимизации // Программные продукты и системы. 2013. № 3 (103). С. 129-133.

12. Parpinelli R., Lopes H., Freitas A. Data Mining with an Ant Colony Optimization Algorithm // IEEE Transactions on Evolutionary Computation. 2002. № 6(4). P. 321-332.

References

1. Popov E. A., Semenkina M. E. Self-configuring genetic programming algorithm for medical diagnostic problems. Vestnik SibGAU. 2013. No. 4 (50), рp. 116-123.

2. Semenkin E., Semenkina M. Spacecrafts' control systems effective variants choice with self-configuring genetic algorithm // Proceedings of the 9th International Conference on Informatics in Control, Automation and Robotics (ICINCO'2012). 2012. Pр. 84-93.

3. Gumennikova A. V., Emel'yanova M. N., Semenkin E. S., Sopov E. A. [About evolutionary algorithms for solving hard optimization problems]. Vestnik SibGAU. 2003. No. 4, рр. 14-23 (In Russ.).

4. Eiben A. E., Smith J. E. Introduction to Evolutionary Computing. Springer, 2003. ISBN 3540401849.

5. Dorigo М., Gambardella L. M. Ant Colony System: A Cooperative Learning Approach to the Traveling Salesman Problem. Transactions on Evolutionary Computation. 1997. Pр. 53-66.

6. Akhmedova Sh. A. Particle Swarm Optimization Algorithms Development and Effectiveness Investigation. Vestnik SibGAU. 2012. No. 4 (44), pp. 78-79.

7. Shah-Hosseini H. Problem solving by intelligent water drops // Proc. of IEEE Congresson Evolutionary Computation, Swissotel The Stamford, Singapore, 2007. Pp. 3226-3231.

8. Khritonenko D. I., Semenkin E. S. Distributed self-configuring evolutionary algorithms for artificial neural networks design. Vestnik SibGAU. 2013. No. 4 (50), pp. 112-116.

9. Semenkin E., Stanovov V. Fuzzy rule bases automated design with self-configuring evolutionary algorithm. Proceedings of the 11th International Conference on Informatics in Control, Automation and Robotics ICINCO 2014. Vol. 1, рp. 318-323.

10. Brester C., Semenkin E., Sidorov M., Minker W. Self-adaptive multi-objective genetic algorithms for feature selection. Proceedings of International Conference on Engineering and Applied Sciences Optimization (4-6 June 2014, Kos Island, Greece). 2014. Рp. 1838-1845.

11. Semenkina O. E., Semenkina O. E. Issledovanie effektivnosti bionicheskih algoritmov kombinatornoy optimizacii [Efficiency investigation of bionical algorithms for combinatorial optimization problems]. Programmnye produkty i sistemy [Software products and systems]. 2013. No. 3(103), рp. 129-133 (In Russ.).

12. Parpinelli R., Lopes H., Freitas A. Data Mining with an Ant Colony Optimization Algorithm. IEEE Transactions on Evolutionary Computation. 2002. No. 6(4), pp. 321-332.

© Семенкина О. Е., Попов Е. А., 2015

УДК 519.6

САМОКОНФИГУРИРУЕМОЕ ГЕНЕТИЧЕСКОЕ ПРОГРАММИРОВАНИЕ И АЛГОРИТМ ЛОКАЛЬНОГО СПУСКА*

М. Е. Семенкина

Сибирский государственный аэрокосмический университет имени академика М. Ф. Решетнева Российская Федерация, 660037, г. Красноярск, просп. им. газ. «Красноярский рабочий», 31

Е-таП: semenkina88@mail.ru

Рассматриваются и тестируются самоконфигурируемый алгоритм генетического программирования для автоматического генерирования различных интеллектуальных информационных технологий и локальный спуск по деревьям.

Ключевые слова: генетическое программирование, локальный спуск, интеллектуальный анализ данных.

* Работа выполнена в рамках проекта RFMEFI57414X0037.

Математические методы моделирования, управления и анализа данных

SELFCONFIGURING GENETIC PROGRAMMING AND LOCAL SEARCH ALGORITHM

M. E. Semenkina

Reshetnev Siberian State Aerospace University 31, Krasnoyarsky Rabochy Av., Krasnoyarsk, 660037, Russian Federation E-mail: semenkina88@mail.ru

A hybridization of self-configuring genetic programming algorithms with a local search in the space of trees is fulfilled to improve their performance for intellectual information technology automated design.

Keywords:genetic programming, local search, data mining.

Интеллектуальные информационные технологии анализа данных широко применяются при решении задач классификации, аппроксимации и прогнозирования в различных областях человеческой деятельности [1], в частности, в аэрокосмической области. Однако их проектирование является нетривиальной задачей оптимизации, поэтому эволюционные алгоритмы (ЭА) могут быть использованы при автоматизации генерирования интеллектуальных информационных технологий, таких как символьные выражения, искусственные нейронные сети и системы на нечеткой логике. Алгоритм генетического программирования может быть использован при создании структур нейронных сетей [2], баз правил в системах на нечеткой логике [3] и символьных выражений, а генетические алгоритмы часто используются для настройки лингвистических переменных, весовых коэффициентов нейронных сетей и параметров символьных выражений. Хотя ЭА успешно применяются при решении многих практических задач оптимизации и моделирования, существенная зависимость их эффективности от выбора настроек и параметров создает серьезные трудности для дальнейшего расширения возможности их применения. Поэтому в рамках данного исследования используются самоконфигурируемые эволюционные алгоритмы [4; 5], автоматически выбирающие наиболее эффективные комбинации операторов. Для повышения эффективности рассматриваемого подхода предлагается выполнить гибридизацию самоконфигурируемого алгоритма генетического программирования и локального спуска.

В данной работе для локального спуска по дереву используются два способа перехода между деревьями (переход по первому улучшению и наискорейший спуск), две системы окрестностей (1-соседняя и 2-соседняя окрестности) и три стратегии просмотра этих систем окрестностей («полный», «неполный» и «усеченный» просмотры). 1-соседними к исходному дереву будем называть деревья, полученные изменением элементов терминального множества, а 2-сосед-ними - деревья, полученные изменением элементов функционального множества. При «полном» локальном спуске просмотр дерева будет начинаться с просмотра 2-соседней окрестности и продолжаться просмотром 1-соседней окрестности, а при «неполном» локальном спуске будет выполняться просмотр только 1-соседней окрестности, алгоритм «усеченного» локального спуска подразумевает просмотр только п выбранных случайным образом узлов дерева. В связи

тем, что узлы дерева, находящиеся ближе к его вершине, оказывают более существенное влияние на получаемый результат, при просмотре 2-сосед-ней окрестности в первую очередь будут изменяться узлы, находящиеся ближе к вершине древа, т. е. просмотр будет осуществляться сверху вниз. В ходе работы было выполнено сравнение эффективности всех вариантов выполнения локального спуска по дереву.

Эффективность всех предложенных алгоритмов [6] оценивалась на репрезентативном множестве тестовых задач и на двух реальных практических задачах классификации. По результатам тестирования можно сделать вывод, что лучший вариант локального спуска для различных форм интеллектуальных информационных технологий может иметь несущественные различия и продемонстрировал лучшую эффективность и существенно повысил эффективность самоконфигурируемого алгоритма генетического программирования. Гибридный алгоритм, состоящий в применении самоконфигурируемого алгоритма генетического программирования и локального спуска для p % лучших индивидов в каждом поколении, почти всегда превосходит лучший для конкретной задачи вариант алгоритма генетического программирования, что позволяет полностью отказаться от выбора его наиболее эффективного варианта настроек. При решении реальных задач анализа данных гибридный алгоритм продемонстрировал лучший результат среди всех рассмотренных альтернатив.

Более подробно результаты исследования будут представлены в докладе.

Библиографические ссылки

1. Семенкин Е. С. Эволюционные алгоритмы поддержки принятия решений при управлении сложными системами // Вестник СибГАУ. 2005. № 3. С. 83-85.

2. Липинский Л. В., Семенкин Е. С. Применение алгоритма генетического программирования в задачах автоматизации проектирования интеллектуальных информационных технологий // Вестник СибГАУ. 2006. Вып. 3(10). С. 22-26.

3. Stanovov V. V., Semenkin E. S. Self-adjusted evolutionary algorithms based approach for automated design of fuzzy logic systems // Вестник СибГАУ. 2013. Вып. 4. С. 148-152.

4. Семенкина М. Е. Самоадаптивные эволюционные алгоритмы проектирования информационных технологий интеллектуального анализа данных //

Решетнееские чтения. 2015

Искусственный интеллект и принятие решений. 2013. № 1. С. 13-23.

5. Semenkin E., Semenkina M. Self-configuring genetic algorithm with modified uniform crossover operator // Lecture Notes in Computer Science. 2012. Vol. 7331 LNCS. Part. 1. С. 414-421.

6. Semenkina M. E. Hybridization of local search with self-configuring genetic programming algorithm for automated fuzzy classifier design // Вестник СибГАУ. 2015. Т. 16, № 1. С. 113-118.

References

1. Semenkin E. S. [Evolutionary algorithms of decision support for complex systems management and control] // Vestnik SibGAU. 2005. No. 3, рp. 83-85 (In Russ.).

2. Lipinsky L. V., Semenkin E. S. [Application of genetic programming algorithm in automated design of intellectual information technologies] // Vestnik SibGAU. 2006. No. 3(10), рp. 22-26 (In Russ.).

3. Stanovov V. V., Semenkin E.S. Self-adjusted evolutionary algorithms based approach for automated design of fuzzy logic systems // Vestnik SibGAU. 2013. No. 4(50), рр. 148-152.

4. Semenkina M. E. [Effectiveness investigation of adaptive evolutionary algorithms for data mining information technology design] // Iskusstvennyyintellekt i prinyatiyeresheniy. 2013. No. 1, рр. 13-23 (In Russ.).

5. Semenkin E., Semenkina M. Self-configuring genetic algorithm with modified uniform crossover operator // Lecture Notes in Computer Science. 2012. Vol. 7331 LNCS. Part 1, pр. 414-421.

6. Semenkina M. E. Hybridization of local search with self-configuring genetic programming algorithm for automated fuzzy classifier design // Vestnik SibGAU. 2015. No. 1(16), рp. 113-118.

© Семенкина М. Е., 2015

УДК 519.87

ЭФФЕКТИВНОСТЬ МЕТОДОВ ИНТЕЛЛЕКТУАЛЬНОГО АНАЛИЗА ДАННЫХ В ИДЕНТИФИКАЦИИ ХИМИЧЕСКОГО СОСТАВА*

А. В. Скороход

Сибирский государственный аэрокосмический университет имени академика М. Ф. Решетнева Российская Федерация, 660037, г. Красноярск, просп. им. газ. «Красноярский рабочий», 31

E-mail: SkorokhodAV@yandex.ru

Рассматривается решение задачи классификации типов объектов по его химическому составу методами интеллектуального анализа данных в платформе программной системы RapidMiner. Произведено сравнение эффективности использованных методов и установлены наиболее эффективные из них.

Ключевые слова: тип стекла, тип стали, классификация, оптимизация, ансамбль.

DATA MININNG TECHNIQUE EFFECTIVENESS IN IDENTIFICATION OF CHEMICAL COMPOSITION

A. V. Skorokhod

Reshetnev Siberian State Aerospace University 31, Krasnoyarsky Rabochy Av., Krasnoyarsk, 660037, Russian Federation E-mail: SkorokhodAV@yandex.ru

Chemical composition identification problem is solved with data mining tools adopted from RapidMiner system. The performance of the used methods is compared and the most effective approaches are determined.

Keywords: type of glass, type of annealing steel, classification, optimization, ensemble.

Проблема классификации типов объектов по его химическому составу имеет большое значение. Классификация стекла или стали, прошедшей отжиг, по типу их исходного использования является актуальной задачей в ситуациях расследования причин и последствий различных происшествий. Так, к примеру, задача классификации типа осколков стекла решалась составителями базы данных в области криминалистики.

Было создано несколько процессов в платформе программной системы RapidMiner [1] для решения проблем классификации: проверка гипотезы о различии средних для двух выборок для данных векторов производительности использованных методов с помощью оператора 7^-1е81 по /-критерию Стьюден-та. Для обучения каждой технологии системы был

* Работа выполнена в рамках проекта RFMEFI57414X0037.

i Надоели баннеры? Вы всегда можете отключить рекламу.