Научная статья на тему 'Об эволюционных алгоритмах в задаче оптимизации процесса отбора информативных признаков'

Об эволюционных алгоритмах в задаче оптимизации процесса отбора информативных признаков Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
66
20
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
МНОГОКРИТЕРИАЛЬНАЯ ОПТИМИЗАЦИЯ / MULTI-OBJECTIVE OPTIMIZATION / ГЕНЕТИЧЕСКОЕ ПРОГРАММИРОВАНИЕ / GENETIC PROGRAMMING / ГЕНЕТИЧЕСКИЙ АЛГОРИТМ / GENETIC ALGORITHM / ИНФОРМАТИВНЫЕ ПРИЗНАКИ / INFORMATIVE FEATURES

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Лосева Е.Д., Бежитский С.С.

Описываются эволюционные алгоритмы для реализации отбора информативных признаков. В качестве получаемых решений принимаются релевантные наборы признаков. Рассматриваются однои многокритериальные алгоритмы. Указаны преимущества предложенных подходов.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Лосева Е.Д., Бежитский С.С.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

ABOUT EVOLUTIONARY ALGORITHMS IN THE TASK OF OPTIMISATION PROCESS OF INFORMATIVE FEATURE SELECTION

The evolutionary algorithms for informative feature selection are described. Relevant feature sets are adopted as a solution. The one and multi-criteria algorithms are considered. The advantages of the proposed approaches are indicated.

Текст научной работы на тему «Об эволюционных алгоритмах в задаче оптимизации процесса отбора информативных признаков»

References

1. Loseva E. D., Lipinskiy L. V. Ensembles of neural network classifiers using genetic programming multi-criteria self-configuring // Actual problems of aviation and cosmonautics: Sat. abstracts. 2015, рp. 25.

2. Loseva E., Lipinskiy L., Kyklina A. Eensembles of Neural Networks with Application of Multi-Objective Self-Configuring Genetic Programming in Forecasting Problems // 11th International Conference on Natural Computation (ICNC 2015). China, Zhangjiajie, 2015. Рр. 525.

3. Angeline P. J. Adaptive and self-adaptive evolutionary computations // Palaniswami M. and Attikiouzel Y. (Eds.) Computational Intelligence: A Dynamic Systems Perspective. IEEE Press, 1995, рр. 152-163.

4. Kasabov N. Foundations of Neural Networks, Fuzzy Systems, and Knowledge Engineering. 2nd printing. The MIT Press, Cambridge, 1998, рр. 16.

5. O'Neill M., Vanneschi L., Gustafson S., Banzhaf W. Open issues in genetic programming // Genetic Programming and Evolvable Machines, 2010, рр. 339-363.

6. Huang J.-J., Tzeng G.-H., Ong Ch.-Sh. Two - stage genetic programming (2SGP) for the credit scoring model // Applied Mathematics and Computation. 2006. Рр. 1039-1053.

7. Semenkina M. E. Self-adaptive evolutionary algorithms of information technologies design of data mining. Artificial intelligence and decision making. K., 2013. Рр. 28.

© Лосева Е. Д., Липинский Л. В., 2015

УДК 519.68

ОБ ЭВОЛЮЦИОННЫХ АЛГОРИТМАХ В ЗАДАЧЕ ОПТИМИЗАЦИИ ПРОЦЕССА ОТБОРА ИНФОРМАТИВНЫХ ПРИЗНАКОВ*

Е. Д. Лосева, С. С. Бежитский

Сибирский государственный аэрокосмический университет имени академика М. Ф. Решетнева Российская Федерация, 660037, г. Красноярск, просп. им. газ. «Красноярский рабочий», 31

E-mail: rabota_lena_19@mail.ru

Описываются эволюционные алгоритмы для реализации отбора информативных признаков. В качестве получаемых решений принимаются релевантные наборы признаков. Рассматриваются одно- и многокритериальные алгоритмы. Указаны преимущества предложенных подходов.

Ключевые слова: многокритериальная оптимизация, генетическое программирование, генетический алгоритм, информативные признаки.

ABOUT EVOLUTIONARY ALGORITHMS IN THE TASK OF OPTIMISATION PROCESS OF INFORMATIVE FEATURE SELECTION

E. D. Loseva, C. C. Bezhitsky

Reshetnev Siberian State Aerospace University 31, Krasnoyarsky Rabochy Av., Krasnoyarsk, 660037, Russian Federation E-mail: rabota_lena_19@mail.ru

The evolutionary algorithms for informative feature selection are described. Relevant feature sets are adopted as a solution. The one - and multi-criteria algorithms are considered. The advantages of the proposed approaches are indicated.

Keywords: multi-objective optimization, genetic programming, genetic algorithm, informative features.

В настоящее время существует множество программных пакетов, предлагающих разнообразие методов снижения размерности. Но часто такие методы не показывают достаточную эффективность, поэтому были разработаны и применены нестандартные подходы, основанные на применении интеллектуального анализа данных (одно- и многокритериальные эволюционные алгоритмы). Успешные применения таких алгоритмов описаны в [1; 2]. Кроме того, были проведены эксперименты с применением многокритериального генетического алгоритма и генетического программирования.

Проведенные эксперименты подтверждают свою высокую эффективность. Например, целесообразность применения однокритериального генетического алгоритма (ГА) к задаче выбора оптимального набора признаков объясняется следующими причинами:

1. Это удобное представление каждого признака с помощью кода "0" или "1": 1 - это релевантный атрибут.

* Работа выполнена в рамках и при финансовой поддержке проекта ММЕП57414Х0037.

Решетнеескцие чтения. 2015

2. В качестве целевой функции выбрана точность классификации на рассматриваемой подсистеме признаков.

Также в работе [3] был предложен многокритериальный ГА для отбора информативных признаков. В качестве моделей используются классификаторы. Причем каждая выбранная подсистема признаков участвует в обучении этих классификаторов. Получается некоторая совокупность моделей. Решение о принадлежности объекта к определенному классу принимается на основе процедуры голосовая обученных классификаторов с учетом правила большинства [5].

В работе [6] предложен новый альтернативный подход с применением многокритериального генетического программирования, позволяющий комплексно подойти к решению задачи отбора информативных признаков. Концепция метода заключается в применении нейросетевых классификаторов, структура которых моделируется с применением генетического программирования. Каждый нейросетевой классификатор декодируется в виде дерева. Генерируется начальная популяция. На вход нейросетевой модели подается разное количество признаков. Далее осуществляется применение эволюционных операторов: селекции, рекомбинации и мутации. Для поиска оптимальной модели, а следовательно, релевантного набора признаков (входных воздействий), применяются следующие критерии эффективности:

1) уровень корреляции входных воздействий;

2) точность классификации;

3) сложность нейросетевой модели.

Задачей алгоритма является поиск «лучшей» модели с точки зрения эффективности по вышеупомянутым критериям. Итоговое решение - это подсистема признаков, соответствующая набору входных воздействий модели.

Работоспособность описанных алгоритмов была исследована на множестве задач распознавания эмоций, пола и возраста человека [7-9]. Полученные результаты показали высокое качество получаемых решений. Интеграция интеллектуальных модулей, например в диалоговую систему, сводится к внедрению блоков, реализующих акустический анализ речевого сигнала, и алгоритма обучения системы, примеры которых представлены в этой статье [10; 11].

Библиографические ссылки

1. Лосева Е. Д. Распознавание эмоций, пола и возраста человека для функционирования системы «Умный дом» // FIITM - 2014 : материалы Междунар. на-уч.-практ. конф. / СФУ. Красноярск 2014. С. 239-249.

2. Brester C., Semenkin E., Sidorov M., Minker W. Self-adaptive multi-objective genetic algorithms for feature selection // Proceedings of Intern. Conf. on Engineering and Applied Sciences Optimization (OPT-i' 14). 2014. P. 1838-1846.

3. Brester C., Sidorov M., Semenkin E. Acoustic Emotion Recognition: Two Ways of Features Selection Based on Self-Adaptive Multi-Objective Genetic Algorithm // Proceedings of the Intern. Conf. on

Informatics in Control, Automation and Robotics (ICINCO). 2014. P. 851-855.

4. Брестер К. Ю. Архитектура программной системы для решения задач классификации с автоматическим извлечением информативных признаков многокритериальным генетическим алгоритмом // Решет-невские чтения : сб. материалов. Красноярск, 2014. Ч. 2. С. 231-233.

5. Venkatadri M., Srinivasa Rao K. A multiobjective genetic algorithm for feature selection in data mining // International J. of Computer Science and Information Technologies. 2010. Vol. 1, no. 5. Р. 443-448.

6. Sergienko R. [Effectiveness investigation of the coevolutionary genetic algorithm for constrained optimization] // Vestnik SibGAU. 2009. No. 3 (24). Р. 31-34 (In Russ.).

7. Hall M. [et al.]. The WEKA Data Mining Software: An Update, SIGKDD Explorations, 2009. Vol. 11, iss. 1.

8. Burkhardt F. [et al.]. A database of german emotional speech. In Interspeech, 2005. Рp. 1517-1520.

9. Haq S., Jackson P. Machine Audition: Principles, Algorithms and Systems, chapter Multimodal Emotion Recognition. IGI Global, Hershey PA. 2010. Р. 398-423.

10. Schmitt A., Ultes S., Minker W. A parameterized and annotated corpus of the cmu let's go bus information system // Proceedings of Intern. Conf. on Language Resources and Evaluation (LREC). 2012.

References

1. Loseva E. D. Recognition of emotion, gender and age of the person for functioning the system "Smart house". FIITM - 2014 : Proceedings of the international scientific - practical conference. Krasnoyarsk: SFU, 2014. Рр. 239-249.

2. Brester C., Semenkin E., Sidorov M., Minker W. Self-adaptive multi-objective genetic algorithms for feature selection // Proceedings of International Conference on Engineering and Applied Sciences Optimization (OPT-i'14). 2014. Pр. 1838-1846.

3. Brester C., Sidorov M., Semenkin E. Acoustic Emotion Recognition: Two Ways of Features Selection Based on Self-Adaptive Multi-Objective Genetic Algorithm // Proceedings of the Intern. Conf. on Informatics in Control, Automation and Robotics (ICINCO). 2014. Pр. 851-855.

4. Brester K. Y. Architecture of a software system to solve classification problems with the automatic extraction of informative features multi-criteria genetic algorithm // Reshetnev reading. Krasnoyarsk, 2014. Coll. of the materials. Part 2, рр. 231-233.

5. Venkatadri M., Srinivasa Rao K. A multiobjective genetic algorithm for feature selection in data mining // International J. of Computer Science and Information Technologies. 2010. Vol. 1, no. 5. Р. 443-448.

6. Sergienko R. [Effectiveness investigation of the coevolutionary genetic algorithm for constrained optimization] // Vestnik SibGAU. 2009. no. 3(24), рp. 3134 (In Russ.).

7. Hall M., Frank E., Holmes G., Pfahringer B., Reutemann P., Witten I. H. The WEKA Data Mining Software: An Update, SIGKDD Explorations, 2009, Vol. 11, iss. 1.

8. Burkhardt F., Paeschke A., Rolfes M., Sendlmeier W. F., and Weiss B. A database of german emotional speech. In Interspeech, 2005, рp. 1517-1520.

9. Haq S., Jackson P. Machine Audition: Principles, Algorithms and Systems, chapter Multimodal Emotion

Recognition. IGI Global, Hershey PA, Aug. 2010, рр. 398-423.

10. Schmitt A., Ultes S., and Minker W. A parameterized and annotated corpus of the cmu let's go bus information system // Proceedings of International Conference on Language Resources and Evaluation (LREC), 2012.

© Лосева Е. Д., Бежитский С. С., 2015

УДК 519.87

О ПРИМЕНЕНИИ МЕТОДОВ ИНТЕЛЛЕКТУАЛЬНОГО АНАЛИЗА ДАННЫХ В ЗАДАЧАХ ТЕХНИЧЕСКОЙ ДИАГНОСТИКИ*

Д. Ю. Мамонтов

Сибирский государственный аэрокосмический университет имени академика М. Ф. Решетнева Российская Федерация, 660037, г. Красноярск, просп. им. газ. «Красноярский рабочий», 31

E-mail: mamontov.bs@yandex.ru

Производится сравнение эффективности различных методов интеллектуального анализа данных в задачах классификации типов повреждений стальных пластин, а также диагностики отказов электродвигателей.

Ключевые слова: техническая диагностика, интеллектуальный анализ данных, классификация, эволюционный алгоритм, оптимизация.

ON DATA MINING TOOLS APPLICATION FOR SOLVING PROBLEMS OF TECHNICAL DIAGNOSTICS

D. Yu. Mamontov

Reshetnev Siberian State Aerospace University 31, Krasnoyarsky Rabochy Av., Krasnoyarsk, 660037, Russian Federation E-mail: mamontov.bs@yandex.ru

In this article, the effectiveness of various data mining methods is compared to the problems of steel plate damage identification and diagnostics of electromotors.

Keywords: technical diagnostics, data mining, classification, evolutionary algorithm, optimization.

Безусловным требованием к ракетно-космической технике является ее надежность, обеспечение которой требует значительных усилий на всех стадиях разработки и изготовления, начиная от оценки качества исходных материалов и заканчивая приемочным контролем качества комплектующих и всего изделия в целом. Для выявления возможных дефектов на всех этапах контроля качества применяются методы технической диагностики, основанные на различных физических свойствах изделий. Однако во всех случаях полученные данные требуют дальнейшего анализа с использованием интеллектуальных информационных технологий. Данная работа посвящена изучению эффективности таких технологий в задачах технической диагностики.

Для этого были выбраны две базы с данными технической диагностики на различных этапах оценки

качества. База данных о стальных пластинах предоставлена итальянским научно-исследовательским центром наук о коммуникации Semeion [1]. База содержит 1941 вектор и 7 классов дефектов. Вторая база данных оценки качества электромоторов предоставлена университетом прикладных наук Германии. База содержит 58509 векторов и 11 классов [2]. Для решения задач использовалась система анализа данных Rapid Miner Studio 5.3.015 [3].

В качестве исследуемых методов анализа данных были выбраны: искусственная нейронная сеть (ANN [4]) с 1 скрытым слоем, состоящим из 19 нейронов с сигмоидальной логистической функцией в качестве функции активации (скорость обуче-

* Работа выполнена в рамках проекта RFMEFI57414X0037.

i Надоели баннеры? Вы всегда можете отключить рекламу.