Математические методы моделирования, управления и анализа данных
УДК 004.89
Р. Б. Сергиенко
Сибирский государственный аэрокосмический университет имени академика М. Ф. Решетнева, Россия, Красноярск
О КОЛЛЕКТИВАХ НЕЧЕТКИХ КЛАССИФИКАТОРОВ ДЛЯ РЕШЕНИЯ ЗАДАЧ ОБРАБОТКИ ДАННЫХ ДИСТАНЦИОННОГО ЗОНДИРОВАНИЯ ЗЕМЛИ
Предлагаются новые подходы к формированию коллективов нечетких классификаторов, автоматизировано генерируемых с помощью самонастраивающихся коэволюционных алгоритмов. Рассматривается использование данного подхода для решения задач обработки данных дистанционного зондирования Земли.
Нечеткий классификатор [1] - алгоритм классификации, основанный на извлечении нечетких правил из массивов данных. Преимуществом данного подхода является возможность явной интерпретации причинно-следственных закономерностей, приводящих отнесение объекта классификации к различным классам.
В [2] разработан и исследован новый подход к формированию нечетких классификаторов, использующий самонастраивающиеся коэволюционные алгоритмы и гибридизирующий основные подходы к формированию нечетких систем генетическими алгоритмами - Питтсбургский и Мичиганский. Процедура состоит из следующих основных этапов:
1. Формирование начальной популяции для Мичиганского этапа. Данная операция очень важна, так как случайное генерирование правил для начального заполнения популяции неприемлемо - при значительном числе информативных признаков в задаче классификации вероятность случайной генерации правила, которому соответствовал хотя бы один элемент из обучающей выборки, становится крайне малой. Эта проблема становится существенной уже при размерности 4 и выше. Поэтому необходимо использовать априорную информацию из обучающей выборки.
2. Мичиганский этап генерирования нечеткого классификатора. Индивиды представляют собой отдельные нечеткие правила. Длина хромосомы равна числу информативных признаков, каждый ген - число от 1 до 6, соответствующее нечеткому числу. Функция пригодности индивидов - доверительный уровень правила - вычисляется по обучающей выборке. Используется коэволюционный генетический алгоритм безусловной оптимизации. Популяция с наибольшей точностью классификации применяется на следующей стадии генерирования нечеткого классификатора.
3. Питтсбургский этап генерирования нечеткого классификатора. Индивиды представляют собой базу нечетких правил целиком. Длина хромосомы равна числу правил, найденных на Мичиганском этапе. Хромосомы бинарные, бит «1» означает использование соответствующего нечеткого правила, найденного на предыдущем этапе, бит «0» - исключение правила из базы. Пригодность - точность классификации базы правил. Вводится ограничение на максимально допустимое число правил, используемых в базе. Применяется коэволюционный генетический алгоритм условной оптимизации [3].
Следует отметить, что в основу работы метода положены стохастические алгоритмы оптимизации. Несмотря на статистическую устойчивость метода, разброс в показателях эффективности получаемых нечетких классификаторов при увеличении сложности решаемых задач классификации (увеличение числа классов и/или числа признаков) и ограниченности вычислительных ресурсов возрастает. Показательной является ситуация, когда в обучающей выборке некоторые классы представлены ограниченным числом элементов. При различных запусках автоматизированной процедуры формирования нечетких классификаторов могут получаться базы правил примерно одного уровня точности классификации в целом, но при этом в одной базе правил имеются характерные правила для одних «редких» классов и отсутствуют для других, в другой же ситуация аналогична, но для иных классов. Интуитивно понятно, что подобные нечеткие классификаторы могли бы «взаимно дополнять» друг друга, существенно повышая точность классификации в целом. Поэтому возникла идея разработки метода коллективов нечетких классификаторов.
Здесь можно рассмотреть несколько подходов. Тривиальным является объединение нескольких баз правил в одну большую базу. Однако при этом теряется свойство компактности нечеткого классификатора, важное для простоты интерпретируемости алгоритма экспертами в соответствующей проблемной области. Кроме того, исследования в [2] показали, что увеличение числа используемых правил может приводить к существенному снижению точности классификации. Разнообразные методы голосования в коллективах решающих правил также не лишены указанных недостатков. Поэтому предлагается на основе нескольких сгенерированных баз нечетких правил формировать новую базу нечетких правил ограниченного объема путем отбора определенных правил из исходных баз правил. По сути, в модифицированном виде повторно реализуется Питтсбургский этап формирования нечеткого классификатора. Аналогом множества правил, полученного на Мичиганском этапе, является множество правил из всех исходных нечетких классификаторов, сгруппированных в единый массив. Целевая функция - точность классификации базой нечетких правил, здесь вводится ограничение
Решетневскце чтения
на число используемых правил, используется коэво-люционный алгоритм условной оптимизации. Данный метод должен позволить генерировать компактные базы правил «повышенной точности», обладающие преимуществами нескольких исходных нечетких классификаторов.
Планируется апробация данного метода при решении задач обработки данных дистанционного зондирования Земли, в частности, в рамках проекта «Малые космические аппараты СибГАУ». В декабре 2011 г. планируется запуск МКА «Юбилейный-2», оснащенного оборудованием для ДЗЗ. Алгоритм обработки данных ДЗЗ на основе метода коллектива нечетких классификаторов может стать важным программным инструментом для использования Студенческим центром управления полетами СибГАУ.
Библиографические ссылки
1. Ishibuchi H., Nakashima T., Murata T. Performance Evaluation of Fuzzy Classifier Systems for Multidimensional Pattern Classification Problems // IEEE Trans. on Systems, Man, and Cybernetics. Vol. 29. May 1999. P. 601-618.
2. Sergienko R. B., Semenkin E. S., Bukhtoyarov V. V. Michigan and Pittsburgh Methods Combining for Fuzzy Classifier Generating with Coevolutionary Algorithm for Strategy Adaptation // 2011 IEEE Congress on Evolutionary Computation. June 5-8. 2011. New Orleans. LA. USA.
3. Sergienko R. B., Semenkin E. S. Competitive Cooperation for Strategy Adaptation in Coevolutionary Genetic Algorithm for Constrained Optimization // WCCI 2010 IEEE World Congress on Computational Intelligence. CCIB, Spain. Barcelona. July 18-23. 2010. P. 1626-1631.
R. B. Sergienko
Siberian State Aerospace University after academician M. F. Reshetnev, Russia, Krasnoyarsk
ABOUT FUZZY CLASSIFIERS COLLECTIONS FOR EARTH REMOTE SENSING DATA PROCESSING
New approaches for fuzzy classifiers collections generated with the help of self-tuning coevolutionary genetic algorithms are presented. Use of this approach for Earth remote sensing data processing is offered.
© Серraенко Р. E., 2011
УДК 004.89
М. Ю. Сидоров
Сибирский государственный аэрокосмический университет имени академика М. Ф. Решетнева, Россия, Красноярск
НЕЙРОСЕТЕВОЙ АНАЛИЗ ДАННЫХ НА БАЗЕ МНОГОАГЕНТНЫХ СТОХАСТИЧЕСКИХ АЛГОРИТМОВ
Предлагается программный комплекс нейросетевого анализа данных, предназначенный как для специалистов в области нейросетевых технологий с возможностью тонкой настройки основных моделей, так и для специалистов прикладных областей - в этом случае происходит структурная и параметрическая оптимизация нейросетевых технологий многоагентными стохастическими алгоритмами.
Искусственные нейронные сети являются одним из наиболее активно развиваемых в последнее время направлением формализации информационно-аналитической деятельности во многих сферах принятия решений. Существует значительное количество хорошо известных исследователям типов нейронных сетей. Таким образом, при необходимости решения конкретной задачи, скажем прогнозирования, в конкретной области возникает задача выбора «правильного» типа нейросети. Однако большинство нейрои-митаторов обычно предлагают ограниченный набор нейросетей, чаще всего относящихся к одному типу. В случае достаточно широкого представительства типов нейросетей остается существенная проблема выбора структуры нейросети, которая зачастую отда-
ется на решение пользователю или решается эвристически на основании интуиции и опыта. И, наконец, третьей проблемой применения нейросетей является трудность ее настройки в случае нестандартной ситуации или просто при больших размерах. Разрешение всех трех проблем требует серьезной квалификации исследователя, что существенно замедляет широкое внедрение полезного и эффективного инструментария в повседневную практику.
Разработка представляемого программного комплекса направлена на решение трех актуальных проблем нейросетевого анализа данных.
Первой составной частью комплекса является совокупность программных систем, реализующих наиболее распространенные типы нейронных сетей (пер-