Научная статья на тему 'Интеллектуальные информационные технологии выявления и диагностики проблем в задачах анализа сложных систем'

Интеллектуальные информационные технологии выявления и диагностики проблем в задачах анализа сложных систем Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
345
71
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ПРОБЛЕМА / СИСТЕМНЫЙ АНАЛИЗ / ИНТЕЛЛЕКТУАЛЬНЫЕ ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ / PROBLEM / SYSTEM ANALYSIS / INTELLIGENT INFORMATION TECHNOLOGIES

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Сопов Евгений Александрович, Сопов Сергей Александрович

Предложен новый подход к выявлению и диагностике проблемной ситуации, основанный на многокритериальном извлечении знаний об исследуемой системе. Рассмотрены основные модели и методы представления знаний, предложены критерии оценки качества полученных знаний.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Сопов Евгений Александрович, Сопов Сергей Александрович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

INTELLIGENT INFORMATION TECHNOLOGIES OF DIAGNOSIS AND DIAGNOSTICS IN COMPLEX SYSTEM ANALYSIS

An original approach to a problem of diagnosis and diagnostics of a problem situation, based on multicriteria knowledge extraction, is proposed. The basic knowledge representation models and methods, along with knowledge quality estimation criteria, are considered.

Текст научной работы на тему «Интеллектуальные информационные технологии выявления и диагностики проблем в задачах анализа сложных систем»

Using an Effecient Hybrid Frequency-Time Method // Proc. of the Intern. Mechanical Engineering Cong. and Exposition. Vol. DE-91. Atlanta, 1996. Р. 41-50.

8. Panning L. Auslegung von Reiblementen zur Schwingungsdaempfung von Turbinenschaeufeln : Diss. Institut fuer Dynamik und Schwingungen. Universitaet Hannover, 2005.

9. NX/NASTRAN. Handbook for Nonlinear Analysis (SOL 106), v67/MSC. Software Corporation, 2008.

10. Басов К. А. ANSYS. Справочник пользователя. М. : ДМК Пресс, 2005.

11. Panning L., Sextro W., Popp K. Spatial Dynamics of Tuned and Mistuned Bladed Disk with Cylindrical and

Wedge-Shaped Friction Dampers // Proc. of ISROMAC-9, The 9-th Intern. Symp. on Transport Phenomena and Dynamics of Rotating Machinery, Paper DD-028. Honolulu, 2002. P. 1-10.

12. Dinar V. Physics Based Reduced Order Models for Frictional Contacts : Diss. Cincinnati, 2005.

13. Ender C. Nonlinear vibration analysis of bladed disks with dry friction dampers // J. of Sound and Vibration. 2006. Vol. 295. Iss. 3-5. Р. 1028-1043.

14. Лапчик М. П. Численные методы. М. : Академия, 2005.

15. Nayfeh A. H., Mook D. T. Nonlinear Oscillations. N. Y. : Wiley, 1995.

O. V. Repetskiy, Phan Van Tuan

THE PROBLEM OF CONSTRUCTION OF MATHEMATICAL MODELS FOR OPTIMIZATION OF PARAMETERS OF FRICTION DAMPERS ON THE EXAMPLE OF BLADES OF GAS TURBINE ENGINES

The article considers a problem of optimization offriction damper for blades of gas turbine engines. Based on this study and the results obtained by the other authors, the authors constructed an effective mathematical model, which makes it possible to design a friction damper with optimal parameters.

Keywords: mathematical model, friction, vibration, damper, optimization.

© Репецкий О. В., Фан Ван Туан, 2011

УДК 004.82

Е. А. Сопов, С. А. Сопов

ИНТЕЛЛЕКТУАЛЬНЫЕ ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ ВЫЯВЛЕНИЯ И ДИАГНОСТИКИ ПРОБЛЕМ В ЗАДАЧАХ АНАЛИЗА СЛОЖНЫХ СИСТЕМ*

Предложен новый подход к выявлению и диагностике проблемной ситуации, основанный на многокритериальном извлечении знаний об исследуемой системе. Рассмотрены основные модели и методы представления знаний, предложены критерии оценки качества полученных знаний.

Ключевые слова: проблема, системный анализ, интеллектуальные информационные технологии.

Понятие «проблемы» в системном анализе.

Системный анализ с практической точки зрения представляет собой универсальную методику решения сложных проблем произвольной природы. Ключевым понятием в данном случае является понятие «проблема», которое можно определить как «субъективное отрицательное отношение субъекта к реальности». Соответственно этап выявления и диагностики проблемы в сложных системах является наиболее важным, так как определяет цели и задачи проведения системного анализа, а также методы и алгоритмы, которые будут применяться в дальнейшем при поддержке принятия решений. В то же время этот этап является наиболее сложным и наименее формализованным.

Анализ русскоязычных трудов по системному анализу позволяет выделить два наиболее крупных

направления в данной области, которые можно условно назвать рациональным и объективно-субъективным подходами.

Первое направление системного анализа (рациональный подход) рассматривает системный анализ как набор методов, и в том числе методов, основанных на использовании ЭВМ, ориентированных на исследование сложных систем [1; 2]. При таком подходе наибольшее внимание уделяется формальным методам построения моделей систем и математическим методам исследования системы. Понятия «субъект» и «проблема» как таковые не рассматриваются, а вот понятие «типовых» систем и проблем как раз встречается часто (система управления - проблема управления, финансовая система - финансовая проблема и др.).

*Работа выполнена при поддержке Федеральной целевой программы «Исследования и разработки по приоритетным направлениям развития научно-технологического комплекса России на 2007-2013 годы» (2011-1.2.2-215-021, 2011-1.9-519-005, 2011-1.4-514-009).

При таком подходе «проблема» определяется как несоответствие действительного желаемому, т. е. несоответствие между реально наблюдаемой системой и «идеальной» моделью системы. Важно отметить, что в данном случае система определяется исключительно как та часть объективной реальности, которую необходимо сравнить с эталонной моделью.

Если опираться на понятие «проблема», то можно сделать заключение, что при рациональном подходе проблема возникает только у системного аналитика, который имеет некую формальную (часто общепринятую) модель системы и обнаруживает несоответствие модели и реальной системы, что и вызывает его «отрицательное отношение к реальности».

Однако навязывание аналитиком субъекту общепринятых (даже если и рациональных) моделей может привести к возникновению «отрицательного отношения» у субъекта, а значит, к появлению новых проблем, что в корне противоречит самой сути системного анализа, который предполагает улучшающее воздействие - когда хотя бы одному участнику проблемы станет лучше и никому не станет хуже.

Очень часто постановку задачи системного анализа в рациональном подходе выражают в терминах задачи оптимизации, т. е. идеализируют проблемную ситуацию до уровня, позволяющего использовать математические модели и количественные критерии для определения наилучшего варианта разрешения проблемы. Как известно, для системной проблемы не существует какой-либо модели, исчерпывающе устанавливающей причинно-следственные связи между ее компонентами, потому оптимизационный подход кажется не вполне конструктивным: «... теория системного анализа исходит из отсутствия оптимального, абсолютно лучшего варианта разрешения проблем любой природы. предлагается итеративный поиск реально достижимого (компромиссного) варианта разрешения проблемы, когда желаемым можно поступиться в угоду возможному, а границы возможного могут быть существенно расширены за счет стремления достичь желаемого. Тем самым предполагается использование ситуативных критериев предпочтительности, т. е. критериев, которые не являются исходными установками, а вырабатываются в ходе проведения исследования...» [3].

Второе направление системного анализа (объективно-субъективный подход), основанное на работах Акоффа [3-6], ставит понятие субъекта и проблемы во главу системного анализа. По сути, в данном подходе мы включаем субъекта в определение существующей и идеальной системы, т. е., с одной стороны, системный анализ исходит из интересов людей - вносит субъективную составляющую проблемы, с другой стороны - исследует объективно наблюдаемые факты и закономерности (отсюда и название подхода).

Вернемся к определению понятия проблемы. Из него, в частности, следует, что когда мы наблюдаем нерациональное (в общепринятом смысле) поведение субъекта и субъект не имеет отрицательного отношения к происходящему, то нет и проблемы, которую

нужно было бы решать. Данный факт хотя и не противоречит понятию «проблема», но в определенных ситуациях исключать возможность существования объективной составляющей проблемы нельзя.

Системный анализ имеет в своем арсенале следующие возможности решить проблему субъекта: вмешаться в объективную реальность и, устранив объективную часть проблемы, изменить субъективное отрицательное отношение субъекта; изменить субъективное отношение субъекта, не вмешиваясь в реальность; одновременно вмешаться в объективную реальность и изменить субъективное отношение субъекта.

Очевидно, что второй способ не решает проблему, а всего лишь устраняет ее влияние на субъекта, а значит, объективная составляющая проблемы остается. Справедлива и обратная ситуация, когда объективная составляющая проблемы уже проявилась, но субъективное отношение еще не сформировано, либо по ряду причин оно пока не стало отрицательным.

Вот несколько причин, почему у субъекта может отсутствовать «отрицательное отношение к реальности»: он имеет неполную информацию о системе или использует ее не полностью; меняет оценку взаимоотношений с окружающей средой на психическом уровне; прерывает взаимоотношения с окружающей средой, которая вызывала «отрицательное отношение»; не верит информации о существовании проблем и их сущности, так как полагает, что сообщающие ее люди очерняют его деятельность или преследуют свои корыстные интересы, а может быть и потому, что просто лично не любит этих людей.

Следует помнить о том, что при отсутствии отрицательного отношения субъекта объективная составляющая проблемы остается и в той или иной степени продолжает влиять на субъекта, либо проблема может существенно обостриться в будущем.

Интеллектуальные технологии извлечения знаний в задачах выявления и анализа проблемной ситуации. Выявление проблемы требует анализа субъективного отношения, и этот этап относится к неформализуемым этапам системного анализа. Каких-либо эффективных алгоритмов или приемов на настоящий момент не предложено, чаще всего авторы работ по системному анализу полагаются на опыт и интуицию аналитика и предлагают ему полную свободу действий.

Системный аналитик должен обладать достаточным набором инструментов для описания и анализа той части объективной реальности, с которой взаимодействует или может взаимодействовать субъект. Инструменты могут включать методы экспериментального исследования систем и их моделирования. С повсеместным внедрением современных информационных технологий в организациях (коммерческих, научных, медицинских и др.) почти каждый аспект их деятельности регистрируется и сохраняется в базах данных, которые уже сегодня имеют очень большие объемы. Информация в подобных базах данных содержит детальное описание как самих систем, так и истории

их (систем) развития и функционирования. Можно сказать, что сегодня при анализе большинства искусственных систем аналитик вероятнее столкнется с недостатком эффективных методов исследования систем, нежели с недостатком информации о системе.

Однако субъективное отношение должен сформулировать именно субъект, а он может не обладать специальными знаниями и потому не способен адекватно интерпретировать результаты исследования, проведенного аналитиком. Поэтому знания о системе и прогнозные модели, которые в итоге получит аналитик, должны быть представлены в явном, доступном к интерпретации виде (возможно, на естественном языке). Такое представление можно назвать знаниями об исследуемой системе.

К сожалению, эффективных методов получения знаний о системе на текущий момент не предложено. Наибольший интерес представляют модели и алгоритмы Data Mining (интеллектуальный анализ данных), которые в частных приложениях используются для извлечения знаний из «сырых» данных. Стоит отметить, что Data Mining является эволюцией теории управления базами данных и оперативного анализа данных (OLAP), основанной на использовании идеи многомерного концептуального представления [7-9]. Но в последние годы в связи с нарастающей проблемой «перегрузки информацией» все больше исследователей используют и совершенствуют методы Data Mining для решения задач извлечения знаний.

Широкое применение методов извлечения знаний весьма затруднено, что, с одной стороны, связано с недостаточной эффективностью большинства известных подходов, а с другой - с трудностью использования эффективных методов интеллектуальных технологий, которые не имеют достаточного формального описания и требуют привлечения дорогих специалистов. Данные проблемы можно преодолеть с помощью перспективного подхода к построению эффективной системы извлечения знаний о системе, основанного на автоматизированном генерировании и настройке интеллектуальных информационных технологий. Такой подход, во-первых, позволит за счет применения передовых интеллектуальных технологий существенно повысить эффективность решения задачи извлечения знаний, которые будут предъявляться субъекту на этапе выявления проблемы при системном анализе; во-вторых, даст возможность исключить потребность в специалисте по настройке и использованию интеллектуальных технологий, так как последние будут генерироваться и настраиваться в автоматическом режиме [10].

Определим, что такое «знание». Следует отметить, что термин «знание» является интуитивно определяемым. Ниже представлены энциклопедические определения.

Знание - результат познавательной деятельности, система приобретенных с ее помощью понятий о действительности [11].

Знание - проверенный практикой результат познания действительности, верное ее отражение в созна-

нии человека. Знание противоположно незнанию, т. е. отсутствию проверенной информации о чем-либо [12].

Знание - селективная, упорядоченная, определенным способом (методом) полученная, в соответствии с какими-либо критериями (нормами) оформленная информация, имеющая социальное значение и признаваемая в качестве именно знания определенными социальными субъектами и обществом в целом [13].

Общими в этих определениях и полезными для нас с практической точки зрения являются следующие моменты. Во-первых, знание отражает результат исследования системы (познания объективной реальности). Во-вторых, знание выражено определенным понятным человеку образом (использует общепринятые символы, понятия, естественный язык).

Поскольку знания о системе будут предъявляться субъекту для выявления проблемной ситуации, авторы считают необходимым добавить еще одно важное требование.

Как известно, для эффективного восприятия и понимания действительности человек разбивает сложное на более простое (что составляет суть аналитического мышления). Например, для выражения физических законов человек использует очень простые, лаконичные формы, хотя последние и не являются точным описанием действительности; при невозможности одновременно оперировать большим количеством сложных правил, логических выводов или критериев человек использует более простые свертки-упрощения (одна из наиболее известных гипотез утверждает, что мозг человека работает только с 7 ± 2 единицами информации [14]). Очевидно, если знание будет достаточно большим или сложным в описании, то для субъекта в большинстве случаев оно будет достаточно трудным для восприятия - будет представлять собой модель «черного ящика».

Следовательно, в-третьих, знание должно быть компактным (по форме, описанию), что делает его доступным для понимания, интерпретации и дальнейшего использования.

Далее необходимо определить, какие модели представления знаний следует использовать при выявлении проблемных ситуаций. Традиционно в теории анализа данных выделяют описательные модели, которые необходимы для лучшего понимания исследуемой системы, известных фактов и наблюдений, и предсказательные модели, необходимые для понимания новых фактов о системе. Эти модели включают в себя регрессионные модели (в том числе модели исключений, модели ассоциаций, модели последовательностей и др.); модели классификации и кластеризации.

По форме представления наиболее распространенными и наиболее естественными для восприятия и понимания человеком являются логические продукционные правила, выраженные средствами естественного языка в форме ЕСЛИ-ТО; символьные выражения (например, математические функции, алгоритмы).

Наконец, необходимо определить методы и алгоритмы, используемые для извлечения знаний из дан-

ных. Очевидно, что наилучший инструмент добычи, усвоения и использования знаний - это непосредственно интеллект человека. Поэтому самым перспективным кажется использование методов интеллектуальных информационных технологий, которые наиболее эффективно воспроизводят такие важные особенности интеллекта, как способность к обобщению, прогнозированию, распознаванию и др.

Обозначенные задачи извлечения знаний достаточно эффективно решаются следующими методами интеллектуальных информационных технологий: методами, основанными на нечеткой логике, методами генетического программирования [15-17].

Методы, основанные на нечеткой логике, способны выявлять знания в явном виде, так как для описания информации используются лингвистические переменные («большая скорость», «дорогая машина», «слабый сигнал» и т. д.), а совокупность выявленных знаний представляется в виде логических правил в форме ЕСЛИ-ТО. Обычно для построения базы знаний требуется предметный эксперт, который определяет как лингвистические переменные, так и сами правила принятия решения. Базу правил можно построить и без эксперта, сгенерировав ее с помощью методов случайного поиска, например, с помощью генетического алгоритма. Однако такая база в зависимости от задачи будет содержать огромное число правил, что нарушает принцип компактности описания знаний.

Аналогичные результаты могут быть получены при использовании метода генетического программирования, который представляет результат исследования системы в виде символьных выражений, сгенерированных из элементов заданного множества элементарных функций, предметных переменных и констант. Например, символьным выражением может быть математическое выражение (формула), описывающая исследуемые зависимости. Принцип компактности описания знаний в генетическом программировании также нарушается, поскольку классический подход направлен в большей мере на точность описания, нежели на интерпретацию результата.

В данной работе, для обеспечения выполнения всех требований, предъявленных к извлекаемым знаниям, впервые предложен многокритериальный подход к построению интеллектуальных технологий. В общем виде множество критериев содержит следующие:

- первый критерий (К1), определяющий качество исследования системы. Обычно это численная оценка соответствия результата извлечения знаний и исходных исследуемых данных, например квадратичная ошибка аппроксимации;

- второй критерий (К2), определяющий компактность полученных знаний о системе. Вид и содержание данного критерия зависит от представления знаний. В случае базы правил на нечеткой логике критерий определяется размером базы (числом правил), в случае генетического программирования - размером и сложностью дерева решения;

- третий критерий (К3), определяющий интерпретируемость знания. В случае базы правил на нечеткой логике критерий определяется средней длиной правил в базе (более простые правила должны быть более понятны субъекту), в случае генетического программирования - разнообразием использованных функций, возможно, с учетом предпочтений субъекта.

Таким образом, задача автоматизированного построения интеллектуальной технологии извлечения знаний о системе сводится к задаче многокритериальной оптимизации (K1, K 2, K 3) ^ extr, которая может быть решена самонастраивающимися генетическими алгоритмами.

Важным преимуществом предложенного многокритериального подхода является то, что субъекту будет предъявлено не единственное решение, а множество несравнимых по эффективности решений (множество Парето). Это, во-первых, увеличит интерпретируемость полученных знаний, так как одна и та же система будет описана «разными словами», во-вторых, разные представления знаний могут раскрыть «разные стороны» системы (отражать разные аспекты зависимостей), а значит, такое описание будет более объективным.

Для более представительной аппроксимации множества (или фронта) Парето целесообразно использовать генетический алгоритм SPEA и SPEA2, которые являются одними из наиболее эффективных подходов к решению сложных многокритериальных задач и обеспечивает поддержание разнообразия парето-эффективных решений [18].

Результаты применения подхода в задачах извлечения знаний. Для демонстрации подхода решены тестовые задачи из базы UC Irvine Machine Learning Repository (URL: http://kdd.ics.uci.edu/), которая содержит множество известных прикладных задач, наиболее часто используемых при апробации различных интеллектуальных информационных технологий. Ниже представлено краткое описание постановки и даны решения задач.

Задача 1. Задача распознавания пользователя по произношению (Japanese vowels. URL: http://archive.ics.uci.edu/ml/datasets/Japanese+Vowels). Задача состоит в распознавании девяти мужчин по произношению дифтонга из двух японских гласных (/ае/). Иными словами, имеем задачу классификации с девятью классами. Исходная база данных (обучающая выборка) состоит из записи 30 произнесений каждого из девяти участников. Для каждого произнесения с помощью алгоритма LPC вычислены 12 кепстр-коэффициентов.

На первом этапе были преобразованы входные данные. На втором этапе был сформирован нечеткий классификатор, где решение о принадлежности к классу определяется по базе правили вида «ЕСЛИ параметр 1 И параметр 2 И ... И параметр 12, ТО класс». При фазификации используется пять термов, равномерно распределенных по области изменения каждого из входных параметров и терм игнорирования (который позволяет создавать правила с непол-

ным набором входных параметров). Вид термов -триангулярные нечеткие числа. На третьем этапе с помощью многокритериального генетического алгоритма SPEA была сформирована эффективная база правил. Использованы три критерия: F1 - эффективность решения исходной задачи (соответствие полученной базы правилам исходной выборки данных), F2 - размер базы правил (число правил в базе), F3 -средняя длина правил в базе.

Многократный запуск алгоритма дал ряд существенно отличающихся наборов правил. При этом во всех наборах наблюдалась общая закономерность: использовались все или почти все входные параметры (терм игнорирования появлялся редко) и в среднем 20.30 эффективных правил. Можно сделать вывод, что все входные параметры являются информативными для решения задачи. При этом эффективный размер базы правил (20.30) существенно меньше размера «полной базы», в которой содержится (513 = 1,2-109) различных правил. Например, одно из полученных решений позволяет получить эффективность классификации 82 % (число угаданных примеров из тестовой выборки), используя всего 24 правила при средней длине правил равной 11,83. Для определения каждого из классов по отдельности используется всего 2.3 индивидуальных правила, что весьма полезно для понимания природы объектов класса.

Задача 2. Задача распознавания изображений, получаемых со спутника (LandSat Satellite. URL: http://archive.ics.uci.edu/ml/datasets/Statlog+(Landsat+Sa tellite)). Спутник дистанционного зондирования Земли сканирует земную поверхность в четырех спектральных диапазонах - зеленом, красном и двух диапазонах в инфракрасной области. Данные представляют собой изображения в виде квадрата 3x3 пикселя. Необходимо отнести данный участок к одному из шести классов (типу почвы). Исходные данные представляют собой сгруппированные по девяти пикселям данные, полученные с небольшого участка изображения, переданного американским спутником LandSat. Объем обучающей выборки составляет 4 435 элементов.

На первом этапе был проведен факторный анализ методом главных компонент. Были получены четыре новых информативных признака (главных компонент), которые содержат в себе около 90 % информации, содержащейся в исходной базе данных. На втором этапе был сформирован нечеткий классификатор. При фазификации используется пять термов, равномерно распределенных по области изменения каждого из входных параметров и терм игнорирования (который позволяет создавать правила с неполным набором входных параметров). Вид термов - триангуляр-ные нечеткие числа. Для задачи с четырьмя информативными признаками общее число всех возможных правил равно 1 296. На третьем этапе была получена эффективная база с минимальным набором. Оптимизация осуществлялась с помощью генетического алгоритма, использующего Питсбургский подход (индивид - база правил).

В результате была построена база нечетких правил, состоящая из 211 правила и дающая надежность классификации 0,817 6. Из конечной базы правил выделены 39 наиболее общих правил, которые доступны для интерпретации. Класс 1 определяется 13 правилами, класс 2 - шестью правилами, класс 3 - семью правилами, класс 4 - одним правилом, класс 5 - семью правилами, класс 6 - пятью правилами. В среднем правила содержат три признака. Очевидные выводы, которые можно сделать по выявленным знаниям -это, например, легкость определения класса 4, отсутствие полезной информации для некоторых классов в определенном спектре.

Задача 3. Задача прогнозирования расхода топлива автомобиля в городском цикле эксплуатации (Auto MPG Data Set. URL: http://archive.ics.uci.edu/ml/ datasets/Auto+MPG). Объем выборки - 398.

На первом этапе были восполнены пробелы в данных в разделе мощность - заполнены средним. На втором этапе с помощью метода генетического программирования были получены решения задачи восстановления символьной регрессии для набора данных. В качестве целевых критериев выбраны точность описания (ошибка аппроксимации) и сложность решения (число узлов в дереве). Пригодность решений оценивалась по аддитивной свертке критериев. Для поиска различных решений из множества Парето использован мультистарт. На третьем этапе полученные решения были упрощены и подвергнуты содержательному анализу. Были сделаны следующие выводы:

- решения с низкой ошибкой содержат большое количество элементов - представляют собой нелинейные зависимости, а потому сложны для анализа;

- среди простых решений с большей ошибкой часто встречаются решения с одной переменной - «динамика», что означает, что более динамичные авто потребляют большее количество топлива;

- переменная «мощность» часто встречается с отрицательным коэффициентом, что означает снижение расхода при большей мощности. Данный вывод логичен для легковых авто и городского цикла (условие задачи), где более мощные авто в режиме разгон-остановка способны работать на более низких оборотах.

Задача 4. Задача из области криминалистики -классификация стекла (Glass Identification) на основе данных измерений оптических и химических характеристик образцов (URL: http://archive.ics.uci.edu/ml/ datasets/Glass+Identification). Всего используется семь параметров, полученных в ходе анализа физических и химических свойств стекла. Данные группируются в три класса: оконное стекло, автомобильное стекло и стеклянная тара (бутылки, банки и т. д.).

На первом этапе был сформирован нечеткий классификатор. При фазификации используется пять термов, равномерно распределенных по области изменения каждого из входных параметров и терм игнорирования (который позволяет создавать правила с неполным набором входных параметров). Вид термов -триангулярные нечеткие числа. На втором этапе была сгенерирована эффективная база правил. В качестве

критериев выступили два: надежность классификации (максимизация) и число правил в базе (минимизация). Оптимизация проводилась классическим генетическим алгоритмом по аддитивной свертке критериев.

Получена база правил, содержащая всего пять правил со средней длиной правила, равной четырем (параметрам). Точность классификации составила 90 %. При этом из базы правил можно сделать выводы, например, что параметр 2 (содержание оксида натрия) не является информативным для принятия решений, а значит, данный тип измерений можно исключить.

Предложенный способ выявления знаний с помощью многокритериального подхода к построению интеллектуальных информационных технологий позволяет сделать процесс исследования систем более прозрачным для субъекта, который формулирует проблему и принимает решения относительно вмешательства в проблемную ситуацию.

Возможность получить не одно-единственное, а множество эффективных и различных по форме представления информации решений, позволяет рассмотреть систему с разных «точек зрения», что повышает надежность интерпретации результатов: какой-то аспект описания системы более понятен субъекту, какой-то - менее понятен.

Численные исследования показывают, что в результате реализации подхода можно, во-первых, существенно упростить решения при допустимой точности описания системы, во-вторых, получить решения, доступные для интерпретации при возможной потере точности. При этом тестовые примеры показали, что потеря точности описания не так критична, поскольку решения позволяют сделать наиболее общие и практические полезные выводы об исследуемой системе. А в случае когда точность необходима, критерий точности можно использовать с большим весовым коэффициентом или оставить единственным.

Библиографические ссылки

1. Оптнер С. Л. Системный анализ для решения деловых и промышленных проблем. М. : Сов. радио, 1969.

2. Антонов А. В. Системный анализ. М. : Высш. шк., 2004.

3. Теоретические основы системного анализа /

B. К. Голиков, Б. Е. Демин, В. И. Новосельцев, Б. В. Тарасов. М. : Майор, 2006.

4. Акофф Р., Эмери Ф. О целеустремленных системах. М. : Сов. радио, 1974.

5. Акофф Р. Искусство решения проблем. М. : Мир, 1982.

6. Тарасенко Ф. П. Прикладной системный анализ. Томск : Изд-во Том. ун-та, 2004.

7. Дюк В., Самойленко А. Data Mining : учеб. курс. СПб. : Питер, 2001.

8. Барсегян А. А. Технологии анализа данных. СПб. : БХВ-Петербург, 2007.

9. Интеллектуальные системы / В. М. Курейчик [и др.]. М. : Физматлит, 2005.

10. Сопов Е. А. Интеллектуальные информационные технологии извлечения знаний // Системный анализ в проектировании и управлении : тр. Х междунар. науч.-практ. конф. Ч. 2. СПб. : Изд-во Политехн. ун-та, 2006. С. 289-296.

11. Толковый словарь русского языка : в 4 т. / под ред. Д. Н. Ушакова. М. : Сов. энцикл. : ОГИЗ, 1935-1940.

12. Большая советская энциклопедия : 3-е изд. [Электронный ресурс] // Book Archive.RU. URL: http://www.bookarchive.ru/jenciklopedii/ (дата обращения: 19.10.2011).

13. Новейший философский словарь. 3-е изд., исправл. Минск : Книжный Дом, 2003.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

14. Miller G. A. The Magical Number Seven, Plus or Minus Two // The Psychological Review. 1956. Vol. 63. P. 81-97.

15. Уоссермен Ф. Нейрокомпьютерная техника: теория и практика. М. : Мир, 1992.

16. Нечеткая логика и искусственные нейронные сети : учеб. пособие / В. В. Круглов [и др.]. М. : Физ-матлит, 2002.

17. Семенкин Е. С. Эволюционные алгоритмы поддержки принятия решений при управлении сложными системами // Вестник СибГАУ. 2005. Вып. 7.

C. 83-85.

18. Zitzler E., Thiele L. Multiobjective evolutionary algorithms: A comparative case study and the strength Pareto approach // IEEE Trans. on Evolutionary Computation. 1999. Vol. 3. № 4. Р. 257-271.

E. A. Sopov, S. A. Sopov

INTELLIGENT INFORMATION TECHNOLOGIES OF DIAGNOSIS AND DIAGNOSTICS

IN COMPLEX SYSTEM ANALYSIS

An original approach to a problem of diagnosis and diagnostics of a problem situation, based on multicriteria knowledge extraction, is proposed. The basic knowledge representation models and methods, along with knowledge quality estimation criteria, are considered.

Keywords: problem, system analysis, intelligent information technologies.

© ConoB E. A., ConoB C. A., 2011

i Надоели баннеры? Вы всегда можете отключить рекламу.