Научная статья на тему 'Комбинаторная оптимизация в системах распознавания для решения задач диагностики и прогнозирования'

Комбинаторная оптимизация в системах распознавания для решения задач диагностики и прогнозирования Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
202
25
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Масич И. С.

Исследуется метод классификации данных, основанный на поиске и использовании логических правил. Решающее правило классификации базируется на модели, получаемой в результате решения ряда задач комбинаторной оптимизации. Для решения этих задач разработаны и исследованы поисковые алгоритмы условной псевдобулевой оптимизации.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

THE COMBINATORY OPTIMISATION of THE RECOGNITION SYSTEMS for the diagnostics and prognosis problem solution

The data classification method based on the search and use of logical rules is considered in the paper. The crucial rule is based on the model received by solving combinatorial optimization problems. The search algorithms of conditional pseudo-Boolean optimization are designed and investigated for solving these problems.

Текст научной работы на тему «Комбинаторная оптимизация в системах распознавания для решения задач диагностики и прогнозирования»

Математические методы моделирования, управления и анализа данных.

Экспериментальные данные взаимосвязи параметров

Скорость наплавки, х 8,5 8,0 7,5 7,0 6,7 6,5 6,3 6,1 6,0

Толщина наплавленного слоя, у 0,5 1,0 1,5 2,0 2,5 3,0 3,5 4,0 4,5

Величина повышения износостойкости, 2 18 27,6 36,7 44,6 52,2 58,4 63,2 68,2 71,8

Значение твердости, г 58 57 56 54 53 51 49 47 45

Несмещенная оценка среднеквадратического отклонения равна

ст2 = 0,632.

Зависимость твердости материала от толщины наплавленного слоя линейна и имеет вид

г (у) = -3,353у + 60,553. Несмещенная оценка среднеквадратического отклонения равна

ст2 = 5,825 • 10-3 Результирующая износостойкость может быть вычислена как

2 = + 2,

где 20 - износостойкость исследуемого материала до проведения наплавки; 2 - величина повышения

износостойкости материала при проведении наплавки.

Получаем, что зная требуемую износостойкость, мы можем найти соответствующую необходимую толщину наплавки у(2) и скорость х(2) по следующим формулам:

у(2) = 1,267е0'021(г-2о) -1,282,

х(2) = -1,2691п(1,267е0'021(2-2о) -1,282) + 7,887.

Практическое применение полученных функциональных зависимостей состоит в том, что с их помощью легко рассчитать, какой должна быть скорость наплавки и толщина наплавленного слоя для получения требуемой величины повышения износостойкости материала.

О. A. Masansky, A. M. Tokmin, P. O. Shalaev Siberian Federal University, Russia, Krasnoyarsk

DEFINITION OF FUNCTIONAL DEPENDENCES OF INDUCTION SURFACING PARAMETERS

The application of the method of regression analysis for the definition of functional dependences between the parameters of the surfacing enables to calculate the speed of the surfacing and the thickness of deposited layer for reception of the demanded size to increase the material wear resistance.

© Масанский О. А., Токмин А. М., Шалаев П. О., 2010

УДК 519.854.33

И. С. Масич

Сибирский государственный аэрокосмический университет имени академика М. Ф. Решетнева, Россия, Красноярск

КОМБИНАТОРНАЯ ОПТИМИЗАЦИЯ В СИСТЕМАХ РАСПОЗНАВАНИЯ ДЛЯ РЕШЕНИЯ ЗАДАЧ ДИАГНОСТИКИ И ПРОГНОЗИРОВАНИЯ*

Исследуется метод классификации данных, основанный на поиске и использовании логических правил. Решающее правило классификации базируется на модели, получаемой в результате решения ряда задач комбинаторной оптимизации. Для решения этих задач разработаны и исследованы поисковые алгоритмы условной псевдобулевой оптимизации.

Большое количество задач распознавания, привлекающих внимание исследователей во множестве различных областей, может быть сформулировано следующим образом. Имеется выборка данных, которая состоит из двух непересекающихся множеств п-мерных векторов. Компоненты векторов (называемые признаками, переменными, характеристиками или

атрибутами) представляют собой результаты определенных измерений, тестов, показаний. Эти компоненты могут быть численными, номинальными или бинарными. Задача состоит в том, чтобы на основании имеющейся выборки данных (классифицированных ранее наблюдений) извлечь информацию о «новом» наблюдении, которое не содержится в выборке.

Работа выполнена при финансовой поддержке гранта Президента РФ (код проекта МК-463.2010.9).

Решетневские чтения

Для решения этой задачи исследуется метод анализа данных, в основе которого лежит принцип вывода логических закономерностей или правил. Каждое правило должно покрывать достаточно много объектов одного класса и практически не покрывать объекты другого класса. Взяв вместе некоторое количество правил, можно получить алгоритм (модель, решающее правило), который будет решать поставленную задачу классификации.

В основе предлагаемого подхода к классификации данных лежит метод, вытекающий из теории комбинаторной оптимизации и называемый логическим анализом данных (Logical Analysis of Data - LAD) [1]. Этот метод успешно использовался для решения ряда задач из различных областей [1; 2]. Основная идея метода заключается в совместном использовании действий по «дифференцированию» и «интегрированию», производимых на области пространства исходных признаков, содержащей заданные позитивные и негативные наблюдения. На шаге «дифференцирования» определяется семейство малых подмножеств, обладающих характерными позитивными и негативными чертами. На шаге «интегрирования» формируемые определенным образом объединения этих подмножеств рассматриваются как аппроксимации областей пространства признаков, содержащих позитивные и, соответственно, негативные наблюдения.

Отличительной особенностью предлагаемого метода является то, что вместо того, чтобы просто ответить на вопрос, к какому из классов принадлежит новое наблюдение, он строит аппроксимацию областей пространства признаков, содержащих наблюдения соответствующих классов. Наиболее важные преимущества такого подхода - это возможность дать объяснение для любого решения, полученного данным методом, возможность выявления новых классов наблюдений, возможность анализа роли и природы признаков.

Построение эффективных правил и модели классификации является сложной комбинаторной задачей. Результаты ее решения определяются видом сформированных критериев и ограничений, а также используемыми алгоритмами оптимизации.

Разработанный алгоритм классификации данных состоит из этапов, на каждом из которых требуется решение серии задач комбинаторной оптимизации [3]. Критерий и ограничения в задачах заданы псевдобулевыми функциями, характеризующимися наличием свойств унимодальности и монотонности, что выделяет их в особенный класс задач, в которых допустимое множество является связным. Сложность заключается в том, что функции эти в общем случае зада-

ются алгоритмически, т. е. вычисляются через определенную последовательность операций. От эффективности решения этих задач зависит точность и трудоемкость метода.

Для решения задачи оптимизации использовались алгоритмы оптимизации, основанные на поиске граничных точек допустимой области [4; 5]. Эти алгоритмы были разработаны специально для этого класса задач и основаны на поведении монотонных функций модели оптимизации в пространстве булевых переменных. Алгоритмы поиска граничных точек являются поисковыми, т. е. не требуют задания функций в явном виде, с помощью алгебраических выражений, а используют вычисления функций в точках. Разработанные поисковые алгоритмы, основанные на поиске граничных точек допустимой области, эффективно решают задачи рассматриваемого класса, повышая тем самым эффективность всего метода классификации данных.

Проводилось экспериментальное исследование разработанного алгоритма классификации на практических задачах прогнозирования. Задачи были решены с точностью, сопоставимой с точностью решения посредством искусственных нейронных сетей. При этом логический анализ данных дает ряд преимуществ при практическом использовании. Прежде всего, в явном виде известны правила, по которым принимается решение о принадлежности к какому-либо классу. Кроме того, при применении модели классификации к новому объекту, по тому, каким числом паттернов покрывается этот объект, можно судить о вероятности возможной ошибки при распознавании.

Библиографические ссылки

1. Hammer P. L., Bonates T. Logical Analysis of Data: From Combinatorial Optimization to Medical Applications // RUTCOR Research Report. 2005. № 10.

2. An Implementaion of Logical Analysis of Data / E. Boros [et al.] // IEEE Transactions on Knowledge and Data Engineering. 2000. № 12(2). Р. 292-306.

3. Масич И. С. Комбинаторная оптимизация в задаче классификации // Системы управления и информационные технологии. 2009. № 1, 2(35). С. 283-288.

4. Antamoshkin A. N., Masich I. S. Heuristic search algorithms for monotone pseudo-boolean function conditional optimization // Engineering & automation problems. 2006. Vol. 5, № 1. P. 55-61.

5. Antamoshkin A. N., Masich I. S. Pseudo-Boolean optimization in case of unconnected feasible sets // Models and Algorithms for Global Optimization. Series: Springer Optimization and Its Applications / ed. by A. Torn, J. Zilin-skas. Springer, 2007. Vol. 4. Р. 111-122.

I. S. Masich

Siberian State Aerospace University named after academician M. F. Reshetnev, Russia, Krasnoyarsk

THE COMBINATORY OPTIMISATION OF THE RECOGNITION SYSTEMS FOR THE DIAGNOSTICS AND PROGNOSIS PROBLEM SOLUTION

The data classification method based on the search and use of logical rules is considered in the paper. The crucial rule is based on the model received by solving combinatorial optimization problems. The search algorithms of conditional pseudo-Boolean optimization are designed and investigated for solving these problems.

© MacHH H. C., 2010

i Надоели баннеры? Вы всегда можете отключить рекламу.