Научная статья на тему 'О методах прогнозирования, основанных на решении задач распознавания образов'

О методах прогнозирования, основанных на решении задач распознавания образов Текст научной статьи по специальности «Математика»

CC BY
129
37
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по математике, автор научной работы — Смирнов А. И.

В статье предлагаются методы прогнозирования динамических процессов, основанные на применении дискриминантного анализа. Дискриминантный анализ является одним из основных разделов распознавания образов. Алгоритмы решения задач распознавания, в том числе разработанные представителями этого научного направления в Институте математики и механики УрО РАН, показали свою высокую эффективность при решении большого числа практических задач. Данная публикация поддерживается междисциплинарной программой фундаментальных исследований Уральского отделения Российской Академии наук «Историческая динамика России: факторы, модели, прогнозы» при участии Уральского института экономики, управления и права.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

ON THE METHODS OF PREDICTION BASED ON TASK SOLUTION OF PATTERN RECOGNITION

Methods of dynamic processes prediction based on the discriminant analysis is offered in the article. Discriminant analysis makes one of the principle parts of the pattern recognition. Problem algorithms of pattern recognition including the ones worked out by the representatives of this scientific school in the Institute of Mathematics and Mechanics of the UrD RAS proved their high effectiveness in a great number of practical task solutions. The given issue is carried out within the scope of the interdisciplinary programme of the UrD RAS 'The historical dynamics of Russia: factors, models, predictions' with the participation of the Urals Institute of Economics, Management and Law.

Текст научной работы на тему «О методах прогнозирования, основанных на решении задач распознавания образов»

ОБРАЗОВАНИЕ

О МЕТОДАХ ПРОГНОЗИРОВАНИЯ, ОСНОВАННЫХ НА РЕШЕНИИ ЗАДАЧ РАСПОЗНАВАНИЯ ОБРАЗОВ Смирнов А.И.

В статье предлагаются методы прогнозирования динамических процессов, основанные на применении дискриминантного анализа. Дискриминантный анализ является одним из основных разделов распознавания образов. Алгоритмы решения задач распознавания, в том числе разработанные представителями этого научного направления в Институте математики и механики УрО РАН, показали свою высокую эффективность при решении большого числа практических задач.

Данная публикация поддерживается междисциплинарной программой фундаментальных исследований Уральского отделения Российской Академии наук «Историческая динамика России: факторы, модели, прогнозы» при участии Уральского института экономики, управления и права.

ON THE METHODS OF PREDICTION BASED ON TASK SOLUTION OF PATTERN RECOGNITION A.I. Smirnov

Methods of dynamic processes prediction based on the discriminant analysis is offered in the article. Discriminant analysis makes one of the principle parts of the pattern recognition. Problem algorithms of pattern recognition including the ones worked out by the representatives of this scientific school in the Institute of Mathematics and Mechanics of the UrD RAS proved their high effectiveness in a great number of practical task solutions. The given issue is carried out within the scope of the interdisciplinary programme of the UrD RAS ‘The historical dynamics of Russia: factors, models, predictions’ with the participation of the Urals Institute of Economics, Management and Law.

Как правило, когда говорят о прогнозировании поведения какого-либо объекта или процесса, речь чаще всего идет о выборе одного из нескольких альтернативных сценариев развития: будет ли к определенному моменту времени курс какой-либо денежной единицы расти или падать, увеличится ли сбор налогов при изменении ставки налогообложения и т.д.

При этом обычно соответствующие уп-

равляющие воздействия либо четко оговариваются («что будет, если ...»), либо неявным образом подразумевается, что условия, в которых происходит развертывание во времени прогнозируемого процесса, остаются до определенной степени неизменными или изменяются по тем же законам, что и прежде. Такой прогноз мы будем называть «качественным» в отличие от ситуации, когда необходимо определить значение опре-

ОБРАЗОВАНИЕ

деленного количественного показателя в определенный момент времени в определенных условиях.

Итак, имеется конечный набор возможных сценариев развития какой-либо системы и необходимо определить, какой из них будет реализован при заданных условиях (управляющих воздействиях).

По сути дела, при такой постановке задачи прогнозирования речь идет о диагностике ситуаций, их классификации, что позволяет использовать достаточно развитый и доказавший свою эффективность на практике математический аппарат распознавания образов, или, более точно, дискриминантного анализа (ДА).

Задача ДА имеет следующий вид:

найти функцию /, удовлетворяющую системе неравенств

/(.т)>0 (дплвсеххЕ^М ^/(*)<(] (сплвсгх х^Щ,/<=Р

Здесь запись х е М означает: элемент х принадлежит множеству М; множество ^ -заранее выбранный класс функций /.

Функция/ решающая эту систему, называется разделяющей, или дискриминантой.

Данная система является линейной, если искомая функция / является линейной или аффинной (т.е. отличается от линейной на константу). Важным для практических приложений является то обстоятельство, что методы решения таких систем достаточно хорошо разработаны.

Если задача ДА имеет решение в классе линейных или аффинных разделяющих функций, множества М и N называются соответственно линейно или аффинно разделимыми. Геометрическая интерпретация этого факта прозрачна: в многомерном пространстве признаков (факторов) данные множества представителей образов лежат по разные стороны некоторой гиперплоскости.

Естественно, могут возникать задачи, в которых число образов больше двух. Однако такие задачи легко сводятся к случаю ДА с двумя образами.

Успех прогнозирования во многом определяется полным набором факторов, влияющих на поведение исследуемого объекта. В приведенных выше формулировках пространство факторов считалось фиксированным, хотя на самом деле поиск минимального набора информативных признаков является одним из важнейших самостоятельных этапов решения задачи распознавания образов.

Полностью формализовать этот этап в настоящее время невозможно, да и, по-видимому, нет необходимости. Поиск информативных систем признаков опирается на содержательный смысл задачи, чаще всего оценкой информативности различных систем признаков в задачах распознавания образов служит конечный результат.

Вместе с тем и здесь возможно и необходимо использование некоторых формализаций. Рассмотрим некоторые из них.

Соберем все номера исходной системы признаков в множество

1= {1, 2, ..., п}.

Пусть набор J = {Л’Л’ - ’Л}' некоторая часть набора/, т.е. набор J содержит номера некоторой подсистемы исходной системы признаков.

Обозначим

Если множества M и N являются аффин-но разделимыми, возникает задача нахождения минимальной системы J признаков, сохраняющей аффинную разделимость, т.е. задача

min { |J|: множества M (J), N (J) аффинно разделимы}.

Здесь |J| - число признаков в системе J, (J), (J) - проекции исходных обучающих множеств в подпространство меньшей размерности, определяемое только признаками из J.

Возможны и другие формализации задачи поиска информативных систем призна-

ВЕСТНИК УРАЛЬСКОГО ИНСТИТУТА ЭКОНОМИКИ, УПРАВЛЕНИЯ И ПРАВА

125

О МЕТОДАХ ПРОГНОЗИРОВАНИЯ, ОСНОВАННЫХ НА РЕШЕНИИ ЗАДАЧ РАСПОЗНАВАНИЯ ОБРАЗОВ

Смирнов А.И

ков. Если имеется критерий затрат на измерение признаков, то естественно искать подсистему признаков, с которой связаны наименьшие затраты при заданном качестве решения задачи дискриминантного анализа.

Одним из критериев качества может служить, как и выше, сохранение аффинной разделимости множеств. При таком подходе все признаки упорядочиваются в зависимости от их "вклада" в разделимость множеств. Поэтому абсолютные величины коэффициентов разделяющей функции также отражают информативность признака в таком понимании.

Заметим, что понятие информативности признака не абсолютно, оно зависит от решаемой задачи.

Возможна также следующая постановка задачи.

Определим расстояние между множествами А и В в пространстве Я ^следующим образом:

Тогда задача поиска информативных систем признаков может быть сформулирована, например, следующим образом:

найти такой набор / с I, содержащий к признаков, что величина расстояния

дИЛЧО).

между множествами М(Т), N(1) является максимальной по всем подсистемам из к признаков.

Методы решения задач ДА и поиска информативных подсистем признаков реализованы в пакете прикладных программ КВАЗАР в Институте математики и механики Уральского отделения РАН.

i Надоели баннеры? Вы всегда можете отключить рекламу.