УДК 681.513 А.В. Лапко, В.А. Лапко, Г.И. Цугленок, А.Н. Капустин
ГИБРИДНЫЕ СИСТЕМЫ РАСПОЗНАВАНИЯ ОБРАЗОВ В ЗАДАЧЕ УПРАВЛЕНИЯ СОСТОЯНИЕМ ХРАНИЛИЩА СЕЛЬСКОХОЗЯЙСТВЕННОЙ ПРОДУКЦИИ*
С позиций принципов имитационного моделирования рассматриваются задачи управления состоянием хранилища сельскохозяйственной продукции. Для её решения разработаны гибридные системы распознавания образов, основанные на последовательных процедурах формирования решений и методах коллективного оценивания. Их применение обеспечивает эффективное использование информации обучающих выборок и априорных сведений о виде решающих функций. Особое внимание уделяется рандомизированному методу идентификации непараметрических алгоритмов классификации.
1. Постановка задачи
Состояние хранилища определяется набором признаков * = (ху , V = 1, к), отражающих, например,
температуру, влажность внутренних помещений и внешней среды, уровень загруженности объекта исследования сельскохозяйственной продукции. Требуемые состояния хранилища обеспечиваются системой вентиляторов и обогревательного оборудования, множество режимов функционирования которых является конечным Rj , } = 1, М .
Пусть имеется информация V = (х1, а(хг), I = 1, п), характеризующая выбор а(хг) оператором хранилища того или иного режима системы вентиляции из множества Rj , j = 1, М в условиях X. Подобные сведения в дальнейшем будем называть обучающей выборкой, а а(хг) - «указанием учителя».
Каждому режиму функционирования системы вентиляции Rj в пространстве признаков х соответствует область (класс) ^ j, которая характеризуется плотностью вероятности pj (х), j = 1, М .
Тогда проблема автоматизированного управления состоянием хранилища сельскохозяйственной продукции сводится к выбору в условиях X конкретного режима функционирования системы вентиляции Rj в
соответствии с решающим правилом:
т(х): в условиях х выбрать режим Rj , если Pj pj (х) = тах Рг рх (х),
г=1, М
где Pj - априорная вероятность выбора режима Rj , j = 1, М .
Данная задача допускает эффективное решение на основании информации обучающей выборки в рамках теории распознавания образов [1] с использованием принципов коллективного оценивания и гибридного моделирования.
Обязательным условием синтеза традиционных моделей коллективного типа является наличие конечного множества решающих правил, каждое из которых имеет самостоятельное значение. Тогда коллектив моделей, например, с позиций «средневзвешенного» преобразования либо оценивания областей их компетентности, аккумулирует преимущества составляющих коллектив решающих правил.
Методика построения линейных непараметрических моделей коллективного типа в задачах восстановления стохастических зависимостей и распознавания образов впервые была предложена в работах [2-3]. Их применение позволяет более полно, по сравнению с традиционными непараметрическими решающими правилами, использовать информацию обучающих выборок на основе управляемого сочетания преимуществ параметрических и локальных аппроксимаций.
* Работа выполнена при поддержке грантов фонда «Научный потенциал» и Президента РФ № НШ-3428.2006.9.
2. Непараметрические алгоритмы коллективного типа
Принципы коллективного оценивания находят широкое распространение на современном этапе развития теории обучающихся систем, когда возникла потребность обобщения разнотипных методов с целью получения интегрированных знаний.
Структуру изучаемого класса систем распознавания образов составляет множество упрощенных параметрических аппроксимаций решающей функции, каждая из которых строится относительно некоторой «опорной» ситуации обучающей выборки. Объединение упрощенных аппроксимаций в коллектив решающих функций реализуется с помощью непараметрической оценки оператора условного математического ожидания относительно «опорной» ситуации. При формировании решения участвуют упрощенные аппроксимации решающих функций с весами, определяемыми ядерной мерой близости между контрольной и «опорными» ситуациями.
Пусть V = (х1, а(хг), I = 1,п) обучающая выборка, составленная из признаков
х1 = (х1у , V = 1, к) классифицируемых объектов и «указаний учителя» а (хг) об их принадлежности к одному, например, из двух классов.
Следуя методике синтеза коллективов решающих правил, построим семейство линейных уравнений
разделяющих поверхностей ф1 ^ (х,а1), I е 10 между классами. Параметры а1 каждой упрощённой ап-
проксимации ф12 (х,а1) искомого уравнения разделяющей поверхности /12 (х) находятся с учётом её
прохождения через опорную то ошибки распознавания образов
прохождения через опорную точку х1, 1 е 10, т.е. ф1 2 (х,а1) = 0, и условия минимума эмпирической
р(а1 )=-Е 1(а(х-7’) а(х])), (1)
п. =1
где
Ма1х' ) а1х
1(а(4 а(х' ))=.М®
[0, апёе а(х )=а(х-1).
Оценки а(х^) «указаний учителя» о принадлежности ситуации х. формируются с помощью решающего правила:
. х] е П1,если р12(х],а1) < 0, т1 (х]):. . , . (2)
х] е П2,если р\2(х],а1) > 0,
которые сопоставляются в (1) с данными обучающей выборки (х^, а(х.) . = 1, п).
На основе полученной информации (р12 (х,а1), х1 ,1 е 10) сформируем непараметрический коллектив упрощённых аппроксимаций уравнения разделяющей поверхности /12 (х) в двуальтернативной задаче распознавания образов:
-1
к
/12 (х) = N П ^ Е Р12( х, а) ПФ
V V=1 у
^ Л
Xv - Xv
(3)
г'е/ 0 V=1
где Ф() - ядерные функции, удовлетворяющие условиям положительности, симметричности, нормированности и имеют конечные центральные моменты [4]; N - количество упрощённых аппроксимаций (элементов множества 10).
Отличие (3) от традиционной непараметрической оценки байесовской разделяющей поверхности заключается в замене «указаний учителя» а(х1) на упрощенные решающие функции р^(х,а1), 1 е 10. Тогда обобщенное решающее правило классификации запишется в виде:
- ( ^ \ х еП1 , если /12 (х) < 0,
т12(х): 1 О 7 1 \ п (4)
х е П2, если /12 (х) > 0.
Для многоальтернативной задачи распознавания образов рекомендуется использовать метод дихотомии [5].
Формирование семейства упрощённых аппроксимаций реализуется с помощью итерационной процедуры последовательного синтеза непараметрической оценки решающей функции коллективного типа (3).
Обозначим через /^ (х) - непараметрический коллектив, построенный на основе 5 упрощённых аппроксимаций уравнения разделяющей поверхности, а т^ (х) - соответствующее ему решающее правило. В качестве новой опорной точки х5+1, (5 + 1)е 10 при построении упрощённой аппроксимации
5 I 1 5 I 1
Р12 (х,а ) принимается точка их исходной обучающей выборки, в которой решающее правило
т12 (х) допускает ошибку.
Дополнительно эффективность непараметрического коллектива классификации (4) можно повысить за счёт использования оценок р1 вероятностей ошибок типа (1) упрощённых параметрических решающих
функций р12 (х, а1).
В этом случае модификация непараметрического уравнения разделяющей поверхности (3) примет
вид
-1
/12 (х) = N Ср П Cv Е р12(х, а1) ПФ
к
V V=1 у
г'е/ 0 V=1
XV - XV CV
V у у
Ф
0 - р
Ср
V р у
3. Нелинейные непараметрические коллективы решающих правил
С позиции последовательных процедур принятия решений и принципов коллективного оценивания разработаны статистические модели распознавания образов, представляющие собой семейство частных решающих функций, организация которых в нелинейном решающем правиле осуществляется с помощью методов непараметрической статистики. Частные решающие функции формируются на основе однородных частей обучающей выборки, которые удовлетворяют одному или нескольким требованиям: наличие однотипных признаков, пропусков данных, возможностью декомпозиции исходных признаков на группы в соответствии со спецификой решаемой задачи. При интеграции локальных решающих функций используются непараметрические оценки оптимальных байесовских решающих правил.
Рассмотрим методику построения нелинейного непараметрического коллектива на примере двуальтернативной задачи распознавания образов в пространстве непрерывных признаков.
Пусть V = (хг , а(хг), г = 1, п) - обучающая выборка объёма п, составленная из значений признаков х1 = (х1, х2,..., хк) классифицируемых объектов и соответствующих «указаний учителя» об их принадлежности к одному из двух классов:
/ л I-1, если хг е П,, а(хг ) = 1
[ 1, если хг е П2 .
Причём отношение «размерность/объём выборки» соизмеримо с единицей.
Условные плотности вероятности распределения значений признаков х в области определения классов неизвестны.
Идея предлагаемого подхода при решении задачи распознавания образов в данных условиях состоит в выполнении следующих действий:
1. В соответствии с особенностями задачи классификации сформировать наборы признаков (х(г), г = ЬТ) и на этой основе осуществить декомпозицию исходной выборки V = (х1, а(хг), I = 1, п)
на однородные части V (г) = (хг (г), а (х‘ (г)) , I = 1, п), г = 1, Т.
2. По полученным данным построить решающие правила:
[хе а1 , если /12(х(г ))^ °’
[х е а 2, если /12 (х(г)) > 0, г = 1, Т.
В качестве оценок частных решающих функций /12 (х(г)) между классами в пространстве признаков (г) = (ху , V е 1г) используются непараметрические
Шг (Xі
(х(г )) :•
(5)
XI
статистики:
/12 (х(^ )) =
- -1 / \ ( і Л
п П Су п 2 ^(х і)п ф Ху - Ху
_ УЄІ{ _ і=1 ує^ 1 Су )
г = 1, Т.
(6)
Оптимизация частных решающих правил (5) по коэффициентам размытости ядерных функций cv , V е 1г осуществляется в режиме «скользящего экзамена» из условия минимума статистической оценки вероятности ошибки распознавания образов типа (1).
3. Используя непараметрические оценки решающих функций (6), сформировать обучающую выборку
(/12 X (1))• /12 У (2)). •••. /12 X (Т)). а(х‘'), I = Т7П)
и построить решающее правило в пространстве значений /12 (х(г)), г = 1, Т,
' х е а1, если Рп (/12 (х(г )))< 0,
т( /12(х(г))): ■
[ х е а 2 , если Р12 (/12 (х(г )))> 0, где непараметрическая оценка обобщённой решающей функции между классами имеет вид
Р12(/12(х(г))):
(7)
" Т " -12 ( і) Г /12 (х(г))-/12 (хі (г))
п П Су 2 а(х і )ПФ
у=1 і=1 у=1 V СУ У
(8)
Предлагаемый алгоритм классификации обеспечивает не только эффективное решение задач распознавания образов в условиях малых выборок, но и позволяет учитывать априорные сведения о виде частных решающих функций.
4. Гибридные системы распознавания образов
При решении задач распознавания образов различают два типа исходной информации: априорные сведения Р(х,а) о виде уравнения разделяющей поверхности /(х) и обучающая выборка
V = (хг, а(х1), I = 1,п), составленная из значений признаков х1 классифицируемых объектов и соответствующих им «указаний учителя» а(х1). Известные подходы к синтезу решающего правила классификации ориентированы в основном на определенный тип исходных данных, что при отличающихся априорных условиях приводит к снижению их эффективности.
Для наиболее полного использования априорной информации предлагаются гибридные модели распознавания образов.
Пусть при решении двуальтернативной задачи распознавания образов кроме обучающей выборки
V = (х1, а(х1), I = 1, п) имеются априорные сведения х, а) о виде уравнения разделяющей поверхности /12 (х) между классами а^ а2 в пространстве хе . Знание х, а) предполагает наличие решающего правила классификации
т
¥ .
12 •
[х е аь если ¥12 (х, а) < 0,
(9)
х е а 2, если ¥12 (х, а) > 0, по тем или иным причинам не удовлетворяющего исследователя.
Для эффективного использования априорной информации (¥12 (х, а), V) воспользуемся принципами гибридного моделирования, которые обеспечивают сочетание в обобщенном решающем правиле классификации преимущества параметрических и локальных методов аппроксимации [6].
Построение гибридного алгоритма распознавания образов предполагает выполнение следующих действий:
1. Определить (либо уточнить) параметры а уравнения разделяющей поверхности ¥12 (х, а) решающего правила (9) из условия минимума эмпирической ошибки распознавания образов.
2. По результатам вычислительного эксперимента сформировать выборку расхождений
Vl =(х1, д(х1), I = 1, п) между «решениями» а(х1) правила (9) и «указаниями учителя» и(х1) из обучающей выборки V. При этом значения функции расхождений
0, если а(х1) = а(х1), д(х1) = < ¥12 (х1, а) + Л, если а(х1) = -1, а в(х1) = 1,
-(¥12 (х1, а) + Л), если а(х1) = 1, а а(х1) = -1.
Таким образом, при наличии ошибки функция расхождения принимает значение обратное по знаку уравнения разделяющей поверхности ¥12 (х, а) и превышает его на величину параметра Л. Например,
если ситуация х1 принадлежит второму классу (а(х1) = 1), а в соответствии с решающим правилом (9)
х е а, т.е. ¥12 (х1, а) < 0, то значение д(х1) = ¥12 (х1, а) + Л.
3. Осуществить синтез непараметрической оценки функции расхождения
X д( х1 )в| (х)
д( х)
1=1
к
(
---------------, в г- (х) = ПФ
X в ,• (х) У=1
ху - ху
Л
(10)
г=1
4. Построить гибридный алгоритм классификации
х е ^1, если ]12 (х) < 0,
т12(х)•
хе а2, если /12 (х)(х) > 0, /12 (х) = ¥12 (х, а) + д(х).
(11)
_ (12) Оптимизация алгоритма (11) по параметрам размытости су, V = 1, к ядерных функций Ф(-) и Л осуществляется из условия минимума статистической оценки ошибки распознавания образов.
5. Модификация гибридного алгоритма классификации
Будем полагать, что имеется алгоритм распознавания образов т^ (х(1)) , принимающий в соответствии со знаком уравнения разделяющей поверхности ¥12 (х(1), а1) решение о принадлежности ситуации
х(1) е Як1 к одному из двух классов а1 , а 2. Пусть в результате экспериментальных работ получена до-
7 О
полнительная информация о признаках х(2)е Як классифицируемых объектов и сформирована обучающая выборка V = (хг (1), х1 (2), а(х1), I = 1, п), где х1 = (хг (1), х1 (2))= ^ , V = 1, к), к = к1 + к2.
Следуя предложенной методике синтеза гибридных алгоритмов распознавания образов, определим функцию расхождения в пространстве признаков х(2)
с
V
_ X ч1 (х(2))р- (х(2)) к (
ч(х(2)) = ^-----------------, р- (х(2)) = П Ф
X в-(х(2)) у=к1+1
Ху - Ху
г=1
С
V
где
^12 (х1 (1), а1) + Л, если х1 (1) е П2, а ^12 (хг (1), а1 )< 0,
Ч1 (х(2)) = < — (^12 (х1 (1), а1) + л) если х1 (1) е &1, а (хг (1), а1 )> 0,
0, если х1 (1) классифицируется безошибочно.
Тогда модифицированный алгоритм классификации представляется в виде
- . | х еП!, апёе ^(х) < 0, ....
т12(х): < о Л (13)
[ х е П 2 , апёе 12 (х) > 0,
где _ _
^12 (х) = Р12 (х(1), а1)+ д(х(2)).
В отличие от рассмотренного ранее гибридного алгоритма распознавания образов (11), в решающем правиле (13) априорные сведения Р (•) о виде уравнения разделяющей поверхности и функция расхождения ч(-) определены в разных пространствах признаков. Ближайшим аналогом предложенного подхода является метод восстановления стохастических зависимостей с учётом их частичного описания [7].
6. Непараметрические алгоритмы распознавания образов и их коллективы, основанные на рандомизированном методе оптимизации
Существующий парадокс традиционных методов идентификации стохастических моделей состоит в сопоставлении конечной случайной выборке наблюдений переменных изучаемых объектов конкретного набора параметров модели, оптимальных в некотором смысле. Предлагается рандомизированный подход определения коэффициентов размытости непараметрических алгоритмов распознавания образов, основанных на ядерной оценке плотности вероятности типа Розенблатта - Парзена.
Впервые методика случайного выбора коэффициентов размытости ядерных функций при синтезе непараметрической оценки плотности вероятности была предложена Т. Вагнером [8].
В работе [9] на основе анализа асимптотических свойств непараметрической оценки р(х) плотности вероятности р(х) показана возможность нахождения рационального закона распределения р(с) V с е (0, к] коэффициентов размытости с в классе степенных функций. Используем полученные результаты при синтезе непараметрических алгоритмов распознавания образов в условиях случайных значений коэффициентов размытости ядерных функций.
Непараметрический алгоритм классификации при случайных значениях коэффициентах размытости. Определим коэффициенты размытости ядерных функций в виде су = с av, где ау -
оценки среднеквадратических отклонений параметров ху , V = 1, к классифицируемых объектов, а с -случайная величина с плотностью вероятности
Рк(с) = аС , а = ^+-1 V се(0, к]. к+1
Примем процедуру формирования последовательности параметров с
1/
с = к £/г+1 (14)
на основании случайной величины £е [0; 1] с равномерным законом распределения. Она может быть получена в результате решения уравнения
£ = | рь (и) du .
0
Сформируем на основании процедуры (14) последовательность коэффициентов размытости и сопоставим случайным образом её элементам ядерные функции в непараметрических оценках плотностей вероятности байесовского уравнения разделяющей поверхности, соответствующего критерию максимума апостериорной вероятности [5]. Тогда непараметрическая оценка уравнения разделяющей поверхности со случайными коэффициентами размытости ядерных функций для двуальтернативной задачи распознавания образов запишется в виде
( I ^ -ф|——-
к ' 1 1 \ „ I
~ / \ 1 п I Л к 1
/12 (-) = —к-------- X о(х1 )п~Ф
п Па, г'=1 "=1с
V с У
~ ( \ Л2\л/~и’ ,,г-\
(х): \ ~ (15)
х е П 2 , если /12 (х) > 0
,=1
Оптимизация непараметрического алгоритма распознавания образов
х е П15 если /12 (х) < 0,
12 (х ) '<
[х еП 2, если J12
по правой границе к области определения плотности вероятности рк (с) осуществляется из условия минимума эмпирической ошибки классификации методом «скользящего экзамена».
В многоальтернативной задаче распознавания образов при наличии классов П у , } = 1, д классификация объектов осуществляется в соответствии с методом дихотомии на основе последовательности решающих правил типа (15) либо используется непараметрический алгоритм
т(х): хеПу ,если Ру ру(х)= тах Рг рг(х),
г=1, д
где рг (х) - ядерные оценки плотностей вероятности хе Пг со случайными значениями коэффициентов
размытости, а Рг - оценки априорных вероятностей появления ситуации х в классах Пг, г = 1, д.
Коллектив непараметрических алгоритмов классификации. Используем принципы синтеза коллектива решающих правил для повышения эффективности непараметрических алгоритмов распознавания образов в условиях случайных значений коэффициентов размытости ядерных функций. Пусть
т{2 (х), у = 1, М - непараметрические решающие правила для двуальтернативной задачи распознавания образов, которые построены по одной и той же обучающей выборке V = (х1, а(хг), I = 1, п) в соответствии с изложенной выше методикой. Решающие правила характеризуются одним и тем же оптимальным параметром к правой границы области определения плотности вероятности рк (с) коэффициента размытости, но разными их случайными последовательностями (с1у , I = 1, п), у = 1, М .
Воспользуемся одним из известных подходов коллективного оценивания, например, методом «голосования» и построим решающее правило:
~ , ч ГхеП1, если М1/М > М2/М,
т12 (х): \ , (16)
[хе П2, если М2/М > Мх/М ,
где Му, у = 1,2 - число «решений», которые принимают члены коллектива о принадлежности объекта с набором признаков х в пользу у -го класса.
В многоальтернативной постановке задачи распознавания образов каждый член коллектива
гп^2(х), у = 1, М использует решающее привило типа (16). Окончательный вывод, например, хе Пг,
принимается, если частота решений членов коллектива в пользу г -го класса максимальная.
Применение коллектива (16) позволяет повысить достоверность принимаемых решений в условиях случайных значений коэффициентов размытости непараметрических алгоритмов. Его эффективность, по сравнению с традиционным непараметрическим решающим правилом и их коллективом, может быть обос-
нована использованием переменных ядерных мер близости между точками в пространстве признаков классифицируемых объектов, которые определяются законом распределения коэффициентов размытости. При этом принципы коллективного оценивания позволяют придать переменным мерам близости более устойчивый характер.
Выводы
Обоснована возможность решения задачи управления состоянием хранилища сельскохозяйственной продукции на основе методов распознавания образов.
С позиций принципов коллективного оценивания, последовательных процедур формирования решений и методов гибридного моделирования разработан новый класс алгоритмов распознавания образов, обеспечивающий эффективное использование априорной информации. Их научная значимость состоит в обобщении традиционных статистических алгоритмов классификации, основанных на использовании оценок плотности вероятности типа Розенблатта-Парзена. Нелинейные непараметрические алгоритмы распознавания образов являются эффективным средством решения задач классификации в условиях малых обучающих выборок. Гибридные алгоритмы распознавания образов обеспечивают эффективное использование априорных сведений о виде уравнения разделяющей поверхности и информации обучающих выборок. Их использование позволяет решить проблему преемственности результатов научных исследований при наличии возможности контроля дополнительных признаков классифицируемых объектов. Рандомизированный метод идентификации непараметрических алгоритмов распознавания образов, основанный на случайном характере значений коэффициентов размытости ядерных функций, позволяет формировать эффективные коллективы решающих правил.
Полученные научные результаты создают теоретическую основу их обобщения на новый класс непараметрических коллективов в задачах распознавания образов, обеспечивающих эффективное решение задачи автоматизированного управления состоянием хранилища сельскохозяйственной продукции в условиях неполной информации.
Литература
1. Васильев, В.И. Имитационное управление неопределёнными объектами / В.И. Васильев, В.В. Конова-ленко, Ю.И. Горелов. - Киев: Наукова думка, 1989. - 216 с.
2. Lapko, V.A. Nonparametric Models of Pattern Recognition of Collective Type / V.A. Lapko // Pattern recognition and image analysis. - 2002. - Vol. 12. - №4. - P. 354-361.
3. Лапко, В.А. Непараметрические коллективы решающих правил / В.А. Лапко. - Новосибирск: Наука, 2002.
- 168 с.
4. Епанечников, В.А. Непараметрическая оценка многомерной плотности вероятности / В.А. Епанечников // Теория вероятности и ее применения. - 1969. - Т.14. - Вып. 1. - С. 156-161.
5. Непараметрические системы классификации / А.В. Лапко, В.А. Лапко, М.И. Соколов [и др.]. - Новоси-
бирск: Наука, 2000. - 240 с.
6. Лапко, А.В. Гибридные модели стохастических зависимостей / А.В. Лапко, В.А. Лапко // Автометрия. -2002. - №5. - С. 38-48.
7. Хардле, В. Прикладная непараметрическая регрессия / В. Хардле. - М.: Мир, 1993. - 349 с.
8. Деврой, Л. Непараметрическое оценивание плотности (L^ -подход) / Л. Деврой, Л. Дьерди. - М.: Мир,
1988. - 407 с.
9. Лапко, А.В. Рандомизированный метод оптимизации непараметрических алгоритмов обработки информации / А.В. Лапко, В.А. Лапко, Г.И. Цугленок // Вестн. КрасГАУ. - 2006. - №14. - С. 84-91.
♦