Научная статья на тему 'Конструктивизация моделей классификации конечных объектов'

Конструктивизация моделей классификации конечных объектов Текст научной статьи по специальности «Математика»

CC BY
2155
131
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
РАЗРЕШИМОСТЬ / ВЫЧИСЛИМОСТЬ / ПРЕДИКАТ / МОДЕЛЬ / ОПЕРАТОР МИНИМИЗАЦИИ / СПЕКТР СТРУКТУРНЫХ СВЯЗЕЙ / СИМУЛЬТАННАЯ МОДЕЛЬ / НУМЕРАЦИЯ / РЕКУРСИЯ / РЕДУКЦИЯ / КОНСТРУКТИВНЫЙ ОБЪЕКТ / СИГНАТУРА

Аннотация научной статьи по математике, автор научной работы — Калядин Николай Иванович

Рассмотрены проблемы разрешимости и вычислимости в конструктивизации моделей классификации конечных объектов. Сформулированные критерии разрешимости позволяют создать эффективные алгоритмы для решения традиционно трудных реальных задач классификации.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Constructivisation of the models of classification of finite objects

We consider the problems of resolvability and computability of the models of classification of finite objects. The Churchs thesis is used in our approach to the problem of classification of finite objects. The criteria of resolvability obtained determine the conditions of adequate description of finite objects as well as the effective computation of the predicates of classification.

Текст научной работы на тему «Конструктивизация моделей классификации конечных объектов»

Известия Института математики и информатики. Ижевск. 2007. №1(38)

Светлой памяти Николая Викторовича Азбелева

УДК 519.712:510.25:510.67 ( Н. И. Калядин

КОНСТРУКТИВИЗАЦИЯ МОДЕЛЕЙ КЛАССИФИКАЦИИ КОНЕЧНЫХ ОБЪЕКТОВ1

Ключевые слова: разрешимость, вычислимость, предикат, модель, оператор минимизации, спектр структурных связей, симультанная модель, нумерация, рекурсия, редукция, конструктивный объект, сигнатура.

Abstract. We consider the problems of resolvability and computability of the models of classification of finite objects. The Church's thesis is used in our approach to the problem of classification of finite objects. The criteria of resolvability obtained determine the conditions of adequate description of finite objects as well as the effective computation of the predicates of classification.

Оглавление

Обозначения........................................................................................6

Введение............................................................................................7

Глава 1. Разрешимость конструктивных моделей классификации..................11

§ 1. Предварительные сведения................................................................11

1.1. Предпосылки к конструктивизации..............................................11

1.2. Экзистенциальность проблем классификации образов ........................17

§ 2. Алгоритмический подход к проблемам классификации ..............................19

2.1. Конструктивизация ................................................................19

2.2. Нумерованные совокупности конечных объектов ..............................27

§ 3. Теоремы существования и единственности в системах принятия решений..........32

3.1. Разрешимость моделей игровых решающих правил............................32

3.2. Условия существования симультанной модели классификации ..............35

§ 4. Классификация множеств по классам эквивалентности..............................39

4.1. О проблеме классификации множеств по классам эквивалентности..........39

4.2. Вычисление предиката равенства множеств ....................................40

4.3. Параллельное вычисление системы предикатов равенства множеств . . . . 41

4.4. Необходимые и достаточные условия симультанности в принятии решений 43

4.5. Канторовские алгебры ..............................................................46

4.6. Канторовская решетка ..............................................................49

4.7. О некоторых классах разбиения конечных семейств конечных множеств . 51

4.8. Построение иерархий семейств конечных множеств натуральных чисел . . 57 § 5. Эталонирование и идентификация конечных множеств..............................58

5.1. Теорема о сильно слипающихся множествах....................................58

5.2. Идентификация конечных множеств ............................................60

5.3. Поиск информативных значений признаков....................................60

Глава 2. Вычислимость конструктивных моделей классификации ................62

§ 6. К задаче классификации конечных множеств натуральных чисел ..................62

1 Конструктивизация моделей, образов, конструктивный объект и т.п. вводятся согласно сложившимся основным понятиям конструктивной математики [115], в частности конструктивный (конечный) объект есть образ, описываемый конечным объемом информации [173].

6.1. Два подхода к классификации конечных множеств............................62

6.2. О продолжении некоторых сюръективных отображений......................63

6.3. Кодирование классифицируемых множеств......................................65

§ 7. Модели принятия решений, работающие в условиях неопределенности............67

7.1. Модель логического решающего правила........................................67

7.2. Модель голосования с отношениями толерантности............................70

7.3. Модель коллективного голосования..............................................70

7.4. Модель сильного голосования ....................................................71

7.5. Модель Гурвица (минимаксный критерий классификации) ..................71

7.6. Модель Вальда......................................................................71

7.7. Модель Лапласа....................................................................72

7.8. Модель Сэвиджа....................................................................72

7.9. Модель минимума среднеквадратического отклонения........................72

7.10. Модель точек с окрестностями....................................................73

7.11. Конечная модель кластеризации с порождением отношений-образов .... 73 § 8. Игровые решающие правила для отношений ..........................................76

8.1. Модели игровых решающих правил для отношений............................76

8.2. Симультанный метод распознавания отношений ................................79

8.3. О нумерации в спектрах отношений ............................................79

8.4. Инвариантное покрытие класса ..................................................80

§ 9. Оптимизация игровых решающих правил ..............................................83

9.1. Обоснование оптимизации..........................................................84

9.2. Постановка задачи..................................................................84

9.3. Предполагаемые подходы ..........................................................84

9.4. Учет альтернативных частных решений ........................................85

9.5. Минимизация эталонов в предикатах классификации ..........................86

§ 10. Симультанный подход в принятии решений ............................................87

10.1. Симультанность при идентификации ............................................88

10.2. Условия существования обобщенной симультанной модели распознавания . 88

10.3. Обобщенная симультанная модель распознавания изображений ..............91

10.4. Нейронные сети симультанной схемы принятия решений......................91

§ 11. Вычислимость в задачах распознавания булевых функций ..........................94

11.1. Существование компактного алгоритма..........................................94

11.2. Спектр структурных связей........................................................99

11.3. Изоморфизм спектров структурных связей...................106

11.4. Модификация формульного описания булевых функций...........111

11.5. Построение фильтров при вычислении булевых функций ..........112

11.6. Оценки сложности вычислений булевых функций...............114

Глава 3. Конструктивизация при классификации конечных объектов......117

§ 12. Пролонгация языков ...................................117

12.1. Распознавание образов и конечные автоматы .................117

12.2. Об общности языков конечных автоматов и распознавания образов .... 117 § 13. Дискретные функции Уолша...............................119

13.1. Аналитические методы расчета Т- и Х-спектров................119

13.2. Дискретные функции Уолша при произвольном конечном числе точек

определения ......................................................................121

13.3. Алгоритм быстрого двумерного преобразования Уолша-Адамара......125

13.4. Связь адамаровского упорядочивания функций Уолша с секвентным и

диадным......................................127

§ 14. Представимость объектов в конечных моделях ........................................145

14.1. Конечные модели и их применение в построении классификатора отношений последовательно-параллельного действия ................................145

14.2. Минимизация предикатных форм в конечных моделях ........................152

§ 15. Примеры реализуемости этапов конструктивизации при классификации (распознавании) конечных объектов ..........................................................159

15.1. Формализованное определение основных операций над изображениями . . 159

15.2. Представление точечных изображений предикатами Радемахера ............162

15.3. Описание текстурных изображений с помощью предикатов Радемахера . . 165

15.4. Классификация текстур методом коллективного голосования ................166

15.5. О минимальном разбиении растрового изображения ..........................168

15.6. Алгоритм параллельной трассировки многоконтактных цепей ..............171

15.7. Оптимизация некоторых этапов автоматизированного проектирования пе-

чатных плат ...................................172

15.8. Алгоритм таксономии по связным областям..................174

15.9. Классификатор натуральных чисел на базе характеристических функций 174

15.10.Нелинейные персептроны.............................175

Глава 4. Прикладные результаты..............................182

§ 16. Классификация (распознавание) текстурных изображений.............182

16.1. Математическое обеспечение анализа двумерных полей ...........182

16.2. Об одной модели классификации текстур на основе метода голосования с

отношениями толерантности ....................................................182

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

16.3. Таксономия по связным областям как задача построения признаков для

текстурных изображений ........................................................183

16.4. Обнаружение классификационных закономерностей методом альтерна-

тивных решающих правил ...........................186

16.5. Теоретико-игровой подход к классификации текстурных изображений . . . 190 § 17. Представление текстур для машинного анализа ...................195

17.1. Параметризация текстурных изображений...................195

17.2. Критерий текстурности фрагмента полутонового изображения.......196

17.3. Сегментация текстурных изображений.....................196

17.4. Представление двумерных дискретных изображений с помощью нумера-

ции в виде одноместного отношения ............................................197

17.5. Об одном методе распознавания текстурных изображений..........198

17.6. Алгоритмические и технические аспекты при автоматическом анализе тек-

стурных изображений..............................199

17.7. Комплекс автоматизированного дешифрирования крупномасштабных кос-

мических фотоснимков ..........................................................202

§ 18. Примеры из компьютеризации медицинских технологий ............................205

18.1. Алгебро-логические алгоритмы в распознавании, идентификации и клас-

сификации медицинских объектов.......................205

18.2. К вопросу построения медицинских экспертных систем ...........210

18.3. Единый методологический подход при алгоритмизации и построении экс-

пертных систем типа «норма-патология» в медицине ...........214

18.4. Применение спектрально-логического подхода в распознавании патологи-

ческих состояний сердечно-сосудистой системы ..............................216

18.5. Диагностика эпилепсии в интерактивном режиме с использованием ком-

пьютерной технологии ............................................................218

18.6. Статистический анализ медицинской информации по онкологическим за-

болеваниям ........................................................................219

18.7. Анализ сигнала ЭКГ в компьютерном мониторном комплексе........220

Выводы...............................................222

Список литературы.......................................223

Обозначения

, {1,] = 1,т) —информативные зоны 1т ^ {1, 2, ...,т}, 1t ^ {1, 2,^} —множества индексов / : 1т — 1t — классифицирующая функция

X — конечное подмножество множества всех натуральных чисел N ^ {0,1, 2,...} ^ : М — К — функция кодирования образов х конечным множеством из К [X = Хг] — предикат равенства множеств X — неизвестного, предъявленного для классификации (распознавания) и Хг — эталонного (известного)

[а € X] — предикат принадлежности элемента а множеству X а € Угт+1 — информативные элементы («идентификационные метки») д = Нтхт — логическая матрица

а = (х1, Х2,..., хп) — псевдосигнатура с характеристиками (х1, Х2,..., хп) множества X¿ Са : Ф — Ф — канторовская операция с псевдосигнатурой а С— канторовский образ множества X¿ М — основное исследуемое множество

— классы сложности с псевдосигнатурой а, г = 0,1, 2 £о — канторовская решетка 8г — классы разбиений (г = 0,1, 2)

Рг^) ^ X € N — предикат принадлежности неизвестного множества X классу эквивалентности N

Кг^) ^ (Ег П X) = 0 — вспомогательный предикат Ег — множество эталонных элементов

5 ^ {N1, N2,..., Nt} — множество классов эквивалентности

Ф — множество всех конечных подмножеств натурального ряда N

X ([X = X¿]) — характеристическая функция предиката равенства

Ь = { —, &, V, —, =, А, /, о} — множество ФАЛ из класса Р2

хп = (х1, ...,хп), хг € £2 = {0,1}, (г = 1, 2,.. .,п) — набор булевых переменных

Р(хп) — логическая (булевая) формула

/ (хп) — булевая функция

Р(хп) ^ /(хп) — алгоритм вычисления /(хп) по Р(хп)

дР — операция порядка р.,-Р 1(хп) — логическая формула длины I Кг — ядро формулы Р(хп) (элементарная операция)

I ь 1

{Кг} ^ I . I , где Ьи € £2, (V = 1, 2,..., 2п) — значения ядра

[ Ь2п ] (КГ) — ядро ранга г

Б (дР) — спектр структурных связей др между признаками хг € хп

) — спектр шириной I

С\ — адрес соответствующей ячейки памяти (Л = 1, 2, 3,...) Я = {ЯъЯ2, } — множество описаний образа А

С С {1, 2,...,^'} х {р1,р2, ...,Рч} — график связи между порядками {р1,р2, ...,Рч} и соответствующими операциями {д1, д2,..., дч} в ппф = Р1(хп)

Р?(хп) — ) — представление формулы Р^(хп) спектром ^)

7[Р1(жп)] — число пар скобок или отрицаний в суперпозиции I ранга (индекс связности) *Р^(хп) ^ х^дР1 хч-...хкдрхд...'др1 хч — модифицированная формульная запись ппф 'др — операция дч- € Ь\- порядка рч-(рч- = 0,1, 2,...; ] = 1, 2, 3, ...,1) ^ + ^ {1, 2, 3,...} — множество целых положительных чисел К — множество действительных чисел

<(к) — г -я дискретная функция Уолша, определенная в т точках, к = 0,1,...,т — 1; т е Z+

Введение

Разработка математической теории классификации или распознавания образов остается одной из центральных областей прикладной математики и кибернетики2.

Существующие подходы к проблемам классификации образов не дают первоочередного ответа на вопрос об их разрешимости. Вместе с тем доказательство разрешимости проблем классификации позволяет сформулировать концепцию конструктивизации исследуемых образов (конечных объектов) [37, 115] и определить рациональные подходы к решению многочисленных задач [39, 41, 52, 98, 117, 179].

Конструктивизация в первую очередь предполагает решение проблем разрешимости и вычислимости моделей классификации образов [35, 37, 142], которые на ранних этапах разработки и практики распознавания образов отодвигались на второй план [20, 31, 41].

Проблема разрешимости моделей классификации конечных объектов (в дальнейшем просто — проблема разрешимости) состоит в следующем: существует ли алгоритм, который по описанию на языке расширенного исчисления предикатов [129] устанавливает принадлежность исследуемого объекта к рассматриваемому множеству М или к одному из классов разбиения

к

^^ {м1,м2,...,мк}, м =и Мг.

г=1

Проблема вычислимости моделей классификации конечных объектов (в дальнейшем просто — проблема вычислимости) заключается в установлении эффективной процедуры, гарантирующей получение результатов вычислений соответствующих предикатов классификации объектов.

Определения разрешимости и вычислимости, рассматриваемые в данной работе, применимы к функциям и предикатам от натуральных чисел. Но это не является существенным ограничением, поскольку операции, включающие другие виды объектов, могут быть закодированы как операции с натуральными числами [109].

В общем случае проблемы вычислимости и разрешимости тесно связаны (см.: [109, с.30]): предикат Р(х) разрешим, если функция ср(х) вычислима; предикат Р(х) неразрешим, если функция Ср(х) невычислима, где Р(х = (х\,х2,... ,хп)) — п -местный предикат на натуральных числах; ср(х) — характеристическая функция:

Ср(х) =

1, если Р(х) — истинно, 0, если Р(х) — ложно.

Если для некоторого класса конструктивных моделей проблема вычислимости решена достаточно эффективно, то разрешимость моделей этого класса, как правило, получается в виде простого следствия [37]. С другой стороны, если установлена проблема разрешимости, то последующая эффективная вычислимость может быть достигнута известными конструктивными методами [115, 142].

Традиционное распознавание образов рассматривается как математическое моделирование слабо формализованных сложных задач. Методы и алгоритмы распознавания образов в значительной мере определяются конкретной физической природой распознаваемых объектов или явлений.

Если в известных работах понятия «распознавание», «классификация», «идентификация» подчас отождествляются, то в настоящей работе они четко разграничиваются на языке характеристических функций [85].

Пусть М — исходное (исследуемое) множество классифициремых (распознаваемых) образов х; К — множество конструктивных (конечных) объектов; р : М ^ К — функция кодирования классифицируемых (распознаваемых) образов х конечным множеством из К.

О ^ {Х1, Х2,..., Хт} — обучающая выборка — семейство множеств Хг, г € 1т, 1т ^ ^ {1, 2,... , т}, то есть набор известных реализаций (описаний) Хг классифицируемых (распознаваемых) образов х.

2В дальнейшем для простоты изложения будет использоваться один из устоявшихся терминов — классификация или распознавание.

Х — неизвестная реализация классифицируемого (распознаваемого) образа х.

5 ^ {N1, N2,..., N4} — разбиение обучающей выборки на классы (эталоны) Nj, ] €

I ^ {1, 2,... , ¿}.

/ : 3т — I — классифицирующая функция, закрепляющая номера г € 3т элементов обучающей выборки Хг € О за номерами эталонов — классов N7 € 5, ] €

Тогда целевые функции, известные как задачи распознавания, классификации и идентификации, определим через операции вычисления характеристических функций следующим образом.

1. Распознавание — операция вычисления характеристической функции принадлежности образа х множеству Х :

(Ух € М)[х € Х] = ( 1 если х € Х,

0, в противном случае.

2. Классификация — операция вычисления характеристической функции принадлежности неизвестной реализации Х одному из классов разбиения:

(УХ € О)[Х € N7] = ( 1, если Х € Nj, ^ € ^

0, в противном случае.

3. Идентификация — операция вычисления характеристической функции равенства множеств реализаций Х — неизвестной и Хг — известной для образа х :

(УХ € О)[Х = Хг]^1, если Х = г € ^

0, в противном случае.

Задачи классификации являются более общим случаем задач распознавания и идентификации. Поэтому в дальнейшем будут рассматриваться в основном задачи классификации конечных объектов. Но там, где необходимо подчеркнуть особенности именно задач распознавания или идентификации, будем переходить на использование соответствующих понятий.

Сделаем краткий обзор по главам основных идей и результатов.

Первая глава посвящена разрешимости конструктивных моделей классификации конечных объектов.

Предпосылками к конструктивизации являются известные задачи классификации некоторого множества допустимых объектов, заданных системой бинарных признаков. Алгоритмы классификации, основанные на модели вычисления оценок, являясь эвристическими, могут неточно классифицировать некоторые объекты из множества предметов или явлений, подлежащих классификации. Однако при введении некоторых дополнительных условий конструк-тивизации доказывается, что существует корректный алгоритм, не ошибающийся на заданном контрольном множестве объектов.

При классификации одной из первоначальных задач является формализация исходного описания образа и переход от физической или семантической модели к математической для последующего вычислительного эксперимента.

Показано, как сочетание геометрических и лингвистических установок при описании образов на языке расширенного исчисления предикатов в выбранном спектральном пространстве определяет экзистенциальность, то есть возможность анализа проблемы классификации на разрешимость [104].

С этой целью исходное множество исследуемых объектов из М редуцируется к множеству всех натуральных чисел N через отображение р : М — N. Пара (М, р) объявляется множеством конструктивных (конечных) объектов, если при этом р — разнозначное отображение, то пара (М, р) называется множеством сильно конструктивных объектов [9].

Введенные понятия конструктивных объектов обеспечивают дальнейшую формализацию на единой методологической основе — классе всех частично рекурсивных функций, совпадающих с классом всех частичных арифметических функций, допускающих эффективные вычисления [9].

Другим способом редукции к натуральным числам и арифметическим функциям является использование подходящей нумерации, то есть отображения V : N — 5, где 5 — произвольное (исследуемое) множество конечных объектов.

Изучение свойств нумераций семейств конечных объектов позволяет перенести проблему классификации из области натуральных чисел в область произвольных конечных объектов.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

В работе излагаются результаты исследований разрешимости алгоритмов классификации конструктивных объектов в моделях с частично рекурсивным основным множеством и сигнатурами решающих предикатов, допускающих многоальтернативность.

Конструктивизация основных понятий моделей классификации выполняется в рамках т -сводимости нумерованных семейств натуральных чисел к произвольному множеству конечных объектов классификации.

Доказанные критерии разрешимости на моделях классификации позволяют ответить на вопросы эффективной вычислимости конструктивных объектов с помощью подходящей нумерации.

При неразрешимости модели классификации т -сводимость предопределяет критерий регуляризации в смысле эффективной вычислимости для указания путей расширения свойств конструктивизируемых объектов или усиления рекурсивности алгоритмов классификации.

В случае индуцированного отношения порядка на моделях классификации удается показать с точностью до изоморфизма разбиение частично рекурсивных (рекурсивно перечислимых) основных множеств моделей.

Доказано, что проблема классификации конечных множеств по классам эквивалентности разрешима, когда число классов эквивалентности конечно, а каждый класс эквивалентности есть сильно рекурсивное множество.

Вторая глава посвящена проблеме вычислимости разрешимых моделей классификации конечных множеств: когда элементы множеств максимально различны и, наоборот, когда наблюдается сильное пересечение («сцепление») множеств.

В зависимости от «силы сцепления» множеств определяются возможные пути к построению различных по эффективности вычислений предикатов классификации.

Рассмотренные типовые модели принятия решений для различных конечных объектов (множеств, кортежей, отношений) допускают интеграцию в общую схему решателя, что позволяет в целом повысить надежность классификации объектов.

Введенные меры близости между эталонным и предъявленным описаниями конечного объекта определяют (при прочих равных условиях) оптимальный выбор моделей классификации.

Оптимальность выбора достигается с учетом критериев эффективности вычислений предикатов классификации:

1) компактность — минимальный объем одновременно хранимых промежуточных результатов (последовательное вычисление);

2) параллелизм — минимальное время вычислений (параллельное вычисление);

3) симультанность (однотактность) — субпараллелизм, то есть параллельное вычисление предиката равенства двух описаний (эталонного и предикатного) только по одному информативному элементу.

Последний критерий доказывает возможность существования обобщенной симультанной модели предельно быстрого принятия решений при классификации конечных объектов.

В результате поиска эффективных (в смысле представимости и вычислимости) языков описания конечных объектов при исследовании вычислимости предикатов классификации были раскрыты богатые возможности языка ФАЛ (функций алгебры логики или булевых функций).

Обнаруженные закономерности в спектре структурных связей между булевыми операторами позволяют конструктивно построить компактный алгоритм распознавания ФАЛ.

Полученные оценки сложности вычисления ФАЛ гарантируют реализацию классификаторов с заранее заданными вычислительными ресурсами.

Язык ФАЛ обеспечивает простое и экономичное функциональное и аппаратное моделирование структуры классификаторов.

Интерпретация полученных результатов вычислимости ФАЛ расширяет в общей проблеме конструктивизации область разрешимости предикатов классификации.

В третьей главе рассматривается конструктивизация при классификации (распознавании) конечных объектов.

Алгоритмы распознавания, как правило, имеют не самостоятельное значение, а реализуются в виде аппаратно-программных комплексов, являясь составными частями более сложных систем.

Пролонгация языков распознавания образов на языки теории конечных автоматов позволяет учесть, с одной стороны, особенности описаний исследуемых объектов, а с другой, требования к синтезу оптимальной структуры соответствующего распознающего автомата.

Одним из таких компромиссных языков являются дискретные функции Уолша, исследованные достаточно полно для аппроксимации сигналов на ЦВМ.

Дискретные функции Уолша расширяют возможности языковых средств при описании конечных объектов с последующей ориентацией на синтез соответствующих распознающих автоматов (классификаторов).

Предложенные методы минимизации описаний предикатных форм в конечных моделях обеспечивают выполнение одного из условий конструктивизации — реализуемость вычислимых моделей классификации.

Четвертая глава содержит прикладные результаты по автоматической классификации (распознаванию) наиболее динамичных и трудных для исследований объектов: текстурных изображений, функциональных состояний человека.

Выполненные объемные исследования на всех этапах конструктивизации моделей классификации текстур позволили создать на базе ЦВМ уникальный инструментарий — аппаратно-программный комплекс по дешифрированию тестурных изображений.

Приведенные реализации примеров из компьютерных медицинских технологий демонстрируют правильность этапов конструктивизации в решении каждой из трех основных проблем компьютеризации в медицине: диагностики, мониторинга, прогнозирования.

Благодарю всех соавторов исследований, указанных в совместных публикациях. Особую благодарность выражаю:

д. ф.-м. н., проф. В. П. Максимову за идею написания статьи и корректировку ее первоначального варианта;

к. ф.-м. н., доценту Т. С. Быковой за квалифицированное техническое редактирование рукописи;

студентке Т. Д. Ратановой за трудоемкий компьютерный набор и верстку; к. ф.-м. н., доценту А. А. Айзиковичу за помощь и поддержку при подготовке материалов исследований;

д. ф.-м. н., проф. Е. Л. Тонкову за продуктивное научное редактирование рукописи; рецензентам за нелегкий труд по чтению рукописи и высказанные критические замечания, способствовавшие ее улучшению.

Глава 1. Разрешимость конструктивных моделей классификации

§ 1. Предварительные сведения

Рассматриваются задачи классификации некоторого множества допустимых объектов, заданных системой бинарных признаков. Процедура классификации основана на модели вычисления оценок, в которой в качестве опорных множеств взяты тупиковые тесты таблицы обучения. Тестовые алгоритмы в последнее время успешно применялись в различных задачах распознавания и классификации [32], таких как задачи геологического прогнозирования, медицинской диагностики, в экономике и в ряде других областей. В то же время эти алгоритмы, относящиеся к классу эвристических, могут неточно классифицировать некоторые объекты из множества предметов или явлений, подлежащих классификации.

Показано, что при выполнении некоторых условий конструктивизации существует тестовый алгоритм, не допускающий ошибок на заданном контрольном множестве объектов. Доказана теорема о корректности алгебраического замыкания модели тестовых алгоритмов. Построены в явном виде тестовые распознающие операторы, порождающие базис в алгебраическом замыкании. Выделяется конечное множество алгоритмов, содержащее корректный алгоритм для данной задачи [47].

1.1. Предпосылки к конструктивизации

Пусть задано множество допустимых объектов М, обладающих некоторыми свойствами. Известно, что множество М представимо в виде объединения конечного числа подмножеств, называемых классами К, ..., К :

I

М = У Кг.

г=1

Будем считать, что каждое свойство х1,...,хп выполнено или не выполнено для произвольного объекта 5 € М. Тогда объект 5 может быть представлен описанием в виде строчки признаков

5 = (хЪ . . . , хп^

где хг(5) = 1, если 5 обладает свойством хг, и хг(5) = 0, если 5 не обладает свойством хг, г = 1, 2, ..., п.

О классах К1, ..., К известна стандартная обучающая информация /о (К1, ..., К), заданная перечислением конечного списка строчек признаков некоторых объектов каждого класса. Эта информация записана в виде бинарной таблицы обучения Мд = ||хг7-||т хп , где ш — количество объектов обучения.

Ставится задача: вычислить по исходной обучающей информации /о (К1, ..., К) и набору объектов 51, ..., € М, заданных строчками признаков, значения предикатов

р (5г) : € К, г = 1, 2 , ...,д 3 = 1, 2 ,..., 1.

Набор = {51, ..., } называется контрольной выборкой и представляется бинарной таблицей Мк = 11хг7' ||9 хп . Задачу вычисления значений предикатов (5г) по информации

/о (К1, ...,К1) для данной контрольной выборки Бд обозначим через 2 (/о , Б4).

Пусть {А(2)} — множество, вообще говоря, некорректных алгоритмов для решения задачи 2(/о , б"9). По алгоритму А € {А} для контрольного множества б"9 строится информационная матрица 11вг7 ||дХг, вг7' € {0,1, А}, где вг7' —значение предиката (5г), вычисленное алгоритмом А, символ А означает, что в алгоритме А невозможно вычисление предиката.

В статье [38, ч. I] показано, что алгоритм А(2) может быть представлен в виде последовательного выполнения двух операторов: А = В о С. Оператор В называется распознающим, результатом его действия является матрица действительных чисел — матрица оценок: В(я) = 11аг71|9 х г. Оператор С — решающее правило — переводит ||аг7-1|9 х г в информационную матрицу ||вг 7 ||9Х1.

Приведем основные определения из статьи [38, ч. I].

Определение 1.1. Алгоритм А называется корректным для задачи Z (/о , Б9), если его результатом является истинная информационная матрица Ца^- У х г для Б)9, то есть

агч = Р (Бг).

Определение 1.2. Решающее правило С называется корректным, если для любой контрольной выборки Б9 существует числовая матрица Ца^-||9 х 1 такая, что С (Ца^- ||9 х г) =

= ||агч Н9 х 1 .

Для задач с непересекающимися классами естественно рассматривать следующее решающее правило:

{1, если агч > а^, £ =

0, если агч < а^ для некоторого £ =

А, если агч ^ а^ и агч = а^0 для некоторого £0 = £ € {1, 2,..., 1}. Это правило, очевидно, является корректным.

Пусть В — множество распознающих операторов семейства (модели) алгоритмов { А } для задачи Z(/о , Б9) при фиксированном решающем правиле С. Над операторами из множества В вводятся операции сложения, умножения и умножения на скаляр.

Пусть Bt € {В}, В^) =

аЬ

, Л^; — действительные числа. Определим

дх1

(£ (Z) =£ Л ||а',|| • Л В')

п

аг ч

дх1

При операциях сложения и умножения на скаляр множество {В} распознающих операторов порождает линейное векторное пространство. По совокупности всех операций множество {В} порождает алгебру над полем действительных чисел. Линейное пространство и алгебру, содержащую множество {В}, будем называть линейным Ь {В} и алгебраическим А { В } замыканиями соответственно.

Определение 1.3. Задача Z (/о , Б9) называется полной относительно множества распознающих операторов {В}, если {В} содержит операторы, порождающие базис в пространстве вещественных матриц размером д х 1.

В стратье [38, ч. I] доказана следующая

Теорема 1.1. Если Z (/о , ) является полной относительно {В}, то линейное замыкание Ь {В о С} содержит корректный алгоритм для Z(/о , ) при произвольном корректном решающем правиле С.

Ниже определяются условия, при которых для рассматриваемой модели алгоритмов алгебраическое замыкание А { В } содержит операторы, порождающие базис.

1.1.1. Модель тестовых алгоритмов

Модели вычисления оценок (голосования) [38, ч. II] формализуют идею близости между уже классифицированным объектом и объектом, подлежащим распознаванию. Имеются различные модификации алгоритмов вычисления оценок. Ниже рассматривается параметрический подкласс алгоритмов вычисления оценок, определяемый следующим образом.

Пусть 1, 2,...,п —некоторая нумерация бинарных признаков х1,...,хп.

Определение 1.4. Пусть Мд = Цх^- ||тхп — бинарная таблица, содержащая т различных строк и такая, что множество ее строк разбито на 1 непересекающихся классов К1, ..., К. Тестом таблицы Мд относительно классов К1, ..., К называется совокупность столбцов {^1,..., ^} таких, что после удаления из Мд всех остальных столбцов в полученной таблице все пары строк из разных классов различны. Тест {^1,..., ^} называется тупиковым, если никакое его собственное подмножество не является тестом.

Понятие теста было введено для проверки логических схем и поиска неисправностей. В последнее время оно нашло многочисленные приложения в задачах распознавания [32]. Исследован ряд характеристик, связанных с распределением тестов для бинарных таблиц, в частности для таблиц, в которых каждая строчка представляет отдельный класс. Ниже (п. 1.1.3) используется то очевидное обстоятельство, что всякий тупиковый тест для таких таблиц включает в себя некоторый тупиковый тест при произвольном разбиении множества строк на классы К1, ...,К.

Первым шагом формирования модели алгоритмов вычисления оценок является указание некоторой системы подмножеств множества признаков {1, 2, ...,п}, называемой системой опорных множеств. В рассматриваемой модели системой опорных множеств О = {й} является некоторое подмножество совокупности всех тупиковых тестов й таблицы обучения Мд относительно классов К1, ..., К.

Если й € О — тупиковый тест таблицы Мд, состоящий из столбцов {_?!,...,^}, то й-частью строки признаков объекта 5 = (х1,..., хп) назовем строку й5 = (х-д,..., х^). Функция близости ст(й£,й£г) по тесту й между объектами 5 = (х1,..., хп) и = (х^ 1,..., х^п) определяется следующим образом:

г~а Г 1, если й5 = й54;

0 , если й5 = й54.

Пусть заданы неотрицательные вещественные параметры 74 = 7(64), г = 1, 2,...,т, называемые весами объектов обучения, и р — веса признаков, j = 1, 2, ...,п.

Тестовый распознающий оператор В = В(7,р) переводит описание объекта 54 в вектор оценок а* = (ал, ...,ай) :

а^ч = Е Е *(й5,й5 4)7(5)р(й), (1.1)

шеп зек,-п{51,...,5т>

где Р(й) = Рл + ... + Рч.

1.1.2. Полнота алгебраического замыкания тестовых алгоритмов

Пусть Мд — бинарная таблица обучения, содержащая описания объектов 51,..., 5т, б"9 — контрольная выборка {51,}. Будем считать, что {51,..., }П{51,...,59} = 0. Заметим, что объем контрольной выборки д удовлетворяет неравенствам 1 ^ д ^ 2п — т.

Покажем прежде всего, что для распознающих операторов Ввида (1.1) задача Z(/о , б"9) может оказаться неполной относительно линейного замыкания Ь{В} для некоторых значений д.

Обозначим через О множество вещественных чисел. Распознающий оператор в В(7,р) при фиксированных опорных множествах й можно рассматривать как срез билинейного отображения От х Оп — О91.

Если линейное замыкание Ь{В} содержит базис пространства О91 всех числовых матриц размером д х 1, то оно совпадает с О91. Обозначим через {е^}, }, г = 1,2,...,т, j = = 1, 2,...,п, базисы пространств От и Оп соответственно. Тогда

Ь {В(От х Оп)} = Ь {В(ег,£ч)}.

Отсюда получаем

д1 = Ь{В)} ^ тп. тп ~

Таким образом, при д > —— задача , б*9) не будет полной относительно Ь{В}.

Покажем, что при выполнении некоторых условий для множества обучения {51,..., 5т} и контрольной выборки задачи Z (/о , ) будут полны относительно алгебраического замыкания А { В }.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Рассмотрим задачи Z(/о , ), которые удовлетворяют следующим требованиям.

Условие 1.1. Классы К1, ..., К попарно не пересекаются. Это требование вытекает из определения тупикового теста.

Условие 1.2. Для любого объекта 5и € и любого класса К? найдется объект обучения 5 € К7 и тупиковый тест Ш € П такие, что 5, Ш5и) = 0.

Условие 1.3. Для любых двух различных объектов 5и и и любого класса К7 найдутся объект обучения 5 € К7 и тупиковый тест ш € П такие, что а(ш5, ш5и) = = 5 *).

Из условия 1.2 и определения тупикового теста следует, что число тупиковых тестов таблицы обучения Мд относительно классов К1, ..., Кг, взятых в качестве опорных множеств, должно удовлетворять неравенству

|П| ^ 1. (1.2)

Известно, что для почти всех бинарных таблиц число тупиковых тестов является быстрорастущей функцией параметров, характеризующих размеры таблицы. (Множество Ап, зависящее от параметра п мощности р(п), содержит почти все элементы множества Вп мощ-

^ ^ = 1.) Поэтому для почти всех достаточно больших таблиц

иости ФЫ), если lim

... ^(n)

неравенство (1.2) будет выполняться.

Совокупность задач Z(То , ¿>q), удовлетворяющих условиям 1-3, обозначим через { Z}.

Теорема 1.2. Совокупность .задач { Z} является полной относительно алгебраического замыкания A{B} семейства тестовых распознающих операторов.

Доказательство. Пусть A — множество произвольных функций, определенных на множестве E. A разделяет точки множества E, если для любой пары различных точек Ж1,Ж2 € E найдется функция f (ж) из A такая, что f (xi) = f (Ж2). Если для каждой точки Жо € E существует функция f (ж) € A такая, что f (жо) = 0, то будем говорить, что A не исчезает ни в одной точке множества E.

Для алгебры A непрерывных функций, определенных на компактном множестве K, справедлива теорема Стоуна-Вейерштрасса: если A разделяет точки множества K и не исчезает ни в одной точке множества K, то равномерное замыкание алгебры A содержит все функции, непрерывные на множестве K.

Поскольку конечное множество компактно, то применительно к рассматриваемому случаю можно сформулировать дискретный аналог теоремы Стоуна-Вейерштрасса.

Для того чтобы алгебраическое замыкание A{ B } содержало базис в пространстве всех вещественных матриц размером q х l, необходимо и достаточно, чтобы для любой упорядоченной пары (u, v) существовал распознающий оператор B, строящий для задачи Z(То , S"9) матрицу оценок Ца^-|| г, в которой элемент auv =0, и для любых двух пар (ui,vi) = (u2,V2) существовал распознающий оператор B, строящий для Z(То , S"9) матрицу Ца^-|| г, в которой = а«2^2 •

Обозначим объекты обучения из {Si,...,Sm}, содержащиеся в j -м классе, через Smj._1+i,..., Smj j = 1,2,...,l, то = 0, Шг = m. Для упрощения введём матрицы V = = HvrtH qxm и U = KtLxi , где

t = St,üSr)p(ü),

Vrt =

ш en

и =

71

7^1+1

7^2

0

7тг_1+1

Тогда матрица оценок ||а»

н г > получающаяся в результате действия тестового распознающего оператора В(7,Р), может быть записана как V ■ и, где произведение понимается в смысле обычного перемножения матриц.

В силу условия 1.2 для совокупности задач { для любой пары (я,;), г = 1,2, ...,д; j = 1, 2,___, I в группе найдется ненулевой элемент, следовательно, соответ-

ствующий распознающий оператор В строит матрицу оценок, в которой элемент а^- = 0. В силу условия 1.3 для задач { ^} для любых двух пар (¿1, jl) = (¿2, j2); ¿1, ¿2 = 1, 2, ...,д; j2 = 1, 2,___, I будет выполняться неравенство

Е 7*1 = Е ^2 7*2 ,

следовательно, соответствующий оператор

В

а

ЯЛ

строит матрицу Ца^^-|| г, в которой

Ш2 •

Таким образом, алгебраическое замыкание А { В } совпадает с пространством всех числовых матриц размером д х I, то есть множество задач { является полным относительно А { В }. Теорема доказана. □

Замечание 1.1. Данный метод доказательства полноты относительно алгебраического замыкания пространства распознающих операторов может быть использован при рассмотрении других моделей распознавания.

1.1.3. Построение корректного тестового алгоритма

Проведем прямое построение операторов В из семейства (1.1), образующих базис в пространстве числовых матриц размером д х I. Предварительно сформулируем лемму, аналогичную лемме 1 в статье [38, ч. II].

Лемма 1.1. Пусть О — система опорных тупиковых множеств, В — распознающий оператор вида (1.1), 7» ^ 0, р ^ 0 — параметры, г = 1, 2, ...,т, j = 1, 2,...,п ЦаЛ^х — матрица оценок, вычисляемая оператором В. Для элементов матрицы Ца^ ||дХг справедлива оценка

<

»=1

Поскольку доказательство простое, оно опускается.

Построение базисных операторов осуществляется в несколько шагов.

Шаг 1. Построим оператор В»1, который во всех столбцах Ь = j матрицы Ца^-1| г строит нули, а в столбце j в строке г строит элемент а^-, отличный от нуля, г = 1,2,...,д, j = 1, 2,..., I, Ь = 1, 2,...,; - 1,; + 1,...,1.

Из условия 1.2 для задач { ^} вытекает существование тупикового теста й € О и объекта € К таких, что ст(й£и,й£г) = 1. Положим 7(5«) = 7« = N > 0, остальные 7 = 0;

для признаков образующих тест ¿), положим = ... = р(]к) = -г, остальные р

К

0

а

произвольны. Тогда для аг7-, г = 1, 2, ...,д имеем нижнюю оценку аг 7 ^ р(ш)7« = 7« = N; верхняя оценка указана в лемме.

При £ = ; имеем а г* = 0.

Если д = 1, то операторы В7, ; = 1, 2,..., 1 порождают базис в пространстве векторов (а1,..., аг). Будем далее считать, что д ^ 2.

Шаг 2. Пусть фиксированы класс К/ и объект 5г € 9. По условию 1.3 для задач { 2} при любом 5* € 5 9, 5 * = 5г существуют объект обучения € К7 и тупиковый тест шо € П такие, что о5«,шо5г) = о5«,шо5*).

Возможны два случая.

А. Пусть о5«,шо5г) = 1, =0 и шо = {л,...,^}. Пусть ш С П — мно-

жество всех тупиковых тестов ш, для которых 5*) = 1. Допустим, что каждый из

столбцов л,...,л принадлежит хотя бы одному тесту из {ш}. Тогда по каждому признаку объект совпадал бы с 5«, следовательно, совпадал бы с по тесту шо. Это противоречит тому, что о5*) = 0. Таким образом, существует столбец ;'о € шо, ко-

торый не принадлежит ни одному тупиковому тесту из {ш}. Припишем ему и всем другим столбцам, обладающим таким же свойством, веса р(;'о) ^ 1, остальным столбцам припишем нулевые веса. Положим 7(5«) = N > 0, веса остальных объектов положим равными нулю. Обозначим построенный таким образом оператор через Вг 7(£). Оператор Вг 7(£) порождает матрицу оценок 11аг71| г, в которой аг7- ^ N а*7 = 0; во всех столбцах, отличных от ; -го, находятся нули; в столбце ; в строках, отличных от г -й, находятся некоторые числа. Обозначим аг7- через N1. Верхняя оценка для N1 дается в лемме 1.1.

Б. Пусть о5и,шо5г) = 0, о5и,шо5*) = 1. Построим оператор В^(£) , как указано в п. А. По условию 1.2 множество распознающих операторов не исчезает в точке (г,;), поэтому существует оператор В, который порождает матрицу ||Ьг7-1| г, где 11аг71| г — некоторое число. В качестве В можно взять оператор Вг7 из шага 1. Рассмотрим линейную комбинацию

Вг 7 (£) = аВ * 7 (£) + вВ, а = -Nз/N2, в = N^N2.

Оператор В г 7 (£) принадлежит А { В } и порождает матрицу оценок 11 аг 7 || г, в которой аг7 = N1, а*7 = 0, а«* = 0, V =

Шаг 3. Оператор

В(г,:/) = П Вг7(£).

*=г

Оператор В(г,;) принадлежит алгебраическому замыканию А { В } степени не выше д — 1 и порождает матрицу оценок 11аг7|| г, в которой аг7- = р > 0, = 0, (з,£) = (г,;).

Таким образом, множество операторов В(г,;), г = 1, 2,..., д, ; = 1, 2,..., 1 порождает базис в пространстве числовых матриц размером д х 1.

По теореме 1.1 для любой задачи 2 (/о , ) из { 2} в А { В о С } содержится корректный алгоритм. Покажем возможность выделения в А { В о С } конечного множества алгоритмов, содержащего корректный алгоритм для данной задачи 2(/о , б"9) € {2}.

Пусть 11аг71| г —истинная информационная матрица для , С —корректное решающее правило для непересекающихся классов.

Обозначим

9 г

В(11вг7||,хг) = Е Евг7В(г,;), вг,7 € {0,1}.

г=1 7=1

Теорема 1.3. Множество алгоритмов А = В(|вг7 ||дхг) ◦ С содержит корректный алгоритм, для задачи 2(/о , б"9) € {2}.

Доказательство. Оператор В(г,;) строит матрицу оценок 11 аг 71| г, где аг7 > 0 = 0 при (г,;) = («,£). Если аг070 = 1, то В(||аг7Н9хг)(го,;о) = аго7о > 0. Так как классы не пересекаются, то для всех = ;'о имеем аго7' = 0 и В(||аг7-||дхг)(го,;') = 0. Из определения решающего правила С следует В(||аг7-|дхг) о С(2) = ||аг7- || г, то есть объекты

5», г = 1, 2,...,д правильно классифицируются алгоритмом А. Отметим, что мощность множества алгоритмов, содержащего корректный алгоритм для задачи 2(То , ), не превышает . □

Замечание 1.2. Теорема 1.3 показывает, что оценка минимального значения степени n алгебраического замыкания, содержащего конечное корректное множество алгоритмов,

1

приведенная в статье [38, ч. III], остается справедливой, если формально положить ——— = 0.

1.2. Экзистенциальность проблем классификации образов

Отсутствие общей теории классификации или распознавания образов вынуждает искать новые подходы к ее решению [22, 40, 163].

Предлагается один из возможных вариантов спектрально-логического подхода к распознаванию образов. Этот подход возник и стал формироваться на протяжении последних нескольких лет [19, 40, 99, 163]. Образы описываются с помощью логических комбинаций некоторых элементарных предикатов, определенных в классе спектральных описаний объектов. Спектрально-логический подход не содержит в своей основе эвристических предположений о характере распознающей процедуры, что позволяет без существенных ограничений описывать практически любой детерминистский метод распознавания.

Более того, в рамках этих методов представляется возможным осуществить экзистенци-альность в распознавании образов, то есть анализ проблем распознавания на разрешимость [122]. Попытки реализации экзистенциальности проблем распознавания образов имели пока место лишь в работах Кейсовской школы [19, 147, 187, 198].

Большинство исследователей [19, 22, 40, 163] распознаванием называют процедуру определения включения данного объекта в рассматриваемый образ. Под образом при этом понимается класс объектов, сходных, но не тождественных между собой [175].

Можно предложить следующую формализацию этих понятий.

Пусть M — некоторое множество объектов распознавания;

TD+ — класс отношений толерантности (сходства) на множестве M, индексированный множеством неотрицательных вещественных чисел D+, то есть Тд+ = {тt }teD+.

Определение 1.5. Пара (M, Тд+) называется входным пространством распознающей системы, если выполняются следующие аксиомы:

(Ai) V 3 ЖТ(y (существование толерантности),

е M t gD+

(A2) V Am С Tt (рефлексивность),

t eD+

где Am = {(х,х)| x € M} — диагональ декартова квадрата множества M,

(A3) V Tt = т—1 (симметричность),

t eD+

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

(A4) V (t ^ s) = (Tt С Ts) (упорядоченность),

t,seD+

(A5) V TtTs С Tt+s (квазиаддитивность).

t,seD+

Аксиомы (Ai) — (A5) определяют класс отношений сходства между элементами множества M, причем степень сходства определяется вещественным индексом соответствующего отношения толерантности. Если толерантность тt € TB+ определить с помощью метрического соотношения

хтt y = p(x,y) ^ t,

где x,y € M, p — некоторая метрика на множестве M, то аксиомы (Ai) (A5) будут эквивалентны определяющим аксиомам метрики p [112].

Пусть заданы:

R = (M, Td+ ) — входное пространство распознающей системы;

ß — мера на множестве M из входного пространства R;

Р — множество некоторых предикатов на множестве М;

V — конечная система подмножеств из М, то есть V = {М1, М2,..., Мп}, М» С М, г = 1,п, причем каждый класс М\ определяется некоторой логической комбинацией предикатов из Р :

М» = {х € М| ^(х), (х)] & V р,(х) € Р}, где £ - некоторая пропозициональная функция.

Определение 1.6. Набор (Я, Р, V, называется логической моделью распознавания, если выполняются следующие аксиомы:

(К1) V V I 3 хт£у ^ 3 хт£,г ) (связность), е€-0+ хеМ; \ уем ¿еМ; /

(К2) 3 V хт^у (ограниченность),

(К3) 3 ¿и(М») = > 0) (объемность),

(К4) ^ (Мп) = 0ДМДМгП)&(О < 0 < 1) (отделимость).

Здесь МП — та часть класса М», которая входит в пересечение с другими классами системы V.

При выполнении аксиом (К1) ^ (К4) классы М» называются образами. Заметим, что на языке метрических соотношений аксиомы (К1), (К2) эквивалентны условию компактности класса М».

Таким образом, логическая модель распознавания (Я, Р, V, целиком задается структурой множества М, мерой классом отношений толерантности Тд+ (или эквивалентно метрикой р), способом описания классов на множестве М в зависимости от набора предикатов Р и совокупностью классов V.

Определение 1.7. Модель распознавания (Я, Р, V, называется спектрально-логической, если:

1) М = где — т -я декартова степень множества вещественных чисел;

2) ^ — есть лебеговская мера в т -мерном пространстве

3) Тд+ — класс отношений толерантности, элементы которого определены с помощью эвклидовой метрики на М :

1

' т ' 2

хт4у = ^ (ж - у»)2 < ¿.

.»=1

С помощью спектрально-логической модели описание любого объекта распознавания х € М, который обладает континуумом свойств, может быть произведено с помощью упорядоченного набора числовых коэффициентов, определяющего некоторую точку в пространстве Такие наборы чисел и есть спектры в самом широком понимании этого термина [155].

Например, в одномерном случае всякая гладкая функция /(¿) € ^[а, Ь] представима

ь

в виде конечного спектра (а0, а1,..., ат-1), где а» = / /(¿) ■ г = 0,1, 2, ...,т — 1,

а

{<£>»} — полная ортонормальная система функций в пространстве £2 [а, Ь], число т определяется в зависимости от гладкости функции / (¿).

Соответствие между гладкими функциями и их спектрами взаимно-однозначное, то есть

/№ = Е а» '

»=0

Совокупность спектров (ао, а1,..., ат-1) образует т -мерное евклидово пространство и поэтому допускает спектрально-логическую модель (Я, Р, V, где Я =(^т,Тд+) удовлетворяет определению 1.7.

Практическая реализация спектрально-логической модели при решении некоторых задач медицинской диагностики (задачи классификации пульсовых кривых) показала применимость этой модели для решения «трудных» задач теории распознавания и подтвердила следующие положительные стороны спектрально-логического подхода в проблеме распознавания:

во-первых, возможно осуществить экзистенциальность, то есть предварительный анализ задачи распознавания на существование распознающей процедуры;

во-вторых, в случае существования распознающей процедуры последняя определяется однозначно. В противном случае корректной распознающей процедуры не существует вообще;

в-третьих, спектрально-логическая модель не содержит в себе эвристических ограничений на характер распознающей процедуры, что позволяет производить редукцию исследуемой модели распознавания к спектрально-логической;

в-четвертых, функциональное представление объектов распознавания (имеющееся в любой практической задаче распознавания) допускает непосредственное применение спектрально-логической модели разложением соответствующих функциональных зависимостей в спектры.

§ 2. Алгоритмический подход к проблемам классификации

Существующие многочисленные подходы к решению проблем распознавания или классификации образов не дают первоочередного ответа на вопрос об их разрешимости, то есть существовании алгоритмов, гарантирующих решение проблем. Вместе с тем доказательство разрешимости проблем распознавания или классификации образов (или по-другому — теорем существования и единственности решений) позволяет наметить конструктивные приемы решения конкретных задач распознавания или классификации образов.

2.1. Конструктивизация

В предлагаемом алгоритмическом подходе к проблемам распознавания или классификации образов используется один из разделов теории алгоритмов — теория нумераций [36], позволяющий учесть и провести формализацию на единой методологической основе, а также сформулировать критерии разрешимости и указать условия существования алгоритмов распознавания или классификации [9, 196, 199].

Все вычисления, которые мы будем рассматривать, по крайней мере, теоретически могут быть проделаны за конечное время. Это означает, что вычисляемые объекты должны быть конструктивными (конечными), то есть заданными конечным количеством информации объектами [173] .

Если в классических работах понятия «распознавание» и «классификация» часто сливается воедино, то в настоящей работе эти понятия четко разграничиваются.

Под распознаванием понимается принадлежность распознаваемого объекта к некоторому множеству (семейству множеств), а под классификацией понимается функция, относящая распознаваемый объект к некоторому классу объектов (номеру класса объектов).

В § 2 рассматривается множество М произвольной природы, которое разбито на ш классов К ^ {М1,..., Мт}. Считается, что существует некоторая редукция р : М ^ Е множества М в пространство конечных объектов Е.

Так как р — произвольное отображение, то р(Мг) С Е и для некоторых X € Е возможно, что они либо принадлежат образу р(Мг), либо нет. Эффективное установление этого факта есть проблема распознавания для р(Мг), 1 = 1, т.

Ниже будет показано, что любому конечному объекту можно взаимно однозначно поставить в соответствие некоторое конечное множество натуральных чисел. Последнему, в свою очередь, с помощью стандартной нумерации [142] взаимно однозначно ставится в соответствие натуральное число. Поэтому в качестве пространства Е можно взять множество всех натуральных чисел N ^ {0,1, 2,..., п,...}. Последнее позволяет сформулировать проблему классификации для тройки (М, К, р).

2.1.1. Конструктивные и сильно конструктивные объекты

Рассмотрим множество М, в котором допускается редукция к натуральным числам.

Определение 2.1. Пара (М, р), где М —некоторое множество, а р : М ^ N — отображение М в множество всех натуральных чисел, называется множеством конструктивных объектов.

Если при этом р есть разнозначное отображение, то есть (Уж', у' € М)[ж' = у' ^ р(ж') = р(у')], то будем говорить, что (М, р) — множество сильно конструктивных объектов.

Очвидно, множество сильно конструктивных объектов есть частный случай множества конструктивных объектов.

2.1.2. Рекурсивность и рекурсивная перечислимость

Будем придерживаться одной из наиболее развитых и изученных формализаций понятий алгоритма — теории рекурсивных функций [142]. Она связана с традиционными понятиями математики — вычислениями и числовыми функциями.

Поскольку с помощью конструктивных объектов можно переходить к подмножествам натуральных чисел, то необходимо рассмотреть вопросы рекурсивности и рекурсивной перечислимости указанных множеств.

Через О обозначим класс всех одноместных общерекурсивных функций, а через О1 — класс всех одноместных разнозначных общерекурсивных функций [36].

Пусть А, В С N.

Определение 2.2 [36]. Предположим, что А ш -сводится к В (символически А В), если существует / € О такая, что (Уж € N)[ж € А] ^ /(ж) € В.

В дальнейшем будем говорить, что функция / ш -сводит А к В.

Укажем ряд простых свойств введенных понятий [36].

1. / ш -сводит А к В ^ /-1(В) = А.

2. Если В — рекурсивное (рекурсивно перечислимое) множество и А ^т В , то А — рекурсивное (рекурсивно перечислимое) множество.

3. Если В — рекурсивное множество и А — собственное подмножество N то есть А С N и А = 0, то В А.

4. А А.

5. Ао А1 и А1 А2 ^ Ао А2.

Пусть 5 — произвольное множество.

Определение 2.3 [36]. Назовем нумерацией V множества 5 произвольное отображение N на 5, то есть V : N ^ 5.

Пусть Кр С Р^) — некоторое семейство рекурсивно перечислимых подмножеств N [36].

Определение 2.4. Нумерация V : N ^ Кр семейства Кр называется вычислимой, если Уш € N множество {С(п,ш)|п € V(ш)} — рекурсивно перечислимо.

Пусть Ф — семейство всех конечных подмножеств множества N. Установим [36] взаимно однозначное соответствие 7 : N ^ Ф между всеми натуральными числами и множествами из Ф так: 7(0) = 0, и для любого п > 0 представляем п в виде суммы

п = 2п0 +2п1 + ... + 2Пк; по < щ < ... < п*

(такое представление — двоичное разложение всегда существует и единственно) и полагаем 7(п) = {по, п1,..., п*}. Нетрудно проверить, что 7 — однозначная нумерация Ф и 7 —

вычислимая нумерация, то есть {С(п, т)|п € V(т)} — рекурсивно перечислимо. Заметим, что конечную последовательность (по, П1,..., ) натуральных чисел можно рассматривать как конечное множество пар натуральных чисел {(1,П1), (П2),..., (к,п^)} или, применяя кан-торовскую нумерацию пар, перевести последнее к конечному множеству натуральных чисел

Наконец, используя нумерацию 7 конечных множеств натуральных чисел, перевести последнее к натуральному числу а = 2С(1'П1) + ... + 2с(к'Пк).

Таким образом, все конечные объекты можно взаимно однозначно закодировать натуральными числами. В прикладных задачах последовательность натуральных чисел можно рассматривать как описание одномерных сигналов, заданных в дискретной форме, например, при распознавании и классификации текстурных изображений [54].

Пусть А С N.

Определение 2.5 [119]. Характеристической функцией ха (п) какого-нибудь множества натуральных чисел А называется одноместная функция, равная нулю в точках

Определение 2.6 [119]. Подмножество А множества всех натуральных чисел N называется рекурсивным, если характеристическая функции множества А общерекурсивна.

Определение 2.7 [119]. Множество А рекурсивно перечислимо, если А = 0 или существует общерекурсивная функция / такая, что А есть множество значений функции /, то есть А = р/.

Проблемой вхождения для числового множества А называется задача отыскания алгоритма, который по стандартной записи (например, десятичной) произвольного натурального числа а позволяет узнать, входит число а в множество А или нет, то есть позволяет вычислить значения характеристической функции множества А [119].

В силу тезиса Чёрча существование такого алгоритма равносильно рекурсивности характеристической функции. Поэтому можно сказать, что рекурсивные множества — это множества с алгоритмически разрешимой проблемой вхождения [119].

2.1.3. К вопросу о разрешимости некоторых задач классификации

Рассмотрим множество конструктивных объектов (М, , где М — некоторое множество, а ^ : М ^ Ф — отображение М в семейство Ф всех конечных подмножеств множества N ^ {0,1, 2,... }.

Пусть М есть образ множества М при отображении ^, то есть М ^ ^ (М). Заметим, что М С Ф.

Приведем простой пример изучаемых объектов. Пусть, согласно работе [174], на множестве М задан набор признаков (свойств) £ , где £ — не более чем счётно. Одноместные предикаты Е (х) , где Е € £, будем интерпретировать так:

Таким образом, рассматриваем модель (М; £) с основным множеством М и сигнатурой £. Через Р (£) будем обозначать множество всех подмножеств множества £. Пусть / : М ^ Р (£) такое отображение, что для каждого х € М

Выберем для £ некоторое фиксированное разнозначное отображение Н : £ ^ N.

После этого для удобства отождествим каждый символический элемент Е € £ с соответствующим числовым «индексом». Такое стандартное отображение называют кодированием,, а

{С(1,П1),...,С(Л,п*)} [119].

множества А и равная единице в точках, не принадлежащих

0, если п € А,

1, если п € А.

Е (х) = |

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

1, если объект х обладает свойством Е; 0, в противном случае.

/ (х) = {Е|Е € £&Е (х) = 1} .

числа, используемые как индексы, называют кодовыми номерами [119]. Кодирование выбирается так, чтобы оно:

задавалось неформальным алгоритмом в неограниченном смысле;

было обратимым, то есть существовал неформальный алгоритм (в неограниченном смысле) для распознавания кодовых номеров и для обратного «декодирующего» отображения кодовых номеров в нечисловые элементы Е € £;

имело неформальный алгоритм для распознавания символов, образующих множество £.

Положим для каждого ж € М :

X — {п|Н-1 (п) € / (ж)} ,

р (ж) — Н (/ (ж)) = {п |п = Н (Е) &Е € / (ж) } .

Тогда если /(ж) конечное множество, то (М, р) — множество конструктивных объектов. Если при этом р — разнозначное отображение, то (М, р) — множество сильно конструктивных объектов.

Введем на множестве М отношение эквивалентности — так:

(Уж, у € М) [ж - у ^ р (ж) = р (у)].

Профакторизуем множество М по отношению —, и фактор-множество обозначим через М Очевидно, что с каждым классом эквивалентности [ж] € Мможно взаимно однозначно сопоставить элемент X = р (ж).

Пусть 5 — {^г}г€1 есть разбиение семейства М, где I не более чем счетное индексное множество.

Рассмотрим для 5 модель (М; б) с основным множеством М и сигнатурой 6 — (Рг)геЗ. Одноместные предикаты Рг (X) будем интерпретировать следующим образом:

(УХ € М) [Рг (X) = 1 ^ X € N . Вопрос о разрешимости предиката Рг (X) назовем проблемой распознавания для класса Шг.

Предложение 2.1 (критерий разрешимости проблемы распознавания). Проблема распознавания для класса Шг конечных множеств разрешима тогда и только тогда, когда Шг сильно рекурсивно.

Доказательство. Рассмотрим элементарное расширение (Ф; 6) модели (М; 6). Предикат Рг (X) на модели (Ф; 6) интерпретируется так:

^ € Ф) [Рг (X) = 1 ^ X € N .

Очевидно, вопрос о разрешимости предиката Рг (X) на модели (М; 6) сводится к вопросу о разрешимости предиката Рг (X) на модели (Ф; 6). Заметим, что для предиката Рг (X) модели (Ф; 6) имеет место равенство

Рг (X) = 1 — ХАг (7-1 (X)) , (2.1)

где XAi — характеристическая функция множества Аг — 7-1 (Шг) , 7 : N ^ Ф — стандартная нумерация [119] множества Ф такая, что 7 (0) — 0 и для любого п > 0, если п = 2то + 2т1 + ... + 2тк, (шо < ш1 < ... < шк), то 7 (п) — {шо,ш1, ...,шк} € Ф.

Из соотношения (2.1) в силу тезиса Чёрча следует, что предикат Рг^) разрешим тогда и только тогда, когда множество Аг рекурсивно или когда Шг сильно рекурсивно (в силу определения сильной рекурсивности семейств конечных множеств [34]).

Предложение 2.1 доказано. □

Вопрос о существовании алгоритма, позволяющего указать номер г класса Шг € 5, для которого Рг (X) = 1, где X € Ф, назовем проблемой классификации для разбиения 5 — {Шг}гез семейства М С Ф.

Предложение 2.2 (критерий разрешимости проблемы классификации). Проблема классификации для разбиения Б ^ {Ж»}»ез семейства М разрешима тогда и только тогда, когда I конечно и для всякого г € I [Ж» — сильно рекурсивно ].

Доказательство.

Пусть проблема классификации для разбиения Б семейства М разрешима. Это значит, что для любого X € Ф за конечное число шагов можно указать номер г элемента Б, для которого имеет место X € Ж», или же сказать, что такого номера не существует. Отсюда следует, что I конечно. Кроме того, в силу разрешимости проблемы классификации для разбиения Б семейства М, очевидно, разрешимы предикаты Р» (X) модели (М; б) , то есть разрешима проблема распознавания для каждого Ж» € Б.

Тогда в силу предложения 2.1 для всех индексов г € I Ж» — сильно рекурсивны.

Пусть I — конечно и для всех г € I Ж» — сильно рекурсивно. Тогда в силу предложения 2.1 проблема распознавания для любого Ж» € Б разрешима и в силу конечности I разрешима проблема классификации.

Предложение 2.2 доказано. □

Следствие 2.1. Если М конечно, то для любого разбиения Б ^ {Ж»}»ез семейства М проблема классификации разрешима.

Доказательство. Пусть Б — произвольное разбиение семейства М. Так как М конечно, то и любой класс Ж» € Б конечен, а следовательно, сильно рекурсивен. Тогда в силу предложения 2.2 проблема классификации для разбиения Б семейства М разрешима.

Следствие 2.1 доказано. □

Следствие 2.2. Если Б ^ {Ж»}»^ разбиение семейства М С Ф такое, что I

конечно, для любого г € I 7-1 (Ж») — рекурсивно перечислимо и У 7-1 (Ж») = N то про-

гез

блема классификации для разбиения Б семейства М разрешима.

Доказательство. Так как Б — разбиение семейства М, а 7 — однозначная нумерация [34], то для любых г, € I имеет место

г = 3 ^ 7-1 №) П 7-1 (Ж,)= 0.

Отсюда, используя условия следствия 2.2 и применяя теорему Поста (см. [119, с.87]), получаем для любого г € I множество 7-1 (Ж») рекурсивно, а значит, N сильно рекурсивно. Тогда в силу предложения 2.2 проблема классификации для разбиения Б семейства М разрешима.

Следствие 2.2 доказано. □

Следствие 2.3. Если проблема классификации для разбиения Б ^ {N1,..., } семейства М разрешима, В ^ {А1, А2,..., Аг} такое разбиение семейства £, что для любого г ^ г € N [7-1 (А») — прообраз стандартной нумерации элементов разбиения В т -сводится к прообразу 7-1 (Ж») стандартной нумерации элементов разбиения Б, то есть 7-1 (А») 7-1 (Ж»)], то проблема классификации для разбиения В семейства £ разрешима.

Доказательство. В силу предложения 2.2 для всякого г ^ г € N 7-1 (Ж») рекурсивно. По свойству т -сводимости 7-1 (Ж») также рекурсивно, а значит и Ж» сильно рекурсивно. Так как это выполнено для всех г ^ г € N то в силу предложения 2.2 проблема классификации для разбиения В семейства £ разрешима.

Следствие 2.3 доказано. □

2.1.4. Проблемы классификации семейств подмножеств натуральных чисел

В работе предлагается с помощью подходящей редукции р : М ^ N переходить от реальных объектов из некоторого множества М к натуральным числам, «понимаемым» техническими вычислительными устройствами.

Такой переход (кодирование) позволяет в первую очередь для некоторого класса А С N определить для любого натурального числа ж при поиске его во множестве А разрешимость предиката [ж € А] . Вычисляя предикат принадлежности [ж € А] , решаем задачу распознавания, а если множеств много, то и задачу классификации. При этом важно в первую очередь вывести критерии разрешимости задачи распознавания или классификации.

Пусть N — {0,1, 2,...} — множество всех натуральных чисел.

Через 5 ^ {А\, ■■■, А^ , где Аг С Ы, (г = 1,£), обозначим разбиение — конечное семейство подмножеств множества N.

Рассмотрим модель М — (Ж; а) с основным множеством N и сигнатурой а — (К1, К2,..., К), предикаты которой вычисляются так:

„ , Л Г 1, если х € Аг, (г = 1Л)

Кг(ж) = < п ^ '

0, в противном случае.

Вопрос о том, вычислимы ли все предикаты Кг € а, назовем проблемой классификации для разбиения 5.

Приведем без доказательства (ввиду его простоты) дополнительные оценки разрешимости проблемы классификации для разбиения 5.

Теорема 2.1. Проблема классификации для разбиения 5 — {А1, А2,.., А^},

Аг С Ы, г = разрешима тогда и только тогда, когда (У-А^ €5) [Аг — рекурсивное множество ].

I _

Теорема 2.2. Если 5 — разбиение, У Аг = Ы, где Аг, (г = — рекурсивно пе-

г=1

речислимы, то проблема классификации для разбиения 5 разрешима.

Формулировка теоремы 2.2 основана на известной теореме Поста (см. [119, с.87]).

Теорема 2.3 (теорема сравнения). Пусть 51 и 52 — два разбиения — конечные семейства подмножеств множества N причем для семейства 52 проблема классификации разрешима. Тогда если (УА € 51) (ЗВ € 52) [А ^т В] , то для семейства 51 проблема классификации также разрешима.

Таким образом, в основу границ возможности решения задачи распознавания и классификации положен тезис Чёрча и при работе со множествами натуральных чисел встает вопрос о разрешимости проблем распознавания и классификации.

Надо заметить, что вопрос о вычислимости принадлежности натурального числа ж подмножеству А С N в теории алгоритмов хорошо известен как проблема вхождения, при этом проблема вхождения разрешима тогда и только тогда, когда А — рекурсивное множество.

С прикладной (интерпретирующей) точки зрения проблему вхождения удобнее трактовать как проблему распознавания.

Если же необходимо один и тот же конечный объект ж искать в нескольких множествах, то возникает задача классификации и ее разрешимости. Очевидно, что в этих условиях задача распознавания играет роль подзадачи задачи классификации.

Можно заметить, что, решив проблему распознавания для каждого из этих множеств, можно говорить и о положительном или отрицательном решении проблемы классификации относительно этого конечного собрания множеств.

Если хотя бы для одного из рассматриваемых множеств проблема распознавания неразрешима, то неразрешима и проблема классификации для всего собрания множеств, в которое входит это множество.

2.1.5. Критерии разрешимости проблем классификации (распознавания)

Пусть ^(M,) ^ N, i € Im ^ {1, 2,..., m}, N С N.

Вопрос о существовании алгоритма, позволяющего по некоторой стандартной записи произвольного натурального числа определить, принадлежит оно множеству (образу) N или нет, назовём проблемой распознавания (вхождения) для N.

Приведем некоторые критерии разрешимости проблем распознавания или классификации для произвольного подмножества N С N.

Предложение 2.3 [119]. Проблема распознавания для N С N разрешима тогда и только тогда, когда N — рекурсивное множество.

Предложение 2.4 (эквивалент теоремы Поста (см. [119, с.87])). Проблема распознавания для N разрешима тогда и только тогда, когда N и N = N— рекурсивно перечислимы.

Прежде чем ставить проблему классификации для тройки (М, Я, ^>), где (М, — множество конструктивных объектов, Я ^ {М1,...,Мт} — разбиение множества М, рассмотрим понятие вычислимой функции Н : N ^ Р(Ж) относительно семейства К ^ {^¿|г € € 1т} множеств натуральных чисел. Здесь Р— множество всех подмножеств натуральных чисел.

Определение 2.8. Будем говорить, что функция Н вида

вычислима относительно семейства K, если для любго n € K за конечное число шагов указывается множество номеров элементов из семейства K, для которых характеристическая функция в точке n обращается в ноль.

В силу тезиса Чёрча справедлива

Лемма 2.1. Функция h(n) = {i|xWi (n) = 0, i € Im} вычислима относительно семейства K ^ {N|i € Im} тогда и только тогда, когда Im конечно и для любого i € Im, N, — рекурсивные множества.

Пусть дано некоторое множество (M, конструктивных объектов с разбиением R ^ ^ {Mi,...,Mm} и функцией Ф(ж') = {i|^>(x') € ^(Mj); i € Im}.

Вопрос о том, существует ли вычислимая относительно {^(M,)|i € I} функция h такая, что диаграмма коммутативна, то есть ф = h^> и выполнимо условие (Уж' € M)[^>(ж') = n ф(ж') = h(n)], назовем проблемой классификации для тройки (M,R,ip).

Приведём некоторые критерии разрешимости указанной проблемы.

Предложение 2.5 (общий случай). Проблема классификации для тройки (М, Я, ^>), где (М, — множество конструктивных объектов, а Я ^ {М1,...,Мт} — конечное разбиение М, разрешима тогда и только тогда, когда для любого г € 1т ) — рекурсивные множества.

h(n) = {i|XNi(n) = 0,i € Im}

N

Доказательство. Очевидно, что для любого n € N h(n) = {i|x^(Mí)(n) = 0, i € 1m} вычислима относительно |p(M¿)|¿ € 1m} в силу того, что p(M¿) рекурсивны и i € 1m — конечное множество, то есть выполнены условия леммы 2.1.

Покажем, что для любого ж' € M имеет место р(ж') = n ^ ^(ж') = h(n).

Подставляя n вместо р(ж') в определение функции Ф, имеем Ф(ж') = {i|n € p(M¿)} ^ ^ {i|X^(M¿)(n) = 0, i € Im} = h(n).

Что и требовалось доказать. □

Следствие 2.4. Пусть множество (M, р) конструктивных объектов таково, что р(М) конечно. Тогда, каково бы ни было разбиение R множества M, проблема классификации для тройки (M, R, р) разрешима.

Доказательство. Так как р(М) конечно, то и любое подмножество p(M¿) С С р(М), где M¿ € R конечно, а следовательно, и рекурсивно [119]. Таким образом, условия предложения 2.5 выполнены для произвольного разбиения R множества M. Отсюда проблема классификации для тройки (M, R, р) разрешима. Следствие доказано. □

Предложение 2.6. Пусть (M, р) — множество конструктивных объектов таково, что р(М) рекурсивно перечислимо, но не рекурсивно. Тогда ни для одного конечного разбиения R множества проблема классификации для тройки (M, R, р) неразрешима.

Доказательство. Предположим, нашлось конечное разбиение R ^ {M¿|i € € I} семейства M такое, что проблема классификации для тройки (M, R, р) разрешима. Тогда, так как Im конечно, а для каждого i € Im р(Mj) рекурсивны по предложению 2.5, то р(M) = U р(^^г) рекурсивны [119]. Противоречие. Предложение доказано. □

¿el

Приведем дополнительные оценки разрешимости проблемы классификации для тройки (M, R, р), когда (M, р) —множество сильно конструктивных объектов.

Для любого множества (M, р) сильно конструктивных объектов разбиение R ^ {M¿|i € € Im} с помощью р индуцирует на р(M) разбиение Г ^ ^(Mj)|i € Im}, поскольку отображение р разнозначно. В силу этого из предложения 2.5 вытекает

Следствие 2.5. Пусть имеется множество (M, р) сильно конструктивных объектов и разбиение R ^ {M¿|i € Im} таково, что все р(Mj), i € 1 рекурсивно перечислимы

и U = N. Тогда проблема классификации для тройки (M, R, р) разрешима.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

¿=1

Доказательство. Так как р разнозначное отображение р : M — N, то разбиению R ^ {M¿|i € I} соответствует разбиение Г ^ ^(Mj^i € I}, то есть при i = j ^(Mj) П р(Ж7)= 0].

Применяя теорему Поста (см. [119, с.87]), имеем р(Mj) — рекурсивные множества, то есть выполняется условие предложения 2.5 и проблема классификации для тройки (M, R, р) разрешима.

Следствие 2.5 доказано. □

Следствие 2.6. Пусть (M, р) — множество сильно конструктивных объектов, и даны два разбиения Ri ^ {A¿|i € In} и R2 ^ {Bj|j € } множества М такие, что существует функция р : — , где ^ {1, 2,...,n}, Ifc ^ {1, 2, ...,k} и имеет место р(Вр(-)) р(А-), (i = 1n). Тогда если проблема классификации для тройки (M, Ri^) разрешима, то для тройки (M, R2, р) она также разрешима.

Доказательство. Пусть для тройки (M, Ri, р) проблема классификации разрешима и выполнены условия следствия 2.6. По предложению 2.5 р(А-), (i € ) — рекурсивные множества.

Но по свойству т -сводимости будем иметь для каждого г € ) — рекурсивные

множества. Отсюда по предложению 2.5 получаем, что проблема классификации для тройки (М, Я2,^>) разрешима. □

Примером конструктивных множеств ^>(М) являются текстурные изображения [57]. Заметим, что ^>(М) есть конечное множество. Поэтому в силу следствия 2.4 проблема классификации для тройки (М, Я, ^>), где Я — произвольное конечное разбиение множества М, разрешима.

Поставленная таким образом задача классификации допускает многоальтернативное решение в том смысле, что функцию Н можно рассматривать как частичное многозначное отображение. Значения этого отображения и являются альтернативами при принятии окончательного решения к какому классу (образу) принадлежит предъявляемый объект х € М.

Одним из условий сокращения альтернатив, то есть получения однозначного решения задачи классификации, является требование к функции ^ : М ^ N обладать разнозначностью. Это тот случай, когда (М, — сильно конструктивные объекты.

Более общим условием однозначного принятия решений является требование попарного непересечения множеств <^(М») и ^>(М;) (г = ] € 1т) для исходного разбиения множества М.

2.2. Нумерованные совокупности конечных объектов

Известно, что класс всех частично рекурсивных функций совпадает с классом всех частичных арифметических функций, допускающих эффективное вычисление [36].

Поэтому представляется желательным, чтобы все исследования в теории алгоритмов и ее приложениях проводились на основе «общего знаменателя» — класса всех частично рекурсивных функций.

Одним из способов такой редукции к натуральным числам и арифметическим функциям является использование подходящей нумерации, то есть отображения некоторого подмножества множества натуральных чисел N на исследуемый класс конечных объектов (формул, слов, матриц и т.д.) [64, 65].

2.2.1. Нумерации множества

Пусть 5 — произвольное множество, N ^ {0,1,2,...} — множество всех натуральных чисел, нумерация V : N ^ 5, то есть произвольное отображение N на 5. Множество 5 с нумерацией V называется нумерованным [36].

В работе [9] рассматривались множества М с обратным отображением ^ : М ^ N множества М в N. Такие множества названы множествами конструктивных объектов. Для любого разбиения Я ^ {М1, М2,..., Мп} множества М ставится проблема классификации для тройки (М, Я, [9].

Изучение свойств нумераций семейств конечных объектов ^ позволяет перенести проблему классификации из области натуральных чисел в область произвольных конечных объектов

[173].

Рассмотрим некоторые конкретные семейства конечных объектов, которые часто встречаются в прикладных задачах [68].

2.2.2. Сильная рекурсивность и сильная перечислимость

Обозначим через Ф семейство всех конечных подмножеств натурального ряда N Фо — семейство конечных множеств из Ф, Фо С Ф. Для семейства Ф известна [119] стандартная нумерация 7 : N ^ Ф, которая определяется так: 7 (0) ^ 0 и для любого п > 0, если п = 2П0 + 2П1 + ... + 2Пк, где п0 < п1 < ... < пк, то 7 (п) ^ {п0,п1, ...,пк} € Ф.

Относительно нумерации 7 известно, что она однозначна и вычислима [36].

Определение 2.9. Семейство Фо С Ф конечных множеств называется сильно перечислимым (сильно рекурсивным), если множество 7-1 (Фо) рекурсивно перечислимо (рекурсивно) [36].

Пусть отображение А : М —Ф таково, что диаграмма коммутативна, то есть А = 7р.

Ф к

Y N

Тогда для любого разбиения R ^ {M¿|i € In ^ {1, 2, ...,n} , n € N} множества M проблему классификации для тройки (M, R, А) можно сформулировать так: существует ли вычислимая относительно {А (M¿) |i € In} функция h : Ф ^ P (In) такая, что диаграмма коммутативна, то есть Ф = hA и выполнено условие

P (In ) h

Ф

(Уж' € M) А (ж') = а ^ Ф (ж') = h (а)

где Ф (ж') = {г|А(ж') € А(М^)}. Функция Н определяется как и в работе [9]: Н (п) = = {¿1хлт4 (п) = 0, г € 1га} , п € N.

Нумерация 7 сводит проблему классификации для тройки (М, Л, А) к проблеме классификации для тройки (М, Л, р) в том смысле, что если проблема классификации для тройки (М, Л, р) разрешима, то для тройки (М, Л, А) она также разрешима, и наоборот, если проблема классификации для тройки (М, Л, р) неразрешима, то для тройки (М, Л, А) она также неразрешима. В силу однозначности и вычислимости нумерации 7 имеет место

Предложение 2.7 (критерий разрешимости для (М, Л, А)). Проблема классификации для тройки (М, Л, А) разрешима тогда и только тогда, когда (УМ^ € Л) [А(Мг) сильно рекурсивно ].

Предложение 2.8 (критерий неразрешимости для (М, Л, А)). Пусть А (М) сильно перечислимо, но не сильно рекурсивно. Тогда ни для какого конечного разбиения Л множества М проблема классификации для тройки (М, Л, А) неразрешима.

В отличие от предложений 1.3 и 1.4 [9], где требуется определять рекурсивность и рекурсивную перечислимость соответствующих подмножеств натурального ряда N в предложениях 2.7 и 2.8 желательно иметь критерии для определения сильной рекурсивности и сильной перечислимости соответствующих подсемейств Ф, имея в распоряжении любую нумерацию некоторого подсемейства Фо С Ф. Для этой цели приведем

Предложение 2.9. Пусть имеется нумерация V! : N ^ Фо. Тогда для любого подсемейства О С Фо, если V-1 (О) рекурсивно перечислимо (рекурсивно) и 7-1 (О) ^т

V- (О) , то есть множество 7 1 (О) т-сводимо к множеству V- (О), то О сильно перечислимо (сильно рекурсивно).

Доказательство. В силу свойств т -сводимости [36] следует, что 7-1 (О) будет рекурсивным или рекурсивно перечислимым, если таковым является множество V-1 (О). В силу определения 2.9 получаем справедливость предложения 2.9. □

Пусть О — семейство всех одноместных общерекурсивных функций (о.р.ф.), а О1 — семейство всех одно-однозначных о.р.ф.

Определение 2.10. Нумерация V : N ^ 5 произвольного множества 5 называется однозначной, если (Уп, т € N) [п = т ^ V (п) = V (т)] .

Предложение 2.10 [36]. Нумерация V : N ^ 5 некоторого семейства рекурсивно перечислимых множеств Б вычислима тогда и только тогда, когда нумерация V сводится к нумерации п, то есть V ^ п (п — постовская нумерация Рп, где Рп — семейство всех рекурсивно перечислимых множеств).

Предложение 2.11. Если нумерация V! : N ^ Фо некоторого семейства Фо С Ф 1 -сводится к 7, то есть (V! ^ 7), то она вычислима и однозначна.

Доказательство. Поскольку 7 — вычислимая нумерация Ф, то по предложению 2.10 7 ^ п. С другой стороны, в силу условия предложения 2.11 V! ^ 7. Отсюда, согласно транзитивности сводимости нумераций, V! ^ п, то есть V! — вычислимая нумерация по предложению 2.10.

Покажем, что V! — однозначная нумерация. Так как V! ^ 7, то (3/ € О!) [V! = 7/] (Уа, Ь € N [а = Ь ^ /(а) = /(Ь)] . Но 7 — однозначная нумерация, и, следовательно, а = Ь ^ ^ 7 (/ (а)) = 7 (/ (Ь)) ^ V! (а) = v1 (Ь). Что и требовалось доказать. □

Обозначим через А следующее подсемейство Ф :

А ^ {{0} , {1} , {2} ,...} .

Предложение 2.12. Нумерация ^ : N ^ А, определенная следующим образом,: (Ух € N [^ (ж) = {ж}] , однозначна и вычислима.

Доказательство. Покажем, что ^ ^ 7- Сводящей функцией / € О! в данном случае служит функция / (ж) = 2х. В силу предложения 2.11 нумерация ^ вычислима и однозначна. Предложение доказано. □

Обозначим через Н семейство всех начальных отрезков натурального ряда N то есть Н = {{0,} {0,1} , {0,1, 2} ,...} .

Предложение 2.13. Нумерация Vя : N ^ Н, определенная как (Уж € N ^я (ж) = {0,1, 2,..., ж}] , однозначна и вычислима.

Доказательство аналогично доказательству предложения 2.12. □

х

В данном случае сводящей функцией является / € О! такая, что / (ж) = ^ 2\

г=0

Предложение 2.14. Семейства А и Н сильно перечислимы.

Доказательство. Множества 7-! (А) и 7-! (Н) являются множествами зна-

х

чений примитивно рекурсивных функций / (ж) = 2х и /2 (ж) = ^ 2г, поэтому 7-! (А) и

г=0

7-! (Н) являются рекурсивно перечислимыми множествами и по определению 2.9 А и Н сильно перечислимы. Предложение доказано. □

Рассмотрим счетное множество семейств Фп С Ф, п € N таких, что

Фп ^ {{а!, а2,..., а„} | (а! < а2 < ... < а„) & (а!,..., а„ € N)} .

Для п = 0 полагаем Фо ^ {0} . Для п =1 имеем Ф! = А.

Возникает вопрос, существуют ли для п ^ 2 вычислимые однозначные нумерации семейств Фп ? Для п = 2 вопрос решается положительно.

Упорядочим элементы множества Ф2 согласно канторовской нумерации [119] (см. рис. 2.1). Тогда нумерация с }) , (г < ,?') семейства Ф2 имеет следующий вид:

с({г,1})=г + 1^-, {КЗ).

Положим Ь (с })) ^ г, Л (с ({г,,?'})) ^

Тогда, если с ({г,^}) = ж, то Л (ж) и Ь (ж) вычисляются следующим образом:

/к (к-1) , ч . Л (ж) (Л (ж)-1) Я(х)=(гк --2 -

Здесь ц — оператор минимизации [119].

о 1 3 6 10 15

{0,1} {0,2} {0,3} {0,4} {0,5} {0,6} ...

2 4 7 11 16

{1, 2} {1, 3} {1, 4} {1, 5} {1, 6} ...

5 8 12 17

{2, 3} {2, 4} {2, 5} {2, 6} ...

9 13 18

{3,4} {3,5} {3,6} ...

14 19

{4, 5} {4,6} ... 2о

{5,6} ...

Рис. 2.1. Упорядочение элементов семейства Ф2

Нетрудно проверить, что нумерация V2 : N ^ Ф2, определенная как (Уж € N) [V (ж) = {Ь (ж), Л (ж)}] , является вычислимой и однозначной.

Для п > 2 поставленный выше вопрос остается открытым. Пусть — семейство некоторых последовательностей (01, 02,..., ага,...) натуральных чисел.

Определение 2.11. Нумерацию ^ : N ^ назовем вычислимой, если для любого ж € N двухместная функция (ж, у) ^ ^ (ж, у) = частично рекурсивна, где ж — номер последовательности (оц, 02,...).

2.2.3. Квазисильная рекурсивность и квазисильная перечислимость

Рассмотрим еще одно семейство конечных объектов, а именно, множество всех кортежей натуральных чисел

К = {А} и N и N х N и N х N х N и ... = и ^

га=0

(здесь А — пустой кортеж).

Определим кодирование с*, которое отображает К взаимно однозначно на N [119].

Определение 2.12. с* (А) = 0;

с* ((ж1, ...,ж„)) = с (сп (ж1, ...,ж„), п - 1) + 1;

, Л (ж1 + ж2)2 + 3ж1 + ж2 п, ,

где с(х 1,Х2) =--- — канторовская нумерация пар, а с ...,хп) — нумерация п -к, которую можно задать рекуррентными соотношениями: с1 (ж) = ж, и для любого п ^ 2

сп (ж1, ...,ж„) = с (сга-1 (ж1,..., жга-1) ,ж„) , (с2 = с) . Легко проверить, что с*-1 однозначная и вычислимая нумерация.

Определение 2.13. Семейство Ко конечных кортежей назовем квазисильно перечислимым (квазисильно рекурсивным), если множество с* (Ко) рекурсивно перечислимо (рекурсивно).

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Пусть отображение Дс» : М ^ К таково, что диаграмма коммутативна, то есть Дс» : с*-1^>. Тогда критерии разрешимости для тройки (М, Д, Дс») можно сформулировать аналогично предложениям 2.7 и 2.8, где вместо сильной рекурсивности и сильной перечислимости будем иметь в виду квазисильную рекурсивность и квазисильную перечислимость.

Приведенные примеры говорят о том, что понятие квазисильной перечислимости и квазисильной рекурсивности можно перенести на любые подмножества конечных объектов ^ с соответствующей однозначной и вычислимой нумерацией. В этом случае сильная рекурсивность и сильная перечислимость будут являться частными случаями квазисильной рекурсивности и квазисильной перечислимости. Вернемся к диаграмме, где А = г/з<£>; г/3 — вычислимая и

однозначная нумерация F, V3 : N ^ F.

Тогда справедливы следующие критерии и оценки разрешимости проблемы классификации для тройки (M, R, А), где R — конечное разбиение множества (M, конструктивных объектов.

Предложение 2.15. Проблема классификации для тройки (M, R, А) разрешима тогда и только тогда, когда для всякого представителя M¿ € R [А (M¿) квазисильно рекурсивно ].

Следствие 2.7. Пусть множество А (M) конечно. Тогда, какое бы ни было конечное разбиение R множества M, проблема классификации для тройки (M, R, А) разрешима.

Доказательство. Так как А (M) конечно, то и любое подмножество А (M¿), где M¿ € R, конечно в силу конечности R. Но тогда v-1 (А(М^)) также конечны, а следовательно, и рекурсивны, то есть А (M¿) квазисильно рекурсивные множества для всех M¿ € R и в силу предложения 2.15 проблема классификации для тройки (M, R, А) разрешима. □

Предложение 2.16. Пусть M таково, что А(M) квазисильно перечислимо, но не квазисильно рекурсивно. Тогда ни для одного конечного разбиения R множества M проблема классификации для тройки (M, R, А) неразрешима.

Доказательство. Пусть нашлось конечное разбиение R ^ |M¿|¿ € } множества M такое, что проблема классификации для тройки (M, R, А) разрешима. Тогда по предложению 2.15 А (M¿) квазисильно рекурсивны, то есть (VM¿ € R) [v—1 (А (M¿)) рекурсивны ]. Но тогда в силу свойств рекурсивных множеств [119] объединение конечного числа рекурсивных множеств v—1 ^(M)) = (J v—1 ^(Mj)) также рекурсивно, то есть

¿el

А (M) квазисильно рекурсивно. Противоречие. Предложение доказано. □

Таким образом, рассматривая семейства конечных объектов, наделенные вычислимыми однозначными нумерациями, удается выделить проблему классификации, определить критерии и оценки ее разрешимости.

§ 3. Теоремы существования и единственности в системах принятия решений

Развитие средств вычислительной техники в направлении увеличения быстродействия накладывает отпечаток и на методы распознавания образов.

В последнее время все большее внимание исследователей обращено к моделям классификации дискретной информации, подчиняющимся распараллеливанию [131].

В данном параграфе формулируются теоремы существования и единственности решений, то есть условия однозначной разрешимости моделей типовых игровых решающих правил.

3.1. Разрешимость моделей игровых решающих правил

Рассматривая модель принятия решений, обычно интересуются ее адекватностью реально существующим объектам, то есть насколько качественно модель справляется с возложенными на нее обязанностями классифицировать заданное множество исходных реализаций.

Наряду с этим вопросом уместно спросить, а существует ли вообще решение для предъявленной реализации в данной модели классификации, и если существует, то единственно ли оно? Причем на эти вопросы необходимо ответить не применяя при этом саму модель к предложенной реализации, а лишь оценив соотношение между структурой модели и свойствами предъявляемой реализации [53, 55, 61].

Сформулируем условия однозначной разрешимости (существования и единственности решений) для класса детерминированных, многоальтернативных решающих правил: модели Вальда, Лапласа, Евклида, коллективного голосования и сильного голосования [87]. Рассмотрим соотношения между обучающей выборкой и неизвестной реализацией, гарантирующие принадлежность последней к одному и только одному классу [73].

3.1.1. Модель коллективного голосования

Модель коллективного голосования обозначим через М1 = (М; О; /; 01) с некоторым основным множеством М, обучающей выборкой О = Ци^ ||г и классифицирующей функцией / : I ^ где I ^ {1, 2,..., 1} , 1 ^ {1, 2,..., £} ; п — число признаков; £ — число классов; 1 — число эталонов; некоторая реализация распознаваемого объекта Ж = (ж1, Ж2..., жп) € М.

Сигнатура 01 = (Яц, Я12,..., Я^) состоит из £ одноместных предикатов, которые интерпретируются следующим образом:

П1к (ж) = V Щ (ж), (к = М) ;

где множество номеров эталонных объектов — = {г|/ (г) = к} , (к = 1, ¿) , ж = (х\, жг-., жга), Ж € М;

частные решающие предикаты:

Кг (ж) = { еСЛИ = *<>;(* = М), Кг = £г ( )

I 0, в противном случае '

.7=1

, ж^-) — мера близости между эталонными и и предъявленными ж^- значениями j -го признака для г -го объекта Ж € М :

1, если = ж.,-; (г = 1,= 1,п) ,

V (иг7) ж7) — I п

0, в противном случае Ко = шах(К1,К2,...,Кг).

3.1.2. Модель сильного голосования

Модель сильного голосования обозначим через М2 = (М; О; /; 02) с тем же основным множеством М, обучающей выборкой О и классифицирующей функцией /, что и в предыдущей модели и сигнатурой 02 = (Я21, Я22,..., Я2£), одноместные предикаты которой интерпретируются следующим образом:

Й2/С (ж) = V Сг (ж), (к = М); (г = м);

где частные решающие предикаты

п

С (ж) = & Г («7 ) .

7=1

Мера близости эталонного описания О(ж) и предъявленного Х(ж) для объекта ж € М определяется как и в модели коллективного голосования.

3.1.3. Модель Вальда

Модель Вальда обозначим через Мз = (М; О; /; 03), где М, О, / те же, что и в предыдущих моделях. Новой компонентой в модели Вальда является сигнатура 03 = (Лз1, Л32,..., Лз^), где общее решение определяется по схеме

Дзк (х) = V (ж), (к = М) ;

геОк

= Г 1, если Да) = А0; (г = 1, /) г I 0, в противном случае,

где Ао = шт(Аю, А2о,..., Аю), Аго =шах(Ай, Аг2,...,Агп).

Аг7 — невязка между эталонным « и предъявленным ж7- значениями j -го признака для г -го объекта: ( )

Ду = - ; (г = 1,= 1~п) .

3.1.4. Модель Лапласа

Модель Лапласа обозначим через М4 = (М; О; /; 04), где М, О, / те же, что и в предыдущей модели. Сигнатура модели 04 = (Л41, Л42,..., Л4^), где общее решение задается схемой:

П4к (ж) = V и (ж), (к = Щ. геОк

Частные решающие предикаты:

ь , . = Г 1, если и = Ь0; (г = 1,1); г 0, в противном случае.

Мера близости эталонного описания О(ж) и предъявленного Х(ж) для объекта ж € М определяется как и в модели Вальда.

Ь — сумма всех невязок А7- по г -й строке, то есть для г -го объекта:

п

Ьг = Е Ду; ¿о = т}п£г; (г = 1,1) ,

7=1 г

где Аг^ — невязка определяется так же, как и в предыдущей модели.

3.1.5. Модель Евклида

Модель Евклида обозначим через М5 = (М; О; /; 05), где М, О, / те же, что и в предыдущих моделях. Сигнатура модели 05 = (Л51, Л52,..., Л5^). Общее решение задается по схеме

(ж) = V £ (ж) , (Л = М) ,

геОк

где частные решающие предикаты

6 (х) — { ^ 6СЛИ = ^ = 0 ' г 0, в противном случае,

Ог — сумма квадратических невязок:

Пг = ^ («у — ж^-)2 , (¿ = 1,/); По = пни (Лъ ГЬ) •••) ^г) •

7=1

Выделенные модели являются наиболее типичными в классе игровых решающих правил. Рассмотрим для каждой модели теоремы существования и единственности.

Вопрос о существовании решения назовем проблемой разрешения. Если решение существует, то будем говорить, что проблема разрешения разрешима, если не существует — неразрешима. Если решение существует и единственно, то будем говорить, что проблема разрешения однозначно разрешима. В противном случае — однозначно неразрешима.

Теорема 3.1. Пусть O С M — некоторая обучающая выборка и объект x € M такой, что существует и единственно i (1 ^ i ^ 1) такое, что [ujm = xm] , (1 ^ m ^ n) и для любого j = i (1 ^ j ^ 1) и для всех k (1 ^ k ^ n) [ujk = ]. Тогда решение на X в модели коллективного голосования существует и единственно.

Доказательство. В силу условий теоремы (Vk) (Vj = i) [r (ujfc,Xfc) = 0] .

n

Следовательно, Kj = ^ r (ujfc,Xfc) =0. По условию теоремы существует i такое, что

fc=i

n

r («im,xm) = 1. Следовательно, K» = r (uim,xm) > 0.

m=1

Пусть Ki = d. Тогда Ko = d. K» (x) = 1 и (Vj = i) [Kj (x) = 0]. Отсюда Rif(г) (x) = 1 и (Vk = f (i)) [Rifc (x) = 0].

Решение существует и единственно. Теорема доказана. □

Для модели сильного голосования условий теоремы 3.1 для однозначного разрешения недо-

n

статочно. Если K» = d < n, то C» (x) = & r (u»j, xj) = 0 вместе со всеми Cj (x) = 0 для j = i.

j=i

В этом случае решения не существует.

Теорема 3.2. Пусть O С M — некоторая обучающая выборка и объект x € M такой, что существует и единственно i (1 ^ i ^ 1) , [x = u»] и для всех j = i (1 ^ j ^ 1) существует, kj (1 ^ kj ^ n), что [ujfcj = xj . Тогда проблема разрешения для модели сильного голосования на x однозначно разрешима, то есть решение существует и единственно.

Доказательство. Возьмем произвольно j / t (j,i = 1,1). Пусть kj таково, что Ujkj = x^j. Такое j по условию теоремы существует. Тогда r (ujkj , xj =0 и

n / \

C» (x) = & r (ujfcj ,xfcJ = 0. j=i

Поскольку j — произвольное, то это выполнено для всех j = i. По условию теоремы х = щ, то есть для всех к = 1,п [хк = Щк] • Следовательно, г(щк,Хк) = 1, (к = 1,п).

n

Отсюда C» (x) = & r (u^, ) = 1. Таким образом, R2f(») (x) = 1 и (Vk = f (i)) [R2fc (x) = 0]. fc=i

Решение существует и единственно. Теорема доказана. □

Теорема 3.3. Пусть min maxAjj < min maxAqj, где k € для некоторого

»eDfc jeln g€l\Dfc jein

x € M. Тогда проблема разрешения для модели Вальда на x однозначно разрешима.

Доказательство. Пусть Ao = minmaxA»j. Поскольку minmaxA»j ^

»ei; jeln ieDfc jeln

^ max maxA»j, то имеем minmaxA»j < min maxA»j, то есть существует i € D такое, »eDfc jeln »eDfc jeln qel;\Dk jeln

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

что A»o = Ao и (Vq € 1\Dfc) [Aqo = Ao] . Отсюда W» (x) = 1 и (Vq € 1\Dfc) [Wq (x) = 0] .

Следовательно, R3f (») (x) = 1 и (Vk = f (i)) [R3k (x) = 0] .

Решение существует и единственно. Теорема доказана. □

Теорема 3.4. Пусть max L» < min Lj для некоторого k € и x € M. Тогда

»eDk jel;\Dfc

проблема разрешения для модели Лапласа на x однозначно разрешима.

Доказательство аналогично доказательству теоремы 3.3. □

Теорема 3.5. Пусть maxQj < min Q7- для некоторого k € Тогда проблема

ieDfc jelVDfc

разрешения для модели Евклида на X однозначно разрешима.

Доказательство очевидно. □

Вернемся к моделям коллективного и сильного голосования.

Теорема 3.6. Если max Ki < min Kj для некоторого k € и X € M, то про-

ie-Dfc iel;\Dfc

блема разрешения для модели коллективного голосования на X однозначно разрешима.

Доказательство. Пусть Ko = max (Ki,..., K). В силу условий теоремы (Зг € Dfc) [Ki = Ко] и (Vj € I\Dfc) [Ki = Ко] . Следовательно, K (X) = 1 и (Vq € 1\Dfc) [Kq (X) = 0]. Отсюда RifW(X) = 1 и (Vk = f (г)) [Rifc (X) = 0] .

Решение существует и единственно. Теорема доказана. □

Теорема 3.7. Пусть max Cj < min Cj для некоторого k € и (3q € D) [Cq = n] Тогда проблема разрешения для модели сильного голосования на X однозначно разрешима.

Доказательство аналогично доказательству теоремы 3.6 с учетом того, что k0 = n. □

Приведем две очевидные теоремы, когда однозначного решения не существует.

Теорема 3.8. Пусть O — некоторая обучающая выборка и объект X € M таков, что существуют г и k (г = k), для которых имеет место Kj = K = Ko и f (г) = f (k). Тогда проблема разрешения для модели коллективного голосования на X однозначно неразрешима.

Теорема 3.9. Пусть O — обучающая выборка и X € M таков, что существуют г и k (г = k) , для которых выполнено

Li = Lfc = Lo; ^i = ^fc = ^o и f (г) = f (k). Тогда проблема разрешения для моделей Лапласа и Евклида однозначно неразрешима.

Приведенные модели классификации реализуются параллельно-последовательным распознающим автоматом [75].

3.2. Условия существования симультанной модели классификации

Недостатком рассмотренных выше (п. 3.1) моделей Вальда, Лапласа, Сэвиджа, коллективного и сильного голосования, работающих с n признаками и имеющих возможность распараллеливать принятие решения, является то, что при большом количестве признаков n необходимо выполнить n сравнений неизвестной реализации с элементами кортежей обучающей выборки прежде, чем дать окончательное решение.

Цель настоящих исследований — построить симультанную («одномоментную») модель классификации, где время на принятие решения не зависит ни от количества эталонов в обучающей выборке, ни от количества признаков, которыми характеризуются эти эталоны [87].

Если мы научимся сравнивать неизвестную реализацию X = (xi, X2,..., Xn) только по одной точке с информативным элементом каждого кортежа обучающей выборки O = | и сохраним параллельный способ принятия решения, то наша цель будет достигнута.

Сформулированные условия существования симультанной модели классификации позволяют доказать теорему о существовании информативных элементов, гарантирующую единственность принятого решения.

Рассмотрим сначала обучающую выборку Oo ^ Xi, X2,..., Xi.

Нам потребуются следующие обозначения.

Исходные множества: V/ = Xj, (г = 1, ¿) .

Индексные множества, получаемые на последующих шагах по рекуррентной схеме:

=

г

У/\£„ ее.ш г/ £? ' •'*: (/•./' !•/!•

, г , в противном случае. Элементы вспомогательной логической матрицы 9 = ||9г*

9г*

= / 0, если = 0;

1, в противном случае.

Замечание 3.1. Из соображений необходимости рассматривать более общий случай полагаем ] = 1 ,п — число идентификационных признаков объектов (а для каждого объекта как минимум один строго отличительный признак), не более г = 1,1 — числа классифицируемых объектов, то есть ] ^ г; поэтому, не уменьшая общности, но для упрощения записей, в дальнейшем принимаем = 1,1.

Замечание 3.2. Введенная рекуррентная схема и логическая матрица д позволяют в сжатой форме записать алгоритм поиска пересечений (сцеплений) исследуемых множеств, благодаря компактности такая запись будет в дальнейшем использоваться в вопросах разрешимости и вычислимости различных предикатов.

Рассмотрим пример введенных обозначений.

Пример 3.1 [70]. Диаграммы Венна для Оо = (£1, £2, £3, £4} , где £] = {1, 2, 3} , £2 = (3, 4, 5} , £3 = (2, 3, 4} , £4 = (6, 7} .

Для указанных множеств

V]1 = £1, р^1 = £2, V1 = £3, р^1 = £4; 911 = 1, 921 = о, дз1 = 0, 941 = 0;

V]2 = £1 = (1, 2, 3} ; 912 = 0;

V? = £2\£] = (4, 5} ; 922 = 1;

Рз2 = £з\£] = (4} ; 932 = 1; VI2 = £4 = (6, 7} ; 942 = 0;

V]4 = (£]\£2) \£з = (1} ;

= (£2\£г) \£з = (5} ; ^з4 = £з\£] = (4} ; V!4 = £4 = (6, 7} ;

V3

= £]\£2 = (1, 2} ; V/ = £2\£] = (4, 5} ; V?3 = £з\£] = (4} ; V43 = £4 = (6, 7} ;

914 = 0 924 = 0

9з4 = 0 944 = 1

91з = 0 923 = 0

9зз = 1 943 = 0

V5 = (1} ; = (5} ; Уз = (4} ; V45 = (6, 7} . Соберем элементы 9г* данного примера в логическую матрицу следующего вида:

9 = || 9-

г* 114x4

10 0 0 0100 0110 0001

Обозначим I ^ {1, 2, 3, ...,1} .

Теорема 3.10. Пусть (Уг € 1г) [X, = 0] . Тогда (Уг € 1г) (У, € 1г+1) V/ = 0

Доказательство.

1. Пусть ] = 1. В этом случае V,1 = 0 в силу того, что по определению V,1 = X,.

2. Пусть j = 2. Предположим, что V,2 = 0 для некоторого г € 1г.

По определению

Г ^1\Х1, если У/\Х1 = 0; г \ V,1, в противном случае.

V,2 не может равняться рг^Хъ поскольку это возможно только тогда, когда рг1\Х1 = 0. У нас же по предположению V2 = 0- Следовательно, V,2 = V1. Отсюда V,1 = 0, что противоречит условию теоремы. Остается признать, что V,2 = 0.

Аналогично показываем, что V2 = 0 ^ V3 = 0 и т.д. Таким образом, для любого г € 1г и для всякого j € 1г+1 V/ = 0. Теорема доказана. □

Теорема 3.11. Для любого г € 1г [У/+1 С V/ С ... С V/ С ... С V,1], 1 ^ j ^ т + 1.

Доказательство следует непосредственно из определения множеств V/. □

Приведем основной результат данного параграфа.

Теорема 3.12 (о существовании информативных элементов). Пусть (Уг € 1г) [X, = 0] и (Уг = j € 1г) [д/ = 1 ^ = 0] . Тогда существует 1 информативных элементов а, € таких, что предикат классификации

й (X) = [а € X] &

V [а/ € Xl & /

обращается в «единицу»» тогда и только тогда, когда X = X,, где X € Оо.

„ Г 1, если условие * в полускобках выполнено;

заметим, что * = < _

0, в противном случае.

Для доказательства теоремы 3.12 нам потребуется

Лемма 3.1. Пусть (Уг € 1г) [X = 0] и а, € У/+1 для некоторого г € 1г. Тогда если [а, € X/ ] = 1 при г = то д/ = 1.

Доказательство. Пусть элемент а, € таков, что а, € X/ и г =

Покажем, что Vг'7 С X/. Предположим, что д,/ = 0, то есть V/ СXj. По теореме 3.10 имеем V/ = 0. По определению введем

/ = V/ ^^ = 0.

Но в силу теоремы 3.11 У/+1 С */'+1. Поэтому V/+1\Xj = 0. Отсюда следует, что а , € X/.

По закону контрапозиции получаем V/ С X/. Следовательно, V/^^ = 0, то есть д,/ = 1.

Лемма доказана. □

Доказательство теоремы 3.12.

Нужно доказать, что при условии теоремы 3.12, если X = X, € Оо, то (X,) = 1 и для всех г = ] € 1г получим й/ (X,) = 0.

Пусть X = X,. Тогда предикат [а, € X/] = 1. Если (У^' = г € 1г) [[а/ € X,] =0], то

V [а/ € Xг 1 & д

/ез I\{,}

0 независимо от д,/, и в этом случае (X,) = 1.

Предположим противное, то есть (3^' = г) [[а/ € X,] =1]. В силу леммы 3.1 имеем д,/ = 1. По условию теоремы 3.12, если г = то / = 1 ^ д= 0. Поэтому имеем д,/ = 0. Отсюда вытекает, что [а/ € X,] & д,/ = 0.

Пусть = г все такие индексы, что [а.^ € £¿1 = 1- Отсюда вытекает

[а.^ € £¿1 & 9.7кг = 0 по тем же соображениям. А с другой стороны, для всех ? € 1Д{л,,?2, г} [а. € £¿1 & 9. = 0 в силу того, что [а. € £¿1 = 0. Отсюда следу-

ет, что

V [а. € £г1 & 9г.

.€1 \{г}

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

0.

Следовательно, (£) = 1.

Осталось доказать, что (У? € 1Д {г}) [0^ (£) = 0]. Заметим, что

0. (£) = [а. € £¿1 &

V [ай € £¿1 & 9^

Возможны два случая, когда [а. € £¿1 =0 и [а. € £¿1 = 1.

В первом случае (£) = 0. Рассмотрим второй случай, когда [а. € £¿1 =1. В силу леммы 3.1 9. = 1. С другой стороны, [а. € £¿1 = 1. Следовательно, [[а^ € £¿1 & 9^1 = 1.

Значит,

= 1 и искомый предикат 0. (£) = 0.

V [а& € £¿1 & 9^

Теорема 3.12 доказана. □

В применении теоремы 3.12 к примеру 3.1 получим следующие решающие предикаты:

01 (£) = [1 € £1 ; 0з (£) = [4 € £1 & - [5 € £1 ;

02 (£ = [5 € £1 ; 04 (£ = [6 € £1 .

Следует заметить, что любой предикат 0^ (£) можно вычислить независимо от других предикатов. Другими словами, их можно вычислить параллельно.

Прежде всего мы добились, что при выполнении условий теоремы 3.12 найдется I информативных точек из множеств обучающей выборки Оо.

Для того чтобы не было у предикатов из теоремы 3.12 «хвоста» вида V [а. € £1 & 9.,

необходимо, чтобы логическая матрица ||9.||гхг была единичной.

С учетом этого условия предикаты 0^ (£) принимают вид

0г (£) = Га € £1.

1. Если £ рекурсивно [119], то нужно вычислить характеристическую функцию множества £ в точке а^.

2. Если £ конечно, то по-прежнему нужно сравнивать значение информативного элемента а^ с каждым элементом множества £.

Ответ на поставленную первоначальную задачу (о сравнении с информативными элементами) следует искать в решающих правилах с обучающей выборкой О = ||и. |хга, имеющей I кортежей (эталонов) щ длины п (п — число признаков). Предварительно преобразуем кортежи щ € О так, чтобы можно было воспользоваться теоремой 3.12. Пусть щ. — действительные числа и А > 0. Вычислим константы:

тах щ. + шт щ.

г %

; 0 = 1 ,п);

С1 = С1 + А; С2 = 2С1 + С2 + А;

га—1

с„ = 2 ¿2 а + с„ + А.

¿=1

Положим далее, что = {и^ + С\,..., щп + сп} , (г = 1,1). £ = {х\ + С\,..., хп + сп} для некоторого х = (ж^ ж2,..., жп) .

Следствие 3.1. Пусть О = Цщ. || таково, что (У^ € 1г) [£1 = 0] и (Уг € 1г)

Тогда существует I информативных элементов а! € таких, что

1, е сл и а — хс.; _ у \

где х = (жь ...,жп) € О, ж,- = ж,- + с. и индекс 0, в противном случае, л л

? выбран из условия с. — с. ^ Ж. ^ с. + с., обращается в «единицу»» тогда и только тогда,

когда Ж = щ € О.

£г\ и £. = 0 предикат (Ж) =

.

2

Константы с, вводятся для того, чтобы не произошло ненужных «слипаний» элементов кортежей обучающей выборки О. Предикаты М, (ж), которые логически эквивалентны предикатам (X) = [а, € X] , позволяют делать сравнения неизвестной реализации ж по одной точке с информативными точками а,. Кроме того, они вычисляются параллельно.

Таким образом, модель классификации с условими следствия 3.1 имеет предельно короткий цикл принятия решения, где время на принятие решения не зависит ни от количества эталонов в обучающей выборке, ни от количества признаков, которыми характеризуются эти эталоны.

Такую модель классификации назовем симультанной моделью классификации, обладающей свойством инвариантности к количеству эталонов в обучающей выборке и количеству признаков в эталонах.

§ 4. Классификация множеств по классам эквивалентности

Решается одна из теоретических задач распознавания образов: классификация неизвестных множеств объектов по заранее заданным их классам эквивалентности [79]. Рассматриваются конечные множества объектов с конечным разбиением. Для решения задачи классификации предъявляется неизвестный объект в целях установления принадлежности к одному из классов эквивалентности.

Требуется предельно быстро (за один такт) принять решение о принадлежности объекта к одному из классов эквивалентности.

В отличие от стандартной обучающей информации, рассматриваемой в работе [38], в данной работе ослаблено условие иметь постоянное число признаков, а также требование упорядоченности между номерами признаков, то есть в качестве обучения рассматривается система множеств необязательно одинаковой мощности.

Допущенное ослабление на механизм получения обучающей информации приводит к дальнейшим обобщениям в теории распознавания [8], а фиксация количества признаков и их номеров следования приводит к частным задачам этого обобщения.

4.1. О проблеме классификации множеств по классам эквивалентности

Рассмотрим М — основное, не более чем счетное множество конечных подмножеств множества всех натуральных чисел N ^ {0,1,2,...} и некоторое конечное разбиение 5 ^ {N1, N2,...,N} множества М, X — неизвестное и предъявляемое для классификации конечное подмножество из N.

Вопрос о разрешимости предиката принадлежности Р(X, N) :

, , (и, если X € 91/, ] = и — «истина», р(X, -Д/) = \

-1 [л, в противном случае; л — «ложь» ,

исследован в работе [8], где доказано, что для разрешимости предиката Р(X, ) (или проблемы распознавания для класса ) требуется, чтобы было сильно рекурсивным.

Если М ^ {X!,X2,...,Xm} — конечное множество известных конечных подмножеств Xi, (г = 1,т) и £ классов эквивалентности Б ^ {9Тъ •••) ) то проблема разрешимости предиката Р(X, ), где X € М, € 5, разрешима согласно следствию 1 [8].

В данном параграфе поставим задачу о вычислении разрешимого предиката Р(X, ) предельно быстро (одномоментно), то есть за один такт принятия решения о принадлежности неизвестного, предъявленного для классификации объекта X к одному из классов эквивалентности .

Обозначим множества индексов 1т ^ {1, 2,..., т} , 1 ^ {1, 2,..., ¿} .

Пусть / : 1т — 1 — классифицирующая функция, связывающая номера конечных подмножеств Xi,(i = 1,т) из основного множества 9Л с номерами классов эквивалентности разбиения 5. Тогда общий алгоритм вычисления предиката принадлежности Р(X, ) можно выразить через предикат равенства (идентификации) множеств

[X = XI = I и, если X = X,;

, л, в противном случае,

и классифицирующую функцию /(г) посредством импликации [X = X,] ^ Р(X, (,)), где г € 1т, /(г) = ?

Следовательно, зная классифицирующую функцию /(г) для неизвестной реализации X € М, достаточно вычислить предикат равенства множеств [X = X,] тем или иным способом, а затем уже судить о предикате принадлежности Р(X,(,)).

Общий алгоритм вычисления предикатов принадлежности Р(X, N) для всех классов эквивалентности N по предъявленному неизвестному множеству X, как одному из представителей основного множества М, сводится к следующему: предъявленное множество X сравнивается с каждым классом X, из разбиений множества М. Далее, вычислив номер г, для которого [X = X,] = и, присваиваем значение "и" предикату Р(X,N^7-(,)).

В силу того что если 5 ^ {N1, N2,..., N4} — разбиение множества М, то

(V? € 1Д{г})[Р(X, N) = и]. Дадим примеры вычисления предиката равенства множеств [X = X,] .

Замечание 4.1. Принимаем в дальнейшем, что предикат

и, если условие * в полускобках выполнено;

м =

л, в противном случае.

В отдельных случаях истинные значения предикатов будем кодировать бинарными значениями: «и» ^ «1», «л» ^ «0» [127].

4.2. Вычисление предиката равенства множеств

Пусть задано два множества Xl ^ ^1, X2,..., Xnl} , X2 ^ {^1, ^2,..., } с некоторым расстоянием р (ж, у) между элементами ж, у : ж € Xl,y € X2. Требуется вычислить предикат равенства

[X — Xг1 —

и, если %(= Хг]) = 1, г = 1,2]

л, в противном случае;

где = X,]) — характеристическая функция предиката равенства

~ Г 1, если [X = X,] = и, 0, если IX = X, | = л.

В качестве расстояния р (ж, у) можно взять, например, р (ж, у) = |ж — у| . Тогда предикат равенства заданных множеств Xl, X2 можно представить как

= X21 = [Xl с X2] & [X2 С Xl] =

Е х( [р (ж, у) = 0]) ^ 1

П х ( Е х([р(ж,у) =0]) ^ 1 ) =1'1 & П х (

уеХ2 /

=1

Следовательно, предикат равенства конечных множеств эффективно вычисляется через расстояние р между элементами этих множеств Xl, X2 в том и только том случае, когда само это расстояние эффективно вычислимо.

Однако при больших значениях П1,П2 числа элементов во множествах Xl, X2 вычисление предиката равенства множеств указанным способом может оказаться трудоемким.

4.3. Параллельное вычисление системы предикатов равенства множеств

Речь идет о параллельном (персептронном) вычислении системы частных предикатов равенств между неизвестным множеством X и определенно связанными между собой подмножествами основного множества М [127].

При этом выигрыш вычислений по времени тем существеннее, чем мощнее основное множество М, хотя при этом предобучение персептрона для вычисления системы частных предикатов равенств при крупных множествах, входящих в основное множество, потребует больших вычислений. Эти сравнения уместны с первым способом вычисления предикатов равенств, который, во-первых, последователен (нужно последовательно перебрать все элементы основного множества М, пока не обнаружится выполнение предиката равенства множеств); во-вторых, каждый раз требуется большой переборный расчет вложений неизвестной реализации во множество из М путем поэлементного сравнения.

Обозначим через Ф множество всех конечных подмножеств множества всех натуральных чисел N ^ {0,1,2,...} .

Пусть Ш ^ {£1, £2, ■ ■ ■, £т} , где € Ф, г = 1, т.

т-г Т.1 -- т^7+1 У?\3£т, если У7\£,- ф 0, (г, 1 = 1 ,т):

Положим V/ =£,-, г = 1 ,т, УГ = < 3 1 3

I

гЗ +1

у, в противном случае.

Множества У? = 1 ,т) назовём информативными зонами при классификации неиз-

вестного множества X в разбиении 5 обучающей выборки М.

Введем элементы 57 логической матрицы д = Ц^ ||тхт следующим образом:

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

{и, если у7 = 0; л, если у7\Х7 = 0.

Для поиска эффективного способа вычислений предиката равенства [X = Х^] докажем ряд вспомогательных теорем — аналогов из работы [73].

Т е о р е м а 4.1 [73]. Пусть (Уг € 1т) [у1 = 0 . Тогда (Уг € 1т) (У; € 1т+1) У/ = 0

Доказательство. Предположим противное. Пусть (Зг € 1т) (3; € 1т+1) у7 = 0 , тогда У/-1\Х7-1 = 0 или у7-1 = 0. Следовательно, У7-1 = 0. Аналогично

Ь 1 Ь * J Ь 1 ь

у7-2 = 0 и т.д. до Уь1 = 0. Пришли к противоречию. Следовательно, теорема верна. □

Т е о р е м а 4.2 [73]. (Уг € 1т)

ут+1 с ут с ... с у/ с ... с у1

, 1 ^ ; ^ т + 1.

Доказательство. Предположим противное. Пусть (Зг € 1т) (у7 С у7+1).

Это означает, что у7 С у7, если 57 = и, иначе у7 С у7\Х7- с у7. Получили, что у7 С у7 —

пришли к абсурду. Следовательно, теорема верна. □

Для любого классифицируемого множества X € Ф через [а € X] будем обозначать пре-

г (и, если а € X;

дикат принадлежности такой, что 1а € XI = <

л, в противном случае. В дальнейшем элемент а назовём информативным элементом или «идентификационной меткой»» для данного множества X.

а € ут+1

и

Тогда

Лемма 4.1. Пусть (Уг € 1т) X = 0] и (3; € 1т)

(Ук = ; € 1т) [[а € Xfc] ^ 5k] .

Доказательство. Пусть ; таково, что а € ут+1. Покажем, что в этом случае (Ук = ; € 1т) [[а € Xk] ^ 5к] . Пусть к € 1т таково, что к взято произвольно так, что к = ; и [а € Xk] = и. Докажем, что ук с Xk. Предположим противное, то есть что ук с Xk.

По теореме 4.1 имеем = 0. Следовательно, V.= 0, то есть . = л. По определению

имеем = / ^, если .= 0;

. . [ ., в противном случае.

Но \Xkfe = 0. Тогда У/+1 = У.\Xjfe. Далее, пусть т > й. Тогда в силу теоремы 4.2 и

транзитивности отношения С имеем ут+1 С ук+1. Поэтому УР*1^ к = 0. Отсюда следует, что а € Xfc, то есть [а € Xfc] = л. Противоречие. Следовательно, С Xfc. Отсюда =

0, то есть дгк = и. Что и требовалось доказать в лемме 4.1

Теорема 4.3 (о существовании информативных элементов) [73]. Пусть (Уг € 1т) [X, = 0] и (Уг = ? € 1т) = —д.г]. Тогда существует т информативных элементов ( «идентификационных меток») а, € ут+1 таких, что предикат равенства [X = X,] , предъявленного для классификации множества X и одного из эталонных классов X, :

V ([а. € X] & д.)

.€Зт\{г}

[X = X,] = [а, € X] &

обращается в «истину» тогда и только тогда, когда X = X,, X, € М.

Доказательство.

Пусть [X = X,] = и. Покажем, что

V ([а. € X] & д.)

.€Зт\{г}

[а, € X] &

Если [X = X,] = и , то X = X, и предикат [а, € X,] = и . Если (V? = г € 1т) [ [а. € X,] = л] , то

= и.

= л независимо от .

V [а. € Xг1 & дг.

.?€:Гт\{г}

В этом случае [аг € X] & — [ V [а. € X] & д. = и.

.е1т\{г}

Предположим противное, то есть (Уг = ? € 1т) [[а. € X,] = и] . В силу леммы 4.1 имеем д.г = и. Тогда по условию теоремы имеем дг. = л. Отсюда вытекает, что [а. € X,] & дг. = л. Пусть ?1, ?2,..., = г — все такие индексы, что [а.к € X,] = и. Отсюда [а. € X,] & д.кг = л по тем же соображениям. А с другой стороны, для всех ? € Зт\ {?1, ?2,..., , г} [а. € X-

& дг. = л. В силу того что [а. € X,] = л. Отсюда следует, что

V ([а. € Xг1 & дг.О .е1т\{г}

&

= л.

Следовательно, [а, € X] &

Пусть [аг € X] & —

^^ — X,] — л. Н

V ([а. € Xг1 & дг.О = и.

.€1т\{г}

ужно показать, что в этом случае

V ([а. € X] & д.)

.€1т\{г}

= л. Пусть V? € 1т\ {г} . Тогда имеем

Иначе нарушилось бы условие теоремы (Уг = ? € 1т) [дг. ^ — д^г] . Пусть Xfc = X,. Подставим

его в правую часть и вычислим высказывание [а, € Xfc] & — V ([а. € Xfc] & дг.)

.€1т\{г}

Возможны два случая: [аг € Xfc] = л или [аг € Xfc] = и. В первом случае вся конъюнкция

ложна. Рассмотрим второй случай: [аг € Xfc] = и. В силу леммы 4.1 имеем = и, то есть

[аг € Xfc] & дг& = и. Отсюда V ([а. € Xfc] & д.) = и. Следовательно,

.е1т\{г}

V ([а. € ^] & дг.О .е1т\{г}

[аг € X] &

= л. Тогда (Уй € 1т) [X = Xfc] получим:

= л, что и требовалось доказать.

V ([а. € X] & д.)

.€1т\{г}

Пусть Б ^ {N1, N2,..., N4} — разбиение М ^ ^1, X2,..., Xm} , / : 1т — 1 — классифицирующая функция. Тогда нахождение разрешимого предиката Р(X, Nfc) сводится к вычислению системы частных предикатов равенства [X = X,] : Р(X, Nfc) = V [X = X,] , где

^к = (я) = к} , к = — множество номеров эталонных классов (объектов)

Другими словами, разрешимость предиката классификации Р(X, Nfc) = [X € N] сводится к вычислимости системы частных предикатов равенства (идентификации) [X = X,].

4.4. Необходимые и достаточные условия симультанности в принятии решений

В предыдущем параграфе исследованы условия существования параллельного (персеп-тронного) принятия решения.

В данном параграфе изучаются условия, при которых логическая матрица ||дг, ||тхт , оставаясь единичной, представляет возможным упрощенное вычисление предиката равенства.

Лемма 4.2. Если а € , то [а € Хг] = и.

Доказательство. По теореме 4.2 — V1 в силу транзитивности отноше-

ния С . Но V1 = X. Тогда для любого а € имеем а € X. Лемма доказана. □

Пусть семейство М ^ {Х1, Х2,..., Хт} таково, что Хг П X, = 0 для г = Тогда имеет место следующая лемма.

Лемма 4.3. Если (Уг € 1т) [д^г = и] & = Хг] , то (Уг = j € 1т) [д, = л] .

Доказательство очевидно. □

Пусть семейство М ^ {Х1, Х2,..., Хт} таково, что для каждого г € 1т

Хг\ и X, = 0 ,€Зт\{г}

(*)

Тогда имеет место лемма 4.4. Лемма 4.4. (Уг € 1т)

Угт+1 = Хг\ и X, ^е1т\{г}

Доказательство. Докажем лемму 4.4 индукцией по г и т. Возьмем произвольное г € 1т. Тогда по определению: V1 = Хг, если Уг1^1 = 0; _ 1 _ _

V2 = 4 V л -г > Если г = 1, то V2 = V,1 = Х1.

г V1, в противном случае. г 1

Если 1 < г ^ т, то V2 = V1\Vl1 = Хг\Х1 в силу того, что Хг\Х1 = 0 по условию

(*). Тогда V3 = I У^^2 , если ^ \V2 = 0; Если г = 1, то V2 = Х1, и, следовательно, г [ V2, в противном случае. г

V3 = ХДХ2 в силу того, что ХДХ2 = 0 по условию (*).

Если г = 2, то V? = Х2\Х1, а = V?, поскольку уДу1 = уДХ 2 = 0.

Таким образом, V3 = ХДХ2, а V23 = Х2\Хь

База индукции для т = 2 очевидно выполнена.

Индуктивное предположение. Пусть для т = п, (п ^ 2) выполнено равенство

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Р^1 = Хг\ и X,. Покажем, что уra+2 = Хг\ и X,.

,€Зп\М ,е1п+1\{г}

В самом деле, проведем доказательство индукции по интервалу 1 ^ г ^ п + 1. Для г = 1

надо показать, что у^2 = Х1\ и Х,.

,е1п+1\{г}

По индуктивному предположению У^1 = Х1\ и X,.

,е1п\{г}

По определению уп+2 = / ^Л^, если = 0;

По определению V-. — <

1 [ У , в противном случае.

Тогда У^ДУ^ = {Х1\ и хД \Х„+1 = Х1\ и

Х.7 Г \Хп+1 = Х1\ и Х,.

,е1п\{г} ) ,е1„+1\{г}

Но по условию (*) последнее выражение не пустое. Поэтому, уга+2 = ХД и X,.

,е1п+1\{г}

Предположим, что 1 ^ г ^ п +1. Сделаем индуктивное предположение, что для 1 ^ г ^ п +1 выполнено условие у"'+2 = Хг \ и X, и докажем, что в этом случае

У++2 = Хг+1\ и X,.

,е1п+1\{г+1}

,е1п+1\{г}

По индуктивному предположению У++1 = Хг+Д и Х,.

По определению У^ = { если 0^+1 = 0

'+1 [ у+1 , в противном случае.

Следовательно, ^+Н11\уга1+1 = Хг+Д и ^\уга1+1 =

;?'€1п\{г+1}

= Хг+Д и Х, \Хга+1 = Хг+Д и Х,.

^€1п\{г+1} ,'е1„+1\{г+1}

Но по условию (*) это выражение не пусто.

Отсюда у++2 = Хг+Д и Х,. Что и требовалось доказать. □

,'€1п+1\{г+1}

Теорема 4.4. Пусть М ^ {Х1; Х2,..., Хт} : (Уг € 1т)

. То-

Хг\ и Х, = 0

[. ,е1т\{г}

гда для всякого г € 1т и для любых чисел аг € Ут+1 предикаты равенства [Х = Хг] и принадлежности [а € Х] совпадают [Х = Хг] = [аг € Х] = и, где Х € М.

Доказательство. Покажем, что [аг € Х] = и ^ [Х = Хг] и, наоборот, [Х = Хг] ^ [аг € Х] — и. Возьмем произвольное г € 1т и аг € Ут+1.

Пусть [аг € Х] = и. В силу леммы 4.4 и условия теоремы 4.4 можно записать

Ут+1 = Хг\ и Х, = 0. (**)

,е1т\{г}

Следовательно, аг € Угт+1 аг € Хг, то есть [аг € Х] ^ [аг € Хг] . Докажем, что Хг единственное из М такое, что Х = Хг. Предположим, нашлось Х,, ? € 1т\ {г} , такое, что [аг € Х] ^ [аг € Х,] = и. Но из выражения (**) следует, что (У? € 1т\ {г}) [аг € Х,] , то есть [аг € Х,] = л. Противоречие. Итак, Х = Хг.

Пусть Х = Хг. Покажем, что в этом случае [аг € Х] = и. В самом деле, [аг € Хг] = и в силу того, что аг € Ут+1 С Хг, но Хг = Х. Следовательно, [аг € Х] = и.

Что и требовалось доказать. □

Теорема 4.5. Логическая м,ат,рица д = Цдг,- ||тхт единична тогда и только тогда,

когда (Уг € 1т)

УД. и к1 = 0

,€Зт\{г}

Доказательство.

Предположим, что матрица д единична, то есть (Уг € 1т) ( У? € 1т\{г}) [дг, = л] . По определению дг, = л, когда У\У?1 = 0. Исходя из теоремы 4.2 получим

Уг"' С У1 ^ У1\У/ = 0 ^ УД и У,1 = 0.

,е1т\{г}

Прямое утверждение доказано.

Предположим, что выполняется условие Уг1\ и У,1 = 0. Так как матрица д

¿€Зт\{г}

единична, то должно быть дгг = и, дг, = л, ? € 1т\ {г} .

Докажем, что дгг = и. Для этого рассмотрим выражение У"*\У?-1 при г = то есть УДУ1.

Исходя из теоремы 3.2 У5 С У1. Отсюда следует УДУг = 0. Тогда по определению дгг = и. Следующим шагом докажем, что

(Уг € 1т) (У? € 1т\ {г}) [дг, = л] .

По теореме 4.4 У = Хг \ и Хк = 0 или, исходя из определения,

кеЗ^-ДМ

У? = У Д и У1.

г г \ , _ и , гк кеЗ^-ДЫ

Тогда выражение У, \Х, = У,\У/ = Уг1\ и У,1.

ке^\{г}

Очевидно, что для г ^ ? ^ 1, если У,\ и Уд.1 = 0, то У^\ и Уд,1 = 0.

к€1т\{г} кеО,-\{г}

Таким образом, У,\Х, = 0 и по определению дг, = л.

То есть доказали, что дгг = и и дг, = л, если г € 1т, ? € 1т\ {г} .

Теорема доказана в обе стороны. □

Напомним, что ранее через Ф обозначили множество всех конечных подмножеств множества всех натуральных чисел N ^ {0,1, 2,...}.

Теорема 4.6. Пусть М ^ {Х1, Х2,..., Хт} — множество подмножеств из Ф, для которых выполняется условие 11дг, ||тхт = Етхт. Тогда (Уг € 1т) (Уаг € У^1) (УХ € М) предикаты равенства и принадлежности совпадают: [Х = Хг] = [аг € Х] .

Доказательство. Поскольку 11 дг, ||тхт = Етхт, то из теоремы 4.2 получаем, что (Уг € 1т) Хг\ и Х, = 0 .

т\{г} ]

Докажем, что предикаты равенства и принадлежности совпадают: [Х = Хг] = [аг € Х] .

Пусть аг € Х. Так как аг € Угт+1, то Х П Угт+1 = 0.

При Х = Хг, Хг П Угт+1 = 0, поскольку из теоремы 4.2 Угт+1 С Хг. Предположим, что Х = Хг, то есть (У? € 1т\ {г}) [Х = Х,] .

Тогда, с одной стороны, Х П У^т+1 = 0, с другой стороны, Угт+1 = Хг\ и Х, по

:/€Зт\{г}

теореме 4.4. Но (Х, П Хг) \Х, = 0 ^ Х П (Хг\ и Хк ) = 0, то есть Х П У^1 = 0.

V к€1т\{г} ) г

Противоречие. Значит, (У? € 1т\ {г}) [Х = Х,] .

Предположим аг € Хг. Поскольку аг € У^т+1, то Угт+1\Хг = 0.

С другой стороны, Угт+1 С Хг ^ Хг\У^т+1 = 0, то есть аг € Хг. Противоречие.

Теорема доказана в обе стороны. □

Теорема 4.6 показывает, что единичность логической матрицы 11дг, ||тхт представляет возможным упрощенное вычисление предиката равенства посредством вычисления предиката принадлежности элемента («идентификационной метки») информативной зоны соответствующему множеству.

Из теоремы 4.3 в силу симметричности отношения «равно» вытекает справедливость следующей теоремы 4.7.

Теорема 4.7. Пусть (Уг € 1т) [Хг = 0] (Уг = ? € 1т) [дг, = — д,г]. Тогда существует т информативных элементов («идентификационных меток») аг € Угт+1 таких, что предикат:

[аг € Х] &

V ([а, € Х] & д,)

:/€Зт\{г}

— [Х — Хг] .

Будем рассматривать щ = (хц, ж^, •••, хт), ^ = 1, Т7г, то есть вектора размерности п и Цг1 = (Хг1, Хг2,..., Хгга) . Из теоремы 4.7 имеем следствие 4.1.

Следствие 4.1. Если выполнено условие 11 дг, ||тхт = Етхт, тогда существует т информативных элементов из информативных зон аг € Угт+1 таких, что предикат,

Г_ _ -, Г 1, если аг = и,;

Iи = иг | = 1 п

0, в противном случае,

где индекс ? выбирается из условия аг = Жг,.

Таким образом, доказанные теоремы 4.6, 4.7 и следствие 4.1 показывают, чтобы получить предельно короткий (однотактный или симультанный) способ принятия решения при классификации, необходимо и достаточно сравнить параллельно по всем кортежам обучающей выборки только по одному информативному значению каждого признака.

4.5. Канторовские алгебры

Введем некоторые количественные характеристики конечного множества X € M натуральных чисел [67].

1. Мощность множества X (число элементов): ß (X) = X.

2. Сумма множества X : ^ (X) = ^ x.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

3. Произведение элементов множества X : Л (X) = Л x.

4. Максимальный элемент множества X : max(X) = max x.

5. Минимальный элемент множества X : min (X) = min x.

max (^X) I min (^X)

6. Среднее арифметическое множества X : г (X) = ---

(Здесь и в дальнейшем квадратные скобки означают целую часть числа).

7. Размах множества X : R (X) = max (X) — min (X).

8. Среднее геометрическое множества X : q (X) = у/max (X) • min (X)

Т (X)

9. Центр тяжести множества X : m (X) =

ß (X)

10. Линейные отклонения множества X : l (X) =

" 1

£ \т (X) — ж| ß (X) xex

11. Дисперсия множества X : d (X) =

( m £ (т(Х)-хУ

ß (X) xex

Далее счетное число характеристик di (X) для i ^ 3 :

di (X) =

(|m (X) — x|r

12. Степень множества X : 2X = ^ 2x. Пусть c(xi,x2) —канторовская нумерующая функция [119]:

c (xi,x2) =

(xi + x2)2 +3xi + x2 3

c3 (xi, x2, x3) = c2 (c (xi, x2) , x3)

СП+1 (Ж1, Ж2, ..., Ж„+1) = Сп (с (Ж1, Ж2) , Ж3, ..., Жп+1) .

Определение 4.1. Канторовской операцией Са : Ф ^ Ф назовем операцию вида Сст (X) = {с (сп (Ж1, Ж2,..., Жп) , ж) |ж € X} , где а — псевдосигнатура с некоторыми из выше введённых 12 характеристик множества X [67, 120].

Определение 4.2. Алгебры вида Q ^ (Ф,с) назовем канторовскими алгебрами, если Ф — множество всех конечных подмножеств натурального ряда Ж, с — канторов-ская нумерующая функция.

1

2

Пусть задано множество конечных подмножеств из Ф : М ^ {Ж1, Х2,..., Хт} , (т ^ 2) и Ж-, Ж2,..., жП — количественные значения некоторых характеристик (ж-, Ж2,..., Жп) множеств Хг, г = 1, т, п € N.

Тогда справедлива следующая

Теорем а 4.8. Пусть (Уг € 1т) [Хг = 0] . Тогда (Уг = j € 1т) [сп (ж-, ...,жП) = = сп С (Хг) П С (Ж,) = 0], где С (Хг), С (Ж,) — канторовские образы мно-

жеств Хг, X,.

Доказательство. Справедливость теоремы 4.8 вытекает из взаимной однозначности канторовских нумераций сп и образов С (Хг), С (Ж,). □

Теорема 4.8 утверждает: различие канторовских нумерующих функций сп(ж1,..., Ж^), сп(ж1,...,жП) характеристик (ж-, Ж2,..., Жп) множеств Хг, Ж, влечет различие соответствующих канторовских образов С(Жг),С(Ж,).

Пусть М ^ {Х1, Х2,..., Хт } ; Хг П Ж, = 0.

Тогда Уг = j € 1т ^ {1, 2,..., т} введем следующие классы:

По ^ {Хг,Ж, € М|[Жг П Ж, = 0]};

П1 ^ Хг,Ж, € М|

Хг\ и Ж, = 0

,€1т\{г}

П2 ^ {Хг,Ж, € М| [(дг, = и) ^ (д, = л)]} .

Для указанных классов справедливы теоремы 4.4, 4.5, 4.6. Рассмотрим расширение введённых классов По,П1,П2 семейств конечных подмножеств натурального ряда:

{М| {С (Х1), С (Х2),..., С (Хт)} € По} ;

: {М| {С (Х1), С (Х2),..., С (Хт)} € П1} ;

: {М| {С (Х1), С (Х2),..., С (Хт)} € П2} ;

где С (Хг) = {с (сга (ж2,ж2, ...,жП,) ,ж) |ж € Жг} .

В приведенных обозначениях ж, —значение j -й характеристики для множества Хг. Для

По

Пж1,ж2, П2

класса п"1'"2'''''"" справедлива теорема 4.4. Для классов П-следствие 4.2 и следствие 4.3.

Пусть V*1 = С (Жг) , г = 1, т для некоторого Ш € ПД'^2'

Х1'Х2'

и п"1'"2'

докажем

V*j+l =

У\С (Ж,) , если У\С (Ж,) = 0;

Элементы логической матрицы: д* = Имеет место следующая

У, в противном случае.

и, если У \С (Ж,) = 0; л, в противном случае.

Лемма 4.5. (УЖ1, Х2 € М) [ Х1 = Х2] ^ С (Х1) = С (Ж2) для любых характеристик (Ж1,Ж2, ...,ЖП) множества X.

Доказательство.

Пусть Х1 = Х2, тогда ж1 = ж2, ...,ж^ = ж^ и, следовательно, С (Х1) = С (Х2) . Пусть С (Х1) = С (Ж2). Обозначим: ж1,ж2,...,жП —значения характеристик (ж-, Ж2,..., жп) множества Х1, ж1,ж2,...,жП —зн ачения характеристик (ж-, Ж2,..., Жп) множества Ж2. Если (\/г = 1 ,п) [х\ = ж2] , то в этом случае, очевидно, = Х2.

Предположим противное, то есть ф Х2. Тогда существует такое ] = 1 ,п, что х\ ф ж2. В противном случае Ж- = Х2. Но в этом случае в силу однозначности канторовских нумерующих функций С (Ж-) = С (Ж2), то есть имеем противоречие. □

;

;

п

п

;

п

Следствие 4.2. Пусть М € ПХ1,Л2--Л", где М ^ {Х1, Х2,..., Хт} . Тогда (Уг € 1т) (Уаг € У/т+^ [[Х = Хг] = [аг € С (Х)] = и] , где Х € М.

Доказательство. В силу условия следствия 4.2 имеем

(Уг € 1т)

С (Хг) \ и С (Х,)= 0

,€1т\{г}

Следовательно, выполнены условия теоремы 4.6, из которой следует, что

[Х = Хг] = [С (Х) = С (Хг)] .

Следствие 4.2 доказано. □

Следствие 4.3. Пусть М ^ {Х1, Х2,..., Хт} таково, что М € пХЬХ2''"'Хп. Тогда существует т элементов аг, (г € 1т) таких, что аг € Ут+1 и предикат равенства

[Х = Хг] = [аг € С (Х)] &

V [а, € С (Х)] & д* ;/€Зт\{г}

где

Доказательство. В силу выбранного семейства М имеем (Уг € 1т) [С (Хг) = = 0] и (Уг = ? € 1т) [(дг, = и) (д, = л)] . Следовательно, выполнены условия теоремы 4.3, из которой следует, что [Х = Хг] = [С (Х) = С (Хг)] , где Х € М. □

Теорема 4.9. Если По С Щ С П2, то для любых характеристик (Ж1, Ж2,..., Жп) множества Х имеет место включение

ПХ1'Х2''"'ХП с ПЖ1'Х2''"'Жп С ПЖ1'Х2''"'Хп

Для доказательства теоремы 4.9 нам потребуется

Лемма 4.6. Пусть М ^ {Х1, Х2,..., Хт} . Тогда справедливы два утверждения:

1) (Ук € 1т) [дкк = и] ;

2) (Уг = 3 € 1т) (УМ € Щ) ^ = л] .

Доказательство. Напомним, что

дг,

и, если У \Х, = 0; л, если У \Х, = 0.

Утверждение 4.1. В силу условия леммы 4.6 (Уг € 1т) [Хг = 0] можем запи-

сать (Уг € 1т)

Хг\ и X, = 0

Возьмем произвольное к € 1т и покажем, что дкк = и. В самом деле, У^ С Хк по теореме 4.2. Следовательно, Укк\Хд = 0. Отсюда следует, что дкк = и.

Утверждение 4.2. Пусть г, ? € 1т таковы, что г = Покажем, что в этом случае дг, = л, то есть У \Х,- = 0.

Предположим противное, то есть нашлись г, ? € 1т такие, что г = ? и У \Х,- = 0. В этом случае У+1 = У, если ? + 1 = т + 1, то по лемме 4.4 имеем Угт+1 = Хг\ и Х, = 0.

Поэтому Хг^,- = 0. Но Ут+1 С Хг^,-. Следовательно, У^+АХ,- = 0. Противоречие.

Если 1 < з + 1 <т +1, то У+^Х,- = 0 и по определению У+2 = У+1. Аналогично получаем У+3 = У+2 и т.д. до тех пор, пока не выполнится ? + г = т + 1, и приходим к первому варианту. В обоих случаях получается противоречие. Лемма 4.6 доказана. □

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Доказательство теоремы 4.9. Для любых М € По, очевидно, выполняется условие

(Уг € 1т) [Хг = 0] Хг\ и X, = 0 , то есть имеет место По С Щ.

:/€Зт\{г} ]

В силу леммы 4.3 для любого М ^ {Х1,Х2,...,Хт}€ П1 условие (Уг = з € 1т) [дг, = и д, = л] выполняется автоматически, поскольку таких дг,, что дг, = и, нет. Отсюда следует, что П1 С П2. На самом деле имеет место строгое вложение: По С П1 С П2 из По С П1 С П2. Для любых характеристик Ж1,Ж2, ...,ЖП конечных множеств в силу определения этих множеств через классы По, П1 и П2 имеет место

ПХ1'Ж2''"'Жп с ПЖ1'Х2''"'Хп С ПЖ1'Х2''"'Хп

Теорема 4.9 доказана. □

Следствие 4.4. Пусть М ^ {Хь Х2,..., Хт} € По. Тогда (Уг € 1т) (Уаг € УГ+1) предикаты равенства и принадлежности совпадают: [X = Хг] = [аг € X] , где X € М.

4.6. Канторовская решетка

Построение быстрых алгоритмов распознавания является актуальной задачей [8, 9]. В настоящей работе рассматривается канторовская решетка £о, элементы которой представляют из себя некоторые классы конечных подмножеств А, В € £о натуральных чисел такие, что если А С В, то для элементов М € В\А, где М ^ {Х1, Х2,..., Хт} , выгодно использовать псевдосигнатуру а класса В для построения решения, использующего по одной точке из каждого множества Хг, (г € 1т) в канторовском образе Со (Хг). В противном случае удобно использовать псевдосигнатуру множества А.

Пусть М ^ {Х1, Х2,..., Хт} — семейство т конечных подмножеств натурального ряда N ^ {0,1, 2,...} ; Ф — множество всех конечных подмножеств натурального ряда N;

По ^ {М|М ^ {Х1, Х2, ..., Хт} , (Хг П X,) = 0, [Уг = з € 1т]};

а = (Ж1, Ж2,..., Жп) —псевдосигнатура с некоторыми характеристиками (Ж1,Ж2,...,ЖП) конечного подмножества множества всех натуральных чисел N.

По ^ {Х1, Х2,..., Хт} & {С° (Х1) ,Со (Х2) ,...,Со (Хт) € По}}.

Со — канторовская операция с псевдосигнатурой а, Со(Хг) П Со(X,) = 0. Пусть ао = (Л) — пустая псевдосигнатура, тогда = По.

Теорема 4.10. Для любых аг € Хг, если М € По, то предикат равенства множеств

1, — ^Хг;

[ Х — Хг] — 1 п

0, в противном случае

можно заменить предикатом принадлежности = = [~ец € х] , (г = 1, т) .

Доказательство. Используя теорему 4.4 и следствие 4.4, убеждаемся в справедливости теоремы 4.10. □

Теорема 4.11. Для любого аг € Хг, где Хг € М € Пд, предикат равенства [X = Хг] определяется через предикат принадлежности к канторовскому образу:

[X = Хг] = [с (сП (ж1, ж2, ..., ЖП) , аг) € С° (Хг)! ,

где сп — канторовская нумерующая функция п -ок; Ж1,Ж2,...,ЖП — значения характеристик (Ж1,Ж2,..., Жп) для множества Хг; а = (Ж1, Ж2,...., жп) — псевдосигнатура с характеристиками (Ж1,Ж2, ...,ЖП) множества Хг; Со : Ф ^ Ф — канторовская операция с псевдосигнатурой а.

Доказат ельство. Рассмотрим первый случай. Пусть [X = Xil = 1. Тогда

к €Xil = |"c(cn) €(Xi)"|_ = 1.

Известно, что CCT (Xi) = {c (cn (ж^ j ж2j * * *í жп) j ж) 1 ж € Xi } j

но ai € Xi.

Следовательно, |"c (cn (ж|, ж2,ж^) , a) € CO (Xj = 1.

Рассмотрим второй случай. Пусть [X = Xil = 0. Поскольку X € M, то найдется такое j = i, что X = Xj. Тогда для любого ai € Xi в силу однозначности канторовской нумерации и в силу того, что Cо (Xi) n CO (Xj) = 0, имеем [c (cn (ж^, жг2,жП) , ai) € CO (Xj)] = 0.

Теорема доказана. Теорема 4.12. По С Ц

(x>

А0

Доказательство. Для VM € По справедливо

или

M € По ^ M € П0

(X

если

(Уг = 3 € 1т) (X,, X, € М) [X, П X,- =

(Уг = 3 € 1т) (Хг, X, € М) [С<х) (Хг) П С<х) (X,) = 0

Следовательно, достаточно доказать, что (VX¿, X, € М) (Уг = 3 € 1т), если (XI П X,) = 0, то [С(XI) П С(X,) = 0 . Предположим противное, то есть (Зг = 3 € 1т) [XI П X, = 0] .

Тогда [C(x> (Xi) П C(x> (Xj) = 0 ^ (3ж0, ж*) c (ж0, ж*) = c (ж0, ж*

Но по определению канторовской функции c (a, b) = c (ai,bi) ^ [(a = ai) & (b = bi)] 0 _ „,0N

ж i

^^j 1 ( — ж0

Значит, XI П X, = 0, что противоречит условиям посылки в доказываемой импликации.

Предположение неверно, так как П X, = 0] ^ [с<х) (X,) П с<х) (X,) =

Из этого следует, что УМ € П0 ^ М € П^ ^ П0 С п0х>. Теорема доказана.

Следствие 4.5. ПО С ПО •

Доказательство. Обозначим ^ (ж1,...,жп ). Необходимо доказать, что УМ € ^ М € Пцп+1. Заметим, что

М € ^ X, € М) (Уг = 3 € 1т) [С(X,) П С(X,) = 0] .

Аналогично определяется

M € Поп+1 ^ (VXi, Xj € M) (Vi = j € Im) [C(Xi) П C'"+1 (Xj) =

m ) On

Докажем, что VXi, X, € М, если С(X,) П С(X,) = 0, то Сст"+1 (X,) П Сст"+1 (X,) = 0. Предположим, что это не выполняется для некоторых X,, X, € М. Рассмотрим

C°™ (X) = {c (cn (ж0,жП) , ж) |ж € X} .

пи (™0 ^0 *

Пусть cn (ж0,жП) = C (X) Cor" (X) = {c (c (0, ж), ж) |ж € X} , C°"+1 (X) = {c (c (C (X), жП+1) , ж) |ж € X} . Так как C°"+1 (Xi) n C°"+1 (Xj) = 0, то для

i = j получим (3ж*, ж*) [c (c (C (Xi), жП+i) , ж*)] = c (c (C (Xj), жП+i) , ж*) ^ C (Xi) =C (Xj) ^ ^ C(Xi) n C°™ (Xj) =

или П

(xi v,xn> 0

противоречие, то есть (VXi, Xj-) [C°"+1 (Xi) n C°"+1 (Xj-) =

С ц0Х1'---'Хп+1>. Что и требовалось доказать.

Теорема 4.13. п0ж'ж>

П

(x>

Доказательство. Доказательство проведем в два этапа. 1-й этап. Сначала докажем, что пОж'ж) С пОх), то есть

(Vi = j € Im) [VXj, Xi € M € Ц

<ж,ж>

^ M € n<x>]

Аналогично вышеизложенному это равносильно условию [С<Т'Х> (Хг) П С<Т'Х> (Х3) =

^ [С(Хг) П С(Х3) = 0 . Предположим противное, то есть С<Т> (Хг) П С<Т> (X,) = 0, что

позволяет записать ( Зж* € Хг,ж* € Х3

С| ж0 ж0 I — С I ж0 ж*

I г ^ 3 I — \ 3 ' 3

3

3

Следовательно,

Тогда с (ж0, ж0) — и {с(с(ж0,ж0) , ж) |ж € Хг} П , ж^ |ж € Х3| — 0.

Получаем противоречие, то есть действительно ПТ'^ С п0т>. 2-й этап. Докажем обратное: п0т> С п0т'т>, то есть

С(Т> (Хг) П С(Т> (Хз) — 0 ^ [с(Хг) П С(Хз) — 0

Предположим противное: С(Хг) П С(Х3) — 0, то есть такие ^Зж* € Хг,ж* € Х3^ , (г — з), что

с (с (ж0, ж0) , ж*) — с (с (ж°, ж°) , ж*) ^ {с (ж0, ж |ж € Хг} П {с (ж°, ж) |ж € Х3} — 0 ^

^ж0 — [С(Хг) П С(Х3) — 0] . Получили противоречие. Таким образом, мы

доказали прямое и обратное включение: п0т'т> С п0т>, п0т> С ПТ'Д что равносильно п0т'т> — п0т>. Теорема доказана. □

Теорема 4.14. п0т'у> — п0у'х>.

Доказательство. Исходя из вышеизложенного, необходимо доказать, что (Уг — з € 1т) (УХг, Хз € М) [С<Т'У> (Хг) П С<Т'У> (Х3) — 0 ^ [С<У'Т> (Хг) П С<У'Т> (Х3) — 0 . Предположим противное: С(Хг) П С(Х3) — 0, то есть

(Зж* € Хг, ж* € Х3) [С (С (жг , у0 ) , жг ) С (С (ж0 , у3 ) , ж* ) ] ^ ж* ж*'

С (С (ж0 , у0 ) ) С (жз, у3 ) ^ ж0 ж0, у0 у3 — противоречие, то есть [С<Т'У> (Хг) П С<Т'У> (Х3) — 0] ^ [С<У'Т> (Хг) П С<У'Т> (Х3) — 0] , что соответствует (в силу произвольности ж и у) утверждению П0Х'У> — П0У'Т>. Что и требовалось доказать. □

Пусть £0 ^ |Пд |и € ©}, где © — множество всех псевдосигнатур. Пусть И1 ^ (ж1, ж2,..., жп)' и2 ^ (У1, У2,..., ут) — псевдосигнатуры с характеристиками жг,у3-(г = 1, п; з = 1, т) . Введем специальные операции объединения и и пересечения П : П"1 ПП^2 ^ П£"1ист2, П^1 ПП^2 ^ П£"1ПСТ2. Тогда имеет место

Теорема 4.15. Частично упорядоченное по включению множество £0 есть решетка относительно операций объединения П и пересечения П и частичного порядка С с минимальным элементом П0 и максимальным Ф.

4.7. О некоторых классах разбиения конечных семейств конечных множеств

Рассмотрим класс М всех конечных семейств конечных подмножеств натурального ряда, у которых существуют разбиения, содержащие не менее двух элементов. Поскольку любое М € М конечно, то и всякое его разбиение 5 конечно.

С каждым разбиением 5 ^ {N1,..., N} семейства М свяжем модель (М; б) с основным множеством М и сигнатурой 6 ^ (Р1, ...,РГ).

Одноместные предикаты Рг на модели (М; 6) интерпретируются так:

(УХ € 971) [Р (X) = 1 «Ф- X <Е 9Тг, (г = ТД)] .

Для любого множества A через P (A) будем обозначать множество всех подмножеств A; для любого семейства множеств A ^ {X} введем операции объединения O (A) и пересечения П (A) следующим образом:

0, если card A = 0;

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

O (A) = ^ X, если card A = 1; (4.1)

UX, если card A ^ 2, XeA

0, если card A = 0;

n(A) = ^ X, если card A = 1; (4.2)

ПХ, если card A ^ 2. XeA

(Здесь card означает кардинал множества.)

Пусть M € R, O(M) — объединение конечного семейства конечных подмножеств натурального ряда N ^ {0,1, 2,...}. На множестве P (O (M)) введем частичный порядок:

A ^ B & A С B. (4.3)

Ставится следующая задача: для любого разбиения S ^ {9Ti, ...,9^} , (г = 1, г) семейства M найти r минимальных (по числу элементов) подмножеств Ei € O(M) для вычисления предикатов Pi(X) модели (M; S) с помощью подмножеств Ei (системы подмножеств) [63].

Введение частичного порядка (4.3) на семействах подмножеств классов из P(O(M)) преследует цель выделить максимальные подсемейства с непустыми зонами в перекрытии минимальных подмножеств Ei € O(M) так, чтобы количество этих подмножеств Ei было минимально.

Для решения указанной задачи введем дополнительные обозначения: через Ir ^ {1, 2,..., r}

обозначим множество индексов элементов множества S; O(M) = U O(Ni), M = O(S).

ielr

В дальнейшем будем малыми буквами латинского алфавита обозначать номера объектов (множеств, семейств и их разбиений); большими буквами готического алфавита — конечные семейства конечных множеств. Через S обозначим класс всех разбиений S элементов из R.

Пусть K1 (N) — семейство всех непустых конечных подмножеств натурального ряда N, K2 (N) — семейство всех непустых конечных подмножеств K1 (N) , K3 (N) — универсальный класс [36] непустых конечных подмножеств семейства K2 (N). Тогда на моделях CN U K1 (N); A1) , CK1 (N) U K2 (N);A2> , CK2 (N) U K3 (N);A3> имеет место равенство сигнатур A1 = A2 = A3 = (€), где € — отношение принадлежности интерпретируется как двуместный предикат.

Пусть v : N ^ K3 (N) — некоторая гёделева нумерация [119] универсального класса K3 (N).

Всякое T С K3 (N) называется разрешимым множеством, если v-1 (T) рекурсивно, то есть если множество всех номеров элементов T есть рекурсивное множество [37].

Рассмотрим произвольные гёделевы нумерации 70 : N ^ K1 (N), 71 : N ^ K2 (N), Y2 : N ^ K3 (N) множеств K1 (N), K2 (N) и K3 (N) соответственно.

Заметим, что S С K3 (N). Тогда для любого S € S, если S ^ {N1,..., Nr} , то множество прообразов гёделевых нумераций 71 элементов разбиения S

V(S) - Ьг1 (N1),Y-1 (N)}

и для любого i € I 1

Y2

Bi

{£|£ € Р ({о (71 (3)) |3 € 172-1(5)\{г}}) & [О (71 (г)) £ О (£)]} ,

где О (71 (г)) — объединение образов гёделевой нумерации 71;

О (£) — объединение элементов семейства образов гёделевой нумерации 71.

Введём подклассы 80, 8 , 82 класса § такие, что У1Г € О(5) :

80 ^ {5 | (Уг — з € 17_1(я)) [О (71 (г)) П О (71 (3)) — 0]} . (4.4)

81 ^ Уг € З^) (Уу € О (5)) [у € 71 (г) ^ у П ^ (5) — 0]} , (4.5) где О (5) — объединение разбиений 5 € 8;

а (5) ^ О (71 (г)) \0 ({О (71 (3)) |з € 17-1 {г} }) .

82 ^ {5 | (Уг € 17-1 (я)) (Уу € О (5)) [у € 71 (г) ^ у П 0г (5) — 0] } , (4.6)

где _

вг (5) ^ О ({О (71 (г)) \0 (£м) = 1, и }) .

В последнем соотношении = 1,^) — максимальные по отношению включения элемен-

ты семейства Вг.

Легко видеть, что для любого I € {0,1, 2} , 81 — 0,

80 С 81 С 82.

Рассмотрим в качестве 70 следующую нумерацию: для любого V € N\ {0}, если V = +2"1 + ... + 2"*, (и0 < VI < ... < ук), то 70 (и- 1) ^ {у0,У1,...,ук} € К1 (ЛГ) .

Введем отображение Н : К1 ^) — К2 (^ семейства К1 (N) на семейство К2 ^) такое, что для любого Х € К1 ^) Н (Х) ^ {70 (т) |т € Х} . Аналогично определим отображение р : К2 ^) — К3 ^) семейства К2 ^) на семейство К3 ^) : для любого N € К2 ^) р (Ж) ^ {Н (Х) |Х € N } .

В силу однозначности отображений Н и р можно заметить, что композиции Н70 и РН70 являются гёделевыми нумерациями семейств К2 ^) и К3 ^) соответственно. Поэтому в качестве нумераций 71 и 72 можно взять композиции Н70 и РН70, то есть 71 — Н70, 72 — РН70. В таком случае легко видеть, что 7— (5) — рекурсивное множество. Следовательно, § — разрешимое множество.

I. Рассмотрим элемент 5 € 80. Пусть т — номер 5, 1т ^ {1, 2,... , т}. Для каждого г € 1т построим подсемейство А0 семейства Р (71 (г)) такое, что

А0 ^ {А |А € Р (71 (г)) & (П (А) — 0)},

на котором введен частичный порядок ^ так:

А1 < А2 ^ А1 С А2.

Пусть в нашлось максимальных элементов (^к = 1 . Тогда, выбирая по одному

элементу из каждого множества П ) = ) получим минимальное множество

которое обладает свойством

Рг (Х) — ( 1, если Х ПЕг — 0, (4.7)

0, в противном случае,

где Рг — предикат модели (О (5); 6т) .

Пример 4.1. Пусть модель (М; 6т), где М ^ {Х1,Х2,Х3, Х4} , Х1 ^ {0} , Х2 ^ ^ {1,2} , Х3 ^ {0,1,2} , Х4 ^ {3} , 6т ^ (Рг1, Рг2), соответствует разбиению 5 ^ {N1,N2} , где N1 ^ {Х1, Х2,Х3} , N2 ^ {Х4} .

Вычислим номера ¿1 и ¿2 классов N1, N2 соответственно:

= + + — 1; г2 = 1,

7о-1 (£i) = 1 = 0, 70"1 (Х2) = (21 + 22) - 1 = 5, 7Ö"1 (*з) = (2° + 21 + 22) - 1 = 6, 70"1 (Х4) = 23- 1 = 7; ¿1 = (2° + 25 + 26) 1 = 96; ¿2 = 27^ 1 = 127.

Тогда = {¿1, i2} = {96,127} , где т = (2h + 2ia) - 1 = (296 + 2127) - 1.

Далее O (N1) = Xi U X2 U X3 = {0} U {1, 2} U {0,1, 2} = {0,1, 2} , O (N2) = X4 = {3} . Очевидно, что O (N1) П O (N2) = 0, то есть выполнено условие (4.4). Следовательно, S € S0. Вычислим множества Ei1 и Ei2.

P (N1) = {0, {{0}} , {{1, 2}} , {{0,1, 2}} , {{0} , {1, 2}} , {{1, 2} , {0,1, 2}} , {{0} , {0,1, 2}} , {{0} , {1, 2} , {0,1, 2}} ; P (N2) = {0, {{3}}} ;

A0i = {{{0}} , {{1, 2}} , {{0,1, 2}} , {{0} , {0,1, 2}} , {{1, 2} , {0,1, 2}}} . A0i,i = {{0} , {0,1, 2}} , A0i,2 = {{1, 2} , {0,1, 2}} ;

П (A0i,i) = {0} П {0,1, 2} = {0} , П (AU) = {1, 2} П {0,1, 2} = {1, 2} , A02 = {{{3}}} , A0i,2 = {{3}} , п (A0i,i) = {3} .

Таким образом, в качестве и £¿2 можно взять — {0,1} , £¿2 — {3} либо — {0, 2} и Ei2 = {3}.

Легко проверяется, что для любого X € M Pi (X) = 1 ^ X П Ei = 0, i € {i 1, ¿2} •

II. Пусть S есть представитель класса S1 и m таково, что 72 (m) = S. Построим для каждого i € Im подсемейство A1 семейства P (D1) , где

D1 ^ {X П Q (S) |X € 71 (i) } .

A1 ^ {А |A € P (D1) & (П (А) = 0)}.

Тогда если 2l|t, (t = есть максимальные элементы A|, то, выбирая по элементу из

каждого множества П (^itj > ^ = также получим минимальные множества Е^, облада-

ющие свойством (4.7).

Пример 4.2. Пусть S ^ {N1, N2} есть разбиение семейства M ^ {X1, X2}, где X1 ^ {0,1, 2} , X2 ^ {1, 2, 3} такое, что N1 ^ {X1} , N2 ^ {X2} ; (M; Sm) — соответствующая разбиению S модель с сигнатурой Sm ^ (Pii, Pi2).

Тогда номера i1, i2 классов N1, N2 вычисляются следующим образом:

^ = 1, г2 = 1; m = (2ix + 2i2) — 1, 1m = {h,i2}]

70"1 (Xi) = (2° + 21 + 22) — 1 = 6, (X2) = (21 + 22 + 23) 1 = 13, i\ = 26— 1 = 63,

¿2 = 213-1 = 8.191, m = (263 + 28'191) — 1, 3m = {63; 8.191} .

Далее O (N1) = X1 ^ {0,1, 2} , O (N2) = X2 ^ {1, 2, 3} , Qil (S) = O (N1) \O (N2) = {0} , Qi2 (S) = O (N2) \O (N1) = {3} .

Очевидно, что S € S1 в силу выполнения условий (4.5). Вычислим множества и £¿2.

Di = {{0}} ; P (Di) = {0, {{0}}} ; = {{3}} , P (D2) = {0, {{3}}} ; Ai = {{{0}}} , А^д = {{0}} , П (А^д) = {0} . A12 = {{{3}}} , А2,1 = {{3}} , П (А^д) = {3} . Очевидно, Eii = {0} , Ei2 = {3} .

Легко проверяется, что для любого X € M Pi (X) = 1 ^ X П Ei = 0, i € {i 1, i2} .

III. Рассмотрим элементы класса S2. Пусть m таково, что 72 (m) = S € S2. Для каждого i € Im построим подсемейства A2 так:

A2 ^ {A |A € Р (D2) & (П (A) = 0)},

где

Тогда если A2t, ^t = 1, n2 j есть

D2 ^ {X П (S) |X € 71 (i) }

(4.8)

выбирая по представителю из каждого множества П (A2

qij =

(4.9)

максимальные по отношению включения элементы А2, то,

= , сформируем мно-

жества Ег и построим логическую (булеву) матрицу [^3] порядка |1т|, где |1т| — число элементов 1т, следующим образом:

1, если Ег П О (71 (г)) — 0, г, 3 € 1т; 0, в противном случае.

Пусть матрица [^3] обладает свойствами [88]:

(Уг € 1т) [дгг — 1] , (Уг — з € 1т) [(9г3 — 1) ^ (?3г — 0)] .

Далее для каждого Х € О (5) положим

Яг (Х) — 1 ^ Х П Ег — 0. Тогда в силу (4.6) и (4.8) имеет место

(4.10)

(4.11)

(УХ € О (5)) [Рг (Х) ^ Яг (Х)]. Предложение 4.1. Для любого разбиения Б € 82 и номер разбиения Б, если [^3 — 1 — 3 — 0], то Рг (Х) — Яг (Х) &-

(4.12)

любого i € Im, где m —

V Rfc (X) &qifc fcelm\{i}

Доказательство.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

( Пусть Рг (Х) — 1 для некоторого г € 1т. В силу (4.12) Яг (Х) — 1, то есть ХПЕг — 0. Возьмем произвольное к € 1т\ {г} и покажем, что Я& (Х) — 0. Пусть ^ — 1. Тогда на основании выражения (4.10) — 0.

Отсюда Ей П О (71 (г)) — 0, но Х С О (71 (г)) . Следовательно, Х П Ек — 0, то есть Як (Х) — 0 и Як (Х) — 0.

Пусть Як (Х) — 1. Это значит, что Х П Ек — 0, но Х С О (71 (г)). Следовательно, Ей П О (71 (г)) — 0, то есть д^г — 1. Используя выражение (4.10), получим дгк — 0 и Як (Х) — 0.

Случаи дгк — 0 или Як (Х) — 0 тривиальны.

Таким образом, V Я^ (Х) — 0.

&€Зт\{г}

Значит, Яг (X) &-

V Rfc (X) &qifc = 1. fcelm\{i}

. Пусть Рг (X) = 0. Покажем, что в этом случае

Яг (X) &-

0.

V Як (Х)

к€1т\{г}

В самом деле, если Яг (Х) — 0, то это очевидно.

Положим теперь, что Яг (Х) — 1. Согласно выражению (4.11) получим, что Х ПЕг — 0. Поскольку Рг (Х) — 0, а 5 - разбиение, то существует такое 3 (3 — г) , что Р3 (Х) — 1. Тогда из формулы (4.12) имеем Я3 (Х) — 1, но Х С иу . Следовательно, Ег П ( иу ) — 0.

уеО(71(3)) уеО(71(3))

Тогда из построения (4.9) имеем дг3' — 1. Отсюда Я3 (Х) &дг3' — 1, то есть

Яг (X) V Rfc (X)

fcelm\{i}

Предложение 4.1 доказано.

0.

Пример 4.3. Пусть S ^ {N1,N2} есть разбиение семейства M ^ {Xi,X2, X3}. Xi ^ {о, 1, 2} , X2 ^ {2, 3} , X3 ^ {l, 3} такое, что N1 ^ {Xi, X2} , N2 ^ {X3} . (M; ©т) -модель, соответствующая разбиению S, Sm ^ (Pii, Pi2). Тогда т = (2* + 2i2) - 1, = {гь ¿2} , где

7о-1 (Xi) = (2° + 21+22) --1 = 6, Y-1 (X2) = (22 + 23) -11 = 11,

Y-1 (X3) = (21 + 23) -1 = 9.

¿1 = (26 + 2И)^ 1 = 2111, г2 = 29^ 1 = 511. O (N1) = X1 и X2 = {0,1, 2} U {2, 3} = {0,1, 2, 3} , O (N2) = X3 = {1, 3} .

Построим

семейства Bii, Bi2.

Bii = {L |L € P ({O (N2)}) &[O (N1) (L)]} = {0, {O (N2)}} ,

Bi2 = {L |L € P ({O (N1)}) &[O (N2) ^O (L)]} = {0} . Lii,1 = {O (N2)} ; Li2,1 = 0. öii (S) = O (N1) \O (Lii,1) = O (N1) \O (N2) = {0,1,2,3} \ {1,3} = {0,2} . 0i2 (S) = O (N2) \O (Li2,1) = O (N2) \0 = O (N2) = {1,3} . Очевидно, что S € S2. Далее

D2 = {{0, 2} , {2}} ; P (D2 ) = {0, {{0, 2}} , {{2}} , {{0, 2} , {2}}} .

D2 = {{1, 3}} ; P (D2 ) = {0, {{1, 3}}} . А? = {{{0, 2}} , {{2}} , {{0, 2} , {2}}} ; A? = {{{1, 3}}} , A2^ = {{0, 2} , {2}} ; П (АД) = {0, 2} П {2} = {2} , АД = {{1, 3}} ; П (АД) = {1, 3} .

Таким образом,

в качестве Eii и Ei2 можно взять Eii — {2} и Ei2 — {1} . Заметим, что

Rii (X1) = 1, Rii (X2) = 1, Rii (X3) = 0, Яг2 (X1) = 1, Яг2 (X2) = 0, Яг2 (X3) = 1

10 11

Легко проверяется, что для любого X € M :

и для любых i,j € Im [qj] =

, то есть условие предложения 4.1 выполняется.

Рг1 (Х) — Яг1 (Х) (Яг2 (Х) ^^) , Рг2 (Х) — Яг2 (Х) &— (Яг1 (Х) &дг2,г1). Пример 4.4. Пусть 5 ^ {N1, N2} есть разбиение семейства М ^ {Х1, Х2, Х3, Х4} .

где

Х1 ^ {0,1,2}, Х2 ^ {4,3,0}, Хз ^ {2,0,3}, Х4 ^ {1,4} такое, что N1 ^ {Хь Х2}, N2 ^ {Хз, Х4} .

Тогда О (N1) — Х1 и Х2 = {0,1, 2, 3, 4}; О (N2)— Хз и Х4 = {0,1, 2, 3, 4}.

Вг1 — {0}, Вг2 — {0}. £г1 — {0}, ^ — {0}.

01 (5) — О (N1) \О (£г1) — О (N1).

02 (5) — О (N2) \О (£г2 ) — О (N2). Очевидно, что 5 € 82.

Однако Д2 — {Х1, Х2} , Д22 — {Хз, Х4} ,

А? = (0, {Х1} , {Х2} , {XI,Х2}} , Аь1 = {XI,Х2} . А| = {0, {Хз} , {Х4} , {Хз, Х4}} , А|2д = {Хз, Х4} .

Егх — — {0}-

Тогда логическая матрица имеет вид: 11

, то есть нарушено условие предложения 4.1.

9] =

11

Таким образом, задача классификации для разбиений 5 из классов 8°,81,82 эффективно решается путем построения процедур для вычисления предикатов моделей (О (5); б), соответствующих разбиению 5, посредством выявления минимальных (по числу элементов) множеств £г, (г = 1, г) , где г = 15*1 .

На интуитивном уровне в первом случае задача классификации эффективно решается, если множества сильно отличаются друг от друга. Во втором случае, наоборот, желательно, чтобы множества, попадающие в один класс, имели общие элементы.

4.8. Построение иерархий семейств конечных множеств натуральных чисел

Введем операцию С (Х) как отображение следующего вида:

С (Х) — {с2 (ск (жь..., Хк), ж) |ж € Х} , (к — 1, 2,...) ,

где с2 и ск — канторовские нумерации пар и к -ок чисел [119].

В формулах 1 ^ 12 п. 4.5 Ж1,Ж2,...,Жк —характеристики множества Х. Подставим С (Х|) вместо Хг, (г = 1, т) . Тогда вместо Фо = {Х1,...,Хт} получим Фд = {С (Х1),..., С (Хт)} .

Подставим вместо множество (% — , а вместо q подставим q —

где Ст+1 вычисляется по рекуррентной формуле

С*У = С(Хг), (г = 17ш).

С*г\С (Х]), если С*г\С (Х]) — 0;

Н]

С]+1 —

С* г, в противном случае;

*

9] —

л, если С* г\С (Х]) — 0; и, если С* г\С (Х]) — 0.

Тогда из теоремы 1 [67] вытекает

Следствие 4.6. Если для любых 1,3 С {1, 2,...,т} таких, что

[1 п 3 — 0] &

и С (Х4) — и С (Хг) гез

и для любых г, У, ^ € 1т ^ {1, 2, ...,т}, (г — 3), (г — ¿) С*г — С* , то существует т чисел Ьг € С^+1 таких, что предикат,

Г (Х) — ГЬ € С (Х)! &

V Г] € С (Х! & 9])

]е1т\{г}

обращается в «единицу»» тогда и только тогда, когда Х — Хг, где Хг € Ф°.

Обозначим через С (ж1, ж2,..., жк, 8°) , С(ж1,...,жк, 81) , С(ж1,...,жк, 82) , (к — 1, 2,...) следующие семейства:

С 8°) ^ {Х| {С (^ (Х), ж) |ж € Х} € 8°} , С 81) ^ {Х| {С (^ (Х) ,ж) |ж € Х} € 81} , С 82) ^ {Х| {С (^ (Х), ж) |ж € Х} € 82} ,

С £, ^ С £, §2

С3 (X) ,£ (X) ,ж) |ж е х} е §0} , С3 (X) ,£ (X) ,ж) |ж е X} е 81} , С3 (X) , £ (X),ж) |ж е X} е §2} ,

С (2,§0) ^ {XI {С ^2х,ж) |ж е X} е 80} .

Здесь Ж1,Ж2,...,ж& —характеристики множества X е Ф.

Следует заметить, что С (2,80) = §.

Между полученными семействами существует следующая иерархическая зависимость (рис. 4.1).

В основу построения иерархической зависимости между семействами конечных множеств натуральных чисел положена сложность переработки реальных массивов данных и использования решающих предикатов для классификации указанных множеств [63].

С §0) С СЕ, §0) С

О П П

§0 С С 81) С СЕ, 81) С

О П П

С §2) С СЕ, §2) С

П

С 81) С СЕ, 81) С

О

81 П П

О

П С §2) С СЕ, §2) С

§2 С С §2) С

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

П

§ = С (2, §0).

Рис. 4.1. Иерархия семейств конечных множеств натуральных чисел

§ 5. Эталонирование и идентификация конечных множеств

5.1. Теорема о сильно слипающихся множествах

Пусть имеются основное множество М ^ {XI,X2, ...Xm} из т конечных подмножеств X¿ натурального ряда N; 5 ^ {N1,N2...N4} — разбиение множества М и предикаты принадлежности неизвестного, предъявленного для классификации множества X классу эквивалентности :

1, если X € N, (г = 1, ¿); 0, в противном случае.

Пусть / : 1т ^ I — классифицирующая функция, распределяющая номера элементов основного множества М по номерам классов из 5, 1т ^ {1,2,...,т}, I ^ {1,2,...,£}; ^ = {г|/ (г) = 3} — множество номеров г эталонных множеств ¿г;

Е& — эталонные множества, полученные по алгоритму выборки элементов сильно слипающихся множеств. Введем вспомогательный предикат пересечения («сцепления») неизвестного множества X с одним из эталонных множеств ¿г :

Р (X) =

Яг (X) =

1, если Ег П X / 0, (г = 1,£); 0, в противном случае.

Очевидно, что Рг (X) Яг (X) .

Логическую матрицу Q — |Ю/1|, учитывающую пересечение («сцепление») эталона Е* с каким-либо из множеств € М, построим следующим образом:

Qг7' —

1, если £гП и ф 0, (г, ] = 1,¿) ; 0, в противном случае.

Алгоритм построения эталонных множеств Е*

Записываем множества класса N в 1-й список. Взяв 1-й элемент X* списка №1, начинаем проводить пересечение его со вторым множеством. Если такое пересечение не пустое, то второе множество выбрасывается, а само пересечение пересекаем с третьим элементом списка и т.д. Если же пересечение на некотором шаге с очередным множеством образует пустое множество, то оставляем предыдущее пересечение без корректировок, а элемент-множество, с которым получается пустое пересечение, записываем во второй список. Исчерпав все элементы первого списка, строим множество Е*, в которое добавляем произвольный элемент из пересечения.

Заменяем первый список вторым и обрабатываем по той же схеме, что и первый список до тех пор, пока во втором списке нечего будет взять, каждый раз при этом выбирая по элементу в множество Е* по окончании просмотра первого списка.

По завершении эталонирования строим множества Е^, (г = 1,£) , которые обладают следующим свойством.

Теорема 5.1 (о сильно слипающихся множествах). Если (У г — 3 € [^¿^ — 1) ^ = 0)], то предикат классификации — принадлежности Рг(Х) — [X € N¿"1 неизвестного множества X классу эквивалентности N в разбиении Б ^ {N1,...,N4} основного множества М ^ {Х1, Х2,..., Хт} равен:

1, если Е* П X — 0;

Р (X) — Я* (X) &

V Я,- (X) & Qij

,?€1ЛЫ

где Я* (X) —

0, в противном, случае.

Доказательство. Докажем, что если для некоторого г € Р* (X) — 1, то

имеет место равенство Яг (X) &

— 1.

V Я, (X) & Qij

В самом деле, в силу условий посылки теоремы 5.1 можем записать Р* (X) ^ Я* (X) . Но Рг (X) — 1. Следовательно, Я* (X) — 1, то есть X П Е* — 0.

Покажем, что

V Я, (X) & Qij

0.

V Я, (X) & Q¿j — 0 независимо от Я, (X) — 1]. Тогда Qjг — 1. По условию

В самом деле, если (Уг — 3 € [Я, (X) — 0], то

Qгj. Предположим противное, то есть (33 — г € теоремы, если г — 3, то Qгj — 1 ^ Q.д — 0.

Поэтому Qгj — 0. Отсюда вытекает, что Я, (X) & Q¿j — 0.

Пусть 31,32,..., 3г все такие индексы, что Я,к (X) — 1. Отсюда Я,к (X) & Q¿jfc — 0 по тем же соображениям.

А с другой стороны, для всех 3 € 3Д {Д, 32,..., >, г} [Я, (X) & Q¿j —0] в силу того, что

Я, (X) — 0. Отсюда следует, что

V Я, (X) & Q¿j

¿езДФ ^ ' ,

Осталось доказать, что (Р* (X) — 0) ^ Я* (X) & — Возможны два случая: Я* (X) — 0 или Я* (X) — 1. В первом случае Я* (X) &

0.

V Я, (X) & Qij ¿езДО}

0.

0.

V Я, (X) & Qij Рассмотрим второй случай: Я* (X) — 1. Тогда Qjг — 1.

С другой стороны, (3к — г € [Р& (X) — 1] . В силу того что Б — разбиение, получаем

Я& С^О — 1 Я& (X) & — 1.

Значит,

V Яй (X) & Q¿fc — 1.

I

Следовательно, Яг (X) & - V Я& (X) & фгк = 0.

кезДМ

Теорема доказана. □

5.2. Идентификация конечных множеств

Пусть задано семейство конечных числовых множеств М ^ {Xl, X2, ...Xm} , где на мно-

т

жестве А = и X, введём некоторое расстояние р (ж, у) и линейный порядок ^ . Обозначим

г=1

через р0 минимальное расстояние между элементами множества А, не равное нулю, позволяющее собрать («стянуть»») в один класс элементы, удовлетворяющие заданному расстоянию:

Як = {х\ р {х^,х) < ~Р0) где Ху £%г,х £ X}.

Задача состоит в том, чтобы вычислить идентифицирующие предикаты для конечного множества X € 9Л, быть может подвергнутого на входе шумам в пределах е < Схема построения предикатов идентификации следующая.

Обозначим через у1 исходные множества X, е М, то есть у1 = X* = {ж3 ± е|ж3 е X}, (г = 1, ш) .

3+1

Построим индексные множества V по рекуррентной схеме:

3 =

V3 ^^, если У = 0;

У, в противном случае.

Эти индексные множества сопровождает логическая матрица с элементами:

/0, если У/\Х* ф 0, (г, ] = Т~т) ; 1, в противном случае.

Приведем теорему о идентификации конечных множеств в условиях шумов.

Теорема 5.2 [73]. Пусть (Уг е 1т) [V,1 = 0 (Уг = з е 1т) [д3- = 1 ^ 3 = 0] . Тогда для любого конечного множества X идентифицирующий его предикат равенства вида:

^ = X*! =

_XX*

V Гр (ж,аг) ^ е]

& - V

3е1т\{г}

V Гр (ж,аг) ^ е] & дгз

где а, е ут+1, X* — множество X, с отклонением элементов ж3 в пределах е, обращается в «единицу» тогда и только тогда, когда X = X*.

5.3. Поиск информативных значений признаков

При обработке бинарных векторов обучающей информации с использованием множеств напрямую не удается подчас получить информативные значения признаков из-за того, что элементы из {0, 1} быстро «слипаются». Поэтому прежде чем обработать векторы таким образом, обучающую информацию необходимо предварительно «линеаризовать».

Пусть исходная обучающая матрица имеет т строк бинарной информации с п бинарными признаками О = Ц^ ||тхп , где из е {0,1} .

Возьмем вспомогательные константы: а = 2 • г , (г = 1, т) и введём «линеаризацию» элементов обучающей матрицы:

Xе ^ {иг1 + С1,иг2 + С2, ...,игп + с„} .

Построим следующие множества V,1 = X?.

3+1 _ I уЛХз, если ф 0, = 1, т)

Vг3, в противном случае.

Эти множества сопровождает логическая матрица с элементами:

л, если V/7 XX — 0; — < г \ з ~т '

и, в противном случае.

Расширением теоремы 4.3 в условиях «слипания» множеств обучающей выборки представляет следующая теорема 5.3, приводимая без доказательства.

Теорема 5.3 [79]. Пусть (Уг € 1т) [X? — 0] (Уг — 3 € 1т) [д*, — и ^ — л] . Тогда существует т информативных элементов а* € таких, что предикат, идентифика-

ции множеств X, X? вида: [X — X?" — [а* € X" &

обращается

V [а, € Xl &

,?€Зт\М

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

в «истину» тогда и только тогда, когда X — X?, где X? выбирается из «линеаризованной» обучающей выборки О1 — {XI, X2,..., Xm} .

Если обучающая выборка О1 с т эталонами разбита на Ь классов с помощью функции / : 3т — где I ^ {1, 2, ...,Ь} , 3т ^ {1, 2, ...,т} , то общее решение для классификации

предъявленного объекта X можно записать так [7]: К^ (X) = V г (X), (к = 1, , где X =

г€Dfc

— {ж1 + с1, х2 + с2,..., жп + с«} для некоторой реализации X — (ж1, ж2, ...жп) € X.

п

Частные решающие предикаты Qi(X) определим следующим образом: Qг(X)— & г (и./, ж,),

Qo(X) — max(Ql, Q2,..., Qг), где г(u¿j, ж,) —мера близости между эталонным и, и предъявленным ж, значениями 3 -го признака для г -го объекта:

1, если = ж./, г = 1,1, 3 = 1,п;

г (uг7', ж ?) — I п

0, в противном случае

^ — {г|/ (г) — к} — множество эталонных объектов из выборки О1.

Таким образом, предложенное решающее правило может безошибочно работать с объектами, участвующими в обучении.

Переход от бинарных элементов неизвестной реализации ж к элементам линеаризированного множества X позволяет работать в измененной обучающей выборке О1, причем поиск информативной единицы или нуля при этом опирается еще на информацию о норме вхождения этого признака в соответствующем кортеже.

Глава 2. Вычислимость конструктивных моделей классификации

§ 6. К задаче классификации конечных множеств натуральных чисел

Сравним два подхода при решении задачи классификации конечных множеств натуральных чисел по классам эквивалентности.

Рассматривая семейство конечных множеств натуральных чисел как обучающую выборку, удается указать ряд простых методов, позволяющих классифицировать множества предикатов нелинейных персептронов. При этом преследуется цель предельно быстрого (однотактного) принятия решения при классификации множества X по некоторым классам эквивалентности. Рассматриваются также классы эквивалентности, соответствующие разбиению указанного семейства множеств и задача классификации множеств по классам эквивалентности.

Если в первом случае требуется, чтобы множества различались максимальным образом, то во втором случае желательно, чтобы множества из одного и того же класса эквивалентности имели общие элементы.

6.1. Два подхода к классификации конечных множеств

Обозначим через Ф множество всех конечных подмножеств натурального ряда N ^ {0,1, 2,...}, 1т ^ {1, 2, ...,т}, т € N; X — неизвестное конечное подмножество из Ф, представляемое для класссификации.

Пусть М ^ {Х1, Х2,..., Хт} — семейство конечных подмножеств Х^ С Ф, (г = 1, ш), т ^ 2.

1 и подход. Классификация с использованием информативных элементов

Положим V/ ^ Хг, (г = 1,т). Индексные множества для последующей классификации определим по рекуррентной схеме:

^■+1 = / V?если V?= 0; г 1 Vij, в противном случае.

Элементы вспомогательной логической матрицы д = ||дг? ||

[и, если = 0, (г, у = 1, т), и — «истина»;

\ л, в противном случае, л — «ложь».

Лемма 6.1 [79]. Пусть М ^ {Х1, Х2,..., Хт}, т ^ 2 таково, что (Уг € 1т)

[ргт+1 = Хг\ и X? = 0]. Тогда для всякого г € 1т и для любого аг € предикат

?е1т\{г}

принадлежности Фг(Х) = [аг € X] обращается в «истину» тогда и только тогда, когда X = Xг, где X € М.

Теорема 6.1 [79]. Пусть (У г € 1т) X = 0](Уг = ] € 1т)[д? = и д?г = л]. Тогда существует т информативных элементов аг € таких, что предикат классификации

V [а? € X]

?е1т\{г}

^г(X) = [а € X]

обращается в «истину» тогда и только тогда, когда X = Xг, X € М.

2 й подход. Классификация на основе сильно слипающихся множеств

Пусть 5 ^ {М1, М2,..., М^} — разбиение множества М. Тогда частные решающие правила-предикаты принадлежности неизвестного подмножества X к одному из г -х классов разбиения 5 :

1, если X € Мг, г € I ^ {1, 2,..., ¿};

Р (X) = , .

0, в противном случае.

Если / : 1т ^ 1 — классифицирующая функция, распределяющая номера элементов основного множества М по номерам классов из Б, то = (г|/(г) = к}, (к = 1,£) — множество номеров эталонных множеств ¿к.

¿к — эталонные множества, полученные по алгоритму выборки элементов сильно слипающихся множеств [79].

Введём частные предикаты «сцепления» (пересечения) какого-либо эталонного множества

¿г, (г € А) :

а) с неизвестным, предъявленным для классификации множеством X :

Д(Х) - / 1 если Е п X - 0; ^^ \ 0, в противном случае.

б) с объединением всех исходных множеств Х^ € М :

1, если ¿¡П и Хк ф 0, (г = 1,

К, - {

0, в противном случае.

Теорема 6.2 [18]. Пусть Б ^ {М1, М2,..., МД — разбиение множества М, г € Если выполнены условия:

1) (УХ € М)(Уг € 14)[Х € Мг] ^ [(Уг - 3 € 14)[Х П и Хк - 0 ^ К, - 1]],

2) (Уг — 3 € — 1 ^ К, — 0], то предикат классификации имеет вид

Рг(х) - дг(х)&-

V Д, (Х)&К,

Таким образом, при рассмотрении задачи классификации конечных множеств по классам эквивалентности можно выделить два подхода в построении эффективных алгоритмов: первый подход основан на формировании эталонов в виде одного информативного элемента из каждого множества с тем, чтобы решающее правило имело вид нелинейного персептрона и требовало минимальных вычислений распознающих предикатов [83, 89, 194].

Второй подход основывается на алгоритме эталонирования путем пересечения множеств в поисках эффективных решающих правил и условий их существования. При таком подходе возможно установить инвариантные зоны в эталонных множествах, которые характеризовали бы каждый класс эквивалентности наиболее устойчивыми представителями, взятыми из обучения. Пример простого алгоритма построения таких эталонных множеств и способ его использования приведены в работе [79].

6.2. О продолжении некоторых сюръективных отображений

Рассмотрим один из способов конструктивизации на примере известной задачи классификации: восстановление целого по его части [45].

Задача классификации или распознавания ставится следующим образом [38]. Известно, что некоторое бесконечное, в общем случае, множество М представлено в виде объединения

конечного числа подмножеств (классов): М - У Классификация есть установление сюръ-

г=1

ективного отображения ф : М ^ {К1, ...,К}. Классифицировать элемент Б € М — значит вычислить ф(Б), или, эквивалентно, определить значение предиката Р, : Б € К,,3 - 1, ...,1. Обычно бывает задано сужение некоторого сюръективного отображения на конечном множестве Е С М и требуется построить продолжение отображения ф' : Е ^ {К1,...,К} на множество М ф : М ^ {К1, ...,К}. Такая задача восстановления целого по его части являясь некорректной, может решаться путем отыскания решения, в некотором смысле близкого к истинному решению.

Будем считать, что каждый элемент Б € М может быть представлен вектором Б - (ж1,...,жп) в п -мерном пространстве признаков. Тогда информация об элементах множества Е, классификация которых известна, определяется матрицей ||ж,||тхп, где т —

число элементов множества Е. Поставим задачу восстановить отображение ф' не на всем множестве М, а на конечном множестве Е1 - {Б1,...,Бд} С М, Е П Е1 - 0. Считаем, что алгоритм, позволяющий восстановить ф на Е1 , обеспечит достаточно хорошее приближение к истинному отображению ф на всем множестве М.

Пусть {А} — множество, вообще говоря, некорректных алгоритмов для решения поставленной задачи. Алгоритм А € {А} для множества Е1 строит матрицу ||вг, ||дХ1,вг.? € € {0,1, А}, где в, — значение предиката Р, (Бг), вычисленное алгоритмом А, символ А означает отказ от вычисления предиката.

В статье [38] показано, что алгоритм А может быть представлен в виде последовательного выполнения двух операторов: А - В о С. Оператор В, используя информацию ||жг, ||тХп о множестве Е, строит матрицу действительных чисел ||а,||дХ1. Оператор С переводит ||а,||дХ1 в матрицу ||вг,||дХ1. Алгоритм А назовем корректным, если его результатом является истинная матрица ||а,||дх^ для Е1, то есть а, - Р,(Бг), Бг € Е1.

Пусть { В } — множество операторов семейства (модели) алгоритмов { А} при фиксированном операторе С. Над операторами из { В } вводятся операции сложения, умножения и умножения на скаляр как соответствующие поэлементные операции над матрицами. По операциям сложения и умножения на скаляр { В } порождает линейное векторное пространство. По совокупности всех операций { В } порождает алгебру над полем действительных чисел. Линейное пространство и алгебру, порождённую множеством { В }, будем называть линейной и алгебраической оболочками Ь { В }, А { В } соответственно.

Множество {В} называется полным, если оно содержит операторы, порождающие базис в пространстве Д9х1 матриц размерности д х I.

В статье [38] доказана следующая

Теорема 6.3. Если {В} полно, то Ь{В о С}, а следовательно, А{В о С} содержит алгоритм, правильно классифицирующий все элементы множества Е1, то есть корректный для Е1 .

Ниже показан способ доказательства полноты алгебраической оболочки А { В }.

Теорема 6.4. Для полноты А{В} необходимо и достаточно, чтобы для любой упорядоченной пары (и, V) существовал оператор В, строящий матрицу 11аг, ||дХ1, у которой а^ - 0, и для любых двух пар («1^1) - («2^2) существовал оператор В, строящий матрицу ||аг, ||дХ1, в которой - а«^.

Доказательство. Условия, указанные в формулировке теоремы, являются дискретными аналогами условий теоремы Стоуна-Вейерштрасса: равномерное замыкание алгебры непрерывных функций, определенных на компакте, которая разделяет все точки и не исчезает ни в одной точке компакта, содержит все функции, непрерывные на этом компакте [146]. Следовательно, если условия выполняются, то А { В } совпадает с пространством Д9Х1 матриц ||аг, ||дХ1 и является полной. □

Рассмотрим применение данного способа к модели классификации с бинарными признаками ж, € {0,1}, в которой оператор В зависит от действительных параметров: 7г - 7(Бг) — веса элементов из Е и р, — веса признаков, г =1,..., т, 3 =1,..., п и переводит вектор Бп - (ж1,...,жп), Б„ € Е1, в вектор а« - (а«1,..., :

а«, - ^ ^ 7(Б4)р(ш)р(шБ4,юБ«), (6.1)

й^еЕпк, ш еп

где О - {Ю} — некоторая совокупность подмножеств множества {1,...,п}, р(сСБ^ОБ«) — функция расстояния, определяемая следующим образом:

~0ч 1 1, если СБ4 - СБ«; р(юб«) - _ „ , _ „

1 0, если ю6 - сюб«;

ùS = (Xji,...,Xjfc) при (ji,...,jfc} = ù.

Оказывается, что для операторов B вида (6.1) L{B} при некоторых значениях q будет неполной. Действительно, оператор B можно рассматривать как билинейное отображение Rm х ^ Rqxl. Если L{B} полно, то L{B} = Rqxl. Отсюда L{B(Rm х Rn)} = L{B(l^g,)}, где {l,}, {g,} — базисы пространств Rm, Тогда

ql = dim L(B(li,gj)) ^ m х n. m • n

Таким образом, при q > —-— линейная оболочка L{B} не будет полной. Рассмотрим данную модель классификации при выполнении следующих условий конструктивизации:

1) K, П Kj = 0 при i = j, i, j = 1,..., l;

2) (VS« € Ei) (VKj ) (3S € Kj П E) (3ù € Q) [p(ù S, ù S«) = 0];

3) (VS«, Sv € Ei) (VKj ) (3S € Kj П E) [p(ù S, ù S«) = p(ù S, ù Sv )].

Очевидно, что задачи с такими условиями удовлетворяют формулировке теоремы 6.4.

Следовательно, верна

Теорема 6.5. Для операторов B вида (6.1) A{B} полно.

Можно провести прямое построение операторов B в алгебраической оболочке A{B } , порождающих базис в пространстве Rqxl матриц | |a,j ||qxi. Эти операторы B (i, j) выражаются в A { B } операторными многочленами порядка не выше q — 1 и порождают матрицы ||a,j||qxi, в которых a,j > 1,ast = 0, (s,t) = (i, j).

Это построение дает возможность конструктивного получения алгоритма, безошибочно классифицирующего элементы множества Ei, то есть осуществляющего продолжение отображения р' с множества E на Ei.

6.3. Кодирование классифицируемых множеств

Обычно при решении задач классификации объектов на ЭВМ трудность состоит в том, что приходится хранить большое количество информации об эталонах соответствующих классов. Такая информация, как правило, собирается в результате обучения ЭВМ. Переходя непосредственно к классификации, приходится перебирать все массивы указанных эталонов при каждом предъявлении классифицируемого объекта. Последовательная обработка таких массивов занимает много времени. Поэтому для более эффективного использования ЭВМ при решении задач классификации необходимо проводить предварительную подготовку (кодирование) исследуемых множеств.

Рассмотрим кодирование конечных множеств натуральных чисел для последующей классификации [65].

Пусть Ф — семейство всех конечных подмножеств множества всех натуральных чисел N ^ {0,1, 2...}. Установим взаимно-однозначное соответствие 7 : N ^ Ф между всеми натуральными числами и множествами из Ф так: 7 (0) = 0 и для любого n > 0 представляем n в виде суммы n = 2n0 + 2ni + ... + 2nk, no < ni < ... < (такое представление — двоичное разложение всегда существует и единственно) и полагаем 7 (n) ^ {no, ni, ...,n&} € Ф [119].

Соответствие 7 : N ^ Ф называется стандартной нумерацией - одной из вычислимых однозначных нумераций семейства всех конечных множеств [119].

Известно [156], что дискретные сигналы и двумерные матрицы со значениями из N можно рассматривать как отношения. Кодировать последнее можно конечными множествами натуральных чисел или вообще натуральными числами. Покажем, как это делается в общем случае, когда имеется семейство M функций f : Ki х K2 х ... х Kn ^ Kn+i, где K,, (г = 1,п+1)— конечные множества натуральных чисел. Каждой функции / соответствует отношение Ff = {(mi, m2,..., mn, f (mi,..., mn))|(mi, m2,..., mn) € Ki х K2 х ... х Kn}.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Сведем каждый кортеж длины n + 1 множества Ff в натуральное число с помощью канторовской нумерации [119]:

cn+i (mi,..., mn+i) = c (c (mi, ...,c(m„,mra+i))...).

Здесь c1 (m) = m,

2 n , n , (k + m)2 + 3k + m с (к, m) = с (к, m) =-

2

Получим конечное множество С (Ff) натуральных чисел размерности К\ х ... х Кп для каждой f € M. Это кодирование функций из M в конечные множества обозначим через ф : M ^ Ф. Далее полученные конечные множества можно с помощью стандартной нумерации Y кодировать натуральными числами.

Предложим более эффективную процедуру кодирования конечных множеств с фиксированной мощностью, то есть процедуру, поддающуюся вычислению кодов множеств с помощью ЭВМ.

Рассмотрим подсемейство Ф2 семейства всех двухэлементных множеств натуральных чисел:

Ф2 ^ {{ж,у}|(ж<у) & (ж,у € N)} .

Упорядочим элементы множества Ф2 согласно канторовской нумерации.

Нумерация c ({i,j}), i<j семейства Ф2 имеет следующий вид:

Положим L (c ({i,j})) ^ i, R (c ({i,j})) ^ j.

Тогда если c ({i,j}) = ж, то R (ж) и L (ж) вычисляется следующим образом:

(k (k-1) \. , ч . R (ж) (R (ж) -1) R (ж) = цк f V ; > ж 1-1; L(x)=x--\ -

Здесь ц — оператор минимизации [119].

Очевидно, нумерация V2 : N ^ Ф2, определенная так: (Уж € N) [V2 (ж) = {L (ж) ,R (ж)}] является вычислимой и однозначной [142].

Для всякого элемента f из M зададим множество ф (f) = {ж!,...,ж&} в порядке возрастания его элементов к = К\ х К2 х ... х _fira.

Тогда это множество можно закодировать так:

ck ({ж1,ж2, ...,жк}) = ^{жьД^, ...^({ж*— ,жк})...).

где c ({i,j}) —нумерация семейства Ф2.

Нужно заметить, что для любых i,j (i < j), кроме двух элементов {0,1} и {0, 2} , имеет место c ({i,j}) ^ max(i,j), поэтому при ж1 < ж2 < ... < , (k ^ 3) ограничение (неравенство) i < j, которое необходимо для нумерации c, всегда выполняется.

Такое кодирование функции из M в натуральное число обозначим через ф : M ^ N. Очевидно, (M, ф) есть множество сильно конструктивных объектов и ф (M) конечно. Поэтому на основании следствия 1.1 [9] проблема классификации для тройки (M, R, ф) разрешима.

На практике, например при работе с текстурами, как правило, переход к натуральным числам не производят, а работают непосредственно с множествами ф (f), f € M.

Пронумеруем множества ф (f), f € M. Тогда получим некоторое семейство Фо ^ ^ {Xi,X2,...,Xm} , очевидно, Фо С Ф. Требуется найти условия, при которых существует

m

m элементов (чисел) из U Xi, и решающие правила классификации.

г=1

Для решения поставленной задачи построим индексные множества Cm+1 и логическую матрицу q = [qij]mxm так: С\ = Xi, (i,j = 1, т) и далее по рекуррентной схеме:

Cг f Cj\Xj, если Cj\Xj = 0; = ( л, если Cj\Xj = 0;

•j+1 | Cj, в противном случае; | u, если Cj\Xj = 0.

Тогда справедлива

Теорема 6.6. Если для любых J, I С {1, 2, ...,m} таких, что J П I = 0 и U Xt =

__í€3

U X¿, и для любых i,j,t = 1,ш, Н ф j), Н ф t), С\ ф С^, то существует т, чисел leí j j

a¿ € Cm +1 таких, что для всякого X из р (M) предикат,

Ф^ (X) = К € X] & обращается в «истину» тогда и только тогда, когда X = Xi, X¿ € Фо.

V \üj € X] & qij j=1

Доказательство. В силу условий теоремы 6.6 индексные множества Сгт+1 не пусты и попарно различны. Выбирая по элементу из каждого множества Ст+1, получим искомые элементы ец, (г = 1,ш) .

В самом деле, по построению множеств Ст+1 и логической матрицы ц видно, что qгj = и ^ ц^г = л.

Пусть X = Хг. Тогда \аг € Хг] = и. Если (У г = у) \\ttj € Хг] = и] , то

V \aj € Хг] & qгj = л независимо от qгj. В этом случае Фг (Хг) = и. j=1

Предположим противное, то есть (3j = i)\\aj € Хг] = и]. Тогда по построению логической матрицы ц имеем qjг = и, то есть qгj = л. Отсюда вытекает, что

т

V \aj € Хг] & qгj = л. j=1

Следовательно, Фг (Хг) = и.

Осталось доказать, что (Уj = г) \Фj (Хг) = л] . Заметим, что

Ф; (Xi) = \a,j € Xi] &

V \ai € Xi] & qji i= 1

Возможны два случая: когда aj € Хг или aj € Хг. В первом случае высказывание \aj € Х] = л и отсюда Ф^- (Хг) = л.

Рассмотрим второй случай: \aj € Х|] = и. Тогда, с другой стороны, \aj € Хг] = и.

Следовательно, V ^г € Хг] & qjl = и, а искомый предикат Ф^- (Хг) = л. Что и требовалось

доказать. □

§ 7. Модели принятия решений, работающие в условиях неопределенности

Задача классификации объектов в математической кибернетике остается весьма актуальной, и число методов классификации неуклонно возрастает [5, 22, 67, 121, 176].

В данном параграфе анализируется группа моделей принятия решений с основным множеством М = М1 х х ... х Мп относительно обучающей выборки О С М, классифицирующей функцией / : 1г ^ 1г ^ {1, 2,..., 1} , 1 ^ {1, 2,..., Ь} , где 1 — число кортежей обучающей выборки О = \\iiij|||хга , t — число классов, и сигнатурами сг^ ^ {Яц, •••, -Кй), {} = 1) ш) ■ Рассмотрим каждую модель (критерий принятия решений) отдельно [70, 123].

7.1. Модель логического решающего правила

Рассмотрим процедуру выбора информативных значений признаков в кортежах обучающей последовательности для построения логического решающего правила для классификации объектов из некоторого множества К О.

Пусть обучающая выборка О представлена в виде матрицы О = ||иг^- ||гхп, где ] = 1,п — число признаков, г = 1,1 — число классифицируемых объектов кортежей действительных чисел вида иг = {иц,Щ2, ...,игп) таких, что для любых г = в ^ иг = и3. Обучающую выборку О сопровождает априорно заданная классифицирующая функция / : 1г ^ где ^ {1, 2,..., 1} , 1 ^ {1, 2,..., Ь} , Ь — число классов эталонных объектов.

I

Через X = (ж1, х2,хп) обозначим неизвестную реализацию объекта из основного множества М. Требуется найти условия существования I чисел а? — идентификационных номеров, то есть информативных значений признаков в кортежах обучающей выборки О, достаточных для построения решающих правил, позволяющих классифицировать объекты-кортежи из множества К С М.

Для этой цели, используя результаты работы [1], приведем поставленную задачу к известной схеме принятия решений с некоторыми ее расширениями.

Наша ближайшая задача — свести кортежи обучающей выборки О к множествам так, чтобы не произошло при этом потери информации.

тах и?

г

тт и

2

= 1 , п) ,7-го признака для ¿-го

Обозначим средние значения С3 = объекта.

Пусть задана некоторая константа А > 0. Используя эту константу, вычислим рекуррентными соотношениями следующие коэффициенты:

С1 = С1 + А; С2 = 2с1 + С2 + А;

СП -

п-1

2 3 + Сп + А.

3=1

3+1

Коэффициенты С3 вводятся для того, чтобы не произошло ненужных «слипаний» элементов кортежей обучающей выборки О = ||^г|1г=Т7-

Введем представления для г -го эталонного объекта в обучении О? ^ {и?1 + с1, и?2 + с2,..., + сп}, а для неизвестного и предъявляемого для классификации объекта X ^ {х\ + С1, х2 + С2, ..., хп + сп}. _

Построим индексные множества Т^р = следующим образом.

Первоначально определяем исходные индексные множества у? = О?.

На последующих шагах вводим рекуррентные представления попарного «сцепления» исходных множеств:

_ / Vj\Qj, если ф 0; (г,^ = М) •

V?, в противном случае.

На последнем шаге получаем конечные индексные множества, не пересекающиеся остатки от исходных множеств, то есть «чистые» от всех возможных пересечений («сцеплений») с другими множествами.

Эти индексные множества сопровождает логическая матрица д = Ц^- Ц^ , элементы ко-

Г 0, если К'Уй Ф 0, {г,з = М) ; торой задаем по правилу: дз = < 3 и 4 7

[1, в противном случае.

Таким образом равенство какого-либо исходного Оз -го множества индексному V? на соответствующем 3 -м шаге построения фиксируется значением д?з = 1 элемента матрицы д.

Пример 7.1. Исходные множества О1, О2, Оз, О4 заданы кругами Венна.

1-й шаг

V2 = Q2; V3 = Q3;

2-й шаг

vi = Qi;

V22 = Q2\QI ; V23 = Q3\Qi;

3-й шаг Vi = Qi\Q2 V32 = Q2\Ql

V33 = Q3\Qi

4-й шаг

V41 = (Ql\Q2)\Qs; V42 = (Q2\Qi) \Q3; Vf = QAQi;

V? = О; У = О= О; ^ = ($4= О; П4 = О\Оз = О; 5-й шаг

У = ((ддд2) \д3) \д4 = (¿м^2) \д3;

У2 = (($2\$1) \Оз) \$4 = ШОО \$з; У3 = ($з\$1) \$4 = (ОДОО;

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

V!? = $4;

Логическая матрица для данного примера имеет вид:

и

j N4x4

1 0 0 0

0 1 0 0

0 1 1 0

0 0 0 1

Обозначим через Ai (p) множество эталонов информационных значений признаков ai :

Ai (р) ^ {а\аг — % + а3 (р) ^ а ^ аг + % - Vj (Р)} I где аг £ У+Ц = М) •

Индекс j выбирается из условия Cj — Cj ^ ai ^ Cj + Cj.

min (a — b) , ,, , .

-, где (а — b) > 0; а, b € {-Uij, «2j, •••, %) •

m

2

(p) = 2pmj, (1 ^ j ^ n; 0 < p < 0, 5) .

Далее через Pf (X) обозначим предикаты «сцепления» (пересечения) неизвестного объекта X с множеством эталонов информационных значений признаков Ai (p) :

1, если Ai (р) П X / 0, (i = ITI) ; 0, в противном случае.

любых F, Jl ^ {1,2,___, l} таких, что F П J = 0 и

Pf (X) =

Теорема 7.1. Если

Ог = и О, и (Уг = к, к ЗеЗ

чисел аг € ^+1 таких, что общее логическое решающее правило

U Qi = U Qj и (Vr = k, k = m) (Vr, k, m € J ^ {1, 2,..., l}) [VJT = Vri], то существует l leF jeJ

iiifl(X) = V ФДХ), (g = l,i)

l£D„

где частные решающие предикаты

Ф1 (X) = Pf (X) &

V Pf (X) & qij j=i

* = j

вычисляются на некотором классе К (р) 1Э О, зависящем от множеств Аг(р), (г = 1, ¿) ; = {^|/ = $} — множество номеров эталонных объектов.

Доказательство. Покажем, что на обучающей выборке О решающее правило теоремы 7.1 работает правильно. Для этого достаточно убедиться, что если X = щ € О, то Фг (Ог) = 1 и для всех j € Зг ^ {1, 2,..., 1} , 1 € N; j = г ^ Ф, (Ог) =0. В самом деле, пусть

X = Ог. Тогда Р? (Ог) = 1. Если (Уj = г) Гр? (Ог) = о! , то V рР (Ог) & = 0 независимо

З = 1

от дг,. В этом случае Фг (Ог) = 1.

Предположим противное, то есть (3j = i) P? (Qi) = 1

^ . По построению логической матрицы д = Ц^гз||гхг имеем 3 = 1, но тогда = 0. Отсюда вытекает, что при г = 3

V Р7р (О?) & = 0. Следовательно, Фг (О?) = 1. 3=1

Осталось доказать, что (У? = г) [Ф, (О?) = 0] .

Заметим, что при r = j Ф^ (Qi) = P? (Qi) &

V P? (Qi) & j

r=1

. Возможно два

3

случая: когда Pj (Qi) = 0 или Pj (Qi) = 1. В первом случае Ф^ (Qi) = 0. Рассмотрим второй случай: P? (Qi) = 1. Тогда j = 1. С другой стороны, P? (Qi) = 1.

Следовательно, при r = j V Pr (Qi) & j = 1, а искомый предикат Ф^ (Qi) = 0, что и

r=1

требовалось доказать. □

Итак, модель логического решающего правила представим в виде: Mi ^ (M; O,/, 0i ^

^ (Rn, R\2, ■ ■ ■, Rit))- _

Следует заметить, что условия существования I элементов (ц € V^, (г = 1,1) показаны в работе [67], а расширения области действия решающего правила R\g (ж), (д = 1, t) на классы K (p) достигаются за счет множеств Ai (p). Множества Ai (p) можно интерпретировать как эталоны для общего решающего правила, приведенного в теореме 7.1, а числа е^, (г = 1,/) — как информативные значения признаков в кортежах обучающей выборки O.

7.2. Модель голосования с отношениями толерантности

Модель голосования с отношениями толерантности обозначим через M2 ^ (M; O, /,Ti,T2, ...,тп; 02), где M — основное множество; O — обучающая выборка; / — классифицирующая функция; Tj — отношения толерантности на Mj, (j = 1 ,п)

02 ^ (R21, R22, •••, R2t) — сигнатура, предикаты которой интерпретируются следующим образом:

а) общее решение — ^2fc(ж) = V Tj (ж) , (fc = l,t) , где множество номеров эталонных

ieDfc

объектов — Dk = {¿|/ (г) = , ж = (ж1, Ж2, •••, жга) € М;

^ / 1, если Ti = То, (г = 1,1)]

б) частные решающие предикаты — Ti (ж) = s „

0, в противном случае.

n

Ti = ^Pj (Uij, Xj); To = max(Ti, T2,..., Ti); j=i

в) pj (uij,Xj) — мера толерантности ( близости, сходства) между эталонным Uj и предъявленным Xj значениями j -го признака для i -го объекта:

, Л Г 1, если uaTjXi, (j = 1 ,п)]

Pj (Uij,Xj) = i ' ij j v ;

0, в противном случае.

Если матрица O состоит из действительных чисел, то в качестве Tj удобно брать, например, следующие отношения толерантности на Mj :

XTjy ^ |ж - y| ^ £i, (£i ^ 0) .

В частности, если все Ei = 0, (г = 1, ¿) , то получим модель коллективного голосования.

7.3. Модель коллективного голосования

Модель коллективного голосования обозначим через M3 ^ (M; O; /; 03) с тем же основным множеством M, обучающей выборкой O, классифицирующей функцией / и сигнатурой

03 ^ (R3i, R32,R3t), общее решение которой интерпретируется следующим образом:

R3k (ж) = V Ki (ж), (к = l,t) , где множество номеров эталонных объектов ieDfc

Dfc = {i|/(i) = k} , Ж = (xi,Xn) € M.

Частные решающие предикаты

__п

1, если Кг = Ко, (г = 1,1) ,Кг = жД;

Кг(х) = ^ ,=1

0, в противном случае.

Мера близости между эталонными щ и предъявленными х, значениями j -го признака для г -го объекта:

, Л Г 1, если иц = ж,-, (г = 1,1; 1 = 1 ,п); Т. ,т. т.

р (^х,) = ^ ' гз З,у п Ко = шах(К1,К2,...,Кг).

0, в противном случае,

В частности, если положить Ко = п, то получим модель сильного голосования.

7.4. Модель сильного голосования

Модель сильного голосования обозначим через М4 ^ (М; О; /; 04) с тем же основным множеством, обучающей выборкой, классифицирующей функцией, что и в предыдущей модели и сигнатурой 04 ^ (Я41, ^42,..., ), предикаты общего решения которой интерпретируются так:

к(х) = V Сг(х) , (г = 1,1) (к = 1,{) , где множество номеров эталонных объектов

геОк

Аь = {г|/ (г) = к} , х = (Х1,..., Хп) € М.

п

Частные решающие предикаты: Сг (х) = & р (щ, , х,).

З = 1

Мера близости между эталонными щ и предъявленными х, значениями j -го признака для г -го объекта

Р (uij ,xj) =

1, если ulj — Xj;

*'11 J ж7) - 1 n

J J 1 0, в противном случае.

Замечание 7.1. Если (Vk € Jt) [^4^ (ж) — 0] , то дается отказ от решения.

7.5. Модель Гурвица (минимаксный критерий классификации)

Модель Гурвица обозначим через M5 ^ (M; O; f; 05). Основное множество M, обучающая выборка O и классифицирующая функция f взяты такими же, что и в предыдущих моделях.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Сигнатура 05 ^ (R5i, ^52,..., ) состоит из t предикатов, которые имеют вид:

а) общее решение:

Rbk [х) = V G, (х), (к = м),

ieDk

где множество номеров эталонных объектов = {i\f (г) = к} , (к = l,t) , X = (ж1,...,жга) € € M;

б) частные предикаты:

G Г 1, если Аг = Ао;

0, в противном случае.

Ai = Ai0 • ß + Aim • (1 - /3), 0 < 1, А0 = min (Аь ..., Дг), Ai0 = max (Aib Ай, ..., А^); А im = min ..., Am) (г = 1, l) , где мера близости А ц = \xj — , (г = 1,1; j = 1,п) .

В частности, при ß — 1 имеем модель Вальда.

7.6. Модель Вальда

Модель Вальда обозначим через Мб ^ (M; O; f; 0б) , где M, O, f — основное множество, обучающая выборка и классифицирующая функция собственно те же, что и в предыдущей модели, а общие предикаты сигнатуры 06 ^ (R6i, ^62,..., ) интерпретируются следующим образом: Rgk (х) = V Wi (Х), (к = l,t) , где множество номеров эталонных объектов

ieDk

Dk = {¿|/ (i) = к} , (к = 1, t) , x = (x\, ...,xn) € M, где частные предикаты:

Wi(s) = i J' еслиА« = Ао; (г=ТЛ)

0, в противном случае,

A0 = min(Aio, Д2о, •••, Аю) ; А»о = max (Aib Ai2, ...,Ain). Мера близости: Д^ = — ж^-1, (г = 1, l,j = 1, п) .

7.7. Модель Лапласа

Модель Лапласа обозначим через M7 ^ (M; O; /; 07) с основным множеством M, обучающей выборкой O, классифицирующей функцией /, что и в предыдущей модели, а предикаты сигнатуры 07 ^ (Ri, R72,..., ) интерпретируются так:

i?7fc (ж) = V U (ж), (к = М) ,

iSDfc

где множество номеров эталонных объектов D = {i|/ (i) = k} , Ж = (xi,x2, ...,жп) € M. Частные предикаты представим следующим образом:

£.(-)_/ если ^ = = М) ;

i 0, в противном случае,

п _

где Li=Y, (i = !> О > L0 = mm Li.

j=i _ _

Мера близости: Д^ = — Xj\, (г = 1, l]j = 1, nj .

7.8. Модель Сэвиджа

Модель Сэвиджа обозначим через Ms ^ (M; O; /; 0s), где основное множество M, обучающая выборка O С M и классифицирующая функция / те же, что и в предыдущих моделях. Предикаты сигнатуры 0s ^^ (Rsi, Rs2,..., Rst) интерпретируются так:

R8k (ж) = V St (ж), (к = М) ,

iSDfc

где множество номеров эталонных объектов D = {i|/ (i) = k} , Ж = (xi, ...,жп) € M. Частные предикаты определим так:

^ , . = Г 1, если = 5*0, (г = 1, ¿) ; i 0, в противном случае,

где = maxr^, So = minSj, (г = 1,1) ;

ji

rij = A,max - Aij, (rij ^ 0) ; Д™ах = maxAij; мера близости А^ = — ж./| , (г = 1, l;j = 1, п) .

7.9. Модель минимума среднеквадратического отклонения

Модель обозначим через M9 ^ (M; O; /; 09). Основное множество M, обучающая выборка O и классифицирующая функция / те же, что и в предыдущих моделях, а предикаты сигнатуры 09 ^ (R9i, R92,..., R9t) интерпретируются следующим образом:

Rgk (Ж) = V вг (Ж) , (к = М) , iSDfc

где множество номеров эталонных объектов D = {i|/ (i) = k} , Ж = (xi, ...,жп) € M. Частные предикаты

0 Сж) — / если ^ = = О '

i 0, в противном случае,

где мера близости Qi = ^ (uj — Xj) , Qo = min (Qi, Q2, • ••, Qi) •

j=i

7.10. Модель точек с окрестностями

Пусть дана обучающая матрица O = ||uj ||ixn, состоящая из l кортежей Ui = (uii, Ui2, •••, Uin) действительных чисел Uj таких, что Ui = Uj при i = j и классифицирующая функция f : Ji — Jt, где Ji ^ {1, 2, •••,l} , Jt ^ {1, 2, •••,t} , (t — число классов). Через |u — c| обозначим евклидово расстояние между векторами u = (ui,u2, •••,un)

Г

и V = (Vi, V2, •••, Vn) , |U — v| = J = (Ui — Vi) •

Пусть £ = min |u — C| , (e > 0) • Тогда для любого X = (xi, X2, •••, xn) частное решение

tt,u€O

определим через предикат

Tw-ч f 1, если Iwj — x| < e!2, (i = 1,

Pi (ж) = 1n v 7

0, в противном случае.

0, в противном случае.

где Ед = {г|/ (г) = к} — множество номеров эталонных объектов.

В целом для т схем принятия решений можно рассматривать общую модель (общий решатель) М ^ (М; О; /; 0) с тем же основным множеством М, обучающей выборкой О и классифицирующей функцией / : 3 — что и в моделях М1,...,Мт и сигнатурой 0 ^ (Я1, ^2,..., Л*), предикаты которой интерпретируются следующим образом:

Г 1, ecnHDk = Do,(k = l,t);

0, в противном случае,

где множество номеров эталонных объектов Dk = ^ Rik (x) ,Do = max (Di, D2,..., Dt),

i=1

m

x = (xi,..., x„) € M; Rik € 00 = U 0i.

i=1

Нетрудно заметить, что все перечисленные модели легко реализовать аппаратно в виде классификаторов последовательно-параллельного действия, и, объединяя последние общим решателем, повысить в целом надежность классификации объектов [6].

7.11. Конечная модель кластеризации с порождением отношений-образов

В работах [11, 52, 57] показано применение кластерного анализа для классификации объектов. В данном пункте будет демонстрироваться своеобразная кластеризация, основанная на порождении классов из обучающей выборки, которая используется в дальнейшем для решения некоторых традиционно «трудных» прикладных задач, в частности, классификации текстур

[72].

При работе с текстурами важно построить адекватную модель классификации для априорно заданных классов текстурных изображений [11]. Такая модель строится для пространства наблюдений F текстурных изображений на основе обучающей информации с порождением отношений-образов двухместной операции, определяемой с помощью полусуммы.

Пусть имеется множество текстурных изображений M с отображением Q : M — F в пространство конечных объектов F, где в качестве конечных объектов взяты дискретные матрицы f (x, y) размером m х n. Функция f (x, y) : Jm x Jn — Jr, где Jm ^ {1, 2,..., m} , Jra ^ {1, 2,..., n} , Jr ^ {1, 2,..., r} .

В пространстве наблюдений F имеется обучающая выборка O = (Q (01) , Q (0:2),..., Q (®г)) такая, что Q (01) = fi (x,y) ,..., Q (01) = f (x,y), и задана классифицирующая функция g'-Zi^Zt, Zi ^ {1, 2,..., 1} , Zt ^ {1,2, ...,t} (t — число классов).

На множестве F введем бинарную операцию полусуммы [D] следующим образом:

/ (X, у) = h (X, у) 0/2 (X, у) ^ / (X, у) = [/1(Ж'У)+/2(Ж'У)

Квадратные скобки означают целую часть числа. Таким образом, имеем алгебру Ц |) с основным множеством Р и операцией [и]. С помощью бинарной операции [и] и множеств Ад = {/ (ж, у) |г € } , где множество номеров эталонных объектов ^ ^ {г|д (г) = к} , (к = 1, порождаются отношения-образы Рд., то есть рассматривается модель М ^ (Р; р , ) с основным множеством Р и отношениями .

Построенная модель адекватна исходной модели А ^ (М; М1, ) с основным множе-

ством М и некоторыми априорно заданными классами М^ С М, (г = . Адекватность достигается тем, что операция [Ц] отражает компактность, имеющую место между текстурами одного класса.

Решающее правило для классификации текстур в этом случае можно записать через предикат принадлежности отношению образа р :

, ч _ Г 1, если Q (ск) € Fi, (г = 1, t)

P г (а) — in

[ 0, в противном случае.

0, в противном случае.

Благодаря основному свойству модели

/ (ж, у) € Ft & fr (ж, у) < / (ж, у) < /Гх (Ж, У), (г = М) ,

где /Гп (ж, у) = min/j (ж, у); /гтах(ж,у) = тах/.,• (ж, у) , (¿,j = l,t), предикат Pi(a) эф-

jeDi jeDi

фективно вычисляется для любого а € M.

Возникает вопрос: какие можно применять преобразования исходного пространства функций F в другие пространства с тем, чтобы расширить классы Fk без ущерба для надежности классификации, получаемой с помощью решающих правил для модели M ? Рассмотрим функционал ф : F ^ N0 такой, что

m n

ф (f (x, y)) ^ ^ ^ f (x, y), где N0 ^ {x|m ■ n ^ x ^ m ■ n ■ r} .

x=1y=1

Обозначим через afn ^ <p (/fcmin (ж, у)) , a™ax ^ <p (/fcmax (ж, у)), (k = Щ .

денные операцией

^ (ДГо; дгь N2,..., . Легко заметить, что Щ ^ {ж|а^1п < ж < а^ах} , (к = ТД) . Кроме того, справедливо соотношение

(V* € &) (V/ (ж, у) € Р) [/ (ж, у) € Рд ^ ф (/ (ж, у)) € N] ,

то есть имеет место расширение классов р., (к = . Другими словами, возможно существование такой функции / (ж, у) € , что ф (/ (ж, у)) € N.

В принципе для классификации исходных элементов а € М можно использовать более простые решающие правила:

= Г 1, если аГ11 < Ф (П (а)) < агтах, (г = М) ; (л)

г \ 0, в противном случае.

Замечание 7.2. Решающие правила вида (А) не будут понижать надежности классификации, достигаемой решающими правилами для модели М при условии попарного непересечения множеств Л^, (к = .

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Это в свою очередь накладывает условия на исходную обучающую выборку следующего вида: для любого г = 1,2, — 1, необходимо а™^) > а"^, где Н (г) — перестановка номеров 1, 2,^ элементов а5"ах,..., атах такая, что а^!) < а)^ < ... < а^^.

Это условие конструктивное и легко проверяется для любой обучающей выборки О = (О («1) ,..., О («4)) с классифицирующей функцией д : Зг — 34.

В качестве другого функционала, обладающего аналогичными свойствами, как и функционал р, возьмем функционал 7 : Е — Зг; Зг ^ {1, 2,..., г} . Тогда образом дискретной матрицы /(ж, у) из пространства конечных объектов Е будет являться отображение вида:

7(f(x,y))= max /(ж, у) ® min /(ж,у).

Обозначим через b^in ^ 7 (f^in (ж, у)) , ^ 7 (f^ax (ж, у)), (Л = М) . На множестве Zr введем также бинарную операцию ф вида: а ® b = ■ Тогда

получим алгебру (Zr]

®

Через (к = обозначим множества, порожденные операцией ф из двухэлемент-

ных множеств {ЬГ,ЬГх} , и рассмотрим модель 3 ^ (Зг; ¿1,...,Р4) . Легко заметить, что ¿к ^ {ж|Ь™1П ^ ж ^ . Кроме того, справедливо соотношение

(V* е 3) (V/ (ж, у) € Е) [/ (ж, у) € Ек ^ 7 (/ (ж, у)) € ^],

то есть имеет место расширение классов (к = и для классификации исходных элементов а € М можно использовать следующие решающие правила:

щ (а) = Г 1, если ЬГп < 7 (П («)) < ЬГХ, (г = м) ; (д)

г I 0, в противном случае.

Замечание 7.3. Решающие правила вида (В) не будут понижать также надежности классификации, достигаемой правилами для модели М при условии попарного непересечения множеств ¿к.

Это достигается, когда для любых г = 1,2, ...,£ — 1 имеем Ь™^) > где Н (г)

= 1, 2

перестановка номеров 1, 2,...,t элементов b™ax,..., b™ax такая, что

ша^ ша^ ^ шах

(1) < (2) < ... < ( 4) .

Аналогичными свойствами функций р и 7 обладают функционалы А и в, которые можно определить так: для любой функции / (ж, у) € Е

А (/ (ж, у)) = П / (ж, у);

х ОП

в (/ (ж,у))= £ 2/ ( х'у).

Для этих функционалов в качестве основных множеств можно взять П = {ж|1 ^ ж ^ гт^га} и В = {ж|2 ■ т ■ п ^ ж ^ 2Г ■ т ■ п} соответственно, а отношения П1,..., П4 и В1, ...,В4 порож-

^ф] из двухэлементных множеств: {С"'п, С"ах} и {¿™"М™ах},

даются с помощью операции (Л = М) , где СГ = Д_(/™п (ж, у)) ; С,тах = А (/™ах (ж, у)); I™ = /3 (/™п (ж, у)) ; ^

= /3(/Гх(ж,у)), (л = 1,4).

Таким образом, моделям

N ^ (N0; N1,...,^); I ^ (I; ¿1,...,Ь4); Р ^ (П;П1,..., П); £ ^ (В; ВЬ...,В4); соответствуют расширения модели М : М1 = (Р; Р1, ...,Р/) ;

М11 = <Р; р'1, ...,Е//> ; М111 = <Е; Е/11, ...,Е///> ; М/у = <Е; , ...,Е/У > ,

такие, что при (г =

р С р1 - {/ (X, у) |ф (/ (X, у)) е , р с р11 - {/ (х, у) |7 (/ (х, у)) е р}, Р с р111 - {/ (X, у) | Д (/ (X, у)) е П}, р с р^ - {/ (х, у) |в (/ (X, у)) е В}.

Заметим, что |3Г | = г; |N01 = т ■ п ■ г — т ■ п = т ■ п ■ (г — 1);

|П| = |В| = 2Г ■ т ■ п — 2 ■ т ■ п = 2 ■ т ■ п ■ (2Г-1 — 1) .

Пусть т,п ^ 2. Тогда при г = 2, 3 имеет место |3Г| < |Жо| < |В| < |П| .

Для фиксированного т и п существует такое го (т, п), что при г < го (т, п)

|3г| < ^о| < |В| < |П| , а при г ^ го (т,п) |1Г| < N < |П| < |В| .

Учитывая это обстоятельство, самым простым следует считать функционал 7, сложным ф, а сложность функционалов Д и в зависит от г, т и п. При г < го (т, п) Д сложнее в, ф и 7, а при г ^ го (т, п) в сложнее Д, ф и 7.

Последнее обосновывает построение иерархической системы классификации: на первой ступени стоит решающее правило, соответствующее функционалу 7. При этом если произойдет отказ от решения или решение многоальтернативное, то переходим к принятию решения, соответствующего функционалу ф.

При отказе от решения по этому правилу или когда решение многоальтернативное, пользуемся следующим правилом:

г < го (т, п) .

Таким образом, если на каком-то уровне иерархической системы происходит однозначное принятие решения, то процедура классификации заканчивается. Наконец, в случае отказа от решения на верхнем уровне иерархии дается общий отказ от решения.

§ 8. Игровые решающие правила для отношений

В погоне за полнотой исходной информации все больше набухают базы данных, содержащие информацию об обучающей выборке, например, при построении компьютерных экспертных систем (ЭС). Для того чтобы эффективнее использовать обучающую информацию при работе ЭС, необходимо при эталонировании искать инварианты для каждого класса. Это позволит выделить главные отличия информативных зон в различных классах с использованием незначительной обучающей выборки и специальных приспособлений к таким эталонам решателей.

В настоящем параграфе исследуются решающие схемы, работающие с отношениями и множествами. Причем, при эталонировании отыскиваются инвариантные пересекающиеся и информативные (чувствительные) зоны этих множеств. Учитывая различные условия расположения между собой множеств (отношений) в обучении, применяются специализированное эталонирование и решатели, позволяющие разделять множества по классам.

Также рассмотрены игровые решающие правила для отношений, указаны пути использования инвариантов в эталонировании множеств для создания эффективно работающих экспертных систем [18].

8.1. Модели игровых решающих правил для отношений

Рассмотрим основное множество в виде декартова произведения:

Если г ^ го (т, п) , то

■шах.

или, наоборот, если

— X 1га2 X ... X 1пг; — {1, 2, пг} .

Пусть т отношений составляют обучающую выборку ...,От} С М;

X ÇM — неизвестная реализация-отношение; P (M) — множество всех подмножеств множества M.

Неизвестный предъявленный объект x € X; (xi, Ж2, •••, xn) — набор признаков xj, (j = l,n) для описания объекта x = {Х\,Х2,...,хп).

Для всякого х € Л4 обозначим через Oi(x), (г = 1, m) и Х(х) предикаты:

„ f 1, если X € Oj; Г 1, если X € X;

Oi (x) = n X (x) = < '

[0, в противном случае. [0, в противном случае.

Пусть обучающую систему Oi, O2,Om отношений сопровождает классифицирующая

функция f : Im — It, где Im ^ {1, 2,..., m} ; It ^ {1, 2,___, t} ; t — количество эталоных

классов, m — число исследуемых отношений.

Положим Dk = {г|/ (г) = к} , (к = l,t) — множество номеров эталонных объектов и рассмотрим игровые решающие правила [1, 113] в интерпретации отношений.

8.1.1. Модель коллективного голосования для отношений

Рассмотрим модель Mi ^ (P (M) ; {Oi, O2,Om} ; ai) с основным множеством P (M), дополнительной обучающей выборкой {Oi, O2,Om} и сигнатурой ai ^ (Rii, Ri2,Rit), одноместные предикаты которой интерпретируются следующим образом:

Rlk (X) = V Qj (X), (к = M) ,

jeDfc

где t — количество классов, определяемых частными решающими предикатами:

_ Г 1, если Kj = Ко; (j = 1, m) ;

О (X) , п

1 0, в противном случае.

Здесь К = Е (К (О* (X) , X (X))); Ко = шах(Кь К2,..., Кт) .

жеМ

Мера близости между эталонными О*(¿с) и предъявленными X (¿с) описаниями отношений объекта X

1, если О* (X) = X (X) ;

К (О* (X), X (X)) = ,

0, в противном случае.

8.1.2. Модель сильного голосования для отношений

Модель сильного голосования для отношений обозначим

М2 - (Р (М); {О1,О2 ,...,От} ; 02),

где 02 — (^21, ^22,..., Д2*) — сигнатура, состоящая) из одноместных предикатов, определяющих общее решение: (X) = V (X), (к = 1,£) ; а частные решающие предикаты Qj(3í)

задаются по схеме: О/ (X) = & Р (О* (X), X (X)).

жеМ

Мера близости между эталонным описанием О*^) и предъявленным X(X) неизвестного объекта X € .М

Р (О, (*), X (*)) = ( еСЛИ ® = ^

0, в противном случае.

Замечание 8.1. Если (Ук е I*) [Д (X) =0] , то дается отказ от решения.

8.1.3. Модель Вальда для отношений

По аналогии с предыдущей моделью введем модель Вальда, где новыми будут сигнатура 03 и решающие правила:

Мз — (Р (М); {О1,О2,...,От} ; 03)

где сигнатура 03 ^ (R31, R32,..., R3t) содержит одноместные предикаты, формирующие общее

решение: = V Wj (X) , для которых частные решающие предикаты:

jeDfc

Lj (X) =

W- (X) = < если Aí0 = ^= т; j I 0, в противном случае,

До = min (Д10,..., Дто), Дг0 = max(Oi (X)).

x€M

Дг = |Oi (X) — X (x)| — невязка между эталонными O¿ (X) и предъявленным X (X) описаниями отношений объекта X.

8.1.4. Модель Лапласа для отношений

Введем новую сигнатуру 04 и другие решающие правила для построения модели Лапласа:

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

М4 ^ <P (М); {Oí, O2,..., Om} ; 04),

где сигнатура 04 ^ <R41, R42,..., R4t),

Общее решение: R^k (X) = V Lj (X) , (k = l,t) , j = 1 , m, где частные решающие пре-

jeDfc

дикаты

1, если L¿ = Lo;

0, в противном случае.

Невязку между эталонным описанием O¿ (X) и предъявленным X (X) для объекта X € X зададим следующим образом:

L¿ = £ |O¿ (X) — X(X)|, Lo = min(Lí,L2, •••,Lm).

xeM

8.1.5. Модель Евклида для отношений

Общая модель Евклида — М5 ^ <P (М) ; {Oí,O2, ...,Om} ; 05), где P (М) ; {Oí,O2, ...,Om} как и в предыдущих моделях; сигнатура 05 ^ <Я5Ъ R52,R5í).

Общее решение: (X) = V £j (X), (k = l,í) , j = 1, m, где частные решающие пре-

jeDk

дикаты

1, если E¿ = E0; 0, в противном случае.

Оценки решающих предикатов через сумму квадратических невязок

= £ (Oi (X) — X (X))2, Eo = min (Eí, E2,..., Em). seM

8.1.6. Модель Гурвица для отношений

Сохраняя основные составляющие предыдущих моделей: основное множество P (М), обучающую выборку {Oí, O2,Om} , классифицирующую функцию f, рассмотрим модель Гур-вица для отношений

Мб ^ <P (М); {Oí,O2,...,Om} ; 06),

где сигнатура 06 ^ <R6í, ^62,R6t), компоненты которой интерпретируются как одноместные предикаты следующим образом:

R6k (X) = V Qj (X), (k = М) ,

jeDk

Ej (X) = |

где частные решающие предикаты

Qj (X) =

1, если = До;

j (X) = ^ п

J 1 0, в противном случае.

Дг = Дго ■ ß + Агт (1 - ß) , 0 < ß < 1,

Дг = |X (X) — Ог (x)| —невязка между эталонными Ог (X) и предъявленным X (X) значением j -го признака для i -го объекта X.

Д0 = min (Дь Д2,..., Лт); Aio = max (Ог (ж)), (г = 1,т); Aim = min (Oi (ж)).

жеМ

8.2. Симультанный метод распознавания отношений

Пусть А — {й1, а2,..., ат} — некоторое конечное множество числовых объектов а е N — {0,1,2,...};

Ап п -ая декартова степень множества А; О1,О2,...,Ог — эталонные множества Ог С Ап, (г = 1, ; X — предъявленное отношение, (I С Л).

Рассмотрим произвольное множество Р С Ап и нумерацию множества Ап

п— 1

7 (¿1, ¿2, •••, «га) = ¿1 + (¿2 - 1) ш + ... + (¿„ - 1) ш'

( ш — размерность А).

С помощью нумерации 7 и множества Р вычислим предикат

О (X) _ / 1, если X = 7 (¿1,г2,...,«п) & < ¿1, ¿2,-, ¿п >е Р;

\ 0, в противном случае.

Рассмотрим кортеж введенных предикатов:

(1) О(|тп|)

где эталонные описания предикатов представим вектором:

Ог = ■■■>Щтп) , компоненты КОТОрОГО Иу = <Э0г 0) ) 0 = 1,Шга) .

Далее для каждого эталонного описания О* предъявленного объекта-отношения X С А, применяем псевдолинеаризацию, то есть <5* = (и*1,..., ) заменяем на иц = {иц + сь ...,щтп + стп), где с,- = 2], ^ = 1, |тга|) .

Тогда существование информативных элементов при линеаризации (теорема 10.1 [79]) позволяет, используя необходимые и достаточные условия симультанности в принятии решений (теоремы 4.3, 4.4 и следствие 4.1 [79]), доказать следующую теорему 8.1.

Теорема 8.1. Пусть (Уг е I) [и* = 0] — единичная логическая матрица Цд/||гхг = = . Тогда существует I информативных элементов а* е таких, что предикат

I 1, если а* — xг7' + С7;

г (X) = ^

0, в противном случ

0, в противном случае,

обращается в «единицу»» тогда и только тогда, когда X = О*, X е М; где индекс ] выбирается из условия ] = щ [и*/ + С/ = а*], ^ — оператор минимизации [119]; V/ = щ, (г = 1, ¿) ; элементы щ и задаются рекуррентной схемой:

ур+1 = | если /0; ^ = Г 1, если Уг3\У/ =0; _

1 1 6 пРотивном случае. \ 0, в прот,и,вно.м случае, (г, ] = 1, .

Таким образом, линейные преобразования отношений, а затем применение псевдолинеари-заций позволяют при единичной логической матрице Цд*/111 х 1 распознавать отношения симультанным методом, то есть находить в каждом отношении информативное значение признака (точку) и параллельно вести сравнение всех таких точек из обучающей информации.

Полученные результаты найдут применение в построении экспертных систем различного назначения, в частности распознающих систем с массивным «параллелизмом»» [131, 135, 137].

8.3. О нумерации в спектрах отношений

Информация, записанная в оперативную память ЭВМ, носит избыточный характер из-за необходимости хранить адреса и размер разнотипных чисел. Для того чтобы полнее использовать такую память, удобно стягивать п чисел с помощью подходящей нумерации в одно число, которое естественно займет больше байтов памяти, но при этом адреса и размер исходных чисел хранить уже не нужно. Необходимо запомнить только адрес и длину одного полученного числа [18].

Рассмотрим декартово произведение п множеств (г = 1 ,п)

= ^ 1т,2 Х ... X 1тп

и некоторое его отношение Р С М *, содержащие I кортежей длины п. Здесь ^ {1,2, ...,Шг}, (г = 1, п).

Перепишем отношение Р с помощью нумерации

7(п, ¿2, ..., ¿п) = ¿1 + (¿2 - 1)Ш1 + ... + (¿п - 1)Ш1 ■ Ш2 ■ ... ■ ш„—1 в виде одноместного отношения О такого, что О = ^О^) = и}, где

и, если X = 7(н, ¿2,..., ¿п) & (¿1, ¿2,..., ¿п) е Р;

О^) =

л, в противном случае, х = 1, т\ ■ т2 • • • тг<

Очевидно, что |О| = I.

Упорядочив элементы отношения О, получим спектр С исходного отношения Р :

С = {(ж1,ж2, , Ж1 < ж2 < ... < € С, (г = 1,£).

По спектру С однозначно восстанавливается исходное отношение Р с помощью обратных функций нумерации 7 : для любого к е С [7(^1 ,¿2, ) = к]

к

1п(к) = цу{у > [-]);

Ш1 ■ Ш2 ■ ... ■ Шп—1

к - (7п(к) - 1) ■ Ш1 ■ Ш2 ■... ■ ш„—1

7п-1 (к) = жу > -);

Ш1 ■ Ш2 ■ ... ■ Шп—2

^ гк - (7га(к) - 1) • Ш1 • Ш2 • ••• • Шга-1 ~ (7га-1 (к) ~ 1) X 1п-г\К] — Ц-УКУ > [

Ш1 ■ Ш2 ■ ... ■ Шп—1 ХШ1 ■ Ш2 ■ ... ■ Шп—2 - ... - (7п—*+1(к) - 1) ■ Ш1 ■ Ш2 ■ ... ■ Шп—*

]);

Ш1 ■ Ш2 ■ ... ■ Ш„_,—1

71 (к) = к - (7п(к) - 1) ■ Ш1 ■ Ш2 ■... ■ Шп—1 - ... - (7э(к) - 1) ■ Ш1 ■ Ш2 - (72(к) - 1) ■ Ш1.

Здесь ц — оператор минимизации [119]. Квадратные скобки означают целую часть числа.

Таким образом, по номеру к е С однозначно восстанавливаются координаты отношения Р, что очень важно для дальнейшей обработки указанного отношения. Отношение Р можно интерпретировать как обучающую матрицу, которая используется во многих моделях принятия решений.

8.4. Инвариантное покрытие класса

Распознавание конечных множеств изучалось в работах [66, 79, 82], где упор делался на идентификацию множества в обучении посредством предикатов равенств множеств. В п. 8.4 эталонирование строится так, что оно накрывает одним эталонным множеством весь класс или всех представителей обучающей информации из данного класса. Такое инвариантное описание классов позволяет компактно содержать информацию в эталонах по всем имеющимся классам.

Алгоритм эталонирования. Пусть имеется основное множество М — {X!, X2,..., Xm} из ш конечных подмножеств X* натурального ряда N — {0,1,2,...}; 5 — {N1,..., N4} — разбиение множества М, где N — класс, содержащий не менее одного множества, идентифицируется предикатом

1, если X е ЭД*;

Р (X) = , _

0, в противном случае.

Пусть / : 1т — I — классифицирующая функция, распределяющая номера элементов основного множества 9Л по номерам классов из ¿>, то есть = {г\/(г) = к} , (к = — множество номеров эталонных объектов.

¿к — эталонные множества, полученные по алгоритму эталонирования сильно слипающихся множеств [79].

Для эталонирования введем новое множество М' ^ (Х1, Х2,..., Х^} , где

•Хг — и и XX к.

5' ^ (N1,..., N} — разбиения множества М' на £ классов, где (Уг € 1т) в N заменено Хг на Хг. Записываем множества класса N в первый список.

Взяв первое множество первого списка, начинаем проводить пересечение его со вторым множеством. Если такое пересечение не пусто, то второе множество выбрасывается, а само пересечение пересекаем с третьим элементом списка и т. д. Если на некотором шаге пересечение с очередным множеством дает пустое множество, то оставляем предыдущее пересечение без корректировок, а элемент — множество, с которым получается пустое пересечение, записываем во второй список. Исчерпав все эти элементы первого списка, строим эталонное множество ¿г, в которое добавляем произвольный элемент из пересечения.

Заменяем первый список на второй и обрабатываем по той же схеме, что и первый список до тех пор, пока во втором списке нечего будет взять, каждый раз при этом выбирая в Е по элементу по окончании просмотра первого списка.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

1, если ¿г П X — 0;

Пусть Лг (X) — .

10, в противном случае.

Через ||О? 11тХт обозначим логическую матрицу Q такую, что её элементы

{1, если £г П и Х& ф 0; (г, ] = 1,£); кеД'

0, в противном случае. Имеют место следующие вспомогательные леммы.

Лемма 8.1. Пусть (Уг € I) (УХ^ € М) X — 0]. Тогда (УХ € М) [Рг (X) ^ Яг (X)] Лемма 8.2. (Уг — j € I) Доказательство. В самом деле,

и Хр П и Ха — 0 ^ О? — 0 реД; ^еД^-

¿г ^ и Х^

^ (Уг — ; € I)

Ег П и Хк — 0 ^ О? — 0

Лемма доказана. □

Теорема 8.2. Если (УХг € М) X — 0] , то (УХ € М) [Рг (X) — Яг (X)] ;

Доказательство.

Если Рг (X) — 1, то Лг (X) — 1 в силу леммы 8.1. Если Р (X) — 0, то Лг (X) — 0.

В самом деле, так как 5 — разбиение, то I 3 j € I ) [Р? (X) — 1] .

\?=г /

Предположим противное, то есть Лг (X) — 1. Тогда X П Е — 0 по определению. Так как

X € N и X ПЕг — 0, то ¿г П и X — 0 Ог? — 1. Отсюда следует противоречие с леммой

Жеэт,-

8.2. Следовательно, предположение неверно, то есть Лг (X) — 0.

По закону контрапозиции имеем Лг (X) Рг (X) . Теорема доказана. □

Вернёмся к постановке задачи.

Требуется найти способ вычисления предикатов

V- ш - / если ^ € ^ =

г 0, в противном случае,

посредством эталонов ¿к и найти условия, при которых такое решение существует.

Теорема 8.3. Пусть Б ^ (N1, N2,..., N4} таково, что (Уг € (У3 € М) [3 € 3 П (Б) ф 0] , где = 1, — максимальные элементы семейства В^ :

Кроме того,

Ог (Б) — и и Хр\ и Хг

к;=1 \реД;

В — £|£ € и и X, & и Хр си 3} . ¿е34\{г} \seDj / реД^ 1е£

(Уг — j € 34) О — 1 ^ — 0] .

Тогда (УХ € М) (Уг € 34)

Рг (X) — Лг (X) &

V Лк (Х) & кеЗДИ

Доказательство. Для доказательства введем две леммы. Лемма 8.3. (Уг € 34) (УХ € М) [Хг — 0] ^ О — 1]. Лемма 8.4. Если выполнено условие (*) теоремы 8.3, то

(Уг € 34) (УХ € М) [Рг (X) ^ Лг (X)] .

Доказательство лемм очевидно. Продолжим доказательство теоремы 8.3.

Пусть Рг (X) — 1 для некоторого г € В силу леммы 8.4 Лг (X) — 1, то есть X П Ег — 0.

Возьмем произвольное к € 3Д {г} и покажем, что Л& (X) & Огк — 0.

Пусть Огк — 1, тогда в силу (**) Окг — 0. Отсюда ¿к П и I — 0, но X С и 3. Тогда

X П ¿к — 0, то есть Л^ (X) — 0 и Л& (X) & — 0.

Пусть Л^ (X) — 1. Это значит, что X П ¿к — 0, X С и 3.

Следовательно, ¿к П и I — 0, то есть О^г — 1 ив силу (**) Огк и Л& (X) & Огк — 0. Случаи Огк — 0 и Лк (X) — 0 тривиальны. Таким образом,

V Лкк (X) & Огк — 0. кеЗДМ

Значит, Лг (X) &

— 1.

V Лк (Х) & _ке34\{г}

Пусть Рг (X) — 0. Покажем, что в этом случае

Лг (X) &

V Лк (Х) & _ке34\{г}

В самом деле, если Лг (X) — 0, то это очевидно.

Положим теперь, что Лг (X) — 0. Это значит, что X П ¿г — 0.

Поскольку Рг (X) — 0, а Б - разбиение М, то существует такое j — г, что Рг (X) — 1. Тогда в силу леммы 8.4 Л? (X) — 1, но О?? — 1 в силу леммы 8.3. Поэтому Л? (X) & О?? — 1. Отсюда V Лк (X) & Огк — 1.

кеЗДИ

Следовательно, Лг (X) &

0.

V Лк (Х) &

_кеЗ(\{г}

Теорема доказана.

Расширим условия существования решения в теореме 8.3, в частности, усилим условие (*) в теореме 8.3 в виде условия (8.1) в следующей теореме 8.4.

0

I

Теорема 8.4. Пусть Б — разбиение М и (УХ € М) выполняются условия:

(Уг € 14) [X € N ^ (Уг = ; € 14)

X П и Хк = 0 ^ Он = 1

кед.

(8.1)

(Уг = ; € 14) [О, = 1 ^ О, = 0] .

(8.2)

Тогда Pi (X) = Я» (X) &

V (X) &

кеЗДМ

Доказательство. Пусть X € Ш», то есть Р» (X) = 1.

Покажем, что Я» (X) & — V Я, (X) & О», = 1.

Ь'еЗДШ

В самом деле (Уг = j € 14) (УX € М) [Р, (X) ^ Я, (X)] , отсюда Я» (X) = 1,

Но тогда, согласно определению предиката, Я»^) запишем X П Е» = 0.

Покажем, что V Я к (X) & Огк = 0. кезДМ

В самом деле, если (У? = г € 1^) [Я,- (X) =0] , то V Я& (X) & Огк = 0 независимо

кеЗД{г}

от • Предположим противное, то есть (Еу = г) [Я, (X) = 1] , то есть X П и Xfc = 0, но

кед,

X С и Xfc, следовательно, по условию теоремы 8.4 Е, П и Xfc = 0, то есть О,» = 1. Отсюда

кед

в силу (8.2) О, = 0. Тогда Я, (X) & О, = 0.

Пусть все такие индексы, что Rjh (X) = 1, (к = 1, г) .

Отсюда Я,^ (X) & О,^ = 0 по тем же соображениям.

С другой стороны, для ^ € 1Д {^1, >} [Я, (X) & О, =0] в силу того, что Я, (X) = 0.

Отсюда следует, что V Я, (X) & О, = 0. •?еЗД{г}

Положим, что Р» (X) =0, и докажем, что в этом случае

Я» (X) &

V Я, (X) & О,

Ь'еЗДИ

0.

Возможны два случая: Я» (X) = 0 или Я» (X) = 1. В первом случае Я» (X) &

= 0 независимо от О

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

у

V Я, (X) & О,

_,е1(\{г}

Положим, что Я» (X) = 1, то есть X П Е = 0.

Поскольку Р» (X) =0, а Б — разбиение, то существует такое у = г, что Р, (X) = 1. Тогда

Я, (X) = 1. Но О,, = 1, поэтому Я^ (X) & О, = 1 .

Отсюда V Як (X) & О, = 1. Следовательно, кезДМ

Я, (X) &

V Я & кеЗДМ

0.

Теорема доказана. □

Теорема 8.4 является расширением теоремы 8.3 по условиям существования предикатов — решателей Р» (X) .

§ 9. Оптимизация игровых решающих правил

С развитием вычислительной техники и робототехники потребность в создании автоматических распознающих систем неуклонно возрастает.

В настоящее время хорошо разработаны статистические методы распознавания образов. В частности, в работах В.А. Ковалевского, В.Н. Вапника, А.Я. Червоненкиса, А.Л. Горелика, Н.Г. Загоруйко [21, 30, 40, 110] и многих других авторов рассматриваются правила принятия решений и выбора признаков, позволяющие минимизировать вероятность ошибки распознавания при различных ограничениях.

I

В то же время математический аппарат, привлекаемый для решения задач распознавания, существенно расширился за счет использования методов алгебры, математической логики и некоторых разделов математического программирования.

В § 9 рассматриваются вопросы оптимизации решающих правил классификации с учетом надежности и времени принятия решений за счет распараллеливания и симультанности при распознавании кортежей, множеств и отношений конструктивных объектов [78].

9.1. Обоснование оптимизации

В качестве объекта исследования выбраны игровые решающие правила, в основу которых заложена конечная обучающая матрица O c I строками — стратегиями [18]. При распознавании неизвестной реализации объекта X выбирается оптимальная стратегия путем оценки функционала близости объекта х стратегии щ € О : С [щ,х) ; (г = ■

Изучаются условия, когда функционал C (иг, Xi) вычисляется независимо от номера i, то есть создаются условия для параллельного способа расчетов функционала C для всех I строк. Если стратегия û € O и распознаваемая реализация X заданы большим количеством значений n признаков, то возникает задача сокращения времени на распознавание объекта.

С этой целью необходимо найти условие для построения предельно быстрой — симультанной (одномоментной или однотактной) схемы принятия решения.

В этой схеме в первую очередь необходимо выделить в каждой стратегии û по одной информативной точке, а затем произвести параллельно n сравнений в этих информативных точках только с одним значением всех n признаков неизвестной реализации X.

Время на принятие решения в распознавании объекта в этом случае будет предельно минимальным, так как функционал близости C(ûi,X) вычисляется за один такт.

На первом уровне временной оптимизации — симультанном уровне, кроме этого, добиваемся инвариантности времени принятия решения ещё и к количеству признаков. При симультанном распознавании схема принятия решения по времени работает как с одним кортежем щ € O и одним признаком, на самом деле участвуют I кортежей и, возможно, n признаков. Если информативные значения признаков отобраны в меньшем количестве признаков, чем n, то все признаки могут и не участвовать. Это зависит не от самих признаков (они могут быть неинформативными), а главным образом, от специальной схемы отбора информативных значений признаков, о которых скажем ниже.

9.2. Постановка задачи

Все игровые решающие правила будем рассматривать как интерпретацию теоретико-игровой модели M ^ (M; O, f ; а) с основным множеством M, обучающей выборкой O = ||ixn, классифицирующей функцией f : Ii — It, где Ii ^ {1,2,...,l}, It ^ {1,2,...,t} , ( t — число классов), распределяющей номера стратегий обучающей выборки O по номерам классов, и сигнатурой а ^ (Ri, R2,..., Rt) одноместных предикатов Rfc(X), таких, что

где Со = min(max) {C (u^x)} выбирается из содержания функционала близости

Ставится задача: найти интерпретации функционала С (йг,ж), обеспечивающие оптимизацию по вероятности правильного распознавания и изучить условия, гарантирующие минимум временных затрат при моделировании решающих правил распознающими автоматами.

9.3. Предполагаемые подходы

Обычно классификаторы строятся на базе некоторой универсальной ЭВМ, где роль процессора заменяет программа, последовательно обрабатывающая массив эталонов для выявления

Rk{x)= V Qi(x), [к = l,i), Dk = {i\f(i)=k},(k = l,t); teDfc

1, если C (ûi,X) = C0; 0, в противном случае,

г

г

С(щ,х), (i = 1,1).

наиболее близкого эталона к предъявленной реализации. Такая процедура на этапе классификации занимает много времени (массивы эталонов, как правило, достаточно велики). В целях сокращения времени для принятия решений предлагается один из вариантов построения классификатора последовательно-параллельного действия, в качестве эталонов которого взяты отношения. Конструктивно отношения строятся на основе обучения как регистры, реализующие полную систему предикатов Радемахера, связанные комбинационными схемами.

Количество регистров — счетчиков соответствует местности отношений, а число выходов комбинационной схемы — числу эталонов — отношений. Принятие решений осуществляется последовательно-параллельным методом: на регистры подаются последовательно все возможные комбинации чисел, то есть задаются все координаты эталонов — отношений, и соответствующие этим отношениям предикаты параллельно сравниваются с предъявленным отношением (предикатом).

Результаты сравнения накапливаются в счетчиках. Как только все комбинации будут проверены, счетчики опрашиваются, и максимально заполненный счетчик вырабатывает сигнал идентифицированного эталона.

Такой подход к построению классификатора отношений тем эффективней, чем больше массив эталонов, так как время для принятия решения при этом не зависит от мощности обучающей выборки, в то время как при последовательной обработке эталонов время для принятия решения возрастет прямо пропорционально количеству эталонов. С теоретической точки зрения при построении таких классификаторов важны вопросы относительной полноты предикатов сигнатуры конечных моделей, в частности предикатов Радемахера, а также вопросы минимизации предикатных форм в конечных моделях [71].

Для симультанных автоматов идея построения информативных элементов в обучении родилась при исследовании обучающих выборок, содержащих конечные конструктивные множества и была перенесена на конструктивные кортежи объектов. Информативные точки а» из кортежа й» = (и»1, и»2,..., ) € О выбираются с помощью процедуры, выделяющей непересекающиеся области полученные следующим образом: V»1 = {м1, и»2,-., } ,

ур+1 = | если ф 0; (г,; = М) ;

» 1 Vi"?, в противном случае,

где а» € и частные решения О» (Ж) отыскиваются в виде

„ , , Г 1, если а» * ж,;

О» (ж) = < п л

0, в противном случае, индекс у выбирается из условия а» = и»,, * — некоторое бинарное отношение.

9.4. Учет альтернативных частных решений

В игровых решающих правилах, приведенных в работе [18], не предусмотрена возможность принятия решения при альтернативном исходе выбранных решений. Хотя при неравном числе альтернатив частных решений иногда можно учитывать наличие большого числа альтернатив, голосующих за определенный класс объектов.

В данной работе указанный недостаток компенсируется построением общих решений путем голосования альтернатив.

Имеется дискретная обучающая выборка О = Цм, ||1ХП, в которой I строк и п столбцов (признаков); и, — натуральные числа и задана классифицирующая функция / : 1 ^ где 1 ^ {1, 2, ..,1} , 1 ^ {1, 2, ...,£} , (Ь —число классов).

Предъявляется неизвестная реализация объекта Ж = (х1,Ж2, ...,жп), для которой считаются величины Б» = С (й»,Ж), где С (й»,Ж) — некоторый функционал близости.

Далее вычислим максимальное или минимальное значение

Б0 = тах(Б1,Б2,..,Б1) V Б0 = ш1п (Б1, Б2,..., Б^) в зависимости от содержания функционала С (й»,Ж).

Частное решение, которое определяет идентификацию объекта ж, фиксируется предикатом

1, если Б» = Б0,

Я» (ж) = , п

1 0, в противном случае.

Общее решение по классификации объекта Ж, то есть по отнесению его к одному из классов:

1, если Гк = го;

Ок (ж) = , п

0, в противном случае,

где го = тах(г1,г2, ...,п), Гк = ^ Я» (Ж) ;

_ г&ок

^к = {¿|/ (я) = к} ) (к = 1) — множество номеров эталонных объектов. Предложенная общая схема классификации позволяет оптимизировать выбор решающего правила из ранее рассмотренных решений в условиях неопределенности (§ 7, 8), при этом учитывается надежность классификации и временные затраты на моделирование решений.

9.5. Минимизация эталонов в предикатах классификации

С каждым разбиением Б ^ {N1, N2,...,N} семейства М, где N ^ {Х»1, Х»2,..., Х»п} свяжем модель (М; а) с основным множеством М и сигнатурой а = (Р1,...,РЧ). Одноместные предикаты Р» на модели интерпретируются для всякого X € М в следующем виде:

и, если X € г € 1г ^ {1, 2,... , г};

Pi (X) =

i ' л, в противном случае.

Необходимо для разбиения S семейства M найти r минимальных подмножеств Ei множества O (M) (если они существуют), посредством которых можно эффективно вычислять предикаты Pi модели (M; а) .

Для любого семейства A = {X} введем, как и ранее (4.2, 4.3), операции: O (A) — объединения множеств X и П (A) — пересечение множеств X :

{0 , если card A = 0; ( 0 , если card A = 0;

X , если card A = 1; n (A) = < X , если card A = 1;

U X, если card A ^ 2. I П X, если card A ^ 2.

XeA ^ XeA

Введем также отношение частичного порядка на основном множестве M :

Ai < A2 ^ Ai С A2. Рассмотрим (Vi € Ir) класс разбиений W2 :

W ^ {S|(V1 € O(S)) [I € N ^ I n Qi(S) = 0]} ,

где Qi (S) ^ О ({О (fTU) \0 (%,t) \t = M~}) ,

— максимальные элементы по отношению включения семейства Bi, где

Bi ^ {T|T € D ({O (Nj) |j € Ir\ {i}}) & O (Ni) С о (T)} .

Пусть S € W2. Для каждого i € Ir построим подсемейства A2 следующим образом:

A2 ^ {A|A € D (D2) & П (A) = 0} ,

где P>2 = {X П Q2 (5) |X € .

Тогда если A2t (i = есть максимальные элементы А2, то, выбирая по представителю

из каждого множества n(A2t), (t = 1,n2), сформируем множества Ei и построим логическую матрицу ||qij|| порядка r следующим образом:

_ Г 1, если ¿¿ПО (r?j) / 0, (г, j = Т~г) ; qij \ 0, в противном случае.

Далее для каждого X € O (S) положим Ri (X) = u ^ X nEi = 0. Тогда справедлива

Теорема 9.1 [79]. Для любого разбиения Б ^ (N1,N2,...,N} € ^2, если (Уг — j € 3Г ^ (1, 2, ...ж}) [дг? — 1 ^ ? — 0], то предикат классификации вычислим по схеме

Рг (X) — Лг (ж) &

V Лк (X) & ^

ке1г\{г}

Рассмотрим класс разбиений ^о и его возможные расширения.

^ (Б|Б ^ (N1, N2,..., N } & (Уг — j € 3Г) [О (N1) П О (N3) — 0]} .

Выделим элемент Б € ^о. Пусть Б ^ (N1, N2,..., N} . Для каждого г € 3Г ^ (1, 2, ...,г} построим подсемейство А0 семейства Р (Щ^) такое, что

АО ^ (А| А € Р (ЭТг) & П (А) — 0} ,

на котором введем частичный порядок: А1 ^ А2 ^ А1 С А2.

Пусть в А® нашлось максимальных элементов = 1 .

Тогда, выбирая по одному элементу из каждого множества П (^и) > = получим

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

минимальные множества ¿г, для которых справедлива

Теорема 9.2 [79]. Для любого Б € ^о

и, если X П ¿г — 0;

Рг (X) — ,

л, в противном случае, где Рг — предикат модели (О (Б); ст).

Пусть ста — (ж1, ...,жп) — некоторая псевдосигнатура с характеристиками Ж1, ...,жп [79]. Обозначим через класс разбиений такой, что

^ (Б |Б ^ (N1, N2,..., N} & С (Б) € ^о} .

Здесь С(Б) ^ (С(N1), Сст° (N2) ,..., Сст° (^)} ,

^ {Ссто (Хг1), (Зей),..., (Хт,)} , (г = .

Пусть ^ (А|А € Р (С(ЭТг) & П (А) — 0)} ,

¿г<7° — множества, полученные выбором по одному элементу из максимальных элементов семейства . Тогда имеет место

Теорема 9.3 [79]. Для любой псевдосигнатры сто — (ж1, ...,жп) [^о С ] .

Теорема 9.4 [79]. Для любого разбиения Б €

' и, если С(X) П С — 0;

Рг (X) — ,

л, в противном случае, где Рг — предикат модели (О (Б); ст). § 10. Симультанный подход в принятии решений

Рассмотрим стандартную обучающую выборку О = ||С/г|| , (г = 1,£) , содержащую £ кортежей конструктивных элементов фиксированной ДЛИНЫ п С/г = (С/ц, Рг2) •••) Щп) ) которые варьируются в пределах е-сети, то есть если С/у — е ^ Uj ^ С/у + е, ] = 1 ,п, то распознаем Uj как С/у, где Uj € С/, С/ = (С/1, С/2, С/п) — неизвестная реализация, е — допуск на шум (помеху).

Задача состоит в том, чтобы предельно быстро (однотактно) идентифицировать неизвестную реализацию С/ к одному из кортежей обучающей выборки О.

Исследование однотактных моделей принятия решений, при идентификации неизвестной реализации, подвергнутой шумам и помехам, безусловно является актуальной задачей [79].

Очевидно, для достижения поставленной цели необходимо, во-первых, сравнивать неизвестную реализацию С/ с эталонами Щ € О параллельно и, во-вторых, только по одному информативному элементу из каждого эталона.

I

10.1. Симультанность при идентификации

Пусть р и ^ — расстояние и частичный порядок между эталонами в обучении. Положим в

_ £

качестве исходных индексных множеств V/ ^ {17ц, Щ2,..., Щп} , (л = 1,£) ; А = и V/. Возь-

г=1

мем в качестве ро — минимальное, не равное нулю расстояние р (х,у), где € А Тогда допуск на шум е можно выбрать из условия е <

Пусть индексные множества на последующих шагах по результатам попарного сравнения задаются рекуррентной схемой

ур+1 = | если ф 0, = М) ;

г 1 V", в противном случае.

Элементы логической матрицы д = ||дг" || определим так:

_ Г 1, если У V/ = 0, (1,] = м) ;

дг" = < ' ' ' '

[0, в противном случае.

Тогда условия существования информативных элементов аг € для симультанного при-

нятия решения определяются следующей теоремой 10.1.

Теорема 10.1 [79]. Если ||дг"Ц^х = Е1Х1 — единичная матрица размера I х I, то существует I информативных элементов аг € таких, что предикат

Я' (и) - { еСЛи ^ е> = 5

г ^ ' \ 0, в противном случае, обращается в «единицу» тогда и только тогда, когда [/¿тС/, где т — отношение толерант-

_ __га

ности такое, что 17^17 ^ р(17^,17^) ^ пе, где индекс ] = /у [ец = 17^} , ц — оператор

'=1

минимизации.

«Наброшенную» на обучающую выборку О е -сеть можно интерпретировать как выборку, фильтрующую зашумленные реальные объекты, не превышающие уровень шума е, и позволяющую с помощью выбранных информативных элементов ец, (г = 1,£) сравнивать их параллельно с неизвестной реализацией 17, выбирая для каждого индекса г одну и только одну необходимую компоненту 17^ реализации 17, и находить расстояние р(ец, 17^) между элементом аг и этой компонентой иг", не превышающее уровень шума е.

Такая фильтрация и быстрый поиск номера кортежа г в обучающей выборке, удовлетворяющего отношению толерантности т с неизвестной реализацией 17, говорит о том, что можем найти наиболее близкий кортеж обучающей выборки к неизвестной реализации 17, подвергнутой шумам в пределах компактной е -сети. Ограничения на шум е выбираются исходя из самой обучающей выборки О так, чтобы максимально верно идентифицировать неизвестную реализацию 17 к одному из кортежей 17г € О.

10.2. Условия существования обобщенной симультанной модели распознавания

Пусть имеется основное множество М ^ {Х1, Х2,..., Хт} конечных подмножеств Хг € Ф, где Ф — множество всех конечных подмножеств натурального ряда N ^ {0,1, 2,...}, 5 ^ {М1,М2, --^М^} — разбиение множества М, £ — число классов разбиения.

Построим обучающую выборку О для распознавания неизвестных объектов X € М :

или О = ||«г"||1хп,

«11, «12, . ., «1га

О= «21, «22, . ., «2га

«11, «12, . «1га

где п — число признаков объекта распознавания Хг, ] = 1,щ £ — число эталонов объектов распознавания Хг, г — 1,1 ; с классифицирующей функцией / : 1 — распределяющей номера 1 ^ (1,2,...,1} эталонных элементов основного множества М по номерам 1 ^ ^ (1, 2, ...,£} классов разбиения Б.

Ок ^ М/(г) = к}, (к = 1,£) — множество эталонных номеров разбиения ¿>. Неизвестная реализация х = (Х\,Х2, ■■■,хп) € X, X — множество неизвестных реализаций (распознаваемого) объекта.

Необходимо найти в каждом кортеже И^ = (иц, 1142,..., Щп) обучающей выборки О по одному информативному элементу аг так, чтобы частные предикаты

О (Х) = { 6СЛИ € ^ ^ См = М);

г 0, в противном случае,

можно было вычислить параллельно, используя одно сравнение компоненты х€ х посредством бинарного отношения * с информативным элементом аг : ж? * аг, где j выбирается из условия аг — иг?.

Обозначим V1 ^ Хг, г € 1 ^ (1, 2,..., I}, С Хг — информативные подмножества

Хг, то есть элементы из множества Хг\рг1+1, оставшиеся в процессе их вычисления, которые назовем информативными зонами.

Информативные элементы аг будем искать в информативных зонах Хг\рг1+1 множеств где строятся по рекуррентной схеме следующим образом:

У1 = {иц,щ2, ...,щп}, [г = !,£)-,

уз+1 = | если ф 0, (г,; = М);

г I , в противном случае.

Наряду с индексными множествами у7 будем строить логическую матрицу д — ||дг? || следующим образом:

ГО, если ф 0, (г, = М);

1, в противном случае.

Теорема 10.2 [81]. Пусть (Уг € 1*) [V/ — 0], (У г — j € З^)^ — 1 ^ ? — 0]. Тогда существует I информативных элементов аг € таких, что предикат

V л [а? € У]

) — [аг € V] &-

обращается в «единицу» тогда и только тогда, когда V — у1; V1 — (иг1,иг2, ...,игп} € О. Следствие 10.1 [81]. Если выполнены условия: V/ ф 0,(г = 1,£), (Уг, з £Ъ)[гфз^й1фщ], (У г € Ъ) [УЧ и У/ ф 0],

?е1£\{г}

то существует I информативных элементов аг € у1+1 таких, что предикат принадлежности

1, если ец € Хг, (г €

<Эг(ж) = | п

0, в противном случае,

обращается в «единицу» тогда и только т,огда, когда х = индекс ] выбирается из усло-

вия а,- — и

г?-

Обозначим Зе ^ {1,2, ...,£}, ^ {1, 2,..., ¿}, Зга ^ {1, 2,..., п}.

Пусть на множестве А ^ {и^\г = = 1, тг} задано некоторое расстояние р(х,у) такое,

что для любых ж, у, г € А

1)р(ж, ж) — 0; 2)р(ж, у) — р(у, ж); 3)р(ж, г) ^ р(ж, у) + р(у, г),

с линейным порядком удовлетворяющим аксиомам:

1.(Vx € A)[(x,x) €<];

2.(Vx,y,z € A)[(x,y) &(y,z) (x,z) €<];

3.(Vx,y € A)[(x,y) &(y,x) x = у].

Обозначим (Vx,y € A)[x ^ у V у ^ x] через ро — минимальное расстояние между эталонными элементами множества A : ро = min p(«ij, «dp) = 0, где Uj и взяты из

U {xj|xj € Vil+1}. Эталонные множества формируются по мере близости к р. j=i

Пусть все значения j -го признака Xj € x, удовлетворяющие заданной мере близости к эталонному значению Uj, «стянуты» в общий таксон — одно множество обучающей выборки Oij = {xj|p(uij,xj) < 1/2ро}.

Представим эталонное описание распознаваемого i -го объекта в виде декартова произведения «стягивающих» множеств Oj : Bj = Oji х Oj2 х ••• х Ojn.

Множество неизвестных реализаций X выразим через объединение всех декартовых про-

1

изведений эталонных множеств Bj : X = U Bj.

j=i

Введем на множестве неизвестных реализаций X отношение толерантности т£ следующим образом:

ХТ£Щ ^ p(Xj,Uij) < 1/2про — £,

'=1

где х = (х\,...,хп) € X, щ = {иц,..., щп) , е > 0 — сколь угодно малая величина. Пусть

I п

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

линейный порядок ^ и расстояние р распространяется на всё множество С = и и О г".

г=1 '=1

Очевидно, А С С. Тогда имеет место

Теорема 10.3. Если выполнены условия: V,¿1 ф 0, (г = 1,^),

(Уг,; «у], (Уг е и у/) Ф 0],

"езди

то существует I информативных элементов аг € таких, что предикат

_ Г 1, если р(ец,ж,) < 1/2р0, (г €

0, в противном случае,

обращается в «единицу» тогда и только тогда, когда хтещ, где индекс ] выбирается из условия аг = «г".

Доказательство.

. В силу условий теоремы логическая матрица || дг" ||^Х1 единична и выполнены условия теоремы 10.2 и ее следствия 10.1. Поэтому в силу следствия 10.1 предикат

д /_ч = Г 1, если р(аг,Ху) =0, (г € 3*); \ 0, в противном случае,

обращается в «единицу», когда х = щ или в силу рефлексивности отношения толерантности, когда хт£щ. Следовательно, при этих же условиях предикат

0 , , = Г 1, если р{(ц,ху) < 1/2р0, (г € ЗД; ^ \ 0, в противном случае,

также обращается в «единицу».

(<=) Предположим, что хтещ. Покажем, что предикат

д = Г 1, если р{(ц,Хэ) < 1/2р0, (г € ЗД; 1 0, в противном случае,

в этом случае также обращается в «единицу».

В самом деле, в этом случае р(аг,ж?) < 1/2ро. Предположим противное, то есть р(аг,ж?) ^ 1/2ро.

Поскольку аг — иг?, то имеем р(иг?, ж?) ^ 1/2ро.

Найдем такое ж, что ж € X и ж не находится в отношении толерантности те, то есть хтещ. В качестве такого ж можно взять

ж — (иг1 + 1/2ро - (1/п)е,иг2 + 1/2ро - (1/п)е, ...,иг„ + 1/2ро - (1/п)е).

п

В этом случае ^ ^ 1/2роП — е, то есть нарушено отношение толерантности хтещ,

3 = 1

что противоречит условию хтещ. Теорема доказана. □

10.3. Обобщенная симультанная модель распознавания изображений

Исследованы условия существования симультанной модели классификации конечных объектов на примере текстурных изображений (ТИ) [81], то есть такой модели, время на принятие решения которой не зависит ни от количества эталонов в обучающей выборке, ни от количества признаков, которыми характеризуются эти эталоны [14].

Другими словами, время на классификацию текстур является инвариантом к количеству эталонов в обучении и к количеству признаков, описывающих эти эталоны.

Построение классификатора такого вида, время работы которого равно одному такту сравнения эталонного описания с предъявленным в какой-либо шкале (метрике) сравнений, стало возможным благодаря параллельному вычислению решающих предикатов.

Пусть х = (х\, Х2,..., хп) неизвестное ТИ, заданное через п значений признаков;

0 — ||иг? - обучающая выборка, содержащая I эталонов, взятых из Ь классов. Номера эталонов и номера классов связаны классифицирующей функцией / : 1 — 1 ^ (1, 2, ...,1} ,

1 ^ (1, 2,...,Ь} . Результат сравнения г -го эталона с j -й компонентой неизвестной реализации ТИ определяется предикатом С^г (ж) вида

„ Г 1, еслиеи*ж?-;

Яг (х) = \ 3

0, в противном

О, в противном случае, = 1,£),

где ец — информативный элемент кортежа щ = {иц, Щ2, Щп) , индекс ] выбирается из условия аг — иг?; * — некоторое бинарное отношение, выражающее близость между элементами аг и ж?.

Элементы аг выбираются из множеств у1+1 по отдельному правилу [81]. Сами же множества у1+1 строятся по рекуррентной схеме:

У1 = {иц,щ2,...,щп}, (г = 1,£) ;

ур+1 = | если ф 0, (и = М) ;

г 1 У?, в противном случае.

10.4. Нейронные сети симультанной схемы принятия решений

Рассмотрим симультанные (однотактные) схемы принятия решений на основе нейронных сетей в персептронах с распараллеленной структурой связанных между собой информативных нейронов [78].

Под изображением X, подаваемым на вход персептрона для распознавания, будем понимать некоторое подмножество точек множества К — (а1, а2,..., а^} .

Пусть на множестве К задано т изображений Х1, Х2,..., Хт, составляющих обучающую выборку О ^ (Х1, Х2,..., Хт} . Для идентификации множества X укажем следующую рекуррентную схему.

Обозначим через V1 ^ Хг, г € 1т ^ (1, 2, ...,т} , а через ут+1 С Хг — информативные зоны множества Хг, то есть элементы из множества Хг\у™+1, оставшиеся в процессе их

вычисления:

" \ V"если V"= 0; г,; € 1т; г I V", в противном случае.

Построим вспомогательную логическую матрицу 11 дг" | из элементов

0, если У"\У/ = 0; г,; € 1т;

1, в противном случае.

Частный решатель Фг (X) в схеме принятия решения об идентификации X определим следующим образом: Фг (X) = ^ [а € X] ^ 1, г € 1т.

Теорема 10.4 [78]. Пусть (У г € 1т) [Xг = 0] и (Уг = ; € 1т) [дг" = 1 ^ " = 0]. То-

гда общее решение — предикат: ^г (X) = ^г (X) & ^ ^ (X) ■ дг" ^ 1

"еЗт

ницу» тогда и только тогда, когда X = Xг, где Xг € О.

обращается в «еди-

Предикаты ^г (X), (г € 1т) реализуются нелинейными персептронами [78]. Частные предикаты при этом [а € X] для X С Я можно интерпретировать нейронами.

Рассмотрим условия симультанного способа принятия решения.

Теорема 10.5 [79]. Логическая матрица д = ||дг"'||тхт единична тогда и только

тогда, когда (Уг € 1т) [(УД и V1) = 0].

"езт\{г}

Будем рассматривать векторы «г = (аг1, аг2 , ...,агп), (г € 1т) из обучающей выборки О как множества У^ = {а^, ец2,..., ецп} , й = {а\, (12, ...,ап) — неизвестная реализации распознаваемого множества X = {а1,ап} , п ^ к. Тогда имеет место

Следствие 10.2. Если выполнены условия д = ||дг"'||тхт = Етхт, где Етхт — единичная матрица порядка т х т, то существует т идентификационных элементов аг € таких, что предикат,

у-^. _ 1 1, если аг — аг";

г 0, в противном случае, г € 1т.

обращается в «единицу» тогда и только тогда, когда й = щ, ^ = /у [а^ = и^}, где /л — оператор минимизации.

Симультанность способа принятия решения об идентификации неизвестного множества X с эталонным множеством из обучающей выборки Xг € О достигается за счет параллельного вычисления информативных нейронов в условиях единичности логической матрицы 11 дг" | путем сравнения неизвестной реализации й с кортежами в обучении щ по одному информативному элементу аг" с идентификационным элементом аг из информативной зоны У^1.

Требование условия следствия, наложенное на логическую матрицу ||дг"'|| , обеспечивается теоремой 10.5. С другой стороны, в теореме 10.4 дается существенное условие: (Уг = ;) [дг" = 1 ^ " = 0] , которое в условиях следствия 10.2 позволяет вычислить идентифицируемый предикат (характеристическую функцию) ^г (X) для неизвестной реализации — конечного множества X, подаваемого на интерфейс параллельного распознающего (классифицирующего) устройства (рис. 10.1).

Рис 10.1. Интерфейс параллельного распознающего (классифицирующего) устройства

§11. Вычислимость в задачах распознавания булевых функций

Пусть Ь = { —, & , V, =, А, /, о} — множество элементарных функций алгебры логики (ФАЛ) 3 из класса Р(Жп) — логическая формула, полученная суперпозицией функций из Ь или переименованием переменных из Жп = (ж1,...,жп), ж^ € = {0,1}, (г = 1, 2,...,п). Построить Р(Жп) / (Жп) — алгоритм вычисления для заданной Р (Жп) всех значений соответствующей ФАЛ /(Жп) [50].

Ряд авторов рассматривали Р(Жп) / (Жп), но при этом так или иначе делали предварительное преобразование Р(Жп) [49, 149, 153, 182].

Вместе с тем, если рассматривать Р(Жп) /(Жп) как некоторый управляемый процесс, то представляет большой интерес следующая задача: существует ли такой алгоритм вычисления /(Жп), на каждом шаге которого, используя логические связи в исходной Р(Жп), можно автоматически обеспечивать получение минимального количества промежуточных результатов?

Алгоритм такого типа назовем компактным алгоритмом вычисления ФАЛ из класса Р2 •

11.1. Существование компактного алгоритма

В п. 11.1 устанавливается возможность существования компактного алгоритма вычисления Р (Жп) / (Жп), то есть возможность эффективной организации памяти персептрона при распознавании бинарных отношений типа ФАЛ из класса Р2 [49].

В такой постановке задача вычисления /(Жп) каким-либо автоматом (ЭВМ или человеком-оператором) уже может быть интерпретирована в виде одной из нерешенных задач в теории персептронов — организация памяти персептрона при распознавании бинарных отношений.

В качестве таких отношений будем рассматривать логические связи в формуле Р(Жп), то есть элементарные ФАЛ из класса Р2, а результаты распознавания этих отношений — промежуточные результаты вычисления Р(Жп) ^ /(Жп) как содержимое памяти персептрона, распознающего бинарные отношения типа ФАЛ из класса

Итак, пусть на вход персептрона для распознавания, то есть вычисления Р(Жп) ^ / (Жп), подается формула Р(Жп), представляющая полную скобочную (инфиксную) форму записи /(Жп) (отрицание над функциями, будем считать, для нашего случая играет роль скобок).

Так как определение Р (Жп) имеет рекурсивный характер, то для построения Р(Жп) ^ /(Жп) необходимо сначала в формуле Р(Жп) отыскать элементарные функции — ядра [92, 162].

Определение 11.1. Ядро (К^) формулы Р(Жп) есть элементарная функция (операция) д € Ь\-, входящая в рассматриваемую Р(Жп), начиная с которой можно по рекурсии определить все значения соответствующей / (Жп).

Как следует из определения 11.1, ядро имеет смысл при двухместных д € Ь\ — .

Если Р(Жп) = Жг(Жг), то назовем Р(Жп) вырожденной формулой и в дальнейшем ее не будем рассматривать.

I ь 1

Значения К обозначим {К^}, то есть {К^} ^ I . I , где € £2, (V = 1, 2,..., 2П).

[ 62" )

Признаком выделения в формуле Р(Жп) в качестве ядра той или иной операции д является первоочередность выполнения (старшинство) операции д, определяемое наличием скобок или знака отрицания над д.

Пример 11.1.

жз) = (ж1 —► ж2 = жз) —► [(ж1 о ж2) V (ж1&ж2)]/ж3, Кг К2 К3

3ФАЛ — функции алгебры логики или булевые функции.

где К1, К2, К3 — ядра.

Следует заметить, что в рассматриваемой Р(жп) одна и та же д € может иметь

различное старшинство в зависимости от того, сколько раз она заключена в скобки или под знак отрицания. Для выделения таких случаев введем понятие порядка операции.

Определение 11.2. Операция д, € ¿\— называется операцией порядка р,, если она входит в Р(Хп) раз в скобки или под знак отрицания и скобки (^ = 1,2,3,... — порядковый номер операции д при чтении Р(Хп) слева направо).

Операцию д, порядка обозначим через др. Если же д, в Р(Хп) не входит под знак отрицания или скобки, то присвоим ей = 0.

Итак, р = 0,1, 2,...

Для примера 11.1 имеем др =2, ^3, °3, v2, &3,/7•

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Для построения алгоритма Р(Хп) ^ /(Хп) удобно ввести понятие длины формулы Р(Хп).

Определение 11.3. Длина (I) формулы Р (Хп) есть количество операций др € € £\ —, содержащихся в Р(Хп) (включая повторяющиеся).

Для примера 11.1: I =7.

Формулу Р(Хп) длины I при распознавании обозначим Р1(жга).

Лемма 11.1. 1 ^ I ^ то.

Доказательство очевидно. □

Лемма 11.2. В формуле Р1(жга) может существовать Q ядер, но всегда 1 ^ Q ^ I.

Доказательство.

1°. В силу того что Р1(жга) вычислима, то в ней всегда найдется хотя бы одна др, которую можно взять за ядро. Следовательно, Q =1.

2°. Если же Р1(жга) содержит только операции, удовлетворяющие ассоциативному закону, то Q = I.

Следовательно, в общем случае 1 ^ Q ^ I. Лемма доказана. □

Следствие 11.1. Без ядер не существует формул Р 1(Хп).

Доказательство очевидно в силу определения 11.1 и леммы 11.2. □

Установив существование ядер в Р1(жга), перейдем к построению алгоритма Р(Хп) ^ /(Хп), предварительно определив ранг ядра.

Определение 11.4. Операция др € £\ —, входящая в формулу Р1(;сга), называется ядром г ранга (Кгг) , если она выделяется в качестве ядра К на г шаге, (г = 0,1, 2, ...,1 - 1).

Строить алгоритм Р1(жга) /(Хп) будем по шагам, вычисляя на каждом шаге только одно ядро.

Теорема 11.1. Для реализации алгоритма Р1(жга) /(Хп) необходимо и достаточно вычислить ядро К1 и построить рекурсивный процесс вычисления КГ : К 1(Хп) ^ ^ Р 1-1 (Хп) ^ ... ^ Р 0(Хп). Через I шагов процесс заканчивается получением

Ь1

Р0 (Хп) = ^ : } = / (Хп).

&2П

Доказательство.

Необходимость. Так как рассматриваемая Р1(ЖП) является вычислимой, то необходимо вычислить ядро 1-го ранга (К1) и построить конструктивный рекурсивный процесс вычисления ядер более высокого ранга (КГ), то есть

Р1(Ж„) ^ Р1-1(Ж„) 5 - ^ Р 1(Ж„) 5 Р°(Ж„).

Достаточность! Следует из того, что КГ ^ Р1-г (Жп) и, следовательно, определяет значение частично-определенной формулы Р 1-Г(Жп).

Достаточность2. Докажем, что процесс вычисления КГ приводит через I шагов

1 61

к получению всех значений / (Жп) = 1 .

[ 62"

Построим, согласно условию теоремы 11.1, схему вычислений:

?1-1(т„ )= Р 1(Ж„)\{К1}

ЧЖп ) = ^ (Жп)\{Кк},

Р 1-2(Ж„) = Р 1-1(Ж„ )\{К2},

Р1-Г (Жга) = Р 1-(г-1)(Ж„)\{К[ },

Р°(Жп) = Р 1(Ж„)\{КЙ1} , (¿Л6,д<1).

Согласно этой схеме вычислений имеем упорядоченную последовательность частично-определенных формул Р 1(ЖП) 5 Р1-1 (Жп) 5 ... 5 Р°(ЖП), из которой после I шагов 1 1

получаем Р°(Ж„) = 1 . 1 = /(Ж„).

[ 62" ]

Действительно, Р°(ЖП) не может быть вырожденной формулой, так как результат

Г 61 )

выполнения др € Ь\— есть 1 . 1 , где 6^ € £2 = {0,1}^ = 1,..., 2П, следовательно,

[ 62" ]

Г *1

Р°(ЖП) = 1 . 1 . Но каждой формуле Р1(ЖП) однозначно сопоставлена функция /(Жп), [ 62^

1 61 )

следовательно, Р°(ЖП) = 1 . 1 = /(Жп). Теорема доказана. □

[ 62" ]

Для установления возможности существования компактного алгоритма Р 1(ЖП) ^ / (Жп) предварительно рассмотрим допустимые виды формулы Р1(ЖП). Условимся для сокращения записи обозначать:

т

а) (.....((хк-1<^3 или Хк-^Хк через ,;

в

б) д/хк)).....) ИЛИ Хк-^Хк через д/ хк\

Определение 11.5. Формула Р1 (хп) называется правильно построенной формулой (сокр. ппф), если для любых «р-- , «р3 , «З+11 в формуле Р1 (хп) выполняется одно из

следующих условий:

1) 2)

3).

4)

« Р-1

«З -1

«Г/

« Р-1

«З -1

«У1

Хк-1

в

01 Хк-1

Л'

71

Уз

7

|

7

ж/с |

02 | ^

72

^/с- |

/3

Рз+1

«з+1

« Рз+1

«З+1

«р 3+1

«з+1

«З+1

. 7, в €{1, 2,3,...} ; 01 ,в2 €{1, 2,3,...} ; 71,72 € {1,2,3,...} ; 7(в) € {2,3,4,...} , но 0(7) = 1.

Отобразим алгоритм Р1 (хп) ^ / (хп), согласно теореме 11.1, в виде графа, вершинами которого будут являться Од — 2п — разрядные ячейки памяти, хранящие промежуточные результаты {КГ}, а ребрами — переменные, необходимые для вычисления КГ (рис. 11.1). Таким образом, каждая вершина графа будет обозначаться через Од — адрес соответствующей ячейки памяти (А = 1, 2, 3,... ).

Рис. 11.1. Пример построения компактного алгоритма Р7(хз) ^ /(хз)

Для уменьшения общего количества ячеек, что равносильно количеству одновременно хранимых промежуточных результатов, потребуем выполнения на каждом шаге условия обеспечения компактности алгоритма — использование логических связей в исходной формуле

з

з

з

З

З

Р1(ЖП) согласно следующему правилу: если {Кгг} ^ О 1, {К£+1} ^ О2 и существует такая операция др^, что имеет место {К[}др{КГ+1}, то {(О1 )дрр(О2)} ^ О1.

Теорема 11.2. Число всех (п-) возможных нумераций через Од вершин графа на шаге г есть п- = Я (Я _ количество ядер ).

Доказательство. Согласно лемме 11.2 имеем на первом шаге П1 = Я, а так как в силу теоремы 11.1 число ядер на г шаге не возрастает, то, учитывая условия обеспечения компактности алгоритма, получим = Я. Теорема доказана. □

Теорема 11.3. Среди последовательности всех п- найдется такая подпоследовательность П? нумерацией вершин графа, что П? ^ П-.

Доказательство. Пусть исходная формула Р 1(ЖП) содержит конечное множество ядер нулевого ранга {К°(др),К°(д^±22),..., К°(дР±±Гг)}, где I > г ^ 3, так как случай г < 3 тривиален.

1°. Рассмотрим предельный случай, когда р < ^¿±2 < Рг±4 < ... < Рг±(Г-2) ^ Рг±г.

Построим, согласно теореме 11.1, граф вычислений Р1(ЖП) ^ /(Жп), взяв за начальное ядро д^ : {К^)} ^ О1, {К2(д^2)} ^ О2.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

В силу того, что условие обеспечения компактности алгоритма вычисления /(Жп) : {(О^д^1 (О2)} ^ О1 не выполняется, так как Р1 (Жп) есть ппф и р < , то после 2-го шага необходимо запомнить О1, О2 и перейти к вычислению {К^д^4)}. Учитывая, что Р1-2(ЖП) 5 Р1(ЖП) есть также ппф и < ... < Рг±(г-2) ^ Рг±г, то по индукции доказываем: после г шагов необходимо запоминать последовательность (О1), (О2),..., (ОГ-1), (Ог).

Нотаккак р^±(Г-2) ^ Рг±г и = шах(рг, ...,рг±г), тона г -м шаге уже будет выполняться условие обеспечения компактности алгоритма вычисления:

{(Ог-1)^-1) (ОгОг-1.

Следовательно, начиная с г -го шага будем иметь убывающую последовательность нумераций Од вершин графа, то есть П? ^ П-, что и требовалось доказать.

2°. Если на 1-м шаге потребовать выполнения условия обеспечения компактности алгоритма Р1(ЖП) /(Жп), то для рассматриваемой в п. 1° формуле Р1(ЖП) необходимо начать вычисления с . Тогда {К^/)} ^ О1, {К2^-)1)} ^ О2 и {(О1)11)'(О2)} ^ ^ О1 выполняется, так как Р1(ЖП) есть ппф и (Г-2) ^ Рг±Г. Следовательно, начав вычисления с др4гГ (Рг±г = тах(р^, ..^рг^)), после г шагов будем иметь подпоследовательность (О1), то есть ^ П-, что и требовалось доказать.

3°. Если же условие обеспечения компактности алгоритма Р1(ЖП) ^ /(Жп) выполняется независимо от того, какое ядро берется за К]1, то имеем предельный случай, когда П? = П-.

Обобщая эти три случая, можем утверждать: поскольку Р1 (Жп) в силу определения 11.5 может иметь такую конструкцию, то для некоторых частей ее имеет место п. 3°, а для других— п. 1° или п. 2°, то для всей Р1(ЖП) имеем П? ^ П-. Теорема доказана. □

Итак, на основании теоремы 11.3 установили: для заданной Р1(ЖП) существует такой алгоритм вычисления /(Жп), на каждом шаге которого, используя логические связи в исходной формуле Р 1(ЖП), можно автоматически обеспечивать получение минимального количества промежуточных результатов, то есть существует компактный алгоритм вычисления ФАЛ из класса Р2.

Следовательно, если на вход перцептрона для распознавания отношений типа ФАЛ из класса Р2 подается логическая формула Р1(ЖП), то существует такой алгоритм упорядочения этих отношений в процессе распознавания Р1(ЖП) /(Жп), который обеспечивает минимальную загрузку памяти перцептрона результатами распознавания.

В примере на рис. 11.1 для реализации Р7(Жз) ^ /(Ж3) по графу а) потребуется 3 ячейки О1, О2, Оз, а по графу б) - 2 ячейки: О1, О2. Следовательно, существует (граф б) компактный алгоритм для Р7(Ж3) /(Ж3).

11.2. Спектр структурных связей

Выбор исходной системы признаков распознаваемых образов представляет в настоящее время наибольшую трудность. Это объясняется тем, что процесс задания исходной системы трудно формализовать. Иначе говоря, до обучения нельзя выделить наиболее экономичную и информативную систему описания. Поэтому предварительный выбор признаков производят, как правило, по интуиции или методом случайных проб, стремясь при этом получить наиболее полное исчерпывающее (абсолютное) описание классов.

Однако такое полное описание обладает большой избыточностью и подчас содержит ненужные, с точки зрения распознавания, сведения. Поэтому после задания исходной системы признаков возникает, естественно, задача ее последующей минимизации, то есть поиска и оценки системы информативных признаков («языка описания»).

Эта задача, несмотря на многочисленные попытки ее решения, до сих пор не имеет даже определенной постановки: не ясно, что нужно искать. Одни авторы предлагают последовательное, поштучное исключение из системы наименее ценных признаков; другие, наоборот, — последовательное добавление наиболее ценных, начиная с одного. М.М. Бонгард предлагает идею использования логических функций для построения признаков из сравнительно небольшого числа элементарных алгоритмов («кирпичиков») [20].

За последнее время появился ряд работ, основное содержание которых связано с развитием методов анализа, предшествующего этапу обучения или принятия решения. Это связано с тем, что предварительное указание алгоритма анализа, то есть априорно заданной совокупности принципов извлечения и упорядоточения информации при распознавании образов, значительно облегчает в дальнейшем получение необходимой и достаточной системы признаков, а также проведения последующих этапов распознавания [2, 31, 33, 40].

Именно к этому направлению исследований по распознаванию образов и относится предлагаемая работа, связанная с построением полного спектра структурных связей между признаками [96, 99].

Для достижения более ясного и глубокого изложения сущности предлагаемой работы, не умаляя достоинств статистического подхода, используем все-таки детерминированный подход как более импонирующий с точки зрения возможностей последующей практической реализации полученных результатов.

Пусть Q = {Ql, Q2,..., Qn} — множество описаний образа А € А = {А1,...,Ат}, г = 1, 2, ...,т конструируемого по правилу € Я = {г1, ...,Г0}, к = 1, ...,0 из элементарных однородных частей 1д € Ь = {11,..., 1п}, А = 1, 2,..., п.

Требуется на множестве описаний Q построить и оценить характер полного спектра (5) структурных связей, возникающих при конструировании образа А^.

Так как 1д € Ь есть элементарные (неделимые) части, то правила € Я должны представлять на первой стадии анализа как минимум некоторые бинарные отношения: ^ 1з(4,1з € Ь).

В общем случае следует считать, что есть отношения более высокого порядка, которые можно выразить через бинарные отношения.

Тогда сформулированную задачу можно адекватно выразить на языке булевых функций следующим образом.

Пространству описаний Q структурных частей Ь поставим в однозначное соответствие булево пространство М множества переменных X = ...,хп }, х% € = {0,1}, г = 1,п.

Каждому описанию Qn образа Аг поставим в соответствие формулу ^ булевой функции /¿, конструируемую из элементов Жг € X по правилам бинарных отношений из Ь = = {—, &, V, =, А,/, °} :

Qn(Aг) € Q ^ Рп(/г) € Р,

где Р = {Р ,^2,...,^} — множество всех описаний функций /¿. Как известно, отношение ^п ^ /г является строго однозначным только в одну сторону, то есть для каждой / существует бесконечно много описаний — формул ^

, но для каждой существует только одна

/г.

Среди множества Е можно выделить отдельные описания , нормированные каким-либо образом относительно числа структурных связей д, € Ь\ — .

Например, описание формулы / только в базисе { —,V} или в базисе {о}, или в базисе {/}.

Нормирование описаний ЕП указанными способами преследует цель достигнуть минимального числа типов структурных связей д, € Ь\ — и облегчить последующую минимизацию описания булевой функции (образа) /¿.

Однако, как и всякая стандартизация, нормирование описаний по числу типов д, € Ь\ — приводит к его удлинению.

Для того чтобы иметь возможность получать короткие описания с помощью фиксированного набора д, € Ь\ —, построим и проанализируем полный спектр структурных связей между признаками Жг € X образа /г, используя полный базис бинарных отношений д, € Ь\ — и Еп — логическую формулу, полученную суперпозицией функций из Ь или переименованием переменных Жг € X = {Ж1, Ж2,..., Жп}.

Введем следующие обозначения:

Жп = (Ж1, Ж2,..., Жп) — набор переменных; др — операция д, € Ь\— порядка (ранга) Р. (Р. = 0,1, 2,...), если она входит в описание р, раз в скобки или под знак отрицания или совместно под знак отрицания и скобки; ] -счетный (слева направо) номер операции д, в Еп , включая повторяющиеся; = ^(Ж^) - формула длины I; I — количество операций дР € Ь\—, содержащихся в ^(Ж^) (включая повторяющиеся). Подчеркнем, что при построении описания, то есть формулы ^(Ж^), существует определенное упорядочивание записи переменных Жг € Жп, операций др € Ь\— и скобок (, ), позволяющее полученную запись называть формулой.

Согласно определению 11.5, = ^(Ж^) называется правильно построенной формулой (сокр. ппф), если для любых др, др^1, др++>2 из ^(Ж^) выполняется одно из следующих условий:

1) ... $ \хк д^+22-;7,/3 € {0,1, 2,...};

¡3 7

2) ж^^1^^2-^!, /32е {0,1,2,...};

3)... 71,72 е {0,1,2,...};

71 72

4)... д^ \%к-1_ %к[ (1Р/+2 • • •; 7(/3)е {0,1,2,...}; но /3(7)е{1,0}.

7 13

Отобразим связь между порядками {р1,р2, ...,р,} и соответствующими операциями {д^ д2,..., д.} в ппф Еп = ^(Ж^) в виде графика С С {1,2,...,^} х {р1,р2, }, по оси абсцисс которого в дискретных точках поместим номер операций д, € Ь\— с заданным их расположением в формуле ^ = ^(Ж^), а по оси ординат — вертикальные отрезки, пропорциональные значению порядка соответствующей операции. Пример построения таких графиков дан на рис. 11.2 а, б.

Получаемый указанным образом график зависимости величины порядка рг операции д, от ее связи и расположения в формуле ^ = ^(Ж^) будем называть спектром структурных связей др между признаками Жг € Жп образа /г или просто спектром Б(др). Этот спектр есть дискретный или линейчатый.

Для одной и той же функции /г можно построить бесконечно много спектров Б(др).

Проанализируем закономерности спектра. Прежде всего заметим, что составляющие спектра (отрезки ординат пропорциональные значению порядков р,) могут отсутствовать, то есть р, = 0 (рис. 11.2 а, д2 рис. 11.2 б: д4 : /), но расположение остальных спектральных линий не нарушается.

В этом смысле по аналогии с радиотехникой наш спектр можно назвать гармоническим [168].

F(X4)=X1 V x2 -> {[(ДЕ,ДДЕ2) -> x3vx4] ^(x^x2 & x3->x,)}

6) pj

0123456789

F(.x,)= [(^v x2 SJC,) A x2] /{[(jqojc, ->*3)Дх2]

Рис. 11.2. Примеры спектров структурных связей между признаками

Шириной (I) спектра Б (Д) назовем длину формулы р = для которой он по-

^ у JTLGIOV^DV.-IVI IXinj v.pv^p'ivi^yjinn ± п - х J

j ) ширин

строен. Спектр S(qpj) шириной I обозначим через Si(qPj).

Определение 11.6. Участок спектра или весь спектр Sgiqi-j) называется осциллирующим,, если: з V Pjt = Pjt +2&[в ■ (Pjt +1 >Pjt) V в ■ (pjt+1 < Pjt)], j <jt,jt+1,jt+2>

где в = Ц ~ Pjt+1 >Pjt; j < jt < I - 2. I 0 ^ Pjt+1 <Pjt , Л

Участок осциллирующего спектра есть [j, jt + 2].

Определение 11.7. Участок спектра или весь спектр Si(qPj) называется монотонно возрастающим (убывающим), если:

а) 3 V Pjt+1 = Pjt + 1 — для монотонно возрастающего участка: j jt

[j, jt + 1]; jt = j, j + 1, j + 2,... (j < jt < I);

б) 3 V Pjt+1 = Pjt — 1 — для монотонно убывающего участка: j jt

[j, jt +1]; jt = j, j +1, j + 2,... (j < jt < I).

Определение 11.8. Участок спектра или весь спектр Si(qPj) называется постоянным, если: 3 V Pj = Pjt • j jt^j+1

Участок спектра [j, jt] .

Лемма 11.3. Спектр Si(qPj) может содержать только осциллирующие, монотонно возрастающие ( убывающие ) или постоянные участки.

Доказательство очевидно (рис. 11.3), в силу определения. □

Установим ряд теорем о спектре Si(qPj).

а)

Р;

б)

Р,

0 1 2 3 4 5

0 1 2 3 4 5

Р(хъ) = \_{ху^х2^»'х3)=х1\^х2

В)

0 0 0 0

0 12 3 4

Г) 1

0 1 2 3 4 5

Зс5) = х1 V х2 V хъ V х4 V х5 F(x3) = x1vx2 & (^Дхг)& х1 = х3

Рис.11.3. Виды элементарных (базовых) спектров: а) монотонно убывающий; б) монотонно возрастающий; в) постоянный; г) осциллирующий.

Теорема 11.4. Для одной и той же формулы р^(жп) можно построить один и только один спектр (Д3), то есть инъективное отображение ^(ж^) ^ 51(33).

Доказательство. Спектр 5*1 (33) есть функциональный график С :

С С{1,2,...,Л },

то есть - (3;)(3р1)(3р2)[(;,р1) € С&(;',Р2) € С&Р1 = Р2].

Поэтому в каждой дискретной точке j ординаты спектр (Д3) имеет только единственную составляющую, то есть V 3 93 ^ Р3.

3 Рз

Следовательно, представление формулы спектром ^¿(^Р3) единственно, что и тре-

бовалось доказать. □

Теорема 11.5 (существование локального максимума). На всей ширине (I) спектра 51(3) всегда найдется хотя бы один локальный максимум, то есть 3 Рз =

3 з

= тах(р1,р2, ...,Р1).

Доказательство.

1°. На всей ширине (I) спектра ^¿(^Р3) существует хотя бы один осциллирующий участок [j,jt + 2]. Тогда, если р34 = р3(+2, то согласно определению 11.5 между и jt + 2 (где j ^ jt ^

< I - 2)

3 в ■ (Рз4+1 > Р*) V /3 ■ (Рз4+1 < р34).

3(<3(+1<34+2

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Если в =1, то есть р34+1 > р34, то р34+1 € 8ир(р3,р3+1, ...,р3(+2), и точка + 1 — есть первый локальный максимум осциллирующего участка [j,jt +2] спектра 51(3). Если в = 0,

Pi

ю\

9 8 7 6 5 4 3 2 1

T T I T I

о 1

10 11 12 13 14 15 16 17

= x1 -^((Х[£Х2)^>({Х2&Съ) ->(ЦД»д) ^((x4AX3) ->(ЦД*:4) ->^))))))))

Pi

J"

10 9 8 7 6 5 4 3 2 1

I It i

О 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 $ Нхл)=Ж(ЩА(¿2 УХ,)) -»(¿^»-»ЦД^)) Мх^)) -К^Дхр ->|Д*з)) ->)) ->С*|Ах2)) ^ДЗ Рис. 11.4. Монотонно возрастающий и монотонно убывающий осциллирующие спектры

то есть р^+1 < р., то Pjt+1 € ш!(р.,р.+1, ...,р. +2) и точка — есть первый локальный максимум осциллирующего участка + 1] спектра ).

2°. На всей ширине I спектра Яг(.) существует хотя бы один монотонно возрастающий (убывающий) участок \jyjt + 1].

Тогда согласно определению 11.7:

а) ЗУР^+1 = Рjt + 1 — для монотонно возрастающего участка \j, jt + 1].

j jt

Следовательно, р^+1 € 8ир(р.,Р.+1, ...,р. +2), а точка jt + 1 — есть локальный максимум участка \j,jt + 1] спектра );

б) ЗУр.(+1 = Рjt — 1 — для монотонно убывающего участка \j, jt + 1].

j jt

Следовательно, pjt € inf (pj, Pj+i, *--, Pjt+2), а точка jt —есть локальный максимум участка [j,jt + 1] спектра Бе(др/)-

3°. Спектр Si(qPj) содержит постоянные участки, тогда остальные участки спектра в силу леммы 11.2 являются либо осциллирующими, либо монотонно возрастающими (убывающими).

В этом случае существование локального максимума определяется пп. 1°, 2° теоремы 11.5.

Спектр Si(qPj) является весь постоянным, тогда формула F^(xn) согласно определению 11.5 содержит только один из типов операций qj € L\-, удовлетворяющих ассоциативному закону (&, V, А, =)-

Следовательно, VPj = max(pi, ...,pi), что и требовалось доказать. □

j

Теорема 11.6 (свойства локальных максимумов). Для любой тройки (j,j + 1,j +2) спектра Sg(qjj), где j + 1 — точка локального максимума, имеет место:

~ 3 pj + 2 ^ pj+i ^ pj+2 + 2, j+i

(11.1)

3 Р3 +2 < Р3+1 ^ Р3+2 + в, (11.2)

3+1

( 1 ^ j + 1 — начало осциллирующего участка + 1, jt + 2]; \ 0 ^ j + 1 — начало участка + 1, ^] постоянного спектра.

Доказательство.

1°. Докажем выражение (11.1). Предположим обратное, то есть

3 Р3 + 2 < Р3+1 ^ Р3+2 + 2. (11.3)

3+1

Согласно теореме 9 узкого исчисления предикатов [149], выражение (11.3) можем записать:

3 Р3+1 ^ Р3 + 2& 3 ^ Р3+2 + 2. (11.4)

3+1 3+1

Если Р3+1 ^ Р3 +2, то должно выполняться одно из следующих условий (3, 4) определения 11.5:

3)... др/ •••; 71,72 е {0,1,2,...};

71 72

4)... дР/\х^др/+\1х^др/++22..- 7(/3) € {0,1, 2,...}; но /3(7)е{1,0}.

7 /3

Если имеет место условие (3), то Р3+2 — Р3+1 = 72 ^ 0, а по предположению (11.4):

Р3+2 — Р3+1 < —2.

Следовательно, выражение (11.1) истинно.

Если выполняется условие (4), то Р3+1 — Р3+2 = в = 1(0), а по предположению (11.4) Р3+1 — Р3+2 = в ^ 2. Следовательно, и в этом случае выражение (11.1) истинно.

2°. Для доказательства (11.2) достаточно заметить, что если Р3+1 ^ Р3 + 2, то в силу условия (4) определения 11.5: Р3+1 — Р3+2 = в = 1(0).

Следовательно, выражение (11.2) также доказано. □

Полученные теоремы 11.1-11.5 позволяют построить полный спектр структурных связей 53 € £\— между признаками ж^ € жп образов, описываемых языком булевых функций.

Примеры спектров структурных связей

Т = 13 Ршк=6

0 1 2 3 4 5 6 7 8 9 10 11 12 13 * р(х4) = (^з & ~ (Х2^(Х4 0е! I хг) V хг) ~ -О х1) >/ хз) ~ хз

Рис. 11.5. Пример построения спектра типа «треугольник»

Р:

Т=13 Р =6

О 1

í I

10 11 12 13

х^) — (л^ V х2 -> х1) -» -»х2 -»х1 -»х2 V ^ -> А х2 -> х5 -»х3 -» -> ) Рис. 11.6. Пример построения спектра типа «впадина»

P:

ik

T= 17 P = 9

max

lid

Ш1

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 1920 21 22 23 24 2526 27 28 29 3031 32 33 3 4 35 3637 38 39 4041 42 4344 45 46 47 48 49 5051

Рис. 11.7. Вид периодического спектра с монотонно убывающими осциллирующими

участками

P

T= 17 P = 9

lili

lili

11

lili

j

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 1 718 1920 21 22 23 24 2526 2 7 28 29 3031 32 33 3 4 35 36 37 38 39 4041 42 4344 45 46 47 48 49 50 51

Рис. 11.8. Вид периодического осциллирующего спектра с монотонно возрастающими

осциллирующими участками

11.3. Изоморфизм спектров структурных связей

Выбор и оценка системы информативных признаков является одной из основных задач в проблеме распознавания образов. Она до сих пор не имеет определенной постановки. Поэтому любые попытки ее решения вносят ясность в один из труднейших вопросов распознавания [157-160, 165].

В работе предлагается использовать язык булевых функций для построения полного спектра структурных связей между признаками образа.

Имея такого рода спектр и зная его характер, можно в заданной реализации образа выделить наиболее информативные связи между признаками, составляющими описание образа.

Основные трудности при выборе из всего спектра наиболее информативных спектральных составляющих связаны с проверкой достаточности и необходимости конкретных систем структурных связей, то есть, говоря о спектре 5*1(3) языком радиотехники, выясним, какие же спектральные составляющие дР3 являются основными (несущими).

В предлагаемой работе вводится понятие суперпозиции формул и спектров и устанавливается с его помощью ряд теорем о спектре структурных связей.

Основной результат может быть использован при рассмотрении вопроса целесообразности учета структурных связей между признаками на этапе предварительного выбора системы признаков.

Пусть имеется формула Р 1(жп) — реализация некоторого образа — булевой функции /¿.

Для формулы Р1(жп) построим ее спектр 5*1 (33) структурных связей дР3, то есть отображение Р1(жп) — 51(3).

Подчеркнем, что структурная связь дР3 - это операция д3- € £\— , входящая в рассматриваемую Р1 (жп) и имеющая порядок Р3(Р3 = 0,1, 2,...).

Замечание 11.1. Порядок Р3 операции д3- € £\, входящей в Р 1(жп), определяет глубину захвата данной операцией переменных ж^ € жп (или ж^) и других операций формулы

Р 1(Ж„).

В зависимости от формы и глубины захвата структурные связи можно подразделить на локальные и глобальные.

Определение 11.9. Структурную связь 3 будем называть локальной связью порядка Р3, если в зоне действия этого порядка в формуле Р 1(жп) :

п ^ ---

/3 7

где ж^,ж3 € жп, причем (в&7)тт = 1.

Допускается вместо жг,ж3- использовать их отрицание, то есть жг,ж3- .

Пример 11.2. Р(ж3) =

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

= жз, где операции д

3

: V3, -2, Д3

имеют локальные связи.

Явно выраженные локальные связи можем выделить на монотонно возрастающих (убывающих) постоянных участках спектра 51(дР3), а также на локальных максимумах осциллирующего участка (пример 11.3 а, б, в, г).

Пример 11.3. а) Р(ж3) = ж1 — б) Р(Ж3) =

ж2Л

ж3 V

ж2 — ж1

ж1 V ж2

— ж2

&ж3 ;

в) Р(Ж3) =

г) Р(Ж3) =

ж1 V ж2 V ж3

ж1 V ж2

ж1 = ж3

, где замкнутый скобочный знак | | обозначает глубину

3

или зону действия 53 локальной связи.

—>

Как нетрудно видеть из примера 11.3 (а ^ г), все локальные максимумы спектра )

будут иметь всегда как минимум одну локальную связь. Если р = 0, то будем говорить, что операция ^ имеет вырожденную или замкнутую на себя локальную связь (в прим. 11.3 г операция ^J : &2, &4 ).

Пример вырожденных локальных связей: Р(Жэ) = Ж1 V ж2 V Ж3.

Пример 11.4. F(Ж3) = Ж1 V ж2 —>■ Х\Ах2 = Ж3.

Операции qpj : vf, А2 имеют локальные связи, а операцию —нельзя в силу определения 11.9 назвать имеющей локальную связь. Эта операция относится уже к другому типу связей — глобальному.

Определение 11.10. Структурную связь qPj формулы Fl(£n) будем называть глобальной связью, если в зоне ее действия, то есть между ее началом и концом, существует хотя бы одна q^A вида

€х Ма+У

13 7

где € жп или ж^ж^ € жп, причем (e&Y)min = 1.

Как правило, наиболее часто в Fl(xn) встречаются комбинации тех и других связей. При этом, если в формуле Fl(£n) рассмотреть некоторую qPj, то можем заметить, что порядок Pj одной и той же операции qj может представлять сумму локальных и глобальных связей. В дальнейшем во всех случаях, кроме тех, где это особо оговорено, вместо знака | | будем

использовать общепринятое скобочное обозначение (),[],{ }.

Пример 11.5. F(Ж4) = (xi V ж2) — [(xf Аж2) = (ж3 V ж4)] .

Операции qPj : А2 и V2 охвачены как локальной (круглые скобки), так и глобальной (квадратные скобки) связями.

Если задана в виде спектра Si(qj'J) реализация Fl(5"ra) некоторого образа /¿, то для определения всех достаточных видов структурных связей qPj в этой реализации целесообразно выделить вначале только их тип — локальные или глобальные, то есть определить тем самым уже классы Ci С C, Ci = (of1, о^2,..., о^1) возможных конкретных систем информативных связей между признаками Жi € жп; (¿Ci € жп), где о есть qj € L\ — - После определения класса Ci = (of1,..., ) уже можем дать в нем конкретную реализацию образа f на множестве (L\—,жп), поставив вместо о в (of1,..., ор) операции qj € L\ — и между ними переменные € жп. Тогда получим: Fl(2„,) = ЖiqP1 Жj...qPl . В силу конечности множеств L\— и жп множество Ci хотя и велико, но также конечно.

Для того чтобы облегчить поиск в классе Ci среди достаточных систем структурных связей qPj необходимых, то есть достаточных систем связей минимальной сложности, введем понятие суперпозиции формулы и спектра.

Пусть имеется F = {Fi, ...,F4} множество всех описаний функций — образа /¿. Каждому описанию Fn С F поставим в соответствие натуральное число , равное длине формулы

Fn — Fn (жга) -

Дополнительно сопоставим каждому символу F4 символ F4(*i о1 *2 о2 ... о^ ) , где Oj — какие-либо qj € L\—, j = 1, 2,...,1Ч; — есть Жi € жп, в = 1, 2, ...,1 + 1.

Допускается вместо использовать Жi € жп с отрицанием, то есть ж^ Символ Fn(*i о1 *2... о^ ) назовем — местным элементарным объектом.

Априорно можем утверждать, что число In — местных элементарных объектов конечно для любого конечного I.

Определение 11.11 (индуктивное). 1. Если формула F^S™) = жДж^, то есть вырожденная, то она есть суперпозиция ранга 0. Суперпозиции ранга 0 формулы F^(;cra) сопоставим однозначно суперпозицию ранга 0 спектра Si(qPj).

2. Формула ^(А, А.2,..., А) называется суперпозицией ранга I, если все I мест знака

заполнены с расстановкой скобок каким-либо д3 € £\ —, а все — заполнены независимыми переменными х% € Жп или Ж^. Суперпозиции I ранга формулы Р1(жп) однозначно сопоставляем суперпозицию ранга I спектра ^(дР3). Формулы Р 1(Жп) есть суперпозиции I ранга.

Пример 11.6. Задан символ Р\(*1 01 *2 02 *э 03 *4).

Суперпозиции, сопоставленные этому символу, соответствующих рангов:

1) Р1 (Ж4) = Ж1 ^ Ж2;

2) Р2(Ж4) = (Ж1 ^ Ж2)ДЖ2;

3) Р3(ж4) = ((Ж1 ^ Ж2)ДЖ2) V Ж1.

Замечание 11.2. Любая формула ) представляет собой всегда суперпози-

цию ранга ^ I.

Дадим геометрическую интерпретацию суперпозиции формулы (рис. 11.9).

Е1(х2) = —» х2)Ах2)\/х1

Рис. 11.9

Образом — местной суперпозиции ранга I ^(А^ А2,..., А^) будем считать направленный граф, в вершинах которого располагаются суперпозиции ранга 1,1-1,1-2,..., 1. Число вершин графа суперпозиции ранга I равно I.

Так как мы рассматриваем на о3 месте только бинарные операции д3 € £\—, то число ребер, входящих в какую-либо из вершин графа, равно 2, а число исходящих - 1. Ребрами, входящими в вершину ¿, = 1,2,...,1 графа суперпозиции ранга I, могут являться или только переменные Жг € Жп (или Жг), или только суперпозиции (¿' — 1) -го и (¿' — 2) -го рангов, или одна переменная Жг € Жп (или Жг) и одна из суперпозиций (¿' — 1) -го ранга. Для подсчета числа суперпозиций формулы р1(Жп) введем понятие изоморфизма суперпозиций, графов и спектров, воспользовавшись результатами.

Определение 11.12. Две суперпозиции ранга изоморфны тогда и только тогда, когда они графически тождественны, то есть на одинаковых местах стоят одинаковые знаки алфавита, состоящего из символов д3 € £\ —, Жг € Жп (или Жг ) и скобок.

Поставим в соответствие графу слово алфавита, состоящего из символов операций (0), переменных (*) и скобок. При этом какую бы суперпозицию, образом которой является данный граф, ни брать, полученные слова будут тождественны.

Определение 11.13. Два графа изоморфны, если соответствующие им слова тождественны.

Формуле Р1(ЖП) однозначно может быть сопоставлен спектр (дР3).

Определение 11.14. Два спектра (др1) и 512 (др2) изоморфны тогда и только тогда, когда 11 = 12 и V (¿1, Рл) = (¿2^) ^ Л = ¿2 & Рл = , 3 = 1, 2,..., 11 = 12,

(?>Рз >

где (¿ъРл) — спектральная составляющая ¿1 амплитуды р31 из спектра (др1); (¿2, ) — спектральная составляющая ¿2 амплитуды р32 из спектра (др2).

Из определения 11.5 и определения 11.11 следуют:

Замечание 11.3. Суперпозиция правильно построенных формул (сокращенно ппф) Р11 (Жа),Р12 (Жа),...,Р1^ (Жа) снова ппф.

Рассматриваемые нами суперпозиции I -го ранга допускают использование как инфиксной (скобочной), так и префиксной (бесскобочной) формы записи Р1(Жга).

Такое комбинированное использование форм записи Р^(Жп) позволяет более полно представить возможные виды структурных связей др между ж^ € Жга (или Ж^), составляющими описание образа /¿.

Относительно бесскобочной формы записи Т1(Жга) заметим следующее: она использует не условную очередность (старшинство) выполнения операций д, € Т\— или их суперпозиций в формуле Р1(Жга), а действительное наличие ассоциативных свойств отдельных операций д, € А - .

В силу того, что число входящих ребер вершины графа суперпозиции I ранга не более 2, то для определения возможности применения префиксной записи к суперпозиции I ранга вполне достаточно рассмотреть наличие свойства ассоциативности у суперпозиции 2 ранга (то есть двух операций д, € £\— ).

Замечание 11.4. На множестве {Т,Жга} помимо операций &, V, А, = можно выделить еще четыре суперпозиции 2-го ранга, удовлетворяющие ассоциативному закону:

1) (ж 1 & ж2) ^ ж3 = ж 1 & (ж2 ^ ж3);

2) (ж 1 ^ ж2) V жэ = ж 1 ^ (ж2 V жэ);

3) (ж 1 = ж2) А жэ = ж 1 = (ж2 А жэ);

4) (ж1 А ж2) = жэ = ж1 А (ж2 = жэ).

В этих формулах скобки могут быть опущены.

Обозначим число пар скобок или отрицаний, играющих в нашем случае роль пар скобок, в суперпозиции I ранга через 7[Р1(Жга)].

Это число, назовем его индексом связности, содержательно отображает структурную связность признаков жпв описании Р1(Жга) образа / .

Пусть Т^1 (Жа)] — индекс связности формулы Т^1 (Жа);

(Ж? )] — индекс связности формулы Р^2 (ж^ );

7[Р1(жга)] —индекс связности суперпозиции I ранга, полученной из Р^1 (Жа) и Р-^2 (ж^).

Тогда имеет место

Лемма 11.4. 7 [^(Ж*)] ^ 7 [р/1 (Жа)] + 7 [Р[2 (Ж?)].

Доказательство. Пусть какая-либо д, € Т\— является операцией, образующей суперпозицию I ранга

Р1(Жп) = ^ (Жа), Р12 (Ж?), где п — наибольшая из длин а или £ соответствующих кортежей Жа и Ж^;

I = I 1 + 12 + 1.

Ребрами, входящими в вершину I графа суперпозиции I ранга, будут являться суперпозиции I1 -го и 12-го рангов.

Выделим в формуле Р^1 (Жа) операцию д^, образующую суперпозицию I 1 -го ранга, а в формуле Р-^2 (Ж^) операцию д^2, образующую суперпозицию 2-го ранга.

Рассмотрим упорядоченную тройку операций (д^, д,, д^2) формулы Р1(Жга).

1°. Если вся тройка удовлетворяет ассоциативному закону, то есть д^ = д, = д<$2, д, € Т' С £\— и Т' = {&, V, А, =}, то в суперпозиции I -го ранга не требуется заключать в скобки суперпозиции 12 -го и 12 -го рангов, следовательно,

7 №„)] ^ 7 [^ (Жа)] + 7 [Р12 (Ж?)],

что и требовалось доказать для случая 1°.

2°. Если из тройки (д^1, д,, д^2) только две операции: (д^1, д,) или (д,, д^2) (причем д^1 = д, или д, = д^2) удовлетворяют ассоциативному закону по одной из 4 суперпозиций 2-го ранга замечания 4, то в суперпозиции I ранга требуется заключить в скобки соответственно

суперпозицию 12 -го ранга и не заключать I 1 -го ранга или наоборот. Следовательно, [ ] [ ] [ ]

7[Т\1(жга)] ^ 7 [Т^1 (Жа)] + 7[^2 (Ж?)],

что и требовалось доказать для случая 2°.

3°. Рассмотрим последний случай. Если все операции тройки (д^1, д,, д^2) разные и суперпозиции двух из них (д^1, д,) или (д,, д^2) не удовлетворяет ассоциативному закону замечания 4, то в суперпозиции I ранга требуется заключить в скобки суперпозицию I 1 -го и 12 -го рангов, следовательно,

7[Т\1(Жга)] ^ 7[Р[1 (Жа)] + 7[Р/2 (Ж?)] ,

что и требовалось для всей леммы 11.4 доказать. □

Из леммы 11.4 вытекает

Следствие 11.2. 7 [Т\1(Жга)] = 7 [Р/1 (Жа)] + 7 [Р/2 (Ж?)] +А, где А = Атах = 2, то есть суперпозиция I ранга составляющих формул Р^1 (Жа) и Р-^2 (Ж^) может отличаться от последних не более, чем на две пары скобок.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Но это, очевидно, справедливо в силу замечания 11.3 только в том случае, если каждая из суперпозиций I 1 -го и 12 -го рангов заключается только один раз в скобки при образовании суперпозиции I ранга.

Рассмотрим как закономерности построения суперпозиций I ранга отражаются в спектре

£1(др7).

Лемма 11.5. При образовании суперпозиции l ранга из формул F11 (жа) и F12 (ж^)

j), (1 < ji < li) или Si2(j2

все составляющие спектров Si1 (j'1), (1 ^ j i ^ 11) или Si2 (qj'2), (1 ^ j2 ^ I2) могут

возрасти одновременно не более, чем на в (д^Ц71) или £^2 в (д^2), (£11 V £^2 = = £ € Е2 = {0,1}).

Доказательство.

1°. Докажем прежде всего, что все составляющие спектров (д,71) или 512 (д^2) одновременно могут только возрастать на величину £ ^ 0.

Пусть имеются две формулы Р-^1 (Жа) и Р-^2(Ж^) и какая-либо д, € Т\— , образующая из них суперпозицию I ранга:

*?(Жга) = р11 (Жа)др7 Р12 (Ж?), где п — наибольшая из длин а или £ соответствующих кортежей жа и ж^;

I = I 1 + 12 + 1.

Согласно лемме 11.4

7[*?(жга)] ^ 7[Р/1 (жа)] + 7[р12(ж?)].

Отсюда следует, что индексы связности 7[Р^1 (жа)] и 7[Р^2 (ж^)] не уменьшаются. При этом заметим, что если происходит их увеличение, то в скобки заключается вся соответствующая суперпозиция I - -го или 12 -го рангов, то есть одновременно все структурные связи формул Р^1 (жа) или Р^2(ж^).

Формуле Р-^1 (жа) однозначно соответствует спектр (д,71), где (1 ^ ]- ^ I-), а формуле

Р/2 (ж?) -спектр 512 (д,22), где (1 < ¿2 < 4).

Так как амплитуды р, ^ 0 спектральных составляющих д, пропорциональны индексам связности, то, следовательно, при образовании суперпозиции I ранга все составляющие спектров (д7) и £12 (д7) не уменьшаются, то есть остаются либо без изменения, либо возрастают одновременно все на величину £ > 0.

2°. Теперь определим величину £, на которую могут возрасти одновременно все составляющие спектров (qPj1) или Si2 (qP^2 )•

Согласно утверждению леммы величина £ € E2 = {0,1}, £ = ^ V£i2, где ^ — величина возрастания амплитуды составляющих спектра Si1 (qj); £i2 — соответственно для спектра

Si2 (qj )•

Если £ = £i1 =0 или £ = £i2 = 0, то это означает, что индексы связности соответствующих спектров Si1 (qPj1) и Sl2(qj) не возрастают, что имеет место в силу случаев 1°, 2° леммы 11.4, то есть min £ = 0.

Для определения max £ предположим, что справедливо утверждение обратное лемме, то есть max £ > 1 и целочисленно. Пусть max £ = £1 =2. Тогда из этого предположения и из того, что £1 = £i1 V £12, следует £^1 =2 V £12 = 2.

Но £i1 = 2 означает, что в суперпозиции I ранга F^1 (жа) дважды заключается в скобки, что недопустимо в силу замечания 11.3 и следствия 11.2. К аналогичному заключению мы приходим при £i2 =2.

Следовательно, нельзя предполагать, что max £ > 1, то есть £ € E2 = {0,1}, что и требовалось доказать. □

11.4. Модификация формульного описания булевых функций

В настоящее время в теории булевых функций известны различные способы описания булевых функций: табличные, формульные, геометрические, аналитические, графические и др. [136].

Несмотря на такое разнообразие, каждому из этих способов присущи два общих свойства:

1) представимость;

2) вычислимость.

Выбор того или иного способа представления булевых функций определяется удобством перехода на язык булевых функций (например, табличные способы удобны для описания работы переключательных схем; формульные — в исчислении предложений и т.д.). Формульная, или аналитическая запись указывает на природу происхождения рассматриваемой булевой функции, но не дает в явном виде ее численного значения. Табличная, или геометрическая запись, наоборот, наглядно представляет значение этой функции, но ничего не говорит о формуле, «породившей» булеву функцию.

В некоторых приложениях теории булевых функций (распознавание образов, машинное доказательство теорем математической логики и т.п.) требуется на основании некоторой исходной логической формулы F^(Xra) вычислить соответствующую булеву функцию Д(жга), то есть найти отображение F^(Xra) ^ Д(жга). Причем с точки зрения удовлетворения 2-го свойства (вычислимости) указанное отображение нужно получить как можно быстрее при минимальном объеме запоминания промежуточных результатов.

Очевидно, этого можно достичь, если произвести предварительно эквивалентные преобразования исходной формулы F^(Xn), в результате которых уменьшается число логических операций в формуле F^(Xn).

Однако при большом числе и разнообразии логических операций q3 € L\-, L\- = {&, V, =, А,/, о, в формуле F^(Xra) такое преобразование (без предварительного вычисления булевых функций) выполнить затруднительно.

В настоящей работе предлагается модификация существующего формульного описания булевых функций. Эта модификация преследует двоякую цель: указать форму записи булевой функции fk(жп), удобную для отыскания отображения F^(Xra) Д(жга) без предварительных эквивалентных преобразований исходной формулы F^(Xra), порождающей булевую функцию fk(Xn).

Пусть имеется общая форма представления булевой функции в виде ппф (правильно по-

(

= {&, V, =, А,/, о, или переименованием переменных ж^ € жп = (ж-, Ж2,..., жп),

г] v

строенной формулы) Р,1(Жп), полученной суперпозицией функций д3 € ¿\— = ж г € К2 = {0,1}, г = 1,п. Тогда модифицированная формульная запись этой ппф *Р£(жга)

будет иметь общий вид

Р?7(жга) ^ жгдР ж,дРжв... др1 ж,, где ж»>.7>к>в>7 € жп = (ж 1,ж2,...,жга), жг,,,к„0,7 € Е2 = {0,1} —булевые переменные; 'д^7 —операция д, € Т\— = {&, V, =, А,/, о, порядка р, (р, =0,1, 2,...; ; = 1, 2, 3,...,1);

] -счетный (слева направо) номер операции др в формуле Р,1(жга), включая повторяющи-

еся;

Г ' Р7 « Р7

. р. I 'д/ — если к данной операции д/ непосредственно применяется знак —;

д,7 = 1 р7' - Р-

^ [ д, — если к данной операции д, знак — непосредственно не применяется. Пример 11.7.

1. Существующая формульная запись — (жз) ^ Х\А[Х\ V жз&(ж1 о Жз)].

2. Предлагаемая модифицированная формульная запись: *Р4(жз) ^ ж -А- ж - V2жз&2ж -03жз.

Заметим, что закономерности в формульной записи ^Р^ж^,) можно проследить, анализируя свойства упорядоченного множества пар чисел (р,

Предложенная модификация формульного описания булевых функций позволяет, благодаря введению показателя р, над операцией д, в формуле Р_1(жга), применить правило компактного алгоритма, существование которого доказано ранее.

11.5. Построение фильтров при вычислении булевых функций

В п. 11.1 было доказано существование эффективного (компактного) алгоритма Р,1(жга) ^ /к(жп) вычисления булевой функции / (жп) по ее исходной формуле Р,1(жга). Компактность алгоритма Р,1(жга) ^ / (жп) в данном случае определяется минимальным количеством одновременно запоминаемых промежуточных результатов в процессе вычисления.

Ранее было введено и изучено понятие спектра £1(др7) для ппф Р_1(жга). Используя понятие спектра ^(д,7), можем сформулировать правила построения компактного алгоритма

(жга ) ^ /(ж ) С {р,..., ...}, /(жга) € {/1,..., /22П }.

Предварительно введем ряд определений.

Определение 11.15. Сечение спектра БДдР7) (или его участка) есть операция разбиения его на две части в точках локального минимума.

Определение 11.16. Локальный минимум спектра Бг(дР7) (или его участка) есть абсцисса Л, для которой выполняется условие рл-1 > рл < рл+ь

Определение 11.17. Локальный минимум ] спектра Бг(дР7) является вырожденным, если он рассматривается как начало монотонно возрастающего спектра (или его участка):

1) Р7_1 = Р7 < Ву+1 (7 = 2) или как конец монотонно убывающего спектра (или его участка);

2) Р7_1 <Р7 = Р7+1 (7 = I — 1).

Определение 11.18. Минимальный (максимальный) локальный минимум спектра бХдР7) есть абсцисса 7, для которой выполняется условие:

Р7 = тт(тах)(Рк,Рл,-.,Р7,..., Рз,Рр), где ,Рл,-.,Р7, ...,Рз, Рр) — кортеж ординат локальных минимумов спектра ^(др7).

Определение 11.19. Локальный минимум Л является связывающим, если он расположен между двумя локальными максимумами к, в в спектре £¿(3) и именно только для него выполняется условие компактности алгоритма (жп) Д(жп) :

{(01 )3(02)}^ 01,

где {Кг(3,3++ ,...,?РЛ)} ^ (01), {К (^ ,вЛ++2 -У)} ^ (02)'г = 3 € {1, 2.....1};

к < Л < в, к = Л = в € {1, 2,..., I}.

Для построения компактного алгоритма Р^(жп) ^ Д(жга) необходимо указать правило выбора такого 1-го шага, который обеспечивал бы запоминание минимального количества промежуточных результатов при вычислении формулы Р^(жп). Имеют место следующие теоремы.

Теорема 11.7 (метод сечений). Для отыскания 1 -го ( начального) шага компактного алгоритма Р^(жп) ^ Д(жга) необходимо и достаточно:

1) построить отображение Р^(жга) — ^¿(^Л3);

2) провести сечение спектра £¿(3) по минимальному локальному минимуму; из двух частей спектра относительно сечения выбрать для дальнейшего вычисления ту, которая содержит наибольшее число связывающих максимальных локальных минимумов;

3) в выбранной части снова произвести сечение по правилам п. 2 и т.д. до тех пор, пока не останется в каждой части спектра не более одного связывающего локального минимума.

Операции qj € Р\ — в исходной Р^(жп), соответствующие их локальным максимумам,, и будут являться ядрами 0-го ранга.

Теорема 11.8 (теорема компактности). Для построения компактного алгоритма ^(жга) Д(жп) необходимо и достаточно по методу сечений выбрать 1-й шаг и, выдерживая на каждом шаге условие компактности, вычислить ядра, соответствующие локальным минимумам, в порядке, обратном сечениям спектра £1(3).

Теоремы 11.7, 11.8, исключая эвристику при построении компактного алгоритма Р^(жга) ^ Л(ж„), указывают пути автоматизации вычислений булевой функции Д (жп).

Назовем фильтром Ф некоторый оператор, упорядочивающий по схеме компактного алгоритма Р^(жга) ^ Д (жп) очередность вычислений всех логических операций в исходной формуле Р^(жга).

Определим те элементарные функции, которые должны реализовываться фильтром Ф.

1. Выделение в спектре £¿(3) локальных минимумов Л по условию

Рл-1 > Рл < Рл+1.

2. Выделение среди кортежа локальных минимумов (к, Л,..., 7,..., в, Р) абсцисс минимальных (максимальных) локальных минимумов согласно условию

Р7 = шт(шах)(Рй, Рл,..., Р7,..., Ре, Рр).

3. Сечение множества пар (Р3,3) спектра ) в точках локального минимума Л (рис. 11.11).

4. Подсчет числа связывающих максимальных локальных минимумов в каждой части спектра £1(3) относительно сечения в точке Л .

5. Выбор части спектра £¿(3) с наибольшим числом связывающих максимальных локальных минимумов.

6. Повторение пп. 3-5 применительно к спектру £¿(3) до получения в последней части спектра не более одного связывающего локального минимума.

7. Индексация (последовательная нумерация) очередности выполнения логических операций исходной формулы Р_1(жга) в порядке, обратном сечениям спектра £¿(3).

На вход фильтра Ф должны подаваться составляющие (Р,) спектра (др7) с указанием их расположения (^) в спектре, то есть пары (Р,, ^). На выходе фильтра Ф получается тот же самый спектр $1 (др7), но его составляющие Р, последовательно пронумерованы в порядке очередности их вычислений по схеме компактного алгоритма Р^(жп) ^ /к (жп) (см. рис. 11.10).

Р,

б 5 4 3 2 1

10

12

17 16

19

18

20

11 13

14

15

1 2 3 4 5 6 7

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

10 11 12 13 14 15 16 17 18 19 20

(-*ч) = *1А[(*1 Х/ Хг) & (х2 ° Хз)] & {Х4 = Х2 Х1 Х1^Х3 Ч/ [(Х2 - Хз) Х1 ° Х2 & (Х4 ~^ Х3 ) ^ (Х2 ~^ Х4 ) Х/ Х2 ° Хз]}

1 сеч

Примечание: Индексы у вершин спектральных составляющих ( ) означают очередность их распознавания по схеме компактного алгоритма.

2 сеч

3 сеч

4 сеч

5дро 0-го ранга

5 сеч

Рис. 11.10. Выбор 1-го шага для получения компактного алгоритма распознавания

Размерность входа (выхода) фильтра Ф : (Р,, ж, )тах = 1(1 — 1). Для реализации фильтров Ф при вычислении булевых функций на универсальных или специализированных ЦВМ целесообразно исходную формулу Р^ (жп) представить в модифицированном виде — (жп).

11.6. Оценки сложности вычислений булевых функций

В связи с появлением работ по использованию произвольного базиса в описании булевых функций при анализе и синтезе дискретных автоматов представляет интерес разработка эффективных способов вычисления булевых функций, заданных на произвольном базисе.

Предложено правило построения эффективного (компактного) алгоритма вычисления булевой функции /к (жп) по ее исходной формуле Р^ (жп), допускающей использование произвольного базиса логических операций д, € {—, V, =, А, о,

Компактность алгоритма вычислений /к (жп), обозначаемого Р^ (жп) ^ /к (жп) определяется минимальным количеством одновременно запоминаемых промежуточных результатов в процессе вычисления.

В работе приводятся оценки сложности вычислений /к (жп).

В качестве меры сложности 6 [Р^ (жп)] вычисления /к (жп) введем два типа сигнализирующих функций [154, 190]:

1) 6^ р(жп)] — функции, связанные с длительностью вычислений /к(жп) : — нижняя оценка 6^[Р^(жп)] , — верхняя оценка 6^[Р^(жп)];

2) 6о [Р^(жп)] — функции, связанные с объемом промежуточной памяти при вычислении /к(жп) : — нижняя оценка 60[Р^(жп)], — верхняя оценка 60[Р^(жп)].

О п р е д е л е н и е 11.20 (). Нижнюю оценку , то есть минимальное число шагов при вычислении Р^ (жп) ^ /к (жп), получим, если на каждом шаге переработку информации будем проводить повсеместно, то есть выполнять вычисления по типу автоматов Неймана.

Рис. 11.11. К задаче построения компактного алгоритма

Для этого необходимо на каждом к -м шаге в описании Р^Хп) вычислять одновременно

все допустимые ядра к -го ранга. Наибольшее число таких ядер может содержать описание ^(хи), спектр Бе(д?3

е1(хп), спектр БДЗ) которого является осциллирующим:

■01 = £ + 1;

1 + 1

где —-— — число локальных максимумов осциллирующего спектра (I = 3, 5, 7,...).

Верхнюю оценку 02 можно получить, если вычисления производить по принципу машины Тьюринга:

02 = I, где I — длина формулы ^(жп).

Определение 11.21 (^>1(2) ). Наименьший объем памяти, необходимой для одновременного хранения всех промежуточных результатов при вычислении по схеме ^(Хп) ^ /к(хи), будет в том случае, если результат {Кг(др)}, полученный на шаге г, используется по правилу компактности на шаге г + 1.

Следовательно, ^>1 = 2. Верхнюю оценку ^>2 можно получить из условия, что спектр р) формулы

Бе(дРр) формулы Е1(хп) относится к классу монотонно возрастающего (убывающего) осцил^

1 I + 1

лирующего спектра. Тогда очевидно справедливо (р2 = I Л—, где - — число локальных

максимумов монотонно возрастающего (убывающего) осциллирующего спектра.

Для оценки эффективности применения компактного алгоритма введем параметр, показывающий в сколько раз объем памяти, необходимый для вычисления /к(Хп) по какому-либо алгоритму, больше объема памяти, необходимого для вычисления по схеме компактного алгоритма

Следовательно, целесообразно перед началом вычислений /к(жп) по ее исходному формульному описанию Р^(жга) установить, исходя из схемы компактного алгоритма, очередность вычислений всех логических операций в Р^(жга). Для этого достаточно реализовать программным или аппаратурным методом функции фильтра.

Результатом следует считать программу для ЭВМ, реализующую компактный алгоритм вычисления ФАЛ из класса Р2 и являющуюся фильтром, при пропускании через который булевой формулы без преобразования нумеруется очередность выполнения операций. Данная нумерация гарантирует минимальное количество ячеек памяти, хранящих промежуточные результаты.

Глава 3. Конструктивизация при классификации конечных объектов §12. Пролонгация языков

12.1. Распознавание образов и конечные автоматы

В связи с развитием работ по распознаванию образов и проектированию сложных систем целесообразно выявить взаимосвязь проблемы распознавания образов и теории конечных автоматов. Даже при беглом взгляде на две названные проблемы между ними обнаруживается некоторое сходство. Действительно, основной задачей теории автоматов является синтез [1], то есть построение структуры автомата M по его некоторому исходному заданию qi € {У}. При этом, как правило, строится не любой автомат, а удовлетворяющий некоторым наперед заданным требованиям в (например, минимальное число элементов памяти, минимальное число связей между элементами и т.д). Если через [C(в)] обозначим функцию сложности структуры автомата от указанных требований, то синтез должен удовлетворять следующему условию:

Li = [min C(в)]/х, Z, S, f = const, (12.1)

где X = {£i, £2, •••, } — входной алфавит; Z = {Zi, Z2, •••, Zg} — выходной алфавит; S = = {^i, 0"2, •••, } —алфавит состояний; fz, fs —характеристические функции.

Основная проблема распознавания образов состоит в отнесении предъявленного образа к одному из эталонных классов. Если функцию сложности (стоимости) алгоритма распознавания обозначить через [С], то построение правила принятия решения о принадлежности опознаваемого образа к одному из эталонов должно удовлетворять условию

L2 = [min C(d)]/A, у,р = const, (12.2)

где A = {ai, •••,afc} — алфавит объектов распознавания; У = {уь-^ут} — пространство признаков; P = {pi, • • •, pr} — ошибка распознавания; D = {di, •••, dg} — правила принятия решения.

Из сравнения (12.1) и (12.2) можем заметить общность подходов к решению основных задач в двух различных теориях: распознавание образов и конечные автоматы.

Несмотря на внешнее сходство проблемы распознавания образов и синтеза конечных автоматов имеют существенные различия: первая строит алгоритм функционирования системы, а вторая реализует первоначально заданный алгоритм на конечном автомате.

Необходимо учитывать также, что алгоритмы, выработанные при решении проблемы распознавания образов, обычно имеют не самостоятельное значение, а требуют дальнейшей практической реализации, например, в виде аппаратно-программных комплексов. Часто системы распознавания образов являются составными частями более сложных систем. В этих условиях могут быть полезны методы синтеза, разработанные в теории автоматов [26, 153].

12.2. Об общности языков конечных автоматов и распознавания образов

Выбор языка описания является одной из центральных задач, окончательного решения которой пока не найдено как в проблеме распознавания образов, так и в теории конечных автоматов [1, 28, 29, 115, 145, 160, 167].

Выбор языка описания, удобного для выражения исходного задания и дальнейшего синтеза автомата, определяется следующими требованиями [1, 28] :

1) алгоритмической разрешимостью языка — возможность элементами выбранного языка установить реализуемость исходного задания каким-либо автоматом и, в случае существования последнего, провести его абстрактный синтез;

2) строгой формализацией — синтаксис и семантика языка должны быть четко описаны;

3) удобством и наглядностью языка при составлении заданий человеком;

4) широтой и гибкостью языка — возможность охватить все важные для практики задания на автомат (как реализуемые, так и нереализуемые);

5) лаконичностью языка — возможность получения коротких описаний, избыточная информация в тексте должна быть ограничена определенным минимумом;

6) абсолютной четкостью языка — не допускается неоднозначность толкования одних и тех же условий сходного задания элементами выбранного языка;

7) удобством перевода (трансляции) описания задания с одного языка на другой.

Многочисленные исследования в теории конечных автоматов [26, 29] показали, что задача

создания единого универсального языка алгоритмически неразрешима. Поэтому поиск наиболее удобного, с точки зрения указанных требований языка, в теории конечных автоматов идет как по пути определения отдельных классов функций, реализуемых в виде конечного автомата, так и по пути создания специальных формализованных языков, запись условий работы на которых дает гарантию их реализуемости [28].

При всем многообразии существующих языков большинство из них имеет в своей основе общий абстрактный язык (язык математической логики и теории множеств) и различается лишь степенью общности, с которой выражает алгоритмы функционирования конечных автоматов.

Рассмотрим подходы к выбору языка в проблеме распознавания образов. В связи со спецификой решаемых задач под языком здесь будем понимать способ описания системы информативных признаков. Таким образом, язык описания в этом случае рассматривается как информационная интерпретация формального языка [28, 41, 46, 114, 116, 186].

Сформулируем требования, предъявляемые к выбору языка для описания распознаваемых объектов:

1) возможность выполнения формализованного описания признаков;

2) возможность проверки достаточности и необходимости конкретных признаков;

3) инвариантность описания признаков при допустимых эквивалентных преобразованиях;

4) абсолютная четкость языка описания;

5) удобство и наглядность языка при составлении описания человеком;

6) богатство и гибкость языка — класс объектов, описываемых на данном языке, должен быть достаточно большим;

7) лаконичность языка — возможность получения коротких описаний элементами выбранного языка;

8) удобство трансляции описания с одного языка на другой.

Как видим, основная часть (пп. 1, 4-8) сформулированных требований к информационной интерпретации формального языка в распознавании образов совпадает с требованиями к его логической интерпретации в теории конечных автоматов. Это единство требований должно способствовать использованию общих методологических приемов при выборе языка описания рассматриваемых теорий [186, 187, 191, 193].

В проблеме распознавания образов задача создания универсального способа поиска полезных признаков не получила еще своего решения даже в таком виде, как в теории конечных автоматов, то есть до сих пор не доказано: алгоритмически разрешима она или нет [1, 2]. Поэтому ее решение идет по пути создания специальных языков, удовлетворяющих конкретному типу задач распознавания. Следует заметить, что оптимального языка описания, вне зависимости от алфавита объектов распознавания, не существует [27, 41].

С учетом исследуемых в работе проблем конструктивизации отметим специальные языки описания в распознавания образов, уже сейчас близкие к языкам теории конечных автоматов.

Как некоторая разновидность языка типа рекурсии может быть указан язык конечных состояний, впервые предложенный Селфриджем [126].

Весьма многообещающим направлением в создании формализованных языков описания следует считать определение правил составления сложных изображений из элементарных частей по методу формальных грамматик [132].

Для распознавания отношений между элементами образа можно использовать подход, предложенный в работе [49]. Здесь используется язык алгебры логики, позволяющий с помощью фиксированного набора отношений (операции типа ФАЛ из класса Р2 и элементов ж^ € £2 = {0,1} ) получить логическое описание объекта любой сложности. Достоинство этого

метода заключается в том, что имеется возможность получения коротких описаний использованием уже разработанных приемов минимизации функций алгебры логики.

Возможность применения языка математической логики не только для распознавания отношений между элементами, определяющими структуру образа, но и для аналитического описания его геометрических свойств доказывается созданием языка К -функций [141]. На возможность создания языка описания для распознавания объектов путем разбиения признаков на элементарные логически синтезируемые части — «кирпичики» указывается работой М.М. Бонгарда [20].

Следует подчеркнуть, что намечающиеся многочисленные подходы в распознавании образов к созданию языка описания, связанного со структурой распознаваемых образов, фактически интуитивно уже используют приемы создания языков в теории конечных автоматов.

Пролонгация языков рапознавания образов на языки теории конечных автоматов позволяет, с одной стороны, учесть особенности исследуемых объектов, а с другой — требования к синтезу оптимальной структуры соответствующего распознающего автомата [42, 43].

§ 13. Дискретные функции Уолша

Рассмотрены дискретные функции Уолша при произвольном конечном числе точек определения и построены матрицы Уолша для разложения одномерных и двумерных сигналов как наиболее часто встречающихся в задачах распознавания образов с помощью ЦВМ.

13.1. Аналитические методы расчета Х- и Х-спектров

Использование неаналитических базисов для аппроксимации сигналов на ЦВМ открывает новые возможности в разработке функциональных преобразователей и специализированных вычислительных устройств [39, 148].

Особый интерес при этом представляет аппроксимация сигналов кусочно-постоянными функциями типа Уолша, Хаара и Чебышева-Маркова [40, 148, 150].

При практическом использовании такого вида разложений в ряд Фурье возникает задача вычисления обобщенных спектров (коэффициентов ряда Фурье) типовых функций [25]. Численные методы расчета обобщенных спектров неудобны для теоретического анализа, поэтому при проектировании функциональных преобразователей есть смысл рассматривать аналитические методы расчета спектров в неаналитических базисах [133].

Известен аналитический метод расчета ^-спектров (спектров Уолша) [148].

В п. 13.1 дается аналитический метод расчета Т- и Х-спектров (спектров Чебышева-Маркова и спектров Хаара) [108].

Т- и Х-спектры определяются следующим образом [148, 150]:

1

о

1

0

1

о

где {Тзп(х),Тап(х)} —система Чебышева-Маркова:

(13.1)

( то-1

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

2 2 <Е

т— 1

ХтзУХ) = —2 2 ) ж €

2т—15 2т у '

2.7-1 .7

.7-1 2^-1 \ ^ = 1 2 2т_1-

2т-, 2т-! I = 1,2,3...;

о, ж €

.7-1 .7

2т— 1 ) 2т — 1

Задача аналитического расчета Т- и Х-спектров решается с использованием преобразования Лапласа [4].

Изображение неаналитических функций Хаара и Чебышева-Маркова являются аналитическими функциями:

1 — е-р ., р

Т*п(р) =

р 4п

, , то-1 О'-!) „ 1-е 2ТО-1 п

Хту(р)= 2—---Ш 1

р

т—1 '

Учитывая свойство преобразования Лапласа [4],

с+те

J / (ж)<7 (1 — х)йх = ■ J Т (р) 5 (р)ерйр.

Далее, используя свойства функций Хаара и Чебышева-Маркова [148, 150], получаем формулы для аналитического расчета Т- и Х-спектров:

с+гте

с+гте

р

с+г оо —-

то-1 1 Г ЗУ 1-е 2т-1 Г)

= ] Р{р)е—^-----^^гФ-

Ниже приводятся аналитические выражения Т- и Х-спектров для некоторых типовых функ-

ций.

I. Т [е-л1„ =

1 - е

—л

Ш4га

Тс

Л х

1-е"л / Л А.

=-г-- -Ш---1 + е4п

п Л V 4п

л

X

—л х

то—1 1 - егто-1 Д ,-л = -2 2 ----.¿/г,-~.е гто-1 _

Л 2т—1

II. =

т Г 1 ^ Ш Ш 1

Гс 81по;я; га =--Ьд— + -

' ш 4п ш

ш Л 1 , ,

СОЭ Сс> + сое ---сое ш 1 —— ) — 1

4п \ 4п

то-1 Ш . 1 г 7* Ш Ш

X ятуж!,- = -2 2 • иа-—) • — кт-- + эт--•(1 — 7).

1 ^ ^ 2т+1 ш 2™ 2т—1

1

с—те

с—гте

с—гте

с—г те

Л

III. Ta[casux]n = ±^-tg%i,

m Г 1 COS W — 1 W 1 г / 1 N W 1

lc cos w¡cL =--ta---1—smw(l ——) — sin to + sin — ,

w 4n w 4n 4n

m — 1

IV. T8[x]n =

Tc[xn] = 0,

1 — 3m

X [x]mj = —2 2 .

Результаты численных контрольных просчетов подтвердили правильность предложенного аналитического метода расчета Т- и Х-спектров.

13.2. Дискретные функции Уолша при произвольном конечном числе точек определения

Целью исследований данного параграфа является выявление свойств дискретных функций Уолша, определенных в произвольном числе точек, и особенностей разложения сигналов по базисным функциям, построенным на основе дискретных функций Уолша, когда число отсчетов не равно целой степени 2.

Часто для анализа дискретных сигналов используется дискретное преобразование Фурье. Известно [155], что базис, состоящий из дискретных функций sin и cos, ортогонален при любом числе точек определения.

В случае дискретных функций Уолша подобная картина не наблюдается, так как базис дискретных функций Уолша ортогонален только тогда, когда число отсчетов равно целой степени 2.

Исследуется влияние числа точек определения дискретных функций Уолша на их свойства. Предлагается использовать для разложения сигналов построенные матрицы Уолша Ym порядка m, где m — число точек определения оригинала.

В общем случае, прежде чем проводить разложение сигнала, удобно предварительно произвести ортогонализацию базиса.

Введем обозначения, сложившиеся в литературе по проблематике неаналитических базисов [117]:

N ^ {0,1, 2,...} — множество натуральных чисел;* Z + ^ {1, 2, 3,...} — множество целых положительных чисел; R — множество действительных чисел;

wm(k) — i-я дискретная функция Уолша, определенная в m точках, k = 0,1,...,m — 1; m € Z+;

M — пространство решетчатых функций [117]:

f (k) : M ^ R , M ^ {0,1,..., m — 1};

m — размерность пространства M. В пространстве M задано скалярное произведение:

m-1

(fi(k),f2(k)) = x; fi(k) ■ f2(k),

k=0

где fi, f2 € M и вводится норма с помощью формулы

\\№\\ = у/(№,№),

где f € M.

* — в отличие от общепринятого, такое обозначение учитывает особенности представлений функции Уолша [117].

13.2.1. Дискретные функции Уолша

Дискретные функции Уолша, определенные в т € 2+ точках, образуются равномерной выборкой непрерывных функций Уолша [117]:

и?(к) = сиг ■ Щ - кТт), (13.2)

где То = т ■ тт — временная база; тт — интервал дискретизации во временной области; - к ■ тт) —дельта-функция.

Рассмотрим частный случай, когда т = 2п, п € N.

Дискретные диадно-упорядоченные функции Уолша (Пэли) с числом отсчетов, равным целой степени 2, можно генерировать с помощью рекуррентных соотношений:

с^(0) = 1, шЩ(к) = (- 1)ко

I Ч (I■ г = ...,т - 1;

п—1

где [|] — целая часть числа к = ^2р ■ кр] п = 1,2,...; к = 0,1,..., т — 1.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

р=0

Известно [151], что функции Уолша (13.3), определенные в т точках, где т = 2п, п € N можно представить в следующем виде:

1 п — 1

Чт(к) = П (-1)гп—р—= (-1)р=0 , (13.4)

р=0

г = 0,1,..., т — 1. Функции (13.4) обладают следующими свойствами [151]:

(Чт(к),^т(к)) = т ■ ^, (13.5)

Г Г 1, если г = 7; где ¿¿з = < п . , .

[0, если г = 7.

Кроме того, имеет место соотношение [151]:

<(к) = ^(г)- (13.6)

Лемма 13.1. Значение дискретной функции Уолша шт(к) в точке т = 2п, к € {0,1,...,т — 1}, п £ 91 совпадает, со значением, непрерывной, функции, Уолша ,

взятым на интервале í = [к ■ тт, (к + 1) ■ тт], где т ■ тт = То.

Справедливость леммы 13.1 следует непосредственно из определения дискретной функции Уолша (формула (13.2) при т = 2п, п € ЭД). Рассмотрим общий случай, когда т € 2

Основной результат можно сформулировать в виде следующей теоремы 13.1.

Теорема 13.1. Пусть г = [и ■ к] — целая часть числа V ■ к, где V = т € € + 1, ТУ = 2п,п € N. Тогда дискретные функции Уолша со^(к) можно предста-

вить в виде

п—1

¿п — р—1^гр

^Г(к) = (—1)р=0 , (13.7)

к = 0,1,..., т — 1; г = 0,1,..., 2п — 1.

Доказательство. Так как функции ш^ (к),ш™ (к) получены из непрерывных функций Шг(-^г) равномерной выборкой с интервалом дискретизации соответственно т^,тт, то имеем тм ■ N = тт ■ т = То.

По определению V = ^ , следовательно,

Тт = ТМ ' V . (13.8)

Умножая левую и правую части (13.8) на к € М, получим

ттк = тмvk . Из условий теоремы 13.1 следует, что

1 < V < -т— • (13.9)

1 + 2/2™ у 7

Откуда, умножая (13.9) на к € М, имеем

к^и-к^-— .

1 + 2/ЛГ

С другой стороны,

< N .

1 + 2/Ж

Следовательно, имеет место неравенство

к ^ V ■ к ^ N.

Отсюда следует, что точка тт ■ к находится на интервале

* = [тм ■ [V ■ к], тм ■ ([V ■ к] + 1)]

или, что то же самое, на интервале * = [г ■ тм, (г + 1) ■ тм]. В силу леммы 13.1 и соотношения (13.4) имеем

п-1

X] гп-р-1^Гр

ш™(к) = шМ (г) = (—1)р=0 ,

где г = 0,1,..., 2п — 1. Теорема 13.1 доказана. □

13.2.2. Базис дискретных функций Уолша

Если рассматривать значения функций Уолша (13.4) как элементы матрицы ^, то получим так называемую [151] матрицу Адамара Нм порядка N. Аналогично для функций (13.7) построим матрицу [а]м,т размера N х т, где т € + 1, Пронумеруем по порядку

столбцы матрицы Нм элементами из индексного множества 3 = {0,1, ...,N — 1}, Обозначим через множество {0, [г/],..., [г/ • (т — 1)]}, где т € + 1,..., -/V}. Тогда очевидно, что матрицу [а]м,т можно получить из Нм вычеркиванием столбцов, соответствующих индексам из множества .

Предложение 13.1. Существует ровно т линейно независимых дискретных функций Уолша, определенных в т точках.

Доказательство. Обозначим через гапд[а]м,т ранг матрицы [а]м,т. Так как т ^ N, то гап^[а]м,т ^ т. С другой стороны, в силу соотношений (13.5) и (13.6) все столбцы матрицы [а]м,т, полученной из Нм, линейно независимы. Отсюда следует, что гапд[а]м,т ^ т. Следовательно, гапд[а]м,т = т. Этот факт говорит о том, что матрица [а]м,т имеет

ровно т линеино независимых строк, то есть существует ровно т линеино независимых функций Уолша, определенных в т точках. Предложение 13.1 доказано. □

Таким образом, вычеркивая из (13.7) линейно зависимые функции Уолша, мы получим базис для разложения решетчатых функций / € М.

Перенумеруем базисные функции индексом г € М и обозначим базис через Ш. Заметим, что размерность базиса Ш совпадает с размерностью пространства М, то есть базис Ш полный [155].

Если т = 2П, п € N то базис Ш неортогонален [155]. Проведем ортогонализацию базиса следующим образом:

^о = Шо, г-1 / \

.. ||2 -ц, (г = 1,2, ...,т - 1). ¿=0 ^11

Обозначим полученную ортогональную систему функций V через V. Нормируя систему V следующим образом:

л/т иг = 71-ГТ • ^г,

добьемся выполнения соотношения

«(Л),^^)) = т ■

Таким образом, получена ортогональная нормированная система функций и^, которую обозначим через и. Так как система Ш полна, то, согласно работе [112], полна и система и.

13.2.3. Одномерное дискретное преобразование Уолша

Подготовив базис и ортогональных нормированных функций ■ит(Л), можем использовать его теперь для разложения решетчатых функций / (й) € М.

Рассматривая значения функций системы и как элементы матрицы , получим матрицу Ут. порядка т. Назовем матрицу матрицей Уолша. Ясно, что

Ут ■ УТ = т ■ Е ,

где Е — единичная матрица порядка т; Т — знак транспонирования.

Пусть [/] — матрица-столбец оригинала /(й) € М; Е — матрица-столбец коэффициентов разложения.

Тогда одномерное преобразование Уолша в матричной форме имеет вид

Е = Ут ■ [/]. (13.10)

Обратное преобразование с учетом (13.10) запишется так:

13.2.4. Двумерное дискретное преобразование Уолша

Обозначим пространство функций двух переменных ^ : М1 х М2 ^ К через Ь ^ |(М,т1,т2),Мй}, здесь Мй = {0,1, ...,тй - 1},тй € ^+, (5 = 1, 2).

Рассматривая значения функции ^ € Ь как элементы матрицы [<£>] размером т1 х т2, а коэффициенты разложения в виде матрицы Ф, получим следующие соотношения для прямого и обратного преобразования Уолша. Прямое преобразование:

ф = ут1 .

Обратное преобразование:

V

13.2.5. Другая форма дискретных преобразований Уолша

В п. 13.2.2 были рассмотрены матрицы [а]м,т размера N х т, где т € + 1, N = 2п,п € N. Заметим, что имеет место следующее соотношение:

И^тИлТ.т = N ■ Е, (13.11)

где Е — единичная матрица порядка т.

Пусть [^>] — матрица-столбец оригинала / € М, [Р] — матрица-столбец образа. Тогда одномерное преобразование Уолша примет вид

[Р] = И*,/

Обратное преобразование с учетом (13.11) запишется так:

Пусть [^>] — матрица оригинала ^ € (М, т1,т2) размером т1 х т2; [Ф] — матрица коэффициентов разложения размером N1 х N2. Здесь

N

€ + Ж = 2гаа, щ еШ, (5 = 1,2).

Тогда двумерное дискретное преобразование Уолша можно записать так:

[Ф] = [а]*1,т1 ММ*2,т2 . Обратное преобразование примет вид

М = дг^^М^ьШ! [Ф]М^2,ш2-

Преобразования в п. 13.2.5 обладают тем преимуществом перед преобразованиями, описанными в пп. 13.2.3 и 13.2.4, что они не требуют предварительного построения матриц Уолша, а используют матрицы вида [а]*,т, которые легко получаются из матриц Адамара вида Н*. К недостатку этих преобразований следует отнести то, что в общем случае коэффициентов разложения получается больше, чем точек оригинала.

13.3. Алгоритм быстрого двумерного преобразования Уолша-Адамара

Использование спектральных преобразований на ЦВМ при обработке изображений вызывает необходимость поиска оператора, удовлетворяющего следующим требованиям: оператор должен быть двумерным, иметь обратный оператор, обладать свойством усреднения и обеспечивать соответствующее перераспределение энергии изображения [144]. Наибольший практический интерес представляет оператор, который, кроме того, является обратным по отношению к самому себе и допускает быструю вычислимость.

Вышеуказанным требованиям удовлетворяет преобразование Уолша-Адамара, использующее симметрические матрицы Адамара [138].

Пусть Р(г, 1) представляет собой матрицу значений интенсивности исходного изображения в N хN точках. Тогда двумерное преобразование Уолша-Адамара функции Р(г, 1) можно записать в виде матричного произведения

[А] = [Н] ■ [Р] ■ [Н], (13.12)

где [Н] — симметрическая матрица Адамара порядка N.

Умножение на [Н] слева и справа в равенстве (13.12) дает обратное преобразование Уолша-Адамара:

и = [Я] • [4 • Iя]-

Для симметрических матриц Адамара порядка N = 2м двумерное преобразование Уолша-Адамара можно записать в виде ряда

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

N — 1 N — 1

, m — (r,1) ■ Wn(r) ■ Wm(l),

m, m

r=0 ¿=0

где Шп(г), Шт(1) — дискретные функции Уолша, п, т € {0,1,..., N — 1 } .

N-1

I] П^ Г; Шп(г) = (—1) ;=0 ,

где п г, г — двоичные аналоги п, г соответственно. Например,

(г)10 С/с = (гм-1 Гм—2 —Г1Го)2 С/с ,

где

г г € {0,1}, г € {0,1,...., N — 1}.

Такое представление дискретного преобразования Уолша-Адамара используется для матриц Адамара, записанных в естественной форме. Данное преобразование можно выполнять на ЦВМ с помощью алгоритма, аналогичного алгоритму Кули-Тьюки для преобразования Фурье [111].

Для построения алгоритма быстрого двумерного преобразования Уолша-Адамара исходную матрицу значений функции Е(г, 1) разделим на четыре подматрицы [107]:

Х1,1 = = К, (13.13)

Xr>l=Fr+Nt-, X =Fr+NJ+N,

где г,1 € {0,1,..., f - 1}.

Каждая подматрица содержит Ц- х Ц- членов, и для каждой из них дискретное преобразование Уолша-Адамара определяется формулой

Я_1 1

2 2

ва,т — Е Е ■ wra(r) ■ wm(i), (13.14)

r=0 ¿=0

где n, m € {0,1,..., f - 1}, а € {I, II, III, IV}.

Учитывая следующие свойства функции Уолша:

N

Wn(r) = Wr(n); Wn(r + —) = Wra(r);

Wn+N (r) = Wra(r); ^ra+f(r + ^) = -^ra(r), где n,r G {0,1,..., ^ — 1}, из (13.13), (13.14) получим рекуррентные соотношения:

A _ R1 + R11 + R111 +

, m , m + Rn, m + Rn, m + Rn , m,

A _ RI _ RII I rIII _ rIv (13 15)

A _ RI + RII - rIII - RIV

n,m-\n, m > Rra, m -D n,m J-'n,mi

A _ Rl - RH - RIII + RIV

где п,т € {0,1,..., ^ — 1}.

Таким образом, вычисление коэффициентов дискретного преобразования Уолша-Адамара матрицы N х N чисел можно свести к вычислению коэффициентов этого же преобразования

четырёх подматриц с ^ х ^ членами. Процесс деления матриц можно продолжить до тех пор, пока не получим N х N одномерных матриц. Так как дискретное преобразование Уолша-Адамара от одного числа равно самому числу, то коэффициенты этого преобразования можно получить из исходной матрицы с помощью промежуточных вычислений по формулам типа (13.15).

В результате работы алгоритма получаются требуемые коэффициенты двумерного преобразования Уолша-Адамара, расположенные в двоично-инверсном порядке.

Программа, реализующая алгоритм быстрого двумерного преобразования Уолша-Адамара, составленная на языке символического кодирования, занимает 205 ячеек памяти вместе с рабочими ячейками. Для хранения массива Ап,т требуется N х N ячеек оперативной памяти. Время работы программы 0, 0015 ■ N2 ■ log2 N с.

Нужно отметить следующие достоинства алгоритма быстрого двумерного преобразования Уолша-Адамара.

2 -ж г

1. Если для нахождения Фурье — образа вычисляют степени е N , то в случае преобразования Уолша-Адамара необходимость в этой операции отпадает: все вычисления сводятся к операциям сложения и вычитания. Минимальное число операций для быстрого двумерного

N 2

преобразования Уолша-Адамара в -- раз меньше, чем для прямого метода.

^2 N

2. В отличие от комплексного преобразования Фурье в случае преобразования Уолша-Адамара не требуется дополнительного массива ячеек для мнимой части преобразования.

3. Алгоритм позволяет получать оценки как прямого, так и обратного преобразования Уолша-Адамара.

Таким образом, предлагаемый алгоритм быстрого двумерного преобразования Уолша-Адамара вследствие присущей ему эффективности может найти применение в кодировании изображений в целях сокращения размерности [138], для повышения качества изображения путем частотной фильтрации [183], в задаче выбора признаков [184] и других задачах распознавания образов [185].

13.4. Связь адамаровского упорядочивания функций Уолша с секвентным и диадным

Обработка сигналов спектральными методами — хотя и традиционная, но постоянно обновляющаяся и развивающаяся дисциплина, широко применяющаяся в науке и технике. Среди множества спектральных описаний сигналов описание в неаналитических базисах (Уолша, Адамара, Крестенсона и т.д.) представляется перспективным в решении прикладных задач. В связи с этим установление связей между различными формами спектров Адамара-Уолша, позволяющих приводить к общему знаменателю — спектру Адамара, наиболее просто реализуемого программой рекурсивного типа, следует считать актуальным. Сведение к спектру Ада-мара позволяет с помощью сортировки получать по этому спектру также диадное и секвентное упорядочение коэффициентов спектра Уолша, что значительно упрощает задачу вычисления спектров на основе универсальной программы, реализующей спектр Адамара [77].

В п. 13.4 рассматриваются три вида преобразований Адамара-Уолша, в зависимости от упорядочивания функций Уолша: адамаровское (естественное), секвентное и диадное (порядковое) упорядочивание. Если рассматривать базис функций Уолша в том или ином упорядочивании, то содержание базиса остается неизменным, меняются местами только номера коэффициентов получаемых спектров. В связи с этим значения функций Уолша образуют так называемую обобщенную матрицу Адамара независимо от упорядочения функций Уолша. Однако в литературе под матрицей Адамара понимают обычно адамаровское (естественное) упорядочение. Поэтому будем придерживаться установившегося понятия матрицы Адамара.

13.4.1. Матрица Адамара

Рассмотрим систему дискретных функций Уолша:

W¿ (к), (г = 0,1,..., М — 1; к = 0,1,..., М — 1).

Обозначим её через {W} .

Требование ортогональности записывается так:

M-1

Е Wi (k) ■ Wj (k) = 0, i = j . (13.16)

fc=0

Условие ограничения значений функций

M-1

Y^ Wi (k) ■ Wj (k) = M. (13.17)

fc=0

Пусть Wi (k) — значение i -й функции в k -й точке. Если значения функции Wi (k) рассматривать как элементы матрицы H (Wi (k) = h ifc), то получим матрицу Адамара порядка M.

Определение 13.1 [117]. Матрицей Адамара называется квадратная ортогональная матрица H с элементами, равными +1 и -1, удовлетворяющая условию

HHT = MI, (13.18)

где M — порядок матрицы H; I — M -мерная единичная матрица; HT — транспонированная матрица H.

Написанные выше уравнения (13.16) и (13.17) сводятся к матричному уравнению (13.18). Матрице Адамара может быть дана (по аналогии с преобразованием Фурье) частотная интерпретация.

Определение 13.2. Секвентой, как предложил Хармут для отличия от понятия частоты, применяемого в sin - и cos -рядах, называют число изменений знака вдоль строки матрицы Адамара.

Такая частотная интерпретация строк матрицы Адамара эквивалентна прямоугольным волнам с амплитудой ±1 и с периодом — единиц [7, 67].

13.4.2. Свойства матриц Адамара

1. Известно, что

Wi (k) = Wfc (i),

(i = 0,1,..., 2m - 1; k = 0,1,..., 2m - 1).

Следовательно, матрицы Адамара H порядка M = 2m, (m — натуральное число) симметричные, то есть

H = HT.

2. Из свойства 1 и определения 13.1 вытекает

H2 = MI,

где H — матрица Адамара порядка M; I — единичная M -мерная матрица.

3. Для M = 2 матрица Адамара выглядит так:

H1 = ( + +

Матрицы Адамара более высокого порядка можно генерировать с помощью следующего рекуррентного соотношения

Н„

Нп-1 Нп-1 Нп-1 - Нп-1

(п = 2, 3,...)

4. Пусть имеются 2 матрицы Адамара: матрица А порядка М и матрица В порядка N. Тогда матрица

/ ацВ й12В ... а1мВ \ Й21В Й22В ... Я>2М В

С =

\ аМ 1В аМ2В ••• аММВ /

является матрицей Адамара порядка М х N.

5. Если Н — матрица Адамара порядка N то матрица

С =

Н Н Н -Н

есть матрица Адамара порядка 2Ж.

Это свойство вытекает из свойства 4. Если в качестве матрицы А взять матрицу Адамара порядка М = 2, то в качестве матрицы В выступает матрица Н порядка N.

Матрицы Адамара могут быть различны по своей природе:

а) естественная форма. Матрица Адамара в естественной форме получается с помощью свойства 3;

б) секвентное представление (порядковая форма). В данном случае строки матрицы Адамара соответствуют секвентно-упорядоченным функциям Уолша;

в) диадная форма. Здесь строки матрицы Адамара упорядочены в соответствии с диадно— упорядоченными функциями Уолша;

г) комбинированная форма. Может быть получена, если в свойстве 4 матрицы Адамара А и В имеют различную природу.

Приведем для примера матрицы Адамара порядка М = 8 различной природы:

а)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

секвента

Н

«3

(+ + + + + + + + \ 0

+ - + - + - + - 7

+ + - - + + - - 3

+ - - + + - - + 4

+ + + + - - - - 1

+ - + - - + - + 6

+ + - - - - + + 2

V + - - + - + + - 5

б)

/+ + + + + + + +\ + + + + - -- -

+ + + +

- - + + + + - -

+ - - + + - - +

+ - - + - + + -

+ - + - - + - +

V + - + - + - + - /

секвента 0 1 2

3

4

5

6 7

в)

H,

g з

/+ + + + + + + +\

+ + + + - - -

+ + - - + + -

+ - + - + - +

+ + - - - -

+ - + - - +

+ - - + + -

+ + - + - +

\ + - - + - + + - / г) положим

A = H

+ + + -

B = H

g 2

Тогда

C =

секвента 0 1

3 7 2 6

4

5

( + + + + \

+ + - -

+ - + -

V + - - + )

( + + + + + + + + \ 0

+ + - - + + - - 3

+ - + - + - + - 7

+ - - + + - - + 4

+ + + + - - - - 1

+ + - - - - + + 2

+ - + - - + - + 6

V + - - + - + + - 5

13.4.3. Преобразования Адамара-Уолша

Пусть имеется массив / (к) М действительных чисел, где М = 2т, (т — натуральное число), (к = 0,1,..., М - 1).

Одномерное преобразование Адамара-Уолша в матричной форме имеет вид

[A (n)] = [H (n,k)] [f (k)],

где

[f (k)] =

f (0) f (1)

f (2m - 1)

[A (n)] =

A (0) A (1)

A (2m - 1)

[H (n, k)] —матрица Адамара порядка M = 2m, ( m —натуральное число). Учитывая свойства 1 и 2, получим обратное преобразование Адамара-Уолша

[fm = jj[H(k,n)] [А{п)\.

Одномерное преобразование Адамара-Уолша можно показать в трех видах:

а) естественное представление (адамаровское);

б) секвентное представление (порядковая форма);

в) диадное представление. Естественное представление

M-1

m— 1

Е/, niki f (k) (-1) i=0

fc=Q

(n = 0,1,...,M - 1).

Обратное преобразование имеет вид:

1 м-1 т-1 к

I V—пг кг

п=0

где члены п и к получаются из двоичного представления п и к соответственно, то есть п = 2т-1пт-1 + 2т-2пт-2 + ... + 2гп + ... + 2щ + по,

к = 2т-1кт-1 + 2т-2кт-2 + ... + 2% + ... + 2к1 + ко,

(пг , кг € {0,1}).

Секвентное представление

м-1 т-1- / N и

-—- > 9г(п) кг

АС / (к)( —1) ,

к=о

(п = 0,1,...,М — 1),

где

£о (п) = пт-1, #1 (п) = пт-1 + пт-2, £2 (п) = пт-2 + пт_з,

^т-2 (п) = Щ + по. Обратное преобразование имеет вид:

1 м-1 т-1-^

м

n=0

Диадное представление

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

M-1 m-1

ЕУ] пгкг

f (k)(-1) г=0 , (n = 0,1,...,M - 1) , (13.19)

fc=0

где n — зеркальное отражение числа n, имеющего m двоичных разрядов (bit reversal) , то есть если

n = 2m-1nm_2 + ... + + ... + 2ni + no,

то п = 2т-1по + 2т-2щ + ... + 2т-(г+1Ч + ... + 2гпт-(г+1) + ... + пга-Ь Выражение (13.19) можно записать в другом виде:

м-1 т-1 к

А (п)=£ / (к) (—1) ;, (п = 0,1,..., М — 1).

к=о

Обратное преобразование имеет вид:

м-1 т-1 к

(») (-1) =о. 1. •••>м -1) ■■

к=о

13.4.4. Двумерное преобразование Адамара-Уолша

Пусть таблица / (ж, у) представляет набор М2 точек оригинала (М = 2т, т — натуральное число). Тогда двумерное преобразование Адамара-Уолша А (и, V) для / (ж, у) определяется матричным уравнением

[А (и, V)] = [Н (V, у)] [/ (ж, у)] [Н (ж, и)], (13.20)

где [Н (г>,у)] , [Н (ж, и)] — матрицы Адамара порядка М = 2т. Учитывая свойства (1), (2), получим обратное преобразование Адамара-Уолша в виде

[/ 0*, У)] = ¿2 [Я *>)] *>)] .

Двумерное преобразование Адамара-Уолша можно записать в другом виде:

[А(и, V)] = {([/ (ж,у)] [Н (ж,и)])т [Н (у, V)]' Т

Тогда обратное преобразование Адамара-Уолша имеет вид

[/ (х, у)] = ([А (и, у)]т [Н (у, [Я (ж, и)]. (13.21)

Если матрицы Адамара [Н (г>,у)] = [Н (у,г>)] и [Н (и, ж)] = [Н (ж, и)] одной природы, то имеет место

[Н (V, у)] = [Н (у, V)] = [Н (и, ж)] = [Н (ж, и)] = Н. Следовательно, соотношения (13.20)-(13.21) запишутся в более удобном виде:

[А (и,и)] = Н [/ (ж, у)] Н, [/(я,^ = (и,г;)] Я

или

Т

[А (и,«)] = {([/ (ж, у)] Н)т н} , [¡(х,у)] = ^{[А(и,ь)]тн)ТН.

Для симметричной матрицы Адамара порядка М = 2т, т — натуральное число, двумерное преобразование Адамара-Уолша может быть записано в трех видах.

1. Естественное представление (адамаровское)

М-1 М-1

Аа М= £ £/(ж,у)(-1)р(х'У'и'^),

ж=0 у=0

т—1

где р (ж,у,и,^)= X] («¿жг + ^уг), (и, V = 0, 1,...,М - 1) .

г=0

Члены иг, жг, V и уг получаются из двоичного представления чисел и, ж, V и у соответственно.

Обратное преобразование Адамара-Уолша имеет вид

1 М—1 М —1

м=0 ^=0

(ж, у = 0,1,...,М - 1).

2. Секвентное представление (порядковая форма)

м-1 м-1

Ас (и,«)= £ £/ (ж,у)(—1)^>у>«>4 ж=о у=о

(и,« = 0,1,...,М — 1),

т-1

где д (и, V, ж, у)= Е (^ (и) ж» + ^ (V) у*).

г=о

Обратное преобразование имеет вид

1 м-1 м-1

«=о ^=о (ж, у = 0,1,...,М — 1).

3. Диадное представление

м-1 м-1

А (и,«)=£ Е/(ж, У) (—1)г(ж'у'и'^),

ж=о у=о (и,« = 0,1,...,М — 1),

т-1

где г (ж,У,и,«)= Е (ит-(г+1)жг + «т-(г+1)У^ . г=о

Обратное преобразование имеет вид

1 м-1 м-1

«=о ^=о (ж, у = 0,1,...,М — 1).

13.4.5. п-мерное преобразование Адамара—Уолша

Пусть функция / (ж1, ж2,..., жп) определена в М = 2т точках, где т — натуральное число.

По аналогии с 2-мерным преобразованием Адамара-Уолша запишем п -мерное преобразование в трех видах.

1. Естественное представление

м-1 м-1 м-1

А (и1, и2, ..., и„) = £ £ ... £ / (ж1, ж2, ..., жга) X ( — 1)р(Х1 ' Х2 ' - > > ^ >«2 ' - ' «п) ,

Ж1=о Х2=о жп =о

т-1

где р (ж1,ж2, ...,ж„,и1,и2, ...,и„) = Е (и1,гж1,г + ... + и^ж^г).

г=о

Обратное преобразование Адамара-Уолша имеет вид

1 м-1 м-1 м-1

/(ж1,ж2,...,жга) = Е Е ••• Е x

х (—1)

М п

«1=о «2=о «п=о

р(«1 , «2 , ... , «п , Ж1 , Ж2 , ... , Х„)

(ж1, ж2,..., жп = 0,1,..., М - 1). 2. Секвентное представление (порядковая форма)

М—1 М—1 М —1

Ас («Ъ«2, ...,ип) = ^ ^ ... ^ / (жьж2, ..^ж^) х

Х1=0Х2=0 хп=0

х (- 1)?(ж1 , Х2 , ... , Х„ , «1 , «2 , ... , «п)

(и1, и2,..., = 0, 1, ..., М - 1) ,

где

М—1

£ (ж1,ж2, ..., жга,и1,и2, ...,ип) = ^ (£г С^) жМ + £г (^2) ж2,г + ... + £г («п) ж„Д

г=0

а

£0 ) = и^т— 1 £1 (и,- ) = и^т— 1 + 2, £2 (и,- ) = и^т—2 + и3;т—3,

£т—1 (и) = и^д + и3;0 , (; = 1, 2, ..., п) Обратное преобразование запишется так:

М—1 М—1 М—1

мп

«1=0 «2=0 «п=0

х (-1)?(«1 , «2 , ... , «п , Х1 , Х2 , ... , Хп)

(ж1, ж2,..., жп = 0,1,..., М - 1).

3. Диадное представление

М—1 М—1 М —1

АЙ («1, «2, ...,ип) = ^ ^ ... ^ / (ж 1, ж2, ..^ж^) х

Х1=0 Х2=0 xn=0 X (-1)г(х1 , Х2 , ... , Хn , «1 , «2 , ... , «п)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

(и1, и2,..., ип = 0,1,..., М - 1),

где

т—1

Г (ж 1, ж2, ..., жга, и1, и2, ..., ига) = 52 (и1)т—(г+1)ж1,г + и2,т— (г+1)ж2,г + ... + ига>т— (г+1)жп,г)

г=0

Обратное преобразование

1 М —1 М—1 М—1

¡(х1,х2,...,хп) = — ^2 Е - Е Ад(иъи2,...,ип) X

«1=0 «2=0 «п=0

X (-1)г(«1 > «2 , ... , «п , Х1 , Х2 , ... , Хп)

(ж1, ж2, ..., жп = 0, 1, ..., М - 1) .

г (Юс/с) г (2 с/с) д(г) С (г)

0 0000 0000 0000

1 0001 0001 0001

2 0010 0011 0011

3 0011 0010 0010

4 0100 0110 0111

5 0101 0111 0110

6 0110 0101 0100

7 0111 0100 0101

8 1000 1100 1111

9 1001 1101 1110

10 1010 1111 1100

11 1011 1110 1101

12 1100 1010 1000

13 1101 1011 1001

14 1110 1001 1011

15 1111 1000 1010

13.4.6. Код Грея. Прямое и обратное преобразования

Обозначим через д (г) — код Грея числа г, а через О (г) — обратный код Грея числа г. Так что

О (д (г)) = г

и наоборот,

д (О (г)) = г.

Коды д (г) и О (г) наглядно иллюстрируются в табл. 13.1.

Алгоритм кодирования 1 (прямое преобразование числа).

Пусть ар — число в р -ичной системе счисления. Исходная комбинация числа

ар = а„ага-1...аг+1агаг-1...а1,

где аг — цифра в р-ичной системе счисления; д (ар) — комбинация кода Грея;

д (ар) = ап ага-1...аг+1агаг-1...а1.

Задача кодирования

ар ^ д (ар). (13.22)

1. ап - ап.

2. аг = аг, если аг+1 — четное.

3. аг = (р — 1) — аг, если аг+1 — нечетное. Практический алгоритм для р = 2 :

1) сдвинуть исходную комбинацию вправо, учитывая, что младший разряд теряется;

2) сложить по шоё 2 исходную комбинацию со сдвинутой. О (ар) — комбинация обратного кода Грея;

О (ар) = вгавга-1..Д+1 АА+Ь-А.

Алгоритм кодирования 2 (обратное преобразование числа). Задача кодирования

ар ^ О (ар) . 135

1. - ап.

2. вг = аг, если вг+1 — четное.

3. вг = (р — 1) — аг, если вг+1 — нечетное. Практический алгоритм для р = 2 :

1) переписывается цифра старшего разряда;

2) каждая следующая цифра инвертируется столько раз, сколько от нее слева стоит единиц в исходной кодовой группе.

В частности, если вместо ар подставить д (ар), то получим алгоритм декодирования 1. Задача

д (ар) ^ ар

1) ап — ап,

2) аг = аг, если аг+1 — четное,

3) аг = (р — 1) — аг, если аг+1 — нечетное. Следовательно,

О (д (ар)) = ар, (13.23)

д(О (д (ар))) = д (ар)

и т.д.

Если в задаче (13.22) вместо ар взять О (ар), то получим задачу

О(ар) ар,

то есть алгоритм декодирования 2. Откуда следует, что

д (О (ар)) = ар, (13.24)

О (д (О (ар))) = О (ар)

и т.д.

Из выражения (13.23) можно получить следующее выражение:

О (О (д (ар))) = О (ар),

а из (13.24) получим

д (д(О (ар))) = д (ар).

Сравнивая (13.23) и (13.24), получим

О (д (ар)) = д (О (ар)) = ар.

13.4.7. Функции Радемахера. Диадные функции Уолша

Функции Радемахера задаются на полуоткрытом отрезке [0,1) следующим образом:

Яо (х) = +1

Г +1, Ц^х <2^1, Яг (х) = ^

1-1,

^ = 1, 2,...; г = 0,1,..., 2г — ,

где I — порядок функции; г — номер интервала задания.

Иными словами, знакопеременная функции Яг (х) задается на 2г интервалах таким образом, что если порядковый номер интервала г четный (начиная с 0-го), то Яг (х) = +1, а если нечетный, то Яг (х) = —1 (рис. 13.1).

Правило образования диадных функций Уолша из функций Радемахера подобно правилу образования двоичных чисел и наглядно иллюстрируется табл. 13.2, рис. 13.1 и 13.2.

Ф. Уолша \ ЯА(х) Дз(ж) (ж) (ж) Выражение функций Уолша

Ф. Радемахера через функции Радемахера

IV! (х) 0 0 0 1 Щ (ж) = (ж)

1¥2(х) 0 0 1 0 т (ж) = я2 (ж)

^з(ж) 0 0 1 1 \У3 (ж) = Я, (ж) • Я2 (ж)

1У4(х) 0 1 0 0 1У4 (ж) = Я3 (ж)

0 1 0 1 И/5 (ж) = Я2 (ж) • Я3 (ж)

1У6(х) 0 1 1 0 W6 (ж) = (ж) • Я2 (ж) • Я3 (ж)

1У7(х) 0 1 1 1 1У7 (ж) = Я4 (ж)

1 0 0 0 \¥8 (ж) = (ж) • Я4 (ж)

И-9 (ж) 1 0 0 1 \¥9 (ж) = Я2 (ж) • Я4 (ж)

Рис. 13.1. Функции Радемахера

Рис. 13.2. Функции Уолша (диадное упорядочение)

13.4.8. Дискретные функции Радемахера

Дискретные функции Радемахера, определенные в т = 2П точках, вычисляются следующим образом:

г^ (0, к) = !,(& = О, 2п - 1)

2п м _ I +1, к = 0, 2П-1 — 1;

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

г ^ (1,к ) =

— 1, к = 2П-1, 2П — 1.

Остальные функции генерируются с помощью итерационного равенства:

г2 (г, к) =r¿ (г- 1,2 к mod 2п), (г = 2 ,щк = 0,2п - 1).

Функции Радемахера представляют из себя подкласс класса функций Уолша. Поэтому в силу теоремы 13.1 для дискретных функций Радемахера rm(i, k), определенных в m € {2n-1 +1,..., 2n} точках, имеет место

2™

Следствие 13.1. rm(i,k) = г2 (г, [и ■ к]), где [•] — целая часть числа, v = —; (i = 0~ñ;k = 0,2п - 1).

13.4.9. Функции Адамара. Связь между диадно-упорядоченными,

секвентно-упорядоченными функциями Уолша и функциями Адамара

Функции Уолша по своей природе диадные. Поэтому диадное упорядочение функций Уолша считают более естественным, чем секвентное. Секвентное упорядочение, однако, оказывается более удобным при проведении аналогии с разложением Фурье [111].

Мы будем рассматривать дискретные функции Уолша. Предполагается, что дискретные функции бесконечны по протяженности и периодичны с периодом M = 2n, где n — натуральное число. Таким образом, полная ортогональная система имеет M различных функций.

Будем обозначать диадно-упорядоченные функции Уолша через pal (m, k), а секвентно-упорядоченные функции Уолша через wal (m, k).

Полная система функций задается в диапазоне m = 0,1,..., M — 1 и k = 0,1,..., M — 1. Диадно-упорядоченные функции Уолша определяются следующим образом:

pal (0, k) = 1 , k = 0,1,...M — 1;

ил м J +1' k = 0,l,...,f-1,

= \ -1, k = f,f+ 1,...,M-1. Остальные функции можно генерировать с помощью простого итерационного уравнения

pal (m, k) = pal ^ , 2kj pal (m, — 2 ^ , kj ,

где [у] означает деление на 2 без остатка. Имеет место

pal (m, k) = pal (k, m).

Если задан массив действительных чисел f (k) длиной M, то Уолш — образ этого массива равен

M-1

AD(m) = Е f (k)pal(m,k), (m = 0,1,...,M - 1). fc=0

Обратное преобразование запишется в виде:

1 M-1

/ W = м Е = 0,1, М - 1) .

m=0

Для секвентно-упорядоченных функций Уолша имеем

M-1

AC(m) = Е f (k) wal (m, k), (m = 0,1,..., M - 1). fc=0

Обратное преобразование имеет вид

1 M-1

= Ac(m)Wal (k, m), (k = 0,1,..., M-1).

m=0

Известно, что диадно-упорядоченные функции Уолша [117] ра1(г,к) связаны с секвентно-упорядоченными функциями -ша1(г,й) следующим образом:

pal (g (i), k) = wal (i, k),

(13.25)

где д (г) — код Грея индекса г [117].

Рассмотрим матрицы Адамара вида Нт, (т = 1, 2,...) .

Обозначим секвенту г строки матрицы Адамара Нг порядка Л = 2Г через С (г, г). Для г = 1 имеем

С (0,1)=0 , С (1,1) = 1.

Нам требуется вспомогательный символ А (г, г) € {0,1} , который определяется следующим образом:

А (0,1) = 0 , А (1,1) = 1;

2Г-1 ~)Т- 1

Д (i,r) =

A(i,r - 1) , i = 0,1,..., 2r-i - 1, (r = 2, 3, ...,n); Д (i - 2r-1,r - 1) , i = 2r-i,..., 2r - 1, Д -отрицание Д.

секвента

Hi

H2 =

Нз

+ 0

+ ) 1

( + + + + \ 0

+ - + - 3

+ + - - 1

+ - - + 2

(+ + + + + + + +\ 0

+ - + - + - + - 7

+ + - - + + - - 3

+ - - + + - - + 4

+ + + + - - - - 1

+ - + - - + - + 6

+ + - - - - + + 2

+ - - + - + + - 5

Секвента C (i,n) определяется следующим образом:

C (i,r) =

2C (i, r - 1) + Д (i, r) , i = 0,1,..., 2 - 1;

2C(i - 2r-i, r - 1) + Д (i, r) , i = 2r-i, 2r-i + 1,..., 2r - 1,

(r = 2, 3,..., n).

С помощью полученных секвент С(г,п) устанавливается связь между секвентно-упорядо-ченными функциями Уолша -ша1(г,й) и диадно-упорядоченными функциями ра1(г,к) :

wal (C (i, n), k) = pal (i, k)

(13.26)

где i — зеркальное отражение двоичного представления индекса i, имеющего n разрядов (bit reversal).

То есть, если i = ira-12ra-i + in-22n-2 +... + i12 + i0, то i = i02n-i + i12n-2 +... + in-22 + in-1. Очевидно, что

i = i.

В дальнейшем будем вместо C (г,п) пользоваться обозначением C (г), понимая под этим, что речь идет о секвенте г -й строки матрицы Адамара Нп порядка М = 2п, где п — натуральное число.

Запишем выражение (13.25) в виде

wal (C (i), k) = pal (i, k),

а выржение (13.26) в виде

wal (C ( i ) , k) = pal (i, k) Сравнивая выражения (13.27) и (13.28), получим

C (i) = C (i)

или

C (i) = C0.

Соотношение (13.29) позволяет определить из C (i) значение индекса i. Таким образом,

i ^ C (i).

Обозначим функции pal ( i , k) через hal (i, k), то есть

hal (i, k) = pal ( i , k) .

Функции hal (m, k) , (m, k = 0,1,..., 2n — 1) назовем функциями Адамара. Учитывая (13.26), получим

hal (i, k) = wal (C (i), k).

Запишем следующее преобразование:

M-1

Aa(m) = J] f (k) hal (m, k), (m = 0,1,..., M — 1).

fc=Q

Это есть преобразование Адамара-Уолша (естественное представление). Обратное преобразование Адамара-Уолша имеет вид

1

M-1

/ (k) = — Y^ А (т) hal (к, ш), (к = 0,1,..., М- 1).

(13.27)

(13.28)

(13.29)

(13.30)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

(13.31)

т=0

Следует заметить, что

Ас (т) = АС (т)

и

Ай (т) = А^ (т).

Строгое доказательство утверждений (13.32) и (13.1) приведено ниже (см. п. 13.4.12). Мы знаем, что

■ша1 (С (т), к) = Л,а1 (т, к).

(13.32)

(13.33)

Отсюда следует, что

ral (0, k) = hal (0, k); ral (i, k) = hal (V-(i+1),k) ; (i = 1,2,..., n).

Учитывая

hal (m, k) = pal (m, k),

получим

ral (0, k) = pal (0, k),

ral (i, k) = pal (2i-1, k) , (i = 1,2,..., n).

Таким образом, если мы имеем M = 2n функций Уолша или Адамара, составляющих полную ортогональную систему, то среди них n +1 — функция Радемахера.

13.4.10. Связь между преобразованиями Адамара-Уолша

Мы установили, что имеется три вида преобразований Адамара-Уолша:

1) естественная форма;

2) секвентное упорядочение (порядковая форма);

3) диадная форма.

Запишем одномерное преобразование Адамара-Уолша через функции Адамара. M-1

1. Aa(m) = £ f (k) hal (m, k), (m = 0,1,..., M - 1).

fc=0

По-прежнему полагаем, что функция f (k) задана в M = 2n точках, где n — натуральное число.

Тогда на основании выражений (13.32) и (13.33), получим M-1

2. Ac (m) = £ f (k) wal (m,k), (m = 0,1,...,M - 1).

fc=0 M-1

3. Ag (m) = £ f (k)pal(m, k), (m = 0,1,...,M - 1).

fc=0

В силу формулы (13.31) запишем

M-1

A« (m) = E f (k) wal (C (m), k), (m = 0,1,..., M - 1). fc=0

Следовательно,

A« (m) = Ac (C (m)). Согласно определения (13.30) можно утверждать

M-1

A« (m) = E f (k) pal (m, k), (m = 0,1,..., M - 1), fc=0

откуда следует, что

A« (m) = Am (m), (13.34)

и, наоборот,

Ag (m) = Aa (m).

Учитывая формулу (13.25), имеем

M-1

Ac (m) = f (k)pal (g (m), k), (m = 0,1,..., M - 1). fc=0

Следовательно,

Ac (m) = Ag (g (m)). Сопоставляя соотношения (13.27) и (13.28), получим

Ag (m) = Ac (C (m)),

или

Ag (m) = Ac (C (m)).

И, наконец, из выражения (13.30) следует, что

pal (m, k) = hal (m, k) . Сопоставляя выражения (13.25) и (13.35), получим

wal (m, k) = pal (g (m), k) = hal (g (m), k).

Следовательно,

(13.35)

(13.36)

Ас (т) = Аа (5 (т)).

13.4.11. Быстрое преобразование Адамара—Уолша

Алгоритм БПА состоит из N log2 N операций сложения и вычитания ( N — целая степень 2) (рис. 13.3-13.5).

Рис. 13.3. Рекурсивное преобразование Адамара. Естественное (адамаровское) представление

Рис. 13.4. Алгоритм быстрого преобразования Уолша с диадным упорядочением функций

Рис. 13.5. Алгоритм быстрого преобразования Уолша с секвентным упорядочением функций

Пунктирная линия, соединяющая 2 узла, означает, что числовая точка более высокого уровня перед сложением умножается на (-1), или (эквивалентно) точка образует вычитаемое в операции вычитания. Операции древовидного графа приводят на 0-м уровне к преобразованию Адамара [138].

В данном случае вычисление БПА может быть сделано «с замещением» (in place), то

есть путем записи всех промежуточных результатов на место исходной последовательности данных, а окончательного ответа — на место промежуточных результатов.

В самом деле, самые крайние слева узлы представляют ячейки, содержащие входные данные. Первая ступень вычислений заключается в вычислении содержимого ячеек, представленного следующими 2П узлами справа от входных узлов. Но каждая пара входных узлов воздействует только на соответствующую пару узлов, находящихся непосредственно за ними справа, и, если вычисления проводятся с двумя узлами одновременно, новые вычисленные значения могут быть записаны в те ячейки, из которых взяты исходные данные, поскольку входные значения больше нужны для дальнейших вычислений.

Допустим, что входные данные могут запоминаться в памяти машины в порядке

/(k), (k = 0,1,..., 2n - 1)

где k — зеркальное отражение (k) (pit reversal) .

В этом случае получим алгоритм «с замещением» для вычисления диадной формы преобразования Адамара-Уолша. В самом деле, пусть

1 N-1

f(k) = — J2Aa (m) hal (m>= °> X> N (13.37)

m=0

Подставим вместо Aa (m) в уравнение (13.37) Ag (m). Тогда, учитывая формулу (13.34), получим

1 N-1 i N-1

(m) hal (m> =Jj Aa hal (m' k"> = f •

m=0 m=0

Аналогично получим «порядковую» форму преобразования Адамара-Уолша, если данные в памяти машины записаны в порядке

/ (g (k)), (k = 0,1,..., M - 1).

Действительно, подставим Aa (m) в уравнение (13.37) и, учитывая соотношение (13.36), получим

1 N —1 1 N —1

(m)hal (т>к) Y1Аа (з (т))hal к) = (*о) •

m=0 m=0

§ 14. Представимость объектов в конечных моделях

14.1. Конечные модели и их применение в построении классификатора отношений последовательно-параллельного действия

Задача построения классификаторов различных объектов в технической кибернетике остается весьма актуальной. В настоящее время построено много классификаторов на базе ЭВМ последовательного действия. Однако, учитывая тот факт, что приходится обрабатывать при этом большое количество информации, а при последовательном способе ее обработки уходит много времени, приходится процесс принятия решений распараллеливать.

Рассмотрим один из способов построения классификаторов отношений последовательно-параллельного действия на основе конечных моделей с минимально полной сигнатурой (предикатами Радемахера).

14.1.1. Предикаты Радемахера

Дискретные функции Радемахера, определенные в m = 2n точках, вычисляются следующим образом [7, 117, 151]:

rm(0, к) = 1, (к = 0, 2га — 1),

rm(i,k) = 1 +1>*-°>2ra-1;

— 1, k = 2n-1,2n - 1. Остальные функции генерируются с помощью итерационного уравнения

гт(г, к) = гт(г - 1,2к mod 2п), (г = 2,щк = 0,2п - 1).

Дискретные функции Радемахера rm(i,k), определенные в m € {2n-1 + 1,..., 2n} точках, связаны с дискретными функциями Радемахера r2" (i,k), определенными в 2n точках следующим соотношением:

rm(i,k) = r2n(i, [v ■ k]),

где [v • к] — целая часть числа v • k; v = 2™, г = 0, п, к = 0, 2п — 1, п = /лу(2У ^ т), /л — оператор минимизации.

Пусть дано конечное множество M ^ {ai, a2,..., am}. Тогда предикаты Радемахера на этом множестве определяются следующим образом:

R ( ) = j и, если(ж = ak)&rm(i, k — 1) = 1;

л, в противном случае;(г = О,П] к = 1 ,т).

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Здесь п = / I' если т = 21;

[log2 т] +1, в противном случае, где [■] — целая часть числа.

14.1.2. Связь точечных предикатов с предикатами Радемахера

Для построения генераторов предикатов конечной модели М ^ (М; а), где М ^ |й1' Й2,...' ат|' а ^ (Я^ •••' Яга)' п = ру (2У ^ т) , р — оператор минимизации, которые используются в классификаторах отношений последовательно-параллельного действия, необходимо представлять точечные предикаты Р^ •••'Рт., где

„ , ч Г 1, если ж = ец; (г = 1, т) ;

Р ( х) = п

[0, в противном случае, через предикаты Радемахера Я^ Я2, •••, Яп :

1, если (ж = ак) & гт (г, к — 1) = 1; (г = 1, п) ;

Яг ( ж) = , п

0, в противном случае.

Здесь гт (г^') —дискретные функции Радемахера, определенные в т точках.

Теорема 14.1 [80]. Для любого к € 1т ^ {1, 2, •••, т} , т € N точечные предикаты Рк (ж) представимы через предикаты Радемахера Як (ж) :

Рк (ж) = Як(ж)&Я2 (ж)&-&ЯП (ж),

где Як(ж) = { ^^^ если ^(к - 1)]га-г+1 =

^ —Яг(ж ), в противном случае,

п

V = 2п/т; [■] — целая часть числа, [V ■ (к — 1)] = £ 2г-1 [V ■ (к — 1)]г; [V ■ (к — 1)]г € {0,1} ;

г=1 ___

п = ¡лу(2У ^ т), /х — оператор минимизации [6], (г = 1,п;к = 1,т).

Доказательство. Характер функции Радемахера г2" (г, к) определяется j = п — г + 1 двоичным разрядом числа

п+1

к = Е 2-7+1 • кз, ку € {0,1} , = 1,п + 1)

.7 = 1

(нумерация разрядов начинается с единицы),

кп-г+1 =0 ^ Г2П (г, к) = 1- (14.1)

По определению

щ,х\ = ) и> если (х = ак)к(гт(г, к - 1) = 1); _

' л, в противном случае, (г = 1, п).

Учитывая следствие 13.1, можно записать

и, если (ж = ак)&(г2"(г, [V(к — 1)]) = 1);

1 л> в противном случае,(г = 1, п).

^г(ж) = Рк(ж) [1/(Л - 1)]п-г+1 =0,(г = 1,щк = 1, ш). (14.3)

Возьмем произвольное к € {1, 2,...,т} и покажем, что Рк(ж) ^ Щ(ж)&Як(ж)&...&ЯП(ж). Пусть Рк(х) = и. Предположим, что существует г € {1, гг} такое, что Щ(х) = л. Рассмотрим первый случай, то есть когда Я2(ж) = Яг(ж). Тогда [V(к — 1)]п_г+1 =0 по определению (14.2), используя тождество (14.3), получим Яг (ж) = Рк (ж). Однако Рк (ж) = и. Следовательно,

Як(ж) = и. Противоречие.

Рассмотрим второй случай, когда Я2 (ж) = -Яг (ж).

Здесь [V (к — 1)]п_г+1 = 1 по определению (14.1) г2™ (г, [V (к — 1)]) = —1, то есть Яг (ж) = л,

а, следовательно, Як(ж) = и. Противоречие.

В обоих случаях мы пришли к противоречию. Следовательно, импликация верна. В силу произвольности выбора имеем для любого г € {1, гг} Щ(х) = и-Докажем, что имеет место обратная импликация:

Як (ж)&Я2к(ж)&...&ЯП(ж) ^ Рк (ж).

Предположим, что к таково, что для любого г € {1 ,п} Я2(ж) = и, то есть имеет место выражение Я>к(ж)&Як(ж)&...&ЯП(ж) = и.

Пусть Як(ж) = Яг(ж). В этом случае [V(к — 1)]га_г+1 = 0. Из тождества (14.3) имеем Яг (ж) = Рк (ж) = и.

Пусть имеет место второй случай, то есть Як(ж) = —Яг(ж). Тогда [V(к — 1)]п_г+1 = 1, то есть г2" (г, [V(к — 1)]) = 1.

Следовательно, Яг (ж) = л по определению Яг (ж) и Яг (ж) = Рк (ж) на основании выражения (14.3), то есть Рк (ж) = и. Импликация обратная выполнена. Теорема доказана. □ В случае т = 2П предикаты Радемахера хорошо интерпретируются двоичными разрядами регистров Рг (п) с п разрядами. При этом 1-й признак Я1 сигнатуры а моделируется п — т разрядом, п -й предикат Я„ — 1-м разрядом указанных регистров.

Таким образом, по предикатам Радемахера можно разложить любой предикат, ( (ж1,..., жк) на М.

14.1.3. Полнота и независимость сигнатур конечных моделей

Полнота в математических теориях играет большую роль. На интуитивном уровне, если доказана полнота теории, это означает, что все формулы охвачены каким-либо свойством и нет среди множества формул теории каких-либо пробелов. Известны результаты по функциональной полноте функций алгебры логики (ФАЛ). Если множество ФАЛ {/1, /2,..., /8} полное, то это означает, что любую функцию из Р2 можно представить через формулы /1, /2,..., /я, связывая их оператором суперпозиции. Для двузначной и к -значной логики известны критерии определения полноты системы функций: это теорема Поста-Яблонского о функциональной полноте и критерий Слупецкого [180, 181].

Приведем еще примеры понятий о полноте. Если М — модель языка О, то через ТЛп (М) обозначим множество всех предложений языка О, истинных в М. Множество ТЛп (М) называется теорией модели М.

С другой стороны, если Т — теория в языке О, то через [Т] обозначим множество всех предложений, выводимых в Т (так называемое логическое замыкание теории Т).

Теория Т называется просто полной по отношению к модели М, если [Т] = ТЛп (М) •

Теория Т называется просто полной, если для всякого предложения А в языке О имеем Т Ь А или Т I—А [37].

Мы будем изучать относительную полноту сигнатур конечных моделей относительно системы предикатов £ (М) на основном множестве модели М [76].

Рассмотрим модель М ^ (М, а) с основным множеством М и сигнатурой а ^ (Ръ.^Рп)

Будем говорить, что модель конечна, если основное множество М конечно. Пусть £ М — произвольное семейство предикатов на М .

Определение 14.1. Сигнатуру а ^ (Р!,...^^ модели М ^ (М, а) назовем полной относительно системы предикатов £ М, если любой предикат этой системы можно получить из предикатов сигнатуры а с помощью логических связок: &, V, —.

Определение 14.2. Сигнатура а модели М ^ (М, а) независима, если ни один предикат сигнатуры а нельзя получить из других предикатов этой сигнатуры, связывая их логическими связками.

Пусть М ^ {й!, а2, •••'ат} — конечное множество с т элементами. Систему всех к -местных предикатов на М обозначим через £Т (М) • Далее через обозначим модель

(М; ар), где предикаты сигнатуры ар ^ (Р!,...^^ будем интерпретировать следующим образом:

р , ^ _ Г и7 если ж = ец, 1 = 1, т; г л, в противном случае.

Теорема 14.2. Сигнатура ар модели Мт полна относительно любой системы предикатов £Т (М).

Доказательство. Примем для любого к € {1, 2,...} Ргьг2,...,гк (жь ж2, • • •, жк ) = = Рг1 (ж!) & ••• & Ргк (жк), «1, ¿2, • • • , ¿к € {1, 2'•••'m}•

Систему этих предикатов обозначим через Ст(М).

Лемма 14.1. Сигнатура ар модели полна относительно системы предикатов

ст(М).

Справедливость леммы 14.1 следует непосредственно из определения 14.1.

Рассмотрим модель ^ (М; Ст(М)) и покажем, что сигнатура СкТ(М) модели

полна относительно системы предикатов £Т (М).

Пусть предикат Р(ж^.^жк) € £Т (М) таков, что он принимает значение «и» на множестве {(аг11 ,аг12 '....'аг1fc )'•••' (аг£1 '•••'aг№)} ^ Мк. Тогда очевидно, что Р(жь ж2, •••' жк) =

— Ргц,___,г1к (ж1 , ••^ жк) V ••• V Ргц,...,г£к (ж1 , •••' жк) •

Тождественно ложный предикат О^^.^жк) можно получить следующим образом. Для любого Р(жl'•••'жk) € СТ(М) предикат О^,...^) = Р(жl'•••'Жk)&—Р(жl'•••'Жk).

Таким образом, мы показали, что сигнатура Ст(М) модели полна относительно

системы предикатов £Т (М)• А так как сигнатура ар модели полна относительно

СТ(М), то очевидно, что она полна и относительно £Т (М)• Теорема 14.2 доказана. □

Рассмотрим модель ^ (М; ад), где т € {1, 2, •••}' а предикаты сигнатуры ад интерпретируются следующим образом:

Яг(ж) =

и, если (х = ау)&(гт(г, ] — 1) = 1), г, ] € 1, т, и — «истина»; л, в противном случае, л — «ложь».

Здесь гТ(г^') —дискретные функции Радемахера, определенные в т точках.

Теорема 14.3. Сигнатура ад модели полна относительно любой системы

предикатов £Т (М)•

Доказательство. Пусть

Л1(Ж) = I еСЛИ - =

3 \ — Дг(ж), в противном случае.

Здесь п = ^ т), ^ — оператор минимизации [119]. Тогда легко проверить, что

любой предикат Р,(ж) € можно представить в виде Р,(ж) = (ж)&Л2(ж)&-.&Лга(ж), (^ = = 1,т), но по теореме 14.2 ар полна относительно любой системы 52Т(М). Следовательно,

также полна относительно 52™ (М)• Теорема 14.3 доказана. □

Можно оценить число предикатов п сигнатуры модели тт следующим образом:

= ( к, если т = 2к;

[1о§2 т] + 1, в противном случае.

Таким образом, для любого т в моделях Мт ^ (М; ) и ^ (М; имеет место неравенство ^ |, причем равенство достигается только при т =1 или 2. Кроме того, имеет место

Теорема 14.4. Сигнатура модели независима.

Доказательство. Предикаты сигнатуры модели можно моделиро-

вать с помощью регистра, где ж — номер элемента а € М, взятый на «1» меньше. Первому разряду соответствует п-й предикат Дга и т.д., п-му разряду— Я1.

Если убрать какой-либо разряд из регистра, то никакой комбинационной схемой с помощью других разрядов нельзя смоделировать убранный разряд. Отсюда и следует справедливость теоремы 14.4. □

Актуальность изучения относительной полноты обусловлена тем, что она используется для построения классификаторов отношений последовательно-параллельного действия, дешифраторов и генераторов предикатов [10].

14.1.4. Некоторые примеры прикладного характера

Для основного множества М можно строить генераторы предикатов любой местности, которые целесообразно использовать, например, для синтеза автоматов-классификаторов последовательно-параллельного действия. В основу автоматов закладывается связь регистров с комбинационной схемой, имеющей I выходов. С помощью схем сравнения производится параллельное сравнение всех I предикатов с неизвестным предикатом. Схема выделения максимального количества совпадений позволяет идентифицировать неизвестный предикат с некоторым эталонным предикатом. В силу относительной полноты сигнатуры с предикатами Ра-демахера так представить можно любой к -местный предикат.

Пример 14.1. Классификатор для трехместных отношений.

В доказательстве теоремы 14.4 мы показали, что если занумеровать элементы основного множества М модели от нуля до т —1, то предикаты сигнатуры можно моделировать регистром с п разрядами, где

= ( к, если т = 2к;

\ [1о§2 т] + 1, в противном случае.

По теореме 14.3 любой к -местный предикат можно смоделировать с помощью к регистров и некоторой комбинационной схемы, то есть можно построить конечный автомат с памятью. Памятью в данной случае можно считать регистры, в которые записываются номера предметных элементов основного множества. В работе [67] рассматривались функции

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

/ : К1 х К2 х ... х ^ Кп+1,

где Кг,(г = 1,п+ 1) — конечные множества натуральных чисел.

В случае, когда К\ = К2 = ... = Кп+1 = К, можем описывать отношения Р = {(ш1,..., тп, /(ш1,..., тп))|ш1,тп Е Кп} в виде (п + 1) -местных предикатов:

, ч Г 1, если тп+1 = /(т1, ...,тп); , ^ ^ч

Рг (т1 ,...,тп+1 ) = 1 п (т1 ,...,тп+1 Е К).

[и, в противном случае.

Тогда функциональная схема классификатора для трехместных отношений будет иметь вид, указанный на рис. 14.1, где Рг-Сг — регистр-счетчик; КС — комбинационная схема; СС — схема сравнений; Сг — счетчик;

х, у, £ — входные координаты;

Р(х,у,£) — классифицируемый предикат в точке (х,у,£).

Рис. 14.1. Функциональная схема классификатора

Работа классификатора построена следующим образом. Перебирая все возможные входные комбинации (х, у, £) на регистрах-счетчиках Рг 1 -Сг 1, Рг 2 -Сг 2, Рг 3 -Сг з, мы накапливаем количество совпадений с предикатом Р(х, у, £) в счетчиках Сг 1,... ,Сг п, где п — количество сравниваемых предикатов. Как только все комбинации будут проверены, подается импульс опроса счетчиков. Максимально заполненный счетчик ответит единичным выходом, то есть тем самым будет идентифицирован соответствующий предикат. На этом работа классификатора заканчивается. Цикл можно повторить для следующего неизвестного предиката Р(х, у, £).

Пример 14.2. Распознающий автомат персептронного типа [15].

Известно, что распознающие автоматы-персептроны являются устройствами с параллельным принципом вычисления распознающих предикатов, в которых, к сожалению, обнаруживается ряд недостатков. Одним из них является плохая экстраполируемость образов одного и того же класса с плохой распознаваемостью объекта, отсутствующего в обучении, то есть не выполняются условия конструктивизации (см. п. 6.2).

Предлагаемая схема последовательно-параллельного вычисления решающих предикатов на базе предикатов Радемахера, в основу которой положен теоретико-игровой метод коллективного голосования, позволяет, во-первых, абстрагироваться от рецепторного поля, необходимого для персептрона, и переходить к т -мерному пространству наблюдения и, во-вторых, экстраполировать эталоны в обучении на близкие к нему реализации предъявленных отношений.

Пусть М ^ {а1, а2,..., а2« } — основное множество наблюдаемых элементов а1, а2,..., а2«, число которых равно целой степени двойки (п € N ^ {0,1, 2,...}). В качестве элементов ак, к = 1,2п могут быть взяты любые конструктивные объекты.

На т -й декартовой степени множества М заданы эталоны обучающей выборки О1, О2,..., 01 С Мт, где I — число эталонируемых классов. Для предъявленного отношения X С Мт вычисляются величины £с, характеризующие идентичность (похожесть) описаний эталонного класса Ос с неизвестным (предъявленным) изображением X в точке ж :

£С= Р(Ос(х),Х(х)),

хемгп

где характеристическая функция:

а) предиката Р -отношение равенства описания эталонного класса Ос с неизвестным изображением X в точке ж :

Р(Ос( ж) Х(ж)) = { если (ж) = ^ (ж); ж = (жьж2,...,жт); \°, в противном случае,

б) эталонного отношения (класса):

1, если ж € Ос;

Ос(ж) = л _ _ , ~ у 7 \ 0, если ж ^ Ос,

в) предъявленного (неизвестного) изображения:

1, если ж € X]

X (ж) = .

°, в противном случае.

Пусть Яо = тах (51, $2,..., Яг). Тогда частные решающие правила строятся следующим образом:

( 1 если С„ = Я

о (х) - { если = Sc, ^С = '

с \ 0, в противном случае.

°, в противном случае.

Общее решение определяется по формуле

к3(х)= V дс (зе), (в = м),

где Ь — число классов; / : 1 ^ 1 — классифицирующая функция.

Множество номеров г эталонных объектов: = {г |/ (г) = , (в = 1, ¿) , в ^ £.

Предложенный метод классификации следует рассматривать как разновидность метода коллективного голосования для отношений. Классификатор на базе этого метода можно реализовать, разлагая отношения по предикатам Радемахера, которые физически интерпретируются двоичными разрядами регистров и составляют полную систему предикатов на конечном множестве М.

Работа классификатора на базе предикатов Радемахера производится следующим образом. Благодаря независимости частных предикатов О (X) появляется возможность организации их параллельных вычислений. Классификатор отношений состоит из входных регистров счётчиков, связанных комбинационной схемой, имеющей I выходов на схемы сравнения с неизвестным предикатом X (ж1, Ж2,..., жт) . Результат сравнения параллельно заносится в регистры-стеки, принимающие через ключи только единичные значения. Так что после записи единицы в регистр-стек производится сдвиг на один разряд. По окончании сравнения по всем координатам отношений 01,02,...,0^ производится опрос регистров-стеков; схема выделения максимума определяет максимально заполненный регистр-стек и выдает значения предикатов $1,О. Поставив необходимые сборки, получим и общие решающие предикаты распознающего автомата персептронного типа.

Рассматриваемый классификатор персептронного типа на базе метода коллективного голосования обладает экстраполяционными свойствами благодаря тому, что не все координаты отношений в обучающей выборке обязаны совпадать со всеми координатами неизвестной реализации, а достаточно лишь выделить максимальное число (приближение) соответствующего отношения в обучении к неизвестной реализации.

14.2. Минимизация предикатных форм в конечных моделях

Проблема простейшего представления предикатных форм для сигнатуры а сводится к выбору базиса и наиболее экономичного представления предикатов в этом базисе. Для функций алгебры логики в настоящее время существенные результаты в решении задачи минимизации получены лишь для базиса, состоящего из отрицания, конъюнкции и дизъюнкции [136]. Поэтому для предикатных форм относительно сигнатуры а будем также придерживаться этого базиса. Тем более, что проблема разрешения для конечных моделей с сигнатурами, состоящими из одноместных предикатов, разрешима [37, 177].

Построим методологию минимизации предикатных форм в конечных моделях, взяв за основу известные методы минимизации функций алгебры логики [136] и сохранив их названия в наших исследованиях [71].

Пусть M ^ (M; а) модель с конечным множеством M ^ (ai, ..., am} и сигнатурой а ^ (Qi,Q2, -,Qz) одноместных предикатов Qi,...,Qi, полной относительно любой системы предикатов 52 ™ (M).

Рассмотрим некоторую предикатную форму от двух переменных:

F (x, y) = Qi (x) &Qi (y) &Q2 (x) V Qi (x) &Qi (y) &Q2 (x) V

VQi (x) (y) LQ2 (x) V Q1 (x) (y) &Q2 (x) V Qi (x) (y) &Q2 (x).

Преобразуем эту предикатную форму следующим образом. Добавим еще один конъюнктивный член Qi (x) &Qi (y) &Q2 (x) . Это добавление не меняет данной предикатной формы, так как (Vx*,y* € M) по свойству операции дизъюнкции Fi (x*,y*) VFi (x*,y*) = Fi (x*,y*) запишем:

F (x, y) = Qi (x) (y) &Q2 (x) V Qi (x) (y) &Q2 (x) V

VQi (x) (y) &Q2 (x) V Qi (x) (y) &Q2 (x) V

VQi (x) &Qi (y) &Q2 (x) V Qi (x) &Qi (y) &Q2 (x).

Теперь преобразуем это выражение, используя сочетательное и распределительное свойства конъюнкции и дизъюнкции:

F (x, y) = Qi (x) &Qi (y) & (Q2 (x) V Q2 (x)) V Qi (x) &Qi (y) &

& (Q2 (ж) V Q2 (x)) V Qi (y) &Q2 (x) & (Qi (x) VQi (x)) .

Используя свойство дизъюнкции F\ (x*,y*) У Fx (x*,y*) = 1 для любых x*,y* € M, получаем

F{x, y) = Qi(x)&Qi(y) V Qi(x)&Q1(y) V Qi(y)&Q2(x). Аналогично предыдущему делаем дальнейшие преобразования:

F{x, у) = Qi{x)k (Qi(y) V QM) V Qi(y)&Q2(x) = Qi(x) V Qi(y)&Q2(x).

Из примера видна неэкономичность некоторых предикатных форм. Для уточнения постановки задачи минимизации предикатных форм относительно сигнатуры а дадим ряд определений.

Определение 14.3. Конъюнкция предикатов сигнатуры а

F (xi,x2,...,xra) = & Qj (xi) = Q^ (x^&Q^ (xi)&...&Q°ttii (xi),

i=i 11 1

где aji € {0,1} , Qj.,- € a, (j = 1, U; i = l,n); Qij ф Qik при j ф к;

Q«ji (x ) f Qij (xi), если aji = 0; ij ( i) \ <3ij (xi), если aji = 1;

называется элементарной, если в этой конъюнкции каждый предикат сигнатуры а с одной и той же переменной xi встречается не более одного раза.

Определение 14.4. Рангом элементарной конъюнкции предикатов сигнатуры а вида F (ж1, Ж2,..., жп) называется число ti — количество одноместных предикатов Qiti(ж^), входящих в эту конъюнкцию.

Определение 14.5. Дизъюнкция элементарных конъюнкций сигнатуры а вида F (Ж1,Ж2, ...,жп) называется дизъюнктивной предикатной нормальной формой (ДПНФ (а)) сигнатуры а.

Определение 14.6. Дизъюнктивная предикатная нормальная форма сигнатуры а для предиката R (Ж1,Ж2, ...,жп), состоящая из конъюнкций ранга n х l, где l = |а| , называется совершенной дизъюнктивной предикатной нормальной формой (СДПНФ) сигнатуры а.

Из этого определения следует, что в СДПНФ (а) входят конъюнкции наибольшего возможного для данного предиката ранга. Поэтому, с точки зрения ранга конъюнкций, входящих в ДПНФ (а), СДПНФ (а) является наиболее сложной (длинной).

Определение 14.7. Длиной ДПНФ (а) назовем число элементарных конъюнкций сигнатуры а, образующих эту ДПНФ (а) .

Длину ДПНФ (а) будем обозначать буквой L.

Определение 14.8. Дизъюнктивная предикатная нормальная форма сигнатуры а, имеющая наименьшую длину по сравнению со всеми другими ДПНФ (а) , эквивалентными данному предикату, называется кратчайшей ДПНФ (а) (КДПНФ (а)).

Определение 14.9. Дизъюнктивная предикатная нормальная форма сигнатуры а, содержащая наименьшее число вхождений предикатов сигнатуры а по сравнению со всеми другими ДПНФ (а) , эквивалентными данному предикату, называется минимальной ДПНФ (а) (МДПНФ (а)).

Определения, аналогичные определениям 14.3-14.9, можно дать и для случая конъюнктивных предикатных форм сигнатуры а.

Подчеркнем, что рассматриваются лишь предикаты R (xi, Ж2,..., жп), которые можно представить в виде предикатной функции сигнатуры а :

f (Qll (Ж1) , Q12 (Ж1) , ..., Qltx (Ж1) , ..., Qn1 (Жп) , Qn2 (Жп) , ..., Qntn (Жп)) = V Fi (Ж1 , Ж2, Жп) .

ieJ

Это в свою очередь позволяет проводить минимизацию предикатных форм сигнатуры а методом неопределенных коэффициентов [2].

В последнем выражении Fi (Ж1,...,Жп) есть элементарные конъюнкции сигнатуры а различных рангов, содержащей предикаты из множества {Q11 (Ж1), Q12 (Ж1) ,..., Q1tl (Ж1) ,..., Qn1 (жп) ,..., Qntn (Жп)}, возможно с их отрицаниями.

14.2.1. Метод неопределенных коэффициентов

Как и для функций алгебры логики описываемый здесь метод может быть применен для минимизации предикатной функции сигнатуры а от любого числа аргументов. Однако для простоты изложения и большей наглядности рассматривать его будем на примере минимизации предикатной функции, зависящей от трех аргументов.

Представим функцию / (ф 1 (ж), Q1 (у), ф2 (ж)) в виде следующей ДПНФ (а)

/ (ф 1 (ж) , ф 1 (у) , (ж)) = К&ф 1 (ж) V К°&ф 1 (ж) V \JKlkQx (у) V К°2к,д! (у) V К^&дг (ж) V (ж) V

-10 (

1 (ж) 1 (у) V КЦЗД (ж) &ф2 (ж) V КЦЗД (ж) &ф2 (ж) V

У^ЗД (ж) &<Э1 (у) V (ж) (у) V АГ^^&С^! (ж) кЯг(у)\/

VK1°2°

VK1°31&(Q 1 (ж) &ф2 (ж) V КЦ&ф1 (ж) &ф2 (ж) V К2131&ф1 (у) &ф2 (ж) V (у) 2 (ж) V 1 (у) &ф2 (ж) V 1 (у) &ф2 (ж) V

^ЙЗад (ж) (у) &ф2 (ж) V К^ЗД (ж) (у) 2 (ж) V

1 (ж) (у) &ф2 (ж) v к12! (ж) (ж) &(31 (у) &ф2 (ж) v К^^ (ж) (у) 2 (ж) v

vKl12°!

VK°0з1&^ 1 (ж) (у) &ф2 (ж) V К°213°&^ 1 (ж) (у) 2 (ж) V

vк10°!&Q 1

(ж) 1 (у) &ф2 (ж) V К^&ф 1 (ж) (у) 2 (ж) .

(14.4)

Здесь представлены все возможные конъюнктивные члены, которые могут входить в дизъюнктивную предикатную форму / (ф1 (ж) , (у), ф2 (ж)). Коэффициенты К с различными индексами являются неопределенными и подбираются так, чтобы получающаяся после этого дизъюнктивная предикатная форма была минимальной. Если теперь задавать всевозможные значения аргументов (ж1,ж2,жз) и приравнивать полученное после этого выражение (отбрасывая нулевые конъюнкции) к значению функции на выбранных наборах, то получим систему (14.5) уравнений для определения коэффициентов К :

К11 К11 К11 К11 К1 К1 К1 К1

V К1

V К1

V к°

V К2°

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

V К1

V К1

V К° УК2°

V Кз1

V Кз°

V Кз1

V К°

V К31

V К°

V К31

V К°

V К^

V КЦ

V К1°

V кц

V КЮ

V КЮ

V К°2°

V К°2°

V К1!

V КЦ

V К1!

V Кз

V к°!

V К°!°

V к°!

V К°!°

V К!

V К2!°

V К!

V К2°°

V К!

V К2!°

V К!

V К2°°

V К^1

V к^

V К™

V К^

V К™

V K°0з°

V К2°2°!

V К°2°°

/ (1,1,1) / (1,1, 0) / (1,0,1) / (1,0,0) / (0,1,1) / (0,1,0) /(0,0,1) / (0,0,0)

(14.5)

Заданная некоторая конкретная предикатная функция определяет значение правых частей системы (14.5). Если набор (ж1, ж2, ж!) таков, что функция на этом наборе равна нулю, то в правой части соответствующего уравнения будет стоять нуль. Для удовлетворения этого уравнения необходимо приравнять к нулю все коэффициенты К, входящие в левую часть рассматриваемого уравнения. (Это вытекает из того, что дизъюнкция равна нулю только тогда, когда все члены, входящие в нее, равны нулю.)

Рассмотрев все наборы, на которых данная предикатная функция обращается в нуль, получим все нулевые коэффициенты К. В уравнениях, в которых справа стоят единицы, вычеркнем слева все нулевые коэффициенты. Из оставшихся коэффициентов приравняем к единице коэффициент, определяющий конъюнкцию наименьшего возможного ранга, а остальные коэффициенты в левой части данного уравнения примем равными нулю (это можно сделать, так как дизъюнкция обращается в единицу, если хотя бы один член ее равен единице). По единичным коэффициентам К из системы (14.4) определяется соответствующая ДПНФ (а).

Пример 14.3.

/ (Ф1 (ж) , (у) , ф2 (ж)) = (ж) (у) &ф2 (ж) V (у) 2 (ж) V

VQl (ж) 1 (у) &ф2 (ж) V (ж) 1 (у) 2 (ж) V (ж) 1 (у) 2 (ж) .

Подобно системе (14.5) составим систему (14.6).

К1 V К V К V К2 V Кз1 V К1 V К^1 = 1 К1 V К V ко V К21 V КО V ко V КЙ0 = 1

К V КО V К31 V КО V Кз1 V КОз1 V КЮз1 = 1 К V КО V КО V КО V КО V КО V К00 = 1

1

ь*0-

к1,1 V к± V кч V к;-1,1 у у лг1 у к

2

>-з

12

К У К о1 У К^' У АТо V К1,1" У Аоч V АТо1" = О

1з -=00-

г^ША-

12з

й^ОЮ-

2

з

12

12з

А? У АО V А31 У КО V А^1 У АОз1 V КОз1 = О КО V КО V КО V КО2О V КОзО V КО 1

(14.6)

Из пятого, шестого и седьмого уравнений в силу свойств дизъюнкции вытекает, что

К0 = К0 = К1 = К0 = К1 = К00 = К01 = К00 А1 = А2 = А2 = Кз = Кз = А12 = А12 = К1з

=К01= = К1з =

= КО1 = А1О = А11 = А ОО1

= К2з = К2з = К2з = К12з

= А010 = КО11 = 0

— А 1 2з — А 1 2з — °

О11

После этого данная система примет следующий вид:

К V К 11

11 12

'11

12

V Кз1 11

V К23

к^ v к2 v кц v к

-11О

12з

К V КО V КО V КОз1

12з

=1 =1 =1

12з

К V КО V КО V КОО

КО V КОО = 1.

V А1ОО = 1.

у А 12з = 1;

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

12з

В силу свойств дизъюнкции для любого значения ж* € М имеем 1 V О (ж*) = 1. Приравняем к нулю в каждом из уравнений все коэффициенты, кроме тех, которые отвечают конъюнкциям, содержащим наименьшее число переменных:

А11 = А1О = А11 = А1О = А111 А12 = А12 = А1з = А1з = А 12з

_ А11О = А Ю1 = А ЮО = а ООО = °

'1О1

100

-ООО

12з

12з

12з

12з

После этого получим систему

К = 1 К = 1

К11 = 1

К V КО = 1; КОО = 1.

Отсюда находим МДПНФ (а) данной предикатной функции

/ (Яг (х), Яг (у), д2 (х)) = Яг (х) V ^ (у) (х).

Таким образом, в отличие от булевых функций для минимизации предикатных форм в конечных моделях используются предикатные функции. Причем аргументные места этих функций могут заменять одноименные предикаты, только с различными переменными.

14.2.2. Метод Квайна—Мак-Класки

Пусть по-прежнему задана модель М ^ (М; а) с основным множеством М ^ {й1,Я2, ат} и сигнатурой а ^ (О1, О2,Ог), содержащей I одноместных предикатов.

При минимизации по методу Квайна предполагается, что минимизируемый предикат К (ж1,..., жп) задан в СДПНФ (а) . Для простоты будем называть элементарные конъюнкции сигнатуры а ранга п х I, входящие в СДПНФ (а) минимизируемого предиката, минитер-мами ранга п х I. Метод Квайна состоит из последовательного выполнения следующих этапов.

1. Нахождение первичных импликант. Все минитермы данного предиката К (ж1

)

сравнивают между собой попарно. Если минитермы В и В таковы, что они имеют вид (х{) и А^Я (х{) , то выписывается конъюнкция А, являющаяся минитермом п х I — 1 ранга. Минитермы п х I -го ранга, для которых произошло склеивание, отмечаются. После построения всех минитермов п х I — 1 ранга вновь сравнивают их попарно, выписывают минитермы п х I — 2 ранга и отмечают склеивающиеся минитермы п х I — 1 ранга и т.д. Этап заканчивается, когда полученные минитермы К -го ранга уже не склеиваются между собой. Все неотмеченные минитермы называются простыми импликантами.

Пример 14.4. Пусть п = 2, I = 2 и / (Яг (хг) , Яг (х2), Я2 (хг), Я2 (х2)) = _

= Яг (хг) кЯг (ж2) к,д2 (хг) кЯ2 (ж2) У Яг (жО (ж2) &<?2 (Ж1) кЯ2 (Ж2) V

V ^ (хг) кОг (х2) кЯ2 (хг) кЯ2 (х2) V ^ (ж^ (ж2) (ж^ (ж2) V

V <31 (хг) кЯг (ж2) кО_2 (хг) кО_2 (ж2) V <31 (хг) кЯг (ж2) кД2 (хг) кД2 (ж2) V

V <51 (жО (ж2) кя2 (ж!) (ж2) V <э1 (хг) ад (ж2) ад (ж^ ад (ж2).

Минитермы 4-го ранга:

3 1 (ж1) 1 (ж2) &ф2 (ж1) &ф2 (ж2)* , 31 (ж1) (ж2) &(2 (ж1) 2 Ы* ,

3 1 (ж1) (ж2) &(32 (ж1) &ф2 (ж2)* , 31 (ж1) (ж2) (ж1) &ф2 Ы* ,

(ж1) 1 (ж2) &(32 (ж1) &ф2 (ж2)* , (ж1) 1 (ж2) (ж1) &ф2 Ы* ,

(ж1) (ж2) &(32 (ж1) 2 Ы* , (ж1) (ж2) &(>2 (ж1) &ф2 Ы* , Образуем минитермы 3-го ранга:

Я_г [хг) кя2 (жО ад (ж2), Яг (ж2) ад (ж^ ад (ж2),

(Ж1) (ж2) &<32 (жО*, (ж2) к^2 (Ж1) &<32 (ж2)*,

Яг (Ж1) ад (ж2) ад (ж2), (ж2) ад (Ж1) ад (ж2)*,

Яг (Х1) кЯг (х2) кО_2 (х2) Яг (х2) кЯ2 (хг) кС}2 (х2),

Яг (хг) кЯг (х2) кЯ2 (хг)* ■

Теперь находим минитермы 2-го ранга:

Яг (х2)кЯ2 (хг) ■

Так как дальнейшее склеивание невозможно, то этап получения простых импликант закончен. Простыми импликантами являются следующие минитермы: Яг (хг) кЯ2 (хг) кЯ2 (х2), Яг Ы кЯ_2 (хг) кЯ2 (х2), Яг Ы кЯг (х2) кД2 (х2), Я1 (хг) к% Ы кД2 (х2), Яг (хг) кЯ2 (хг) кЯ2 (х2), Я1 (х2) кЯ2 (хг) ■

2. Расстановка меток. Для данного предиката Я (ж1,ж2) ДПНФ (а) имеет вид

/ (ф1 (ж1) , (ж2) , ф2 (ж1) , ф2 (ж2)) = V Р (ж1, ж2) , (14.7)

где р (ж1,ж2) — простые импликанты, полученные нами на первом этапе.

Полученные ДПНФ (а) определяют сокращенную ДПНФ (а) для предиката Я (ж1,ж2). Необходимо теперь произвести выбрасывание некоторого количества первичных импли-кант. На этапе расстановки меток составляется таблица (табл. 14.1), число строк которой равно числу полученных первичных импликант минимизируемого предиката Я (ж1,ж2). Число столбцов совпадает с числом минитермов СДПНФ (а). Если в некоторый минитерм ДПНФ (а) выражения (14.7) входит какая-либо из первичных импликант, то на пересечении соответствующего столбца и строки ставится метка.

В нашем примере будет шесть столбцов и восемь строк (табл. 14.1).

3. Нахождение существенных импликант. Если в каком-либо из столбцов составленной таблицы имеется только одна метка, то первичная импликанта, стоящая в соответствующей строке, называется существенной импликантой. Существенная импликанта не может быть исключена из правой части выражения (14.7), поэтому из таблицы меток исключаются строки, соответствующие импликантам, и столбцы минитермов, покрываемых этими существенными импликантами.

В нашем случае существенной импликантой является (ж2) 2 (ж1). Она покрывает минитермы:

31 (ж1) (ж2) &(2 (ж1) 2 (ж2) , ((1 (ж1) (ж2) 2 (ж1) Ы , (ж1) (ж2) &(32 (ж1) &(32 (ж2) , (ж1) (ж2) 2 (ж1) (ж2) .

При переходе к следующему этапу эти минитермы могут быть вычеркнуты.

4. Вычеркивание лишних столбцов. Исследуется таблица (табл. 14.1), полученная после третьего этапа. Если в ней есть два столбца, в которых имеются метки в одинаковых

строках, то один из них вычеркивается. Это можно сделать в силу того, что оставшийся столбец покрывает выбранный минитерм.

Таблица 14.1

(хг) (х2) кЯ2 (хг) кЯ2 (ж2) V V

Я1 (Ж1) (ж2) &<32 (хг) &Я2 (х2) V

Яг (хг) ад (ж2) кД2 (ал) кД2 (ж2) V V

<21 (XI) к~Яг (х2) ад (жО ад (ж2) V V

Яг (хг) кя 1 (ж2) ад (жО ад (ж2) V V V

Яг (жО ад (ж2) ад (жО ад (ж2) V V

Яг (хг) кЯх (ж2) кЯ2 (хг) кЯ2 (х2)

Яг (хг) ад (ж2) кД2 (хг) кД2 (ж2) V V

^см ^см см

см с <3 см с <3 см с <3 см с <3 см с <3

<М с <3 <м с <3 с? <3 1С? <3 <М 1С <3 <М 1С <3

1С? 1С? 1С? с? с? с?

После вычеркивания существенной импликанты и минитермов, которые она покрывает, таблица меток принимает следующий вид (табл. 14.2).

Таблица 14.2

""с? ^ А ^ С 1С <3 - С 1С <3 ""с? ^ А ^ с 1С <3 -г? ^ - с 1С <3 1 ^ 'о) .¿1 А ^ с С <3 -г? « С <3 'о) .¿1 А ^ с 1С <3 -г? « - с С <3

Яг (хг)кЯ2 (Ж1)ад (ж2) V V

Яг (х2) ад (хг) ад (ж2) V V

Яг (хг)кЯг(х2)кЯ2 (х2) V

Яг (хг) кЯг (х2) кЯ2 (х2) V V

я 1 (хг) кЯ2 (хг) кЯ2 (ж2) V

5. Вычеркивание лишних первичных импликант. Если после выбрасывания некоторых столбцов на четвертом этапе в таблице появляются строки, в которых нет ни одной метки, то первичные импликанты, соответствующие этим строкам, исключаются из дальнейших рассмотрений, так как они не покрывают оставшиеся в рассмотрении минитермы.

6. Выбор минимального покрытия максимальными интервалами. Исследуется полученная таблица. Выбирается такая совокупность первичных импликант, которая исключает

метки во всех столбцах (по крайней мере, по одной метке в каждом столбце). При нескольких возможных вариантах такого выбора отдается предпочтение варианту покрытия с минимальным суммарным числом вхождений предикатов сигнатуры а, образующих покрытие.

Для рассматриваемой предикатной функции выбираем покрытие из импликант Я\ (х\) &.Я2 (^1) &.Я2 (ж2) и (^1) &-Я\ (ж2) , так как они совместно покрывают все

оставшиеся после четвертого этапа минитермы. МДПНФ (а) для данного предиката Я (ж1,ж2) имеет вид

/ (Яг Ы , Яг (х2), Я2 (хг), Я2 (х2)) = = Я1 (Ж1) (Ж1) ад (ж2) V (Ж1) ад (ж2) ад (ж2) V (ж2) ад (Ж1) .

14.2.3. Метод Блека—Порецкого

Недостатком рассмотренного нами метода Квайна-Мак-Класки является то, что для его применения необходимо, чтобы исходный, минимизируемый предикат был бы представлен в СДПНФ (а) .

Желательно найти возможность построения сокращенной ДПНФ (а) не по СДПНФ (а), а по произвольной ДПНФ (а) данного предиката Я (ж1,ж2, ...,жп) .

Идея такого построения рассматривалась А. Блеком и П.С. Порецким [136] и вытекает из следующей теоремы.

Теорема 14.5. Если в ДПНФ (а) для данного предиката Я (ж1,...,жп) входят все конъюнкции вида А&Я (жг) и В&Я (жг) ) Я € а1 то имеет место равенство для любого набора значений переменных ж1,ж2, ...,жП € М

Р = Р V А&В, (14.8)

где Г — ДПНФ (а), эквивалентная предикату Я (ж1, ...,жп).

Доказательство. Нужно показать, что левая и правая части соотношения (14.8) принимают одинаковые значения на всех возможных значениях аргументов ж1,..., жп € М.

Рассмотрим произвольный набор ж1,ж2,...,жП, для которого Я (ж1, ж2,..., жП) = 1. В силу эквивалентности между Я и Р имеет место равенство, вытекающее из (14.8):

Я (ж1,ж2,...,жП) = 1 V А&В.

Это равенство тождественно, так как в дизъюнкции, стоящей справа, имеется единица. Рассмотрим теперь произвольный набор значений аргументов ж1, ж2,..., жП, для которого Я (ж1, ж2,..., жП) =0. На основании (14.8) имеем

0 = 0 V А&В.

Это равенство может выполняться лишь при условии А&В = 0.

Таким образом, надо доказать, что на наборах значений аргументов, на которых предикат Я (ж1, ...,жП) обращается в нуль, обязательно обращается в нуль А или В или одновременно А и В. ДПНФ (а) Р, по предположению теоремы, имеет вид

Р = Б V А&Я Ы V В&Я (Жг) •

Так как на рассматриваемых наборах Р = 0, то должны одновременно выполняться следующие три равенства:

5 = 0; АкЯ (х*) = 0; В&Я (х*) = 0.

Из двух последних равенств вытекает, что либо А, либо В, либо А и В обращаются в нуль, так как Я (х*) и Я (х*) одновременно в нуль не обращаются. Теорема доказана. □

Легко проверить, что пополнение ДПНФ (а) в соответствии с доказанной теоремой приводит после элементарных поглощений к сокращению ДПНФ (а) . После построения сокращенной ДПНФ (а) можно использовать метод Квайна, начиная со второго этапа (то есть с построения таблицы меток).

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Пример 14.5. Найти сокращенную ДПНФ (а) для предикатной функции

/ (О1 (х), Ог (у), о2 (ж)) = (ж) ад (у) V О1 (ж) ад (у) &02 (ж) V О1 (ж) ад (у) ад (ж) V

V <?1 (у) &02 (ж) V О1 (ж) &02 (ж).

Для этой ДПНФ (а) имеются две пары конъюнкции, удовлетворяющие условиям теоремы

($1 (ж) ад (у) ад (ж); 01 (х) ад (у) ад (ж)) и (01 (ж) ад (у);01 (у) ад (ж)).

Поэтому

/ (01 (ж), 01 (у), о2 (ж)) = 01 (х) &о 1 (у) V 01 (ж) &о 1 (у) ад (ж) V 01 (ж) ад (у) ад (ж) V

V <?1 (у) ад (ж) V <51 (ж) ад (ж) V <51 (ж) ад (у) V <51 (ж) ад (ж).

После элементарных поглощений получаем сокращенную ДПНФ (а) :

и (х, у) = с?1 (ж) ад (у) V 01 (у) ад (ж) V (ж) ад (ж) V 01 (ж) ад (у).

14.2.4. Метод карт Вейче

Приведем пример минимизации предиката Я (ж, у) сигнатуры а = (ОъО2) методом карт Вейче [13].

Я(х, у) = Яг (ж) ад (у) ад (ж) V О1 (ж) ад (у) ад (ж) V О1 (ж) & ад (у) ад (ж) V 01 (ж) ад (у) ад (ж) V Яг (ж) ад (у) ад (ж).

Запишем этот предикат в виде предикатной функции

/ (О1 (ж), 01 (у), д2 (ж)) = [01 (ж) кЯг{у) &0з_(ж)] V [01 (ж) ад (у) &ад (ж)] V V [01 (ж) ад (у) ад (ж)] V [01 (ж) ад (у) ад (ж)] V [01 (ж) &ад (у) ад (ж)].

О1 (ж) 01(ж)

О2 (ж) О2 (ж)

О2 (ж)

1 1

1

1

1

01 (у)

О2 (у)

Рис. 14.1. Карта Вейче Таким образом, после склеивания имеем

Я (ж, у) = О1 (ж) V О1 (у)&О2 (ж).

§15. Примеры реализуемости этапов конструктивизации при классификации (распознавании) конечных объектов

15.1. Формализованное определение основных операций над изображениями

Под изображением понимается некоторое подмножество конечного множества. Вводятся операции над изображениями и рассматривается алгебра изображений. Строится модель классификации изображений на основе обучающей информации с порождением отношений-образов двухместной операцией над изображениями, определяемой с помощью полусуммы [17].

Пусть в пространстве Л задано конечное множество точек Я = |а1, а2,..., ап}. В частности, точки могут быть интерпретированы векторами ец = {ац,..., (Цт), (г = 1 ,п) для некоторого т € N ^ {0,1, 2,...}.

Под изображением X будем понимать некоторое подмножество точек множества Я, где частный (атомарный) предикат

г Г 1, если а € X;

[а € X] = < ' , '

^ 0, если а € X.

1. Для любых изображений X, Xi, X2 Q R введем теоретико-множественные операции над изображениями:

a) Xi U X2 — объединение изображений. В терминах предикатов дизъюнкция атомарных предикатов X1 U X2 ^ [а € X1] V [а € X2] ;

b) Xi П X2 — пересечение изображений. В терминах предикатов конъюнкция атомарных предикатов X1 П X2 ^ [а € X1] & [а € X2] ;

c) X1\X2 — разность изображений. В терминах атомарных предикатов

X1\X2 ^ [а € X1] &- [а € X2] ;

d) симметрическая разность изображений

X1 — X2 ^ (X1\X2) U (X2\X1), или в терминах атомарных предикатов

X1 - X2 ^ ([а € X1I V [а € X2])&-([a € X1I & [а € X2I);

e) дополнение

X = R\X,

в терминах атомарных предикатов выразим

X ^ - [а € X] .

2. Пусть m = 3 и точки изображения Xi Q R принимают свои значения а^ € M, M ^ {0,1, 2,..., 2n — 1}, n € N ^ {0,1, 2,...}. Тогда любое тернарное отношение Xi Q M есть изображение на M.

Если при этом Xi = {(ai1,ai2,/(ai1, ai2))| (ai1, ai2) € M2,/ (а^,а^) € M} для некоторой функции / : M2 — M, то будем говорить, что изображение Xi задано функцией /.

Введем операции сложения, вычитания и умножения по модулям над изображениями:

a) сложение изображений по mod 2 n :

(X1 + X2) mod 2n ^ {(x, y, (/1(x, y) + /2(x, y)) mod 2n)},

где X1 = {(x,y,/1(x,y))};X2 = {(x,y,/(x,y))};

b) умножение изображений по mod 2 n :

(X1 ■ X2) mod 2n ^ {(x,y, (/1(x,y) ■ /2(x,y)) mod 2n)},

где X1 = {(x,y,/1(x,y))}; X2 = {(x,y,/2(x,y))};

c) симметрическая разность изображений по mod 2n :

(X1 - X2) mod 2n ^ {(x,y)|/1(x,y) - /2(x,y)|},

где X1 = {(x,y,/1(x,y))};X2 = {(x,y,/2(x,y))}.

3. Пусть X = {(x,y,/(x,y))|(x,y) € M2}.

Поставим задачу по вычислению предиката [a € X] , где a = (x,y,z) € M3. Удобным аппаратом для вычисления предиката [a € X] является теория разложения изображения X по предикатам Радемахера [74].

Будем различать на множестве M предикаты Радемахера:

/ ч _ Г и, если (х = к + 1 )к(гт(г, к) = 1); (г = 0, п), к = 0, 2п - 1;

\ л, в противном случае,

где гт(г,к) — дискретные функции Радемахера (см. п. 13.4.8). Введём согласно работе [80] точечные предикаты Р^(ж)

„ , ч I и, если х = t,(t = 1, 2п): Pt(x) = ^

л, в противном случае.

Пусть

X = {{x, y, f (x,y))|(x,y) € M2} = {<¿11, «12,¿13), •••, (¿11, ¿12, ¿13)}• Соответствующий этому изображению предикат

P(Ж1,Ж2,Жз) = [<Ж1,Ж2,Жз) € X]

можно записать так [74] :

P (Ж1,Ж2,Жз) = Piu,ii2,ii3 (Ж1,Ж2,Жз) V ••• V Pia,ii2,ii3 (Ж1,Ж2,Жз),

где _

РЬ1^2^з(Ж1,Ж2,Ж3) = Pijl{xi)kPij2{x2)kPij3{x?,), [j = l,£). (*)

Подставим в выражение (*) замену :

Pijk (xfc) ^ Rj(xk)&...&Шк (xk), (k = 1, 2, 3),

где iRUxk) = ( Rjxk\есЛи [q - 1]n-P+1 = 0;

[ — Rp(xk), в противном случае.

^Яр(жк), в противном случае. Заметим, что нумерация двоичных разрядов начинается с нуля младшего разряда:

п— 1

р =1, 2,..., п; Я € {¿^}, 5 = ^ 2* ■ & € {0,1}.

*=0

Тогда получим требуемое разложение изображения по предикатам Радемахера [74].

В ряде случаев такое представление изображения оказывается экономичнее и вычисление предиката принадлежности при этом более эффективно, нежели при переборе всех точек исходного изображения.

4. Наконец, операция полусумма изображений X!, X2 Q Я :

XIШ Х2 = {(х, у, [/1 (х, у) + /2(х, у)]/2)},

где X1 = {(ж, у,/1(ж, у))}; X2 = {(ж, у, /2(ж, у))}, [■] — целая часть числа.

5. При работе с текстурами важно уметь построить адекватную модель классификации для априорно заданных классов текстурных изображений [11]. В данном случае такая модель строится для пространства наблюдений Р текстурных изображений на основе обучающей информации с порождением отношений-образов двухместной операцией, определяемой с помощью полусуммы.

Пусть имеется множество текстурных изображений Т с отображением О : Т ^ Р в пространство дискретных изображений Р, где в качестве дискретных взяты изображения

X* = {(ж,у,/(ж,у))|(ж,у) € М2,/(ж,у) : М2 ^ М}.

В пространстве наблюдений Р имеется обучающая выборка О = (0^1), 0^2),..., О(Х^)) такая, что О^) = X1,..., О(ж^) = XI, где X* = {(ж, у,/ (ж,у))|(ж,у) € М2,/ (ж, у) € М}, и задана классифицирующая функция я : 1 ^ £ — число классов; 1 ^ {1,2, ...,1},

На множестве Р введем бинарную операцию ЕЕ, чтобы получить алгебру <Р;ЕВ) с основным множеством Р и операцией ЕВ. С помощью бинарной операции и множеств Ак = {Х^ € где Ик = {г\д (¿) = к}, (к = порождаются отношения-образы Рд.,

(А; = 1,£), так как рассматривается модель М = (Р,; ..., с основным множеством и отношениями ^1,^2,..., Р;.

Построенная модель М адекватна исходной модели О = (Т;Т1,...,Т*) с основным множеством Т,- и некоторыми априорно заданными классами Т\ С Т, (г = 1,£). Адекватность достигается тем, что операция ЕВ отражает компактность, имеющую место между текстурами одного класса.

Решающее правило для классификации текстур зададим в виде

1, если П(а) € р;

0, в противном случае.

С помощью основного свойства модели M определим отношения-образы Fi :

{(x,y,f(x,y))} <= Fit* fr(x,y) < /(ж, у) < frx(x,y)-,i = M,

где /r(max)(x,y) = min(max)/j(x,y); j € A.

Предикат Pi (а) эффективно вычисляется для любого a € T.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

15.2. Представление точечных изображений предикатами Радемахера

Рассматривается представление точечных изображений в системе предикатов Радемахера. Показано, что в ряде случаев такое представление после минимизации позволяет сократить исходное описание. Предложенная процедура описания изображений предикатами Радемахера может быть использована для построения генераторов изображений [74].

Точечные изображения примем в виде функции / (x, y) двух переменных с областью определения = {(х, у) \х, у = 1, 2,..., 2п } , областью изменения pf С {1, 2,..., 2га} для некоторого n € N ^ {0,1, 2,...} . Если задана функция / (x, y) , то с ней можно взаимно однозначно сопоставить отношение F следующего вида: F = {(x,y,/(x,y)) |(x,y) € D} .

Задача состоит в том, чтобы отношение F, соответствующее функции /, представить в базисе предикатов Радемахера.

15.2.1. Разложение отношения по предикатам Радемахера

Введем множество M ^ {1, 2,..., 2n} . Дискретные функции Радемахера, определенные в m = 2n точках, вычисляются следующим образом (см. п. 13.4.8):

гт(0,к) = 1, (к = 0, 2™-1);

rm(l,k) = J +1' Л - 0, 2- 1-1;

— 1, k = 2n-1 — 1, 2n — 1 . Остальные функции генерируются с помощью итерационного уравнения

гт(г, к) = гт(г - 1, 2к mod 2га); (г = 2, щ к = 0, 2п - 1). Предикаты Радемахера на множестве M имеют следующий вид:

(х) _ \ 1, если (х = к + 1 )к(гт(г, к) = 1); (г = 0, п) , к = 0, 2п - 1; ^ I 0, в противном случае.

Точечные предикаты Р^ (ж) определяются на множестве М следующим образом:

л , , Г 1, если x = t,(t = 1, 2га);

Pt (x) = S п

0, в противном случае.

Пусть F = {(x, y, / (x, y)) |(x,y) € D} = {(¿11,¿12,¿13),..., (¿11, ¿12, ¿13)} . Соответствующий этому отношению предикат

, f 1, если (x1,x2,x3) € F; P (x1,x2,x3) = i n

0, в противном случае,

можно записать в виде дизъюнктивного разложения по «единичным» значениям предиката P(x1,x2,x3) на кортежах (¿я, ¿i2, ¿i3) :

P (x1,x2,x3) = Piu,ii2,ii3 (x1,x2,x3) V ... V Pi£1,i£2,i£3 (x1,x2,x3) ,

где _

Ргп,г32,г33 (Ж1,Ж2,Ж3) = Р^ (Хг) кР%п (ж2) ЬР^ (ж3) , (.] = 1,1). Подставляя в последнем выражении вместо Рг^ (ж к)

Р? (Хк) = Я? (Хк) (Жк) &...&ЯП'к (ЖЛ) ,

д , . . Яр (жк), если (п — р +1) разряд двоичного разложения числа д — 1 равен 0;

где

Яр (жк) 1 —Яр (жк) , в противном случае, (к =1,2,3) (нумерация разрядов начинается с нуля младшего разряда), р = 1,2, ...,п; д € },

п—1

д = ^ 2гдг, дг € {0,1} , получаем требуемое разложение отношения по предикатам Раде-

г=о махера.

Разложение функции / (ж, у) по функциям Уолша приводится в работе [7]. Пример 15.1. М = {1, 2, 3, 4} , п = 2.

0 12 3 к

г(0, к); к = 0,3

к г(1,к)] к = 0,3

1

-1

г(2, к)] к = 0,3

Рис. 15.1. Функции Радемахера при п = 2

/(ж, у)

4 2 2 1 1

3 2 2 1 1

2 2 2 1 1

1 2 2 1 1

1 2 3 4

Рис. 15.2. Изображение / (ж, у)

Тогда отношение Р, соответствующее функции / (ж, у) (рис. 15.2), представимо в виде набора кортежей:

Р = (1,1, 2), (1, 2, 2), (1, 3, 2) , (1, 4, 2), (2,1, 2), (2, 2, 2), (2, 3, 2), (2, 4, 2), (3,1,1), (3, 2,1), (3, 3,1), (3, 4,1), (4,1,1), (4, 2,1), (4, 3,1), (4, 4,1). Предикатное описание этого отношения Р можно представить следующим образом:

Р (ж1,ж2,жз) = Р1Д;2 (ж1,ж2,жз) V Р^.2 (жЬж2,жз) V Р1Д2 (жЬж2,жз) V VPl,4,2 (ж1,ж2,жз) V Р2Д)2 (жЬж2,жз) V Р2,2,2 (жЬж2,жз) V Р2,з,2 (ж1,ж2,жз) V VP2,4,2 (ж1,ж2,жз) V Рз,1,1 (ж1,ж2,жз) V Рз,2,1 (ж1,ж2,жз) V Рз;зд (ж1,ж2,жз) V VPз,4,1 (ж1,ж2,жз) V Р4ДД (ж1,ж2,жз) V Р4Д1 (ж1,ж2,жз) V Р4Д1 (ж1,ж2,жз) V VP4,4,1 (ж1,ж2,жз) =

1

к

= Р2 (жз) & (Р1 (ж1) &Р (ж2) V Р2 (ж2) V Рз (ж2) V Р4 (ж2)) V VP2 (ж1) &Р2 (ж2) & (Р1 (ж2) V Р2 (ж2) V Р3 Ы V Р4 (ж2)) V VPl (жз) &Рз (ж1) & (Р1 (ж2) V Р2 (ж2) V Рз (ж2) V Р4 (ж2)) V VP4 (ж1) & (Р1 (жз) & (Р1 (ж2) V Р2 (ж2) V Рз Ы V Р4 (ж2))) = = Р2 (жз) & (Р1 (ж2) V Р2 (ж2) V Рз (ж2) V Р4 (ж2)) & (Р1 (ж1) V V Р2 (ж1)) V Р1 (жз) & ((Р1 (ж2) V Р2 (ж2) V Рз (ж2) V Р4 (ж2)) & &( Рз (ж1) V Р4 (ж1))) =

= Р1 (ж1) &Р1 (ж2) &Р2 (жз) V Р1 (ж1) &Р2 (ж2) &Р2 (жз) V VPl (ж1) &Рз (ж2) &Р2 (жз) V Р1 (ж1) &Р4 (ж2) &Р2 (жз) V VP2 (ж1) &Р1 (ж2) &Р2 (жз) V Р2 (ж1) &Р2 (ж2) &Р2 (жз) V VP2 (ж1) &Рз (ж2) &Р2 (жз) V Р2 (ж1) &Р4 (ж2) &Р2 (жз) V VPз (ж1) &Р1 (ж2) &Р1 (жз) V Рз (ж1) &Р2 (ж2) &Р1 (жз) V VPз (ж1) &Рз (ж2) &Р1 (жз) V Рз (ж1) &Р4 (ж2) &Р1 (жз) V VP4 (ж1) &Р1 (ж2) &Р1 (жз) V Р4 (ж1) &Р2 (ж2) &Р1 (жз) V VP4 (ж1) &Рз (ж2) &Р1 (жз) V Р4 (ж1) &Р4 (ж2) &Р1 (жз) =

= яЙ2 (жз) (жз) & ( (Я (ж2) &яя2 (ж2) V яЙ2 (ж2) & &Я2 (ж2) V Яз (ж2) (ж2) V Я4 (ж2) & Я4 (ж2^ &

& (Я1 (ж1) &Я1 (ж1) V Я2 (ж1) & Я2 (жО) V Я (жз) & &Я1 (жз) & ( (Я (ж2) (ж2) V Я (ж2) &Я2 (ж2) V ví?3 (ж2) &яя2 (ж2) V Я4 (ж2) & Я4 (ж2^ & (Яз (ж1) &

&Яз (ж1) V Я4 (ж1) & Я4 (ж1))) =

= Я1 (жз) &-Я2 (жз) & ((Я1 (ж2) &Я2 (ж2) V Я1 (ж2) & &—Я2 (ж2) V —Я1 (ж2) &—Я2 (ж2) V —Я1 (ж2) &—Я2 (ж2) & & (Я1 (ж1) &Я2 (ж1) V Я1 (ж1) &— Я2 (ж1))) Я1 (жз) & & (Я2 (жз) & ((Я1 (ж2) &Я2 (ж2) V Я (ж2) &—Я2 Ы V V—Я1 (ж2) &Я2 (ж2) V —Я1 (ж2) &— Я2 (ж2)) & & (—Я1 (ж1) &Я2 (ж2) V —Я1 (ж1) &— Я2 (ж1))) =

= Я1 (жз) &—Я2 (жз) & ((Я1 (ж2) & (Я2 (ж2) V —Я2 (ж2) V V Я2 (ж2)) V —Я1 (ж2) &— Я2 (ж2)) & (Я1 (ж1) &Я2 (ж1) V V— Я2 (ж1))) V Я1 (жз) &Я2 (жз) & ((Я1 (ж2) & (Я2 (ж2) V V— Я2 (ж2)) V —Я1 (ж2) & (Я2 (ж2) V — Я2 (ж2))) &—Я1 (ж^ & & (Я2 (ж1) V — Я2 (ж1)))) = Я1 (жз) &—Я2 (жз) & & ((Я1 (ж2) V —Я1 (ж2) &— Я2 (ж2)) & Я1 (ж1)) V Я1 (жз) & &Я2 (жз) & ((Я1 (ж2) V —Я1 (ж2)) &— Я1 (ж1)) = Я1 (жз) & &—Я2 (жз) &Я1 (ж2) &Я1 (ж1) V Я1 (жз) &Я2 (жз) &—Я1 (ж1).

Таким образом, искомый предикат примет окончательный вид:

Р (ж1,ж2,жз) = Я1 (жз) &—Я2 (жз) &Я1 (ж2) &Я1 (ж1) & &Я1 (жз) V Я2 (жз) &—Я1 (ж1) = Я1 (жз) & (я1 (ж1) & &Я1 (ж2) &—Я2 (жз) & V —Я1 (ж1) & Я2 (жз)).

В работе [10] доказано, что предикаты Радемахера составляют полную систему относительно любого семейства п -местных предикатов. Отсюда следует, что любое точечное изображение Р можно представить в виде комбинации предикатов Радемахера, связанных пропозициональными связками. Последующая минимизация такого представления методами, описанными в работе [71], позволяет получать минимальную форму точечного изображения, разложенного по предикатам Радемахера.

Таким образом, представление точечных изображений предикатами Радемахера позволяет в ряде случаев сократить исходное описание. Учитывая тот факт, что предикаты Радемахе-ра хорошо реализуются регистрами [7, 10], на их базе можно строить генераторы точечных изображений.

15.3. Описание текстурных изображений с помощью предикатов Радемахера

Пусть на R2 задано некоторое текстурное изображение (полутоновое, цветное). Выберем на области D Q R2 конечное поле-изображение, имеющее m цветов. Пронумеруем цвета от 1 до m. Пусть |D| = d и имеется разбиение области D на t классов эквивалентности

Di, (i = 1 , t) или подполей-изображений так, что U Д = Д и для г ф j, Di П Dj = 0,

i=1

|Di| = di € N ^ {0,1, 2,...} .

Определение 15.1. Пару ((x,y) ,j) назовем пикселом поля-изображения D, если в точке (x, y) € D имеет место j -й цвет j € Im ^ {1, 2,..., m}, m € N.

Определение 15.2. Множество пикселов Ud = {((x,y), j) | (x,y) € D} назовем изображениями поля изображения D. Соответственно для Di, Ud = {((x,y), j) | (x,y) € Di} подызображения подполя-изображения Di.

Изображения подполей-изображений можно укрупнять с помощью операций объединения DiVj = Di U Dj, (¿,j € ^ {1, 2, ...,t}), t € N или в общем случае DilVi2v...vin = = Dii U Di2 U ... U Din.

Обозначим через S ^ {Di|z € It} разбиение области D, а через A ^ (S; ст) — алгебру с основным множеством S и сигнатурой ст = (U). Имеет место

Теорема 15.1 [80]. Множество L ^ {Di1vi2v...vi„\ij € 3t]j = есть верхняя

полурешетка относительно частичного порядка ^ такого, что (Va, b € L) [a ^ b ^ a Q b с наибольшим элементом D € L].

С каждым элементом a € L свяжем изображение Ua = {((x,y), j)|(x,y)€ D} поля-изображения D.

На практике обычно области будут прямоугольные: D = {(х,у) \х = l,k\] у = 1 ,fc2} или квадратные, когда k1 = k2. Пусть имеется изображение Ud, D = M2; M ^ {1, 2,..., k} .

Поставим задачу по вычислению предиката [a € Ud] , где а = ((x,y), j) € M3.

Для вычисления предиката [a € Ud] воспользуемся разложением изображения по предикатам Радемахера [74]. Будем различать предикаты Радемахера на множестве M

к (х) — { если = р) ^ (г р — 1) = 1); = 1)р £ м) I 0, в противном случае,

г ^ к), р — оператор минимизации [119]; г (¿,р) -махера, определенные в точках и точечные предикаты Р^ (ж) =

, п,

0, в противном случае,

где п = р,г (2^ ^ к), р — оператор минимизации [119]; г (¿,р) — дискретные функции Раде-

1, если ж = ¿; 0, в противном случае. Пусть Цо = {(ж, у,| (ж, у) € М2} = {(¿11, ¿12, ¿1з),..., (¿я, ¿12, ¿1з)}, соответствующий этому изображению предикат Р (ж1,ж2,жз) = |"(ж1,ж2,жз) € Цо] можно записать так:

Р (жЬж2,жз) = Ргц,г12,г1з (ж1,ж2,жз) V ... V Рг£ьг£2,г£3 (ж1,ж2,жз) ,

где Яьг^з (Ж1,Ж2,Ж3) = Рд (а?1) & (ж2) & (ж3); 0' = 1, £) ■ Введя замену Р^к (ж*) = Я{к (ж*) & ... & ЯЙ'к (ж*); (к = 1, 2, 3),

где Яр (ж*) = ( Яр(ж;)' если ^(<? - 1)]п-р = 0; р [ —Яр (ж*) , в противном случае,

2™

г/ = —, [•] — целая часть числа (нумерация двоичных разрядов начинается с нуля, с млад__га— 1

ших разрядов р = 1,п); д = £ 2г • ^ € {0,1}, мы находим требуемое разложение по

г=0

предикатам Радемахера [74].

15.4. Классификация текстур методом коллективного голосования

Важное место при решении задач классификации текстур занимают такие вопросы, как выбор оптимального количества элементов исходной обучающей выборки О, построение эффективной процедуры обучения и минимизации окончательной обучающей выборки в целях дальнейшей ее эксплуатации в режиме дешифрирования (классификации) указанных объектов [69].

Определим возможности метода коллективного голосования в решении указанных вопросов.

Исходным материалом является обучающая выборка О, класс контрольных выборок А = {К1, К2,..., Кг} и класс испытательных выборок В = {^1,^2,...,^} . Предполагается, что выборки формируются при фиксированной системе признаков.

15.4.1. Дискретизация обучающей, контрольных и испытательных выборок

Пусть $ = О и А и В, где О = ||агц ||тхп — обучающая выборка, агц — значения непрерывных признаков (г = 1, т; у = 1, п) .

Пусть [аг,Ьг] —интервал распределения г -го признака; аг —нижняя граница; Ьг —верхняя граница г -го признака.

Пару (г,/ (г)) назовем «паспортом» для кортежа (агь..., агп); обозначим множества номеров эталонных объектов ^ {г|/ (г) = к} , (к = 1, ¿) , классифицирующую функцию

/ : 1т ^ 1 ^ {1, 2,..., г}, 1т ^ {1, 2,..., т}, г, т € Ж,

г — число классов (эталонов).

Пусть для некоторого г > 0, определяющего глубину (шаг) квантования, с помощью оператора дискретизации Ф (0, г) получена матрица Ф (0, г) = О (г) = ||1гц ||тхп .

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Между номерами кортежей 1г = (¿г1,___, 1гп) и ^ = (Ц1,1^2,..., 1цп) установим отношение

эквивалентности следующим образом: = Ц (VI = 1, п) [¿¿2 = .

Профакторизуем каждое множество {к = 1,£) по отношению эквивалентности то

есть рассмотрим фактор-множество . Взяв по одному кортежу с «паспортом» (г,/ (г)),

где г принадлежит классу эквивалентности <Х/ € по всем к = и, пронумеровав всю

полученную выборку от 1 до (¿1 + ¿2 + ... + 14), получим минимальную матрицу

О^ (г) =

( а11 а12 ... а1п ) (а1х+12+...+1( ... а11+12+-+1гп)

с классифицирующей функцией /^ (г) такой, что

{1, если 1 ^ г ^ 1;

2, если 11 + 1 ^ г ^ 11 +12;

г, если 11 — 12 — ... — ¿4—1 + 1 ^ г ^ ¿1 + + ... +

Полученная матрица далее используется для классификации посредством некоторых решающих правил [70]. Рассмотрим одно из наиболее распространенных — метод коллективного голосования.

15.4.2. Метод коллективного голосования

Пусть имеется некоторая минимизированная обучающая эталонная матрица

(«11 «12 . .. «1п)

О= («21 «22 . .. «2п)

(«11 «12 . . «1п)

с классифицирующей функцией /г : 1 ^ 14, где 1 число классов).

{1, 2,..., 1} , ^ {1, 2,..., г} , (г

Предъявляется неизвестная реализация ж = (ж1,...,жп), для которой считается величина

п

отнесения этой реализации к г -му объекту классификации при обучении ¿г = 52 Р («гц, жц),

__3=1

(г = 1,1) , где — мера близости между эталонным и^ и предъявленным х^ значе-

ниями признаков в реализации ж :

Р (uj ,xj) =

1, если «ц = жц; 0, в противном случае.

Далее вычислим максимальное значение ¿о = тах (¿1,..., ¿п), частное решение которого, определяющее идентификацию объекта ж, фиксируется предикатом

R(x) =

1, если ¿i = ¿о;

0, в противном случае.

Пусть Dfc ^ {i|f {i} = k} , (k = l,i) — множество номеров эталонных объектов.

Тогда общее решение будет вычисляться предикатом Qk (x) следующего вида:

Qfc (x) = V Ri (x). ieDfc

Таким образом, полученное правило классификации есть не что иное, как правило коллективного голосования, которое допускает многоальтернативное решение.

15.4.3. Эффективное обучение и полнота обучающей выборки

Достижение максимального значения надежности классификации по глубине квантования назовем эффектом экстраполяции контрольной выборки относительно обучающей выборки О. Этот эффект удобно использовать в задаче оптимизации построения обучающей выборки для дальнейшей её эксплуатации.

Оптимизация ведется следующим образом.

1. Производится поиск максимума H надежности классификации Ki относительно обучающей выборки О° с помощью выбранного решающего правила.

2. Обучающая выборка расширяется так: Oi = Оо U K°. Пункты 1 и 2 повторяются для всех Кг, (г = 1,<£) так, что

О2 = Oi иK°,...,Od = Od-1 Uk°,

где K° = {x — неверно классифицировано |x € O° } .

Замечание 15.1. Каждый раз К®, (i = 1 ,d) строится в точке 3max, когда достигнута максимальная надежность классификации.

Таким образом, эффективно построенная обучающая выборка Od является исходным материалом для проверки качества обучения с помощью класса испытательных выборок B.

Критерием качества обучающей выборки может служить «почти точное»» равенство (VUi,U2 € B) [H (r max (Ui)) » H (r max (U2))] .

Другими словами, если для любых двух испытательных выборок системы B надежность классификации стабильна, то система обучена полностью.

Общую надежность классификации системы можно оценить математическим ожиданием a = min (aii, a2i,..., amj); bj = max (aii, a2i, •••, am).

Оператор дискретизации Ф (A, n) переводит любую матрицу следующим образом: если

A =

Jj llfcxn

,О =

a

ij Hmxn

, то Ф (A, n) = A (r) =

llfcxn ,

где =

Pij-

Aj

A,-

(г = 1 , к; ] = 1,Щ г € {1,2,...}), здесь квадратные скобки означают целую часть числа; (ац, Ьц) — характеристики матрицы О.

Надежность классификации Н (А) при работе выбранного решающего правила вычисля-количество верно и однозначно

ется так: H (A) = матрице A.

классифицируемых объектов из A

И

100%, где |A| — число элементов в

_ bj-aj.

j

r

15.4.4. Минимизация обучающей выборки

Переход от матрицы О к О (г) (см. п. 15.4.1) будем понимать как действие оператора, то есть Ф(О,г)= О (г), г € {1, 2,...} .

Пусть обучающая выборка О = Ца^||тхп такова, что задана классифицирующая функция

Е Я(гтах(Я)}

/ : Зт где М (53) = |в|-.

Понятие «почти точного» равенства можно уточнить, а именно: для некоторого небольшого отклонения дисперсия О(В) не должна превышать заданного порога то есть

Е [м (В) - Н (гтах (Я))]2 В (53) = ^--- < 6.

Замечание 15.2. Все выборки из О формируются случайным образом с тем расчетом, чтобы в каждом классе обучающей выборки О было 80-100 объектов (кортежей) и для любого объекта из А, |А| ^ 100.

Эти оценки приведены из статистических соображений с учетом точности вычисления надежности классификации [105].

15.5. О минимальном разбиении растрового изображения

В настоящее время общий метод разбиения изображения на части пока неизвестен [144]. Более того, существующие частные методы представления растровых изображений, включая поточечный и разложение в спектры (типа Уолша, Хаара и т.д.), дают избыточные описания изображений [139, 144].

Предлагается метод разбиения изображения из множества А плоских точечных черно-белых изображений на конечном растре на минимальное число базисных прямоугольных элементов.

На основе канторовской нумерации введено понятие и изучены свойства геометрического спектра изображения, являющегося глобальным признаком при анализе растровых изображений. Формализован процесс синтеза растровых изображений как процедура построения структурного графика изображения нумерацией элементов «натурального базиса» и элементов группы преобразований. Предложен алгоритм оптимизации, позволяющий значительно сократить объем памяти ЦВМ при машинном анализе и синтезе изображений. Доказана универсальность предложенного алгоритма для класса растровых изображений [92].

Введем некоторые определения.

Определение 15.3. Классом, базисных прямоугольников назовем множество прямоугольников Ф ^ (ж, у)} со сторонами ж, у € ^\0, удовлетворяющих условию

(Уг,з € N\0) (ЗЛ € N\0) [рп (ж*, у) П (ж,, у,) = № (ж*, у*)]

Согласно данному определению некоторый базисный прямоугольник (ж, у) есть множество точек плоскости

№ (ж, у) ^ {<ж4,у4> |(0 < ж* < ж) & (0 < у4 < у)} ,

где ж^у^ € О (О — множество действительных чисел); ж, у € N\0 (N\0 — множество натуральных чисел без 0 ).

Определение 15.4. Классом параллельных переносов над базисными прямоугольниками назовём группу О = <{д )} , о> преобразований д , ) со значениями € N переносов базисного прямоугольника по осям ж, у и групповой операцией (о) композиции преобразований.

В соответствии с определениями 15.3, 15.4 некоторый прямоугольный элемент а изображения А € А имеет вид

а = д (¿хЛ) № (ж, у).

Определение 15.5. Геометрическим спектром (ГС) изображения А относительно класса базисных прямоугольников Ф назовем график

(А) ^ {<Л (с (ж, у)) ,с (ж,у)>} ,

где с (ж, у) —канторовская нумерация [119] пар <ж,у> базисных прямоугольников (ж, у), осуществляющая однозначное отображение

с : N х N ^ N

а соответствующая Л -я гармоника геометрического спектра есть натуральное число

Л (с(ж,у)) = |{д ) |д) № (ж,у) € А}|.

Содержательно геометрический спектр изображения А показывает, какие базисные прямоугольники (ж, у) и сколько их Л (с (ж, у)) содержит изображение А. Первая гармоника геометрического спектра Л (1) интерпретируется как площадь изображения А (как, например, в спектре Уолша), а остальные гармоники дают представления о площадях оставшихся частей изображения А.

Важность определения 15.5 подчеркивают следующие леммы [92], приводимые без доказательств.

Лемма 15.1. Для непустого изображения А € А существует его единственный геометрический спектр £ф (А).

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Лемма 15.2. Геометрический спектр £ф (А) инвариантен относительно следующих преобразований изображения :

а) параллельный перенос по осям ж, у;

б) отражение относительно осей ж, у.

Лемма 15.3. Геометрический спектр ¿>ф(А) изображения А, полученного поворотом изображения А на угол п/2, равен инверсии £ф (А). Геометрический спектр (ГС) изображения А, то есть

5ф(1) = {(к (с (х, у)), с (у, ж))} =

где Л(с(у,ж)) = |{д(^4М^ХЛМу,ж) € А}^ ¿х = ¿Ул = ¿х.

Поскольку ГС £ф(А) не дает одно-однозначного описания изображения, то вводится следующее.

Определение 15.6. Структурным графиком изображения А, образованного из базисных прямоугольников класса Ф с помощью преобразований из группы О, назовем график

£с,ф(А) ^ {<с(^хл),с(ж,у)>|а(п,т) = )^(ж,у) € А},

где с , ¿у) = п, с (ж, у) = т есть соответственно канторовские номера пар >, <ж,у>;

а (п, т) — прямоугольный элемент изображения А.

Структурный график (А) дает уже одно-однозначное описание изображения, по-

скольку содержит полные описания всех его прямоугольных элементов а (п, т).

Определение 15.7. Произвольный подграфик (А) геометрического спектра £ф (А) изображения А назовем р-м геометрическим подспектром изображения А.

В следующем важном определении нам понадобится лемма 15.4.

Лемма 15.4. Непустое пересечение любых двух прямоугольных элементов изображения А снова является прямоугольным элементом того же изображения А.

Для с (ж, у) = т обозначим, согласно книге [119], через I (т) = ж, г (т) = у соответственно левый и правый элементы пары (ж, у).

Определение 15.8. Полным подспектром (А) = {(к (т), т)} изображения А назовем подспектр изображения, удовлетворяющий условию:

ЕЕ Б [а (п,т)] - Е Е Е Е Я [а (пг,тг) П а (п,т,-)] = к (1), (15.1)

п=1 т=1 п$=1 mi=1 п2 = 1 т^ = 1

где г,_7 € Ж, (п^т^) = (п, т^-) ; г — число элементов подграфика структурного графика (А) изображения А, соответствующего минимальному полному подспектру; Б [а (п, т)] = = I (т) ■ г (т) есть площадь элемента а (п, т) .

Условие (15.1) выражает критерий полноты покрытия изображения А элементами, соответствующими подспектру (А).

Определение 15.9. Мерой сложности подспектра (А) назовем число

Жр (А) ^Е [1р (т) + гр (т)] ■ кр (т), (15.2)

т=1

где £ — число гармоник ГС изображения А; 1р, гр, кр — параметры р-го подспектра

(А).

Определение 15.10. Минимальным полным подспектром (А) изображения А назовем полный подспектр с минимальной мерой сложности.

Определение 15.11. Минимальным разбиением изображения А называется разложение его на минимальное число базисных прямоугольников (ж, у) .

Теорема 15.2 [92]. Минимальное разбиение изображения А является подграфиком его структурного графика (А) = {(п,т)} , соответствующим минимальному полному подспектру £ф (А) = {(к (т), т)} .

Процедура построения минимального разбиения изображения А, заданного поточечно, на основе теоремы 15.2 выглядит следующим образом:

1) построение контуров изображения А методом отслеживания границ;

2) построение структурного графика (А) изображения А;

3) построение минимального разбиения изображения А по критериям (15.1), (15.2).

В п. 2 вышеописанной процедуры изображение А разбивается на части продолжениями отрезков его контура, построенных в п. 1, а затем выделяются всевозможные прямоугольные элементы, образующие структурный график изображения А.

Отмечено [142], что вопрос об универсальности алгоритма разбиения для класса А изображений решается в зависимости от того, частично рекурсивна или нет частичная характеристическая функция любого изображения А из класса А :

, , Г 0, если точка г € А; ХА (г) =

не определена, в противном случае. Указанная частичная характеристическая функция построена конструктивно:

/ V-!

ХА (г) = ,вд

ЕА^ (г)

Й=1

-^ , (15.3)

где А^ (г) = ^ (г) — (г) есть приращение фазового угла радиуса-вектора в точке г и концом в к -й вершине контура изображения А; V — число вершин контура; зд (а) — знак числа а.

Поскольку функция ха (г) — вида (15.3) частично рекурсивна [119, 142], то построенный алгоритм универсален для класса А изображений.

Предлагаемый метод представления изображений минимальным числом прямоугольных элементов позволяет сокращать объем памяти ЦВМ для хранения изображений.

Для оценки эффективности предлагаемого метода представления изображений в «натуральном базисе» по сравнению с поточечным методом и представлением в спектре Уолша решалась на ЦВМ контрольная задача «Робот», в которой изображение на растре 128 х 128 требовало для описания поточечным методом 15 736 ячеек памяти, неусеченное представление в спектре Уолша занимает 16 384 ячейки, а предлагаемым методом — всего 40 ячеек памяти ЦВМ.

15.6. Алгоритм параллельной трассировки многоконтактных цепей

Автоматическая трассировка печатных соединений между парами контактов обычно осуществляется с помощью волнового алгоритма Ли [192] и его эвристических модификаций [189, 197]. В данной работе расширяется понятие эвристического алгоритма для параллельной трассировки многоконтактной цепи [93].

Пусть {О1, О2,..., О&} — множество контактов (источников) цепи. Для любой ячейки г, лежащей на кратчайшем пути, который исходит из источника О^, функция стоимости / определяется следующим образом [197]:

/(г) = д(г) +а(1{Ог,1), г = Т/к,

где д (г) — некоторая известная функция стоимости; а — заданная константа; ^ (О^,г) — расстояние от источника О^ до ячейки г по кратчайшему пути.

Если ячейка г предшествует ячейке ] при распространении волны от некоторого источника О4, то обозначим г У

Определение 15.12. Функция стоимости / называется монотонной, если для любых ячеек г,^, лежащих на одном пути, выполняется условие

[г У 3] ^ [/ Ш ^ / (г)].

Введем следующую эвристическую функцию е стоимости:

е (к) = / (к) + а Е с (к, гр); р ф £ =

(15.4)

р=1

где с(г^, гр) — расстояние Манхэттена (оценочная функция) между ближайшими ячейками г^ и гр фронтов волн от источников О4 и Ор.

Предложение 15.1. Если д (г) — монотонная функция, то е также является монотонной функцией.

Доказательство. Для любых г^ У ^ покажем, что е ^ е (г^). Действительно, при Ь = р имеем

еШ = ЗЫ + а

^) + Е с(^,гР) р=1

= + а

^ д(г4) + а Предложение 15.1 доказано.

¿(О4 ,г4) + Е с(г*, гр)

р=1

р=1

= е(г*).

Определение 15.13. Алгоритм называется допустимым, если для любой монотонной функции пути / (г) он находит путь минимальной стоимости при условии, что последний существует.

Предложение 15.2. Пусть Р — допустимый алгоритм пути, / (г) — монотонная функция стоимости, Е — эвристический алгоритм, полученный из Р -алгоритма заменой функции / (г) на функцию е вида (15.4). Тогда Е -алгоритм находит путь с минимальной стоимостью / (г) .

Доказательство. Поскольку Е является допустимым алгоритмом, то он находит путь с минимальной стоимостью е, если такой путь существует. Для последней ячейки пути, которую находит Е-алгоритм, выполняются равенства

к

е = / + а Е с = ^ ^ ' ^ =

4=1

Так как е (¿¿) = / (24), то найденный путь имеет минимальную стоимость / (г). Предложение 15.2 доказано. □

Определение 15.14. Пространство поиска Ц- для цепи с контактами О1, О2,..., Ок, последней ячейкой г и функцией стоимости / есть множество ячеек г таких, что / (г) ^ / (г) на путях с минимальной стоимостью.

Предложение 15.3. Пространство поиска Ц- для Е -алгоритма есть подмножество пространства поиска иf для Р -алгоритма.

Доказательство. Для любой ячейки г € ие имеем е (г) ^ е (г). Поскольку / (г) ^ е (г) ^ е (г) = / (г), то по предложению 15.2 ячейка г находится на пути минимальной стоимости / (г). Тогда по определению 15.14 г € ^, что влечет ие С ^.

Предложение 15.3 доказано. □

15.7. Оптимизация некоторых этапов автоматизированного проектирования печатных плат

Применение известных методов автоматизированного проектирования печатных плат ограничивается большим объемом памяти ЭВМ для хранения геометрических и топологических описаний плат и значительным машинным временем для обработки указанных описаний. Отмеченные ограничения весьма существенны при использовании в проектировании средних и практически исключают возможность применения малых ЭВМ.

Предлагается метод минимального геометрического описания однослойных печатных плат, на основе которого методами планирования эксперимента отыскиваются оптимальные в смысле затрат памяти и времени счета ЭВМ решения взаимосвязанных задач компоновки плат и трассировки соединений между компонентами [91].

Каждая плата Р представляется в виде прямоугольного растра размерами Н х В ячеек и содержит базис А ^ {а(г,^)} всевозможных прямоугольных элементов а(г,^), где г = = с(£ж,£у), ] = с(ж,у) соответственно канторовские номера опорной вершины ) и раз-

меров сторон ж, у соответствующего прямоугольного элемента.

Применение канторовской нумерации с, осуществляющей взаимно однозначное отображение множества пар N х N натуральных чисел в множестве N натуральных чисел, позволило уменьшить размерность пространства параметров в решаемых задачах.

Последовательно решаются две поставленные выше задачи.

1. Задача оптимальной компоновки п плат Р набором ЕС А из т модулей. Вводится понятие геометрического спектра 5(Е) функционально полного набора Е компонентов (модулей)

5(Е) ^ {< %,;> |(34)[а(г,;) € Е]}, (15.5)

где ] -я гармоника спектра есть натуральное число

= |{г|(3;)[а(г,;) € Е]}|. (15.6)

Поставленная задача сводится к поиску некоторого оптимального разбиения спектра 5 (Е) на подспектры 5(Е*), где £ = 1, 2,..., п.

Множество М всевозможных вариантов компоновки плат определяется наборами параметров (факторов) Z/ = (%1, %2,..., Н, В, т, п) и с учетом очевидного соотношения

т=

можно описать векторами Z(kl, %2,..., , Н, В, п).

Каждый вариант оценивается по некоторым критериям оптимальности. В качестве одного такого критерия принят суммарный коэффициент заполнения плат компонентами

п вг

ЕЕ у*,.?

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

где е* — число гармоник подспектра 5(Е*).

В качестве другого критерия оптимальности предложена характеристика, которая «взвешенно пропорциональна» (в целях сглаживания поверхности отклика) общему числу т компонентов

п вг

М(^) = Е Е К; + у*,^. (15.8)

*=1 ¿=1

Очевидно, что для любых т1 < т2 (и соответствующих 21, 22 ) сохраняется отношение порядка М(2^ < М(22).

Оптимальный вариант компоновки соответствует максимуму критерия (15.7) и минимуму критерия (15.8), поэтому в качестве интегрального критерия оптимизации принят

.кг)

м(2) ■

Ограничениями при оптимизации являются:

а) [Уа(г1,;'1),а(г2,;'2) € Е4][а(гьл) П а(г2^2) = 0];

б) 5(Е*) С 5 (Р), где £ = 1, 2,..., п.

Полный перебор вариантов 2 уже при десяти уровнях дискретных параметров практически не позволяет определить максимальное значение интегрального критерия 3(2) даже путем вычислений на большой ЭВМ.

Для решения задачи компоновки предложен метод планирования эксперимента в дискретном пространстве параметров, близкий к способу пошагового уточнения параметров «знаний» об областях «приемлемых» и «неприемлемых» вариантов 2, что совместно с применением минимального геометрического описания плат позволило реализовать алгоритм компоновки с получением субоптимального решения на малой ЭВМ.

2. Задача оптимальной трассировки соединений между компонентами из набора Е* для £ = 1, 2,..., п.

На основе рассмотренного выше геометрического подхода к описанию печатных плат предлагается модификация известного волнового алгоритма, позволяющая сократить объем памяти и время счета ЭВМ при автоматической трассировке соединений на каждой плате:

а) методом отслеживания границ осуществляется переход от громоздких точечных описаний контактных площадок и запрещенных областей А, (г = 1,2,..., г) платы Р к их контурным описаниям;

б) разрешенная область соединений определяется выражением

К = Р\ и А;

г=1

в) множество М возможных вариантов разбиения области К на элементы а(г,^) базиса А представляется набором параметров V = (к1, к2,..., к8), где к1, к2, ..., к5 —гармоники геометрического спектра 8(И) , которые определяются выражениями, аналогичными выражениям (15.5), (15.6).

С целью сократить число переборов для поиска субоптимального варианта по критерию минимума М(V) вида (15.8) применяется вышеупомянутый метод планирования эксперимента в дискретном пространстве параметров:

г) для каждого элемента а(г,^) € А субоптимального варианта вычисляются значения модифицированных масс т[а(г,^)];

д) по вычисленным массам строятся минимальные непересекающиеся пути.

В случае неудовлетворительной трассировки осуществляется перекомпоновка плат по п.1.

В результате уменьшения требуемого объема памяти и времени счета вычислительной машины предложенные алгоритмы удалось реализовать на малой ЭВМ.

15.8. Алгоритм таксономии по связным областям

Рассматривается задача таксономии, где роль расстояния, а точнее связующего звена, между объектами, играет отношение толерантности т на множестве М [171].

Обозначим через М множество М ^ {а1, а2,..., ат} ; Н (X) —количество связных областей для подмножества X С М.

Алгоритм таксономии. Пусть X = {а1, а2,..., ат} С М. Если X = 0, то полагаем Н(Х) = 0. Если X = {а}, то Н^) = 1, и мы имеем один таксон Т1 = {а}.

Пусть п ^ 2. Положим Н(X) := 0, Ао = {а1}, Во = {а1,...,ап}. Для каждого Ь € Во, начиная с а2, проверяем отношение а2тЬ. Если отношение выполнялось для некоторого Ь € Во, то полагаем А1 = Ао и {Ь} , В1 = Во\ {Ь} . Если Ь1 есть элементы, то проверяем каждый элемент из В1 по отношению толерантности с элементами А1 и строим аналогично множества А2 и В2. Если на г -м шаге такая цепь оборвалась из-за отсутствия элементов В^, то полагаем Т1 = А^ и Н(X) := Н(X) + 1. Если все элементы В^ перебраны, а связанных отношением т элементов с элементами множества А^ не оказалось, то полагаем Т1 = А^, и если при этом В^ = {а}, то положим Т2 = {а}, Н^) := Н(X) +2. В противном случае выбираем а^ — первый элемент множества В^ и полагаем Ао = {а^ } , Во = Вг\{а^х} . Процесс вычисления повторяем.

Таким образом, создается своеобразное отношение эквивалентности =т на множестве X, фактор-множество которого XI =т = {Т1, Т2,..., Т^х)} .

15.9. Классификатор натуральных чисел на базе характеристических

функций

Рассматривается конечное множество чисел £ ^ {0,1,..., 2п — 1} и I его непересекающихся подмножеств £1, £2,..., £1 С £.

Задача состоит в том, чтобы эффективно реализовать решающие функции на базе характеристических функций множеств = 1,£) :

Хг(х) = V 1д\х - а\, (г = 1,£),

a&Si

_, , Г 1, если х = а:

где зд\х - а\ = <

0, в противном случае.

В этом случае множество £1,£2,...,£ можно интерпретировать обучающей выборкой О.

Классификатор чисел может быть реализован при этом в виде специализированного рас-

I

познающего устройства последовательно-параллельного действия, содержащего 52 |£» | реги-

г=1

стров кольцевого типа с записанными в них числами а,ц, a2i, ■■■, = 1)^)- При сдвиге

этих регистров поразрядно параллельно производится сравнение последних с неизвестной реализацией X. Результаты сравнения со схем сравнения записываются в регистры сравнения, содержащие n двоичных разрядов. Выходы этих разрядов подаются на схему конъюнкции (&), а выход схемы конъюнкции (&) заносится на вход схемы дизъюнкции (V), собирающей все выходы, соответствующие числам а € <S¿, (i = !,£)■ Таким образом, i-й выход схемы дизъюнкции V моделирует характеристическую функцию x¿(x) [10].

Такое техническое решение при моделировании характеристических функций позволяет добиваться инвариантности времени принятия решения к объему обучающей информации.

15.10. Нелинейные персептроны

Рассматриваются решающие правила для нелинейных персептронов, которые реализуют в своей структуре персептроны Гамбы с линейными решающими предикатами, связанные операцией умножения [127, 143].

Поскольку в таких персептронах в отличие от линейных персептронов имеется возможность экстраполяции (расширения) области влияния информативных зон на распознаваемые изображения, не включенные в обучающую выборку, то актуальность рассмотренных вопросов не вызывает сомнений [78].

15.10.1. Понятие обобщенного изображения

i

Пусть в пространстве A задано конечное множество точек R = (ai, a2,..., an}, A = (J X¿,

_ i=l

объединяющее некоторое множество изображений X¿, i= 1,£.

Под обобщенным изображением X будем понимать некоторое подмножество точек множества R, то есть X С R. Частный предикат принадлежности будем констатировать так:

г ^ Í 1, если a € X; [a € X] = < п , ~

0, если a € X.

Обозначим через V,¿1 множества X¿, а через (i = 1,£) — индексные подмножества

множества X¿, которые вычисляются по рекуррентной схеме:

^ X¿, (г = М),

yj+i = Í ^\У/,если V¿\V¡ ф 0, См = М); г 1 Vj, в противном случае.

Пусть вспомогательная матрица q =|| q¿, || строится из элементов q¿, следующим образом:

qij =

0, если ф 0, Ц, г = 1,£)]

1, в противном случае,

а частный решатель (идентифицирующий по информативному элементу а предикат)

Фг (X) =

£ [a € X! ^ 1 a&Vf

/1+1

1, если [a € X] = 1; 0, в противном случае.

15.10.2. Условия существования решения для нелинейного персептрона

Обозначим множество индексов 1 ^ {1, 2, ...,1} . Имеет место

Теорема 15.3 (о существовании нелинейного персептрона). Пусть обучающая выборка О ^ {Х1, Х2,..., Х1}, (Уг € 1 )[Хг = 0] и (Уг = ] € [^г^ = 1 ^ (^г = 0]. Тогда пре-

I

дикат идентификации неизвестного множества X : фг(Х) = Ф^(Х)&

обращается в «единицу»» тогда и только тогда, когда Х = Хг, где Х € О.

Е Ф,(X)&qij ^ 1 j=i

Доказательство. Возьмем произвольное Ь таких, что Ь €

Тогда Ф^г) =

£ [Ь € X] ^ 1

ьеУ,-

£+1

= 1.

Поэтому если удалось узнать, что для некоторого Ь € то это означает, что

Фг^г) = 1. Нужно заметить, что предикаты Фг (X) можно представить через дизъюнкцию Фг^) = V [а € X] . Тогда предикаты

д^) = Фг^- VФj (X)&qгj].

Т/'еЗДШ

Задача сводится теперь к тому, чтобы при условиях теоремы доказать, что существует I информативных элементов а € таких, что предикат фг^) = [аг € X] &

&—[ V [а. € X] ] обращается в «единицу» тогда и только тогда, когда X = XI, X € О.

Зё1(.\{г}

Далее, используя доказательство теоремы 3.12, получим справедливость теоремы. □ Предикаты £^¿(56), (г = 1,£) реализуют нелинейный перееитрон в силу того, что они связывают нелинейные предикаты Ф^^), реализуемые персептроном Гамбы, путем умножения на линейную часть с весами ^ :

¿ф. (X) & Зг,- ^ 1

.7 = 1

Замечание 15.3 (о чувствительности нелинейного персептрона). Поскольку информативные точки а € выбираются произвольно, то все точки информативной зоны равноправны и собираются в предикат Ф.(X), вычисляемый персептроном Гамбы. Это означает, что если представлена хотя бы одна точка а € информативной зоны изображения X, то предикаты фг^) гарантируют безошибочное решение.

Замечание 15.4 (об общности решений). Если обучающая выборка О разбита на Ь классов с помощью классифицирующей функции / : 1 ^ то общее решение ищем в следующем виде: = V (^¿(ЗЕ), где А = (г|/(г) = к}, (к = — множество номеров

эталонных объектов.

Замечание 15.5 (об интерпретации предикатов). Поскольку исходное пространство А абстрактное, то частные предикаты [а € X] , где а € К С А, X С К можно интерпретировать нейронами [127].

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Сформулированные условия существования решения для нелинейного персептрона демонстрируют возможность экстраполяции (расширения) области влияния информативных зон на изображения, не включенные в обучающую выборку.

15.10.3. Распознающий автомат на базе нелинейного персептрона

Построение распознающего автомата, время принятия решения которого равно одному такту сравнения неизвестной реализации, подвергнутой шумам и помехам, с эталоном обучающей выборки, является актуальной задачей [75, 78].

Пусть на обучающей выборке О = Ц«.введено расстояние р (ж, у) и линейный порядок ^ . Обозначим через V/, (г = 1,£) множества

V»1 = {«¿1,«г2, ..., «гп} .

Как и ранее, введем рекуррентную схему:

ур+1 = { УЖ, если ф 0, (и = м) ;

г I V7, в противном случае.

Обозначим через р0 минимальное расстояние между эталонами обучающей выборки О, не равное нулю.

Так как предикаты фг (X), согласно теореме 15.3, реализуются нелинейным персептро-ном, то для выделения линейной части необходимо и достаточно, чтобы матрица Ц^.|| была единичной.

Одно из условий линеаризации решающих предикатов дает

Теорем а 15.4 [16]. Пусть выполнены условия

1) (V* € 1*)

2) (V* € 1*)

V/ ф 0\ (\/г ф 2 € Зе) [щ ф щ] ; где щ = {иц,щ2, ...,щп) , щ = ■~,Щп)

У V1 = 0

7€1Л{г}

Тогда существует I чисел а% € таких, что предикат

„ Г 1, если а* = XI, XI £х = (Х1,Х2, ■■■,хп) ;

Яг(Х) = \ п

[0, в противном случае,

обращается в «единицу» тогда и только тогда, когда ОС - ^^) ос ^ О. Индекс ] выбирается

из условия аг = иг..

Для учета шумов и помех при распознавании необходимо расширить область решений предиката <5г(ж) в теореме 15.4.

Пусть на объекты ж = (х\, х2,..., хп), подаваемые к распознаванию, действуют шумы и

помехи так, ЧТО X € В г = Оц X О г 2 X О г 3 X ... X Огп, Где Оу = \ х3 з = Т~п).

р(иц,Хз) < (г = 1,£;

На множестве М ^ У В введем отношение толерантности т следующим образом:

г=1

жт«

1

< -П ■ ро. .=1 2

Тогда справедлива

Теорем а 15.5 [16]. Пусть выполнены условия

1) (V* е 3£)

2) (V* € 11)

Уг ф 0] (Уг ф 2 € Зг) [щ ф щ], щ = {иц,щ2, ...,щп); щ = («¿ъ «¿2, ...,щп)

V' \ и V1 = 0

7€1Л{г}

Тогда существует I чисел аг € таких, что предикат

д = Г 1, если р(сц,Хз) < \р0; г у 0, в противном случае,

обращается в «единицу» тогда и только тогда, когда оститу ОС ^ М, индекс ] выбирается из условия аг = «г..

Благодаря параллельному вычислению предикатов Qi (ж) и сравнению каждого эталона обучающей выборки с неизвестной реализацией по одной информативной точке достигается предельно быстрое (однотактное) действие распознающего автомата типа нелинейного персеп-трона.

15.10.4. Система типа «персептрон» для распознавания конечных множеств

Полученные теоретические результаты могут быть применены для построения распознающих устройств персептронного типа с симультанным (однотактным) способом принятия решения. Принципиально новым моментом является введение такого определения, как псевдосигнатура, фактически содержащая набор названий функционалов, в отличие от сигнатуры в теории алгебраических систем, которая содержит названия предикатов или операций [36, 119].

Для исходного семейства непересекающихся множеств М € Л0, М ^ {Х1, Х2,..., Хт} некоторых элементов ец € Хг, (г = 1 ,т) и неизвестной реализации X € М в персептрон для принятия решений вводится т предикатов вида

Фг(Х) =

Е ^г(а) ^ 1

где ^¿(а) = [р(а, аг) = 0] , р — евклидово расстояние.

Изучаемые в работе канторовские алгебры позволяют разводить сложно сцепленные классы конечных подмножеств натурального ряда и с этой целью могут быть использованы для построения эффективных решающих правил для классификации множеств.

Для поиска быстрых алгоритмов распознавания введем классы сложности (как и ранее при рассмотрении канторовских решеток):

П

Ц0 ^ {Хг, Х, € М |(Уг = 2 € 1т ^ {1, 2,...,т},т ^ 2)[Хг П Х, = 0]}; ^ {Хг, Хз € М |(Уг = 2 € 1т ^ {1, 2,...,т},т ^ 2)[С(Хг) П Сст (Х,) = 0]}.

0

где Са — канторовская операция с псевдосигнатурой а (определение 4.1).

По теореме 4.10 предикат равенства Р(Хг, Х) = [Хг = Х] можно заменить предикатом принадлежности Р(Хг) = [а € Хг] .

Однако предиката равенства по теореме 4.10 недостаточно для распознавания сильно слипающихся множеств Х, поэтому введём более сильную процедуру — предикат идентификации на основе канторовской операции.

Теорема 15.6 [79]. Пусть Х ^ {а1,...,аз-,...,аг} — неизвестная (распознаваемая) реализация на входе персептрона, Хг ^ {агх, аг2,..., агг. } — эталонный класс. Тогда Р(Хг, Х) — предикат идентификации неизвестной реализации Х с эталоном Хг представим в виде

Р(Х- Х) = / 1, если Сст(Хг) = ССТ(Х); г 0, в противном случае,

где Са(Хг) = {с(Ь,,а,)|(Уа, € Хг), 3 = 17г}; Ь, = с(сп(хь..., хп), а,); Са(Х) = {с(Ь, а)| (Уа € Х), Х € М}; Ь = с(сп(жь ...,ж„),а).

Предложенная иерархия классов сложности (п. 4.8) при симультанном принятии решения может быть использована при построении однотактных персептронных устройств для распознавания конструктивных объектов. При этом чем длиннее псевдосигнатура различных характеристик конечного множества натуральных чисел, тем сложнее соответствующий класс в канторовской решетке. Эффективный решатель ищем в классах с наиболее простой и информативной псевдосигнатурой.

Для семейства М € По множеств Xi,(i = 1 ,т), т = \М\ некоторых элементов аг € Са (Хг) и неизвестной реализации Х € М соответствующий персептрон имеет т распознающих предикатов

^ ^г(а) ^ 1

Фг(Х) =

где ^г(а) = [р(а, аг) = 0] , р — евклидово расстояние.

аес^ (Хг)

15.10.5. Персептрон с граничным между классами вектором-эталоном

Пусть задана обучающая выборка с бинарными значениями признаков «¿з € {0,1} :

О =

«11 «12... «1га «21 «22... «2га

«г1 «г2... «гга

«11 «12... «1га

Причем если «¿з = 1, то это означает, что 2 -й признак в г -строке присутствует. Пусть задано распределение номеров кортежей обучающей выборки по двум классам и ^2 с помощью функции / : 1 — {1,2} , где 1 ^ {1,2, ...,1} , а множество номеров эталонов обозначим через А = {¿|/(г) = к} , (к = 1,2) , (г = 1,£) , = 1,п) .

Признаки «г = («г1,..., «г«,) независимые. Будем считать, что 2 -й признак информативен, Е «гз

если =

ге-Ок:

|

Имеет место

■ 100% > 50%.

Теорема 15.7 [18]. Пусть в обучающей выборке О все признаки независимы и информативны. Тогда существует граничный вектор-эталон I = (11,12,..., ), 1г € {0,1} такой, что имеет место решатель

К (X) =

1, если 5 > р;

2, в противном случае,

где неизвестная реализация — х = (х1,х2,...,хп) мера близости эталона и реализации:

5 = Е ^ ■ р (1з, хз); Р (13, х3) =

€ {0,1} ; р — некоторый порог, 5 —

1, если = ж.,-; {р = 1, п) ; 0, в противном случае.

15.10.6. Нелинейный персептрон для распознавания цифровой информации

Продемонстрируем возможности нелинейных персепртронов на примере распознавания цифровых символов: 0,1, 2,... , 9 [89].

Цифровые символы, выводимые на бумажный носитель каким-либо печатающим устройством, например АЦПУ ЭВМ СМ-4, представляют собой строго определенные наборы элементов матрицы О =|| ^ ||7х5 (рис. 15.3). Пронумеруем элементы матрицы Б слева направо и сверху вниз. Получим множество М = {(1ц\(Ь] = (г — 1) * 5 + г = 1,7, ] = 1,5, п = 1,35}. Под изображением Х будем понимать любую последовательность цифр от 1 до 35. Выпишем изображения символов-цифр Жг, (г = 0,9) :

Х0 = {2,3,4,6,10,11,14,15,16,18,20,21,22,25,26,30,32,33,34},

Х1 = {3,7,8,13,18,23,28,32,33,34},

Х2 = {2,3,4,6,10,15,18,19,22,25,26,31,32,33,34},

Хз = {1,2,3,4,5,10,14,18,19,25,26,30,32,33,34},

Х4 = {4,8,9,12,14,16,19,22,23,25,29,34},

Х5 = {1,2,3,4,6,11,12,13,14,20,25,26,30,32,33,34},

Хб = {3,4,5,7,11,16,17,18,19,25,26,30,32,33,34},

Х7 = {1,2,3,4,5,10,14,18,22,27,32},

Хз = {2,3,4,6,10,11,15,17,18,19,25,26,30,32,33,34},

Х9 = {2,3,4,6,10,11,15,17,18,19,20,25,29,31,32,33}.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Цель работы — найти информативные элементы каждого изображения, позволяющие построить решающие правила для распознавания изображений Хг.

х

з

Построим рекуррентную схему поиска информативных элементов рассматриваемых изображений:

= ЗЕг, (г = 079),

ур+1 = { если ф 0, (г,; = М);

г I ^г.^1, в противном случае.

Введём вспомогательную матрицу д из следующих элементов:

= ( 0, если V?^ = 0; г. 1, в противном случае.

Рис.15.3.Цифровые символы печатающего устройства ЭВМ СМ-4

Согласно принятым обозначениям построим индексные множества У^ , (г = 0,9) и логи-

ческую матрицу д = || дг. || 10*10

Имеем V,10 = {21},

V«10 = {17},

0

V,10

V.10

= {28},

К10

= {26},

6 — Л "7 = {27}, Логическая матрица д

V/0 = {17}, ^10 = {17}. дг. || примет вид

V,10

{1}, V/0 = {9}, П10 = {12},

дг. У 10x10 =

1000000000 0100000000 0010000001 0001010100 0000100000 0000110000 0000001011 0000000100 0000001011 0000001011

Обозначим множество ^ {0,1, 2, ...,1 — 1}. Для построения решающих правил вос-

пользуемся теоремой 3.12.

Легко заметить, что исходные изображения ЗЕ^, (г = 0, 9) не различимы в смысле теоремы 3.12, так как логическая матрица д, построенная на основе этих изображений, противоречит условию теоремы, а именно условию, что (V* = ] € 1) [дг. = 1 ^ д.г = 0].

Из всего множества изображений неразличимыми являются X«, Xg и X9, так как

V«10 = V/0 = ^д10 = {17}.

Чтобы преодолеть эту ситуацию и построить решающие правила распознавания изображений, достаточно дополнить два любых изображения из Хб, Хв, Хд элементами {24} и {35}. Пусть это будут Хб и Х9. Тогда индексные множества (г = 0,9) и логическая матрица

Я будут иметь вид

V,10 = {21}, V!10 = {28}, У210 = {31}, Р310 = {1}, Р410 = {9}, У510 = {12}

Рб10 = {24}, Р710 = {27}, Р810 = {17}, V,10 = {35}.

Ягз У 10x10 =

1000000000 0100000000 0010000001 0 0 0 1 0 1 0 1 0 0 0000100000 0000011000 0000001000 0000000100 0 0 0 0 0 0 1 0 1 1 0000000001

Логическая матрица я, составленная по уточненным исходным данным, как видим, удовлетворяет условию теоремы 3.12. Это значит, что мы имеем право составить предикаты распознавания : _

Яо(Ж) = ф0(£),<э1(£) = ф1(£),<э2(£) = ф2(х)&ф9(х); <Эз(£) = ф3(х)&(ф5(х) v ф7(х)),д4(х) = ф4(х); я5(ж) = ф5(х)&ф4(х),д6(х) = ф6(х),д7(х) = ф7(х); д8(х) = ф8(х)&(ф6(х) V ф9(х)),д9(х) = ф9(х),

где ЩХ) = [ец € X] , (г = (Щ

аг € рг10, а0 = 21, а1 = 28, а2 = 31, а3 = 1, а4 = 9, а5 = 12, аб = 24, а7 = 27, а8 = 17, а9 = 35.

Замечание 15.6. Для исходных печатных символов справедливы также следующие простые решающие правила:

50 (х) = [2 € х] & [3 € х] & [4 € х] & [6 € х] & & [10 € х] & [11 € х] & [14 € х] & [15 € х] & [16 € х] & & [18 € х] & [20 € х] & [21 € х] & [22 € х] & [25 € х] & & [26 € х] & [30 € х] & [32 € х] & [33 € х] & [34 € х] .

51 (х) = [3 € х] & [7 € х] & [8 € х] & [13 € х] & [18 € х] & & [23 € х] & [28 € х] & [32 € х] & [33 € х] & [34 € х] .

5д(х) = [2 € х] & [3 € х] & [4 € х] & [6 € х] & [10 € х] & & [11 € х] & [15 € х] & [17 € х] & [18 € х] & [19 € х] & & [20 € х] & [25 € х] & [29 € х] & [31 € х] & [32 € х] & & [33 € х] .

Однако составленные предикаты (^¿(Х), (г = 0,9) гораздо более выгодны с вычислительной точки зрения. Так, для распознавания изображения X^ по предикатам ¿¿(X), (г = 0,9) потребуется как минимум в 18 раз больше элементов, чем по предикатам (^¿(Х), (г = 0,9).

Глава 4. Прикладные результаты

§ 16. Классификация (распознавание) текстурных изображений

16.1. Математическое обеспечение анализа двумерных полей

В работе [101] описана система программного обеспечения, предназначенная для измерения параметров случайных полей по их реализациям в целях оптимальной классификации наблюдаемых реализаций, выявления зон нестационарности и оценивания внутренних параметров источника.

Метод обработки основан на модели случайного поля с ограниченным пространственным влиянием (модели ОПВ). В модели предполагается существование так называемых элементарных полей, обладающих свойствами стационарности, эргодичности и отсутствия статистических связей между значениями реализаций в совокупностях точек, удаленных на расстояние, превышающее некоторый критический радиус (радиус пространственного влияния). Допустимые моделью ОПВ поля характеризуются существованием элементарного поля в достаточно малой окрестности любой точки, за исключением множества меры нуль. Определенные таким образом поля в общем случае являются нестационарными и неэргодичными.

Для измерения параметров случайных полей используются их одномерные сечения. В общем случае оценка параметра представляет собой усредненное по сечениям среднее значение некоторого функционала, определенного на малом интервале, скользящем вдоль трассы сечения. Таким образом, каждый параметр определяется соответствующим интервалом и заданным на нем функционалом. Установлено, что для стационарных полей параметры описанного типа подчиняются нормальному закону распределения, что позволяет вычислить значение функции правдоподобия и тем самым осуществить оптимальную классификацию. Для нестационарных полей сечения группируются по близости, выявляются зоны стационарности (и значений функции правдоподобия). Внутренне параметры источника определяются по методу максимального правдоподобия. Геометрия пространственного влияния сечений зависит от радиуса пространственного влияния и характера нестационарностей, отличающихся в различных прикладных задачах.

В соответствии с требованиями описанного метода математическое обеспечение для анализа двумерных случайных полей включает в себя программные блоки, реализующие следующие виды обработки:

обмен с устройствами ввода информации;

управление процессом пространственного размещения сечений случайного поля; выполнение расчетов в целях вычисления заданных функционалов; целевой анализ вычисленных параметров случайных полей; принятие решений с использованием функций правдоподобия; реализацию диалога с оператором, управляющим процессом обработки; организацию хранения необходимой информации на магнитных носителях; организацию взаимодействия программ и устройств системы.

Программное обеспечение построено по модульному принципу, что позволяет в кратчайшие сроки вносить необходимые изменения. В состав системы входят тестирующие модули, которые используются для оперативной проверки ее работоспособности.

Описанное программное обеспечение может быть использовано в самых различных прикладных задачах исследования двумерных случайных полей. Опыт двухлетней эксплуатации системы применительно к решению ряда конкретных задач показал как ее высокую эффективность, так и работоспособность положенного в ее основу метода.

16.2. Об одной модели классификации текстур на основе метода голосования

с отношениями толерантности

В настоящее время в связи с развитием автоматических робототехнических систем задача классификации сложноструктурированной информации становится весьма актуальной [72].

Для решения задачи классификации текстур предлагается использовать отношения толерантности, которые на содержательном уровне хорошо согласуются с понятиями «близость», «сходство».

Пусть имеется М — множество текстурных изображений, разбитое на Ь классов К1, К2,..., К^. В пространстве наблюдений Р отображения О : М ^ Р элементы а € М воспринимаются как образы О(а) С Р, то есть как кортежи из О(а) : ж = (ж1,...,жп) € € М = М\ х х ... х Мп. На множествах М= 1 ,п) заданы отношения толерантности Tj, = 1 ,п) . Кроме того, имеется обучающая выборка О = (0(0:1), ...,0.(а,{)) = \uij\ixn размером I х п и классифицирующая функция / : 1 ^ где 1 ^ {1, 2,..., 1} , 1 ^ {1, 2,..., Ь} , п — число признаков, ] = 1,щ I — число объектов классификации, г = 1,1] £ — число классов текстурных изображений в множестве М.

Рассмотрим модель классификации М ^ (М; О ,/, т1,...,тп; Л) относительно обучающей выборки О, классифицирующей функции /, и отношений толерантности т1,...,тп с основным множеством М и сигнатурой А = (Л1 ,... , Л^), где предикаты (ж) интерпретируются следующим образом: (X) = V (X), (£; = 1,£) , здесь Р>д. ^ {г |/ (г) = к} — множество

номеров эталонных изображений; частные предикаты (решающие правила) для г -го объекта классификации

__п

1, если Si = ¿>о, (г = 1,1) ] Sí = Рз {хз,Щз);

7 = 1

0, в противном случае, 50 = шах(£1, ...,£г),

где — сумма совпадений голосов р. при сравнении неизвестной реализации ж. с эталонами в обучении по отношениям толерантности т. между этими точками ж.т.. Мера толерантности (близости, сходства) значений ] -го признака неизвестной реализации ж. с эталонным значением этого же признака для г -го объекта (класса текстуры):

1, если ж^ГуИу, (г = 1, I]] = 1 ,п)

ь3 , "Ч? ) — ^ п

0, в противном случае.

рг (ж3, «г? ) —

Модель М есть модель голосования с отношением толерантности. Для числовых множеств М1,...,МП можно взять, например, такие отношения толерантности т?-, что (Уж,у € М?-)

[жт3У ^ |ж - у| < ^ 0] .

16.3. Таксономия по связным областям как задача построения признаков для текстурных изображений

Трудности, возникшие при классификации текстур визуальными методами, удается преодолеть, применяя для этой задачи ЭВМ с соответствующим устройством ввода текстурных изображений.

Для того чтобы эффективно решать задачу классификации текстур на ЭВМ, необходимо сформировать информативные признаки, а затем, используя обучающую выборку, классифицировать произвольно заданное изображение посредством некоторых решающих правил.

Для формирования информативных признаков предлагается использовать понятие связной по отношению толерантности области.

Целью настоящих исследований является обобщение понятия связного множества Е в некотором пространстве Р, наделенном отношением толерантности т, а также изучение конструктивных приемов вычисления предиката связности [12].

16.3.1. Связные множества

Обычно связные множества рассматриваются как подмножества некоторого метрического пространства Т обладающего свойствами, которые будут перечислены ниже.

Определение 16.1. Множество Т, элементы которого мы будем называть точками, есть метрическое пространство, если любым двум точкам р и д множества Т соответствует вещественное число ^ (р, д), называемое расстоянием от р до д такое, что

а) й (р, я) > 0, если р = я,й(р,р)=0;

б) й (р, я) = й (Я,р);

в) при любом г € Т : й(р, я) ^ й(р, г) + й(г, я) [146].

Пример 16.1. — евклидово пространство — метрическое с метрикой

р (Р, Я) = \/(Р1 — 91>2 + --- + (РА: —

Важно заметить, что каждое подмножество С С Т в свою очередь является метрическим пространством.

Определение 16.2 [146]. а) окрестностью точки р называется множество, состоящее из всех точек я таких, что й (р, я) < г;

б) точка р называется внутренней точкой множества Е, если она имеет окрестность N такую, что N С Е;

в) множество Е открыто, если каждая точка множества является его внутренней точкой.

Определение 16.3 [146]. Множество Е в метрическом пространстве Т называется связным, если не существует двух открытых множеств А и В пространства Т таких, что пересечение А П В = 0, А ПЕ = 0 и В ПЕ = 0, ЕС А и В.

Рассмотрим некоторую сетчатку и такую, что и С Л2 и и — метрическое пространство.

Определение 16.4 [127]. Две точки в пространстве и называются смежными, если они являются квадратами с общей стороной.

Определение 16.5 [127]. Фигура Е связна, если любые две ее точки (то есть «квадраты») р1, р2 можно соединить путем, проходящим по смежным точкам.

Приведённые определения связных множеств обладают теми недостатками, что, во-первых, они привязаны к конкретной метрике и, во-вторых, из определений непосредственно не видны конструктивные приемы, позволяющие вычислить значение предиката связности для любого ЕС Т (и).

Рассмотрим множество Р с отношением толерантности т, которое обладает двумя свойствами:

1) рефлексивностью ата;

2) симметричностью атЬ ^ Ьта для любых а, Ь € Р.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Дадим рекурсивное определение связных по отношению толерантности т множеств Е С Р (далее будем говорить просто по т).

Определение 16.6. а) все одноэлементные множества {а} С Р связаны по отношению толерантности т;

б) пусть множество Е — связное по отношению т, тогда Е и {а} , где а € Р\Е связное по отношению т, если существует Ь € Е такое, что атЬ;

в) других связных множеств по отношению т нет.

Обозначим через Р (Р) множество всех подмножеств Р и введем на Р (Р) частичный порядок ^ следующим образом: Е1 ^ Е2 ^ Е1 С Е2.

Теорема 16.1. Пусть Е = 0 не является связным по отношению толерантности т подмножеством Р. Тогда существует, по крайней мере, два непустых связных по отношению толерантности т подмножества Е1, Е2 С Е множества Е.

Доказательство. Так как Е = 0 и не является связным по т множеством, то существует по крайней мере два одноэлементных подмножества {а0} , {а1} С Е.

Множества Е связные по отношению толерантности т, иначе Е было бы связным по т множеством. □

Определение 16.7. Максимальные связные по т подмножества множества Е назовем областями связности по т множества Е.

Приведем примеры некоторых отношений толерантности.

Пример 16.2. Пусть Зт ^ {1,2, ...,т} . Рассмотрим следующее отношение толерантности та на Зт Для любых а €{1, 2} и а1 = (а^,..., ) , а2 = (а^ , ...,а^п) . Тогда

\/(«»i - «л)2 + - + ((К, ~ ajj2

< a.

Замечание 16.1. Для п = 2 и а = 1 понятие связности, которое дается в [2], совпадает с понятием связных по Т1 подмножеств Е множества = х

Другим отношением толерантности [та] на Зт может служить следующее отношение:

ai [та] а2 ^

(«»i - «л)2 + ••• + (ai„ ~ ajn)2

^ а; (для а = 1, 2,...).

Здесь квадратные скобки [■] означают целую часть числа.

Пример 16.3. Любое отношение эквивалентности = на P есть в то же время отношение толерантности на P.

Пример 16.4. Пусть P = {ai,...,am}. На R (P \{0}) можно рассматривать отношения толерантности тп и ти, определённые следующим образом: для любых A, B € € R (P) \ {0} ; АтпВ ^ A П B = 0; АтиВ ^ A U B = 0.

16.3.2. Алгоритм вычисления количества связных областей

Пусть на конечном множестве P = {ai, ...,am} задано отношение толерантности т, которое можно эффективно проверить для (a, b) € P2. Обозначим через h (E) количество связных областей для любого подмножества E С P. Приведем алгоритм для вычисления h (E) для любого E С P.

Пусть E {ai,..., an} С P.

Если E = 0, то полагаем h (E) := 0.

Если Е = {а}, то h (Е) := 1.

Пусть Е = n ^ 2. На первом шаге берётся h(£) = 0 и Ао = {ai}, Во = {ü2, аз,..., ап} так, что Ао = 1, Во = п — 1. Для каждого b € Во проверяется отношение ацтЬ. Если отношение выполнилось для некоторого b € Во, то полагаем Ai := Ао U {b} , где b — первый встретившийся элемент Во, который находится в отношении с элементом ai € Ao. Если же отношение aiTb не выполняется ни для какого b € Во, то h (E) := h (E) + 1. Если при этом bi = ДА не содержит больше элементов, то вычисление заканчиваем. Если В\ = 1, то h (E) := h (E) +2. В противном случае для всех b € В1 проверяется отношение толерантности с элементами Ai и цикл повторяется. Строятся множества A¿ и В^,г ^ 2. Исчерпав все элементы множества Во, процесс вычисления заканчиваем.

16.3.3. Формирование признаков для текстур с помощью связных по отношению

толерантности областей

Пусть текстурные изображения, заданные в виде функции f (ж, y) на дискретной области определения D = Jm х , принадлежат t классам. Здесь Jm ^ {1,2, ...,m} , ^ ^ {1, 2,...,n} —диапазон изменения функции [a, b] разбит на т градаций. Кроме того, на D задано отношение толерантности т.

Для текстурных изображений наиболее подходящими являются признаки Hí, (i = 1, г) , вычисленные на области D следующим образом: для любой текстуры f (ж, y)

H = h ({(ж, y) € D |Mi (ж, y) = 1}),

гдеМ;(*,у) = ( + А, = (г = 1,г) ;

[ 0, в противном случае. Здесь Н — количество связных по т областей г -го сечения.

Гистограммы признаков [г = 1,10) , снятые с 8 классов текстурных изображений, показаны на рис. 16.1. Используя данные признаки, можно набрать статистический материал для обучающих выборок и затем, выбрав какой-либо критерий принятия решений, например метод коллективного голосования, метод Гурвица, критерий Лапласа, критерий Сэвиджа или метод минимума среднеквадратического отклонения, классифицировать текстурные изображения с помощью приведенных признаков [70].

Рис. 16.1. Распределение количества связных областей по 10 сечениям для 8 классов изображений (У — количество связных областей, X — количество сечений)

Приведенное понятие связных по отношению толерантности множеств позволяет решать задачу кластеризации (таксономии), то есть разбивать на связные по отношению толерантности области и подсчитывать количество таких областей. Используя число связных по отношению толерантности областей как признак, удается решать задачу классификации образов (в частности, текстурных изображений).

16.4. Обнаружение классификационных закономерностей методом альтернативных решающих правил

Задача обнаружения классификационных закономерностей может быть представлена следующим образом. Имеется некоторая совокупность объектов, сгруппированных по классам в соответствии с вполне определенным принципом классификации. Сами объекты недоступны непосредственному анализу, а доступны лишь результаты их наблюдений (измерений), выполняемых с помощью конкретных приборов. Совокупность возможных результатов измерений над объектами образует пространство наблюдений. На основе эмпирического материала — результатов наблюдений некоторого конечного множества объектов, необходимо установить, существует ли классификация элементов пространства наблюдений, адекватная (с точностью

до некоторого критерия) исходной классификации объектов, и, в случае положительного ответа, построить классифицирующий алгоритм.

Формальная постановка задачи [33] предполагает существование априорных вероятностей Рг, (г = 1, 2, ...,п) появления объектов г -го класса и распределений /¿(ж) элементов г -го класса по пространству наблюдений X. В виде критерия качества классификации используется вероятность принятия ошибочных решений (в общем случае — средний риск). Эмпирический материал (обучающая выборка) необходим для оценки распределений /¿(ж). При такой постановке задачи минимизация вероятности ошибки (среднего риска) достигается применением байесовых решающих правил. Если достигнутое качество распознавания элементов пространства наблюдений удовлетворяет определенным практическим требованиям, то считается, что искомая классификация существует; при этом алгоритм классификации реализует байесово правило.

Описанная модель принятия решений обладает двумя недостатками. Во-первых, физическая реализация байесовых решающих правил может быть осуществлена лишь в простейших задачах обнаружения классификации. Во-вторых, практические задачи поиска классификации не всегда согласуются с этой моделью. Причины тому следующие:

1) далеко не во всех задачах удается установить точные значения априорных вероятностей Рг; при определенных условиях значения Р^ могут изменяться даже в ходе решения фиксированной задачи. Это обстоятельство вынуждает применять решающие правила иного типа (правило максимального правдоподобия [110], минимаксные и субминимаксные правила [126]), которые, строго говоря, не являются оптимальными;

2) мощность обучающей выборки, необходимой для оценки распределений /¿(ж), экспотен-циально возрастает с ростом размерности пространства наблюдений X. Поэтому практическая реализация байесова метода возможна лишь в пространствах небольшой размерности. В некоторой степени эту трудность можно обойти [20], используя признаки отображения X в некоторые пространства малой размерности (в частности одномерные), и принимая частные решения по каждому отдельному признаку. Однако существующие методы выделения полезных признаков основаны на эвристических предположениях о характере решаемой задачи. Кроме того, при синтезе общего решения выдвигаются очень жесткие требования к совокупности признаков [134], выполнение которых сопряжено с большим объемом вычислительных работ;

3) во многих задачах число классов п либо очень велико, либо потенциально неограниченно. Поскольку диапазоны значений измеряемых параметров ограничены, возникает ситуация, когда для многих элементов ж € X байесово правило при классификации в большинстве случаев будет приводить к ошибкам;

4) неравноценность различных типов ошибок классификации вынуждает отказаться от критерия минимума вероятности ошибки и приводит к введению в задачу функции потерь, приписывающей различным типам ошибок различные веса [33]. Однако формирование функции потерь носит субъективный характер и осуществляется пользователем результатов классификации в соответствии с собственными представлениями о значимости различных типов ошибок. Наличие нескольких категорий лиц, использующих результаты классификации в практической деятельности, с различными представлениями о функции делает такой подход несостоятельным. Кроме того, существуют задачи классификации, в которых ошибки считаются недопустимыми, но допускается возможность указания нескольких вариантов решения, если количество этих вариантов существенно меньше п.

Для решения задачи обнаружения классификационных закономерностей в условиях действия указанных выше факторов предлагается ввести в рассмотрение неоднозначные решения. Области решений в пространстве наблюдений будут при этом пересекаться, однако термин «классификация» сохраняет свое значение, если все возможные пересечения областей решений считать классами (так, как это предложено в работе [158]).

Формально области решений ж € XI могут быть описаны характеристическими функция-

ми

, , Г 1, если х € Хг, °г(х) = \ 0, если х

В этом случае решение для объекта х € X представляется вектором альтернатив

а(х) = (о1(х), 02(х),..., Оп(х)), (16.1)

перечисляющим возможные альтернативы решения. Решающие правила вида (16.1) названы в работе [106] альтернативными решающими правилами (АРП). Введем в рассмотрение также вещественную функцию

!,(+) = / 1, если £ > 0, Л(£) = \ 0, если £ < 0.

Если ошибками классификации считать отбрасывание истинного варианта решения в (16.1), то есть выполнение условия Ог(х) = 0 объекта х € X г -го типа, то нетрудно заметить, что вероятность ошибок обращается в нуль при выполнении условий

Ог(х) ^ ^/¿(х)] (16.2)

для всех х € X и г = 1, 2,..., п. Потому для случая использования АРП критерии вероятности ошибки и среднего риска практического значения не имеют.

Оценку качества АРП можно произвести различным образом. Простейшей характеристикой является различимость — математическое ожидание принятия однозначных решений. Довольно очевидно, что при выполнении условия (16.2) максимум различимости достигается в случае равенства

0г(х) = ^/¿(х)] (16.3)

при всех х € X и г = 1, 2,..., п. Это означает, что задача построения АРП (в отличие от байесовой задачи) не является оптимизационной и решается непосредственно на основании равенства (16.3). Считая корректно построенными лишь те АРП, для которых имеет место (16.3), получаем соотношение, определяющее различимость

5 = О * (х) Е Рг/г(х)^х

X ¿=1

где

( п

1, если 52 Ог(х) = 1; О * (х) = { ¿=1

0, если 52 Ог(х) = 1.

г=1

На практике различимость 5 может быть определена экспериментально, как процент однозначно классифицированных объектов.

Необходимо отметить следующие существенные особенности метода АРП. Применение корректно построенных АРП представляет собой самую «осторожную» стратегию принятия классификационных решений. Вероятность ошибки в принципе может быть сделана сколь угодно малой (по крайней мере, теоретических ограничений для этого нет). Метод АРП некритичен по отношению к количеству классов п. Корректные АРП вида (16.3) не зависят от величины априорных вероятностей Р^. Указанные обстоятельства сводят задачу обнаружения классификационных закономерностей к оценке распределений /¿(х) на основании обучающей выборки, построению АРП в соответствии с (16.3) и экспериментальному оцениванию различимости 5. Если значение различимости невелико (не удовлетворяет практическим требованиям), делается вывод об отсутствии классификационных закономерности в исходном эмпирическом материале (случай неинформативности пространства наблюдений X). В противном случае

найденная классификационная закономерность описывается решающим правилом (16.1) и может быть использована для целей последующей классификации объектов.

С точки зрения методики обнаружения классификационных закономерностей методом АРП наиболее серьезную проблему представляет анализ обучающей выборки — определение функций Л,[/г(ж)] в (16.3). Довольно очевидно, что непосредственная оценка распределений /¿(ж) в многомерном пространстве наблюдений X практически не может быть осуществлена; так же, как и в случае применения байесовых решающих правил, мощность обучающей выборки должна быть очень большой. Рассмотрим возможность построения АРП с использованием признаков.

Пусть ^(ж) (^ = 1,2,...,т) — вещественные функции (признаки). Тогда для каждого ] -го признака существуют распределения /у (Ь), где Ь — вещественная переменная, соответствующая распределениям /¿(ж) в пространстве наблюдений X. Для оценки распределений /у (Ь) необходима сравнительно небольшая обучающая выборка. Применяя (16.3) к каждому признаку, получим

(Ь) = / (Ь)] ,

где Ь = ^(ж).

АРП имеет следующий вид:

а,-(Ь) = К-(Ь),^(Ь),...,а„у(Ь)) . (16.4)

Для построения общего АРП необходимо учесть, что отброшенные альтернативы решений в (16.4) должны быть отброшены также и в итоговом АРП.

Поэтому общее АРП имеет конъюнктивный вид:

ат(ж) = «(ж)&ат(ж)&...&<(ж)),

где

т

*Г(ж) = П ^^(ж)].

Методы построения признаков должны быть связаны со структурой решаемых задач и поэтому выходят за рамки данной работы. Существенным здесь является то, что метод мультипликативных АРП, применяемый для обнаружения классификационных закономерностей, некритичен по отношению к составу и мощности системы признаков.

Разработанная методика обнаружения классификационных закономерностей на основе использования мультипликативных АРП экспериментально исследовалась при решении задачи автоматического дешифрирования аэрофотоснимков. Интерес к этой задаче был обусловлен следующими ее особенностями:

невозможностью точного определения значений априорных вероятностей появления объектов соответствующих классов;

потенциальной неограниченностью количества классов;

высокими требованиями к надежности результатов дешифрирования, предназначаемых нескольким категориям пользователей;

отсутствием полных представлений об информативности используемых аэрофотоснимков.

Объектами дешифрирования в экспериментах являлись в основном растительные покровы различных типов. Количество классов объектов изменялось от 14 до 22. Снимки подвергались фотометрированию с последующей цифровой регистрацией; результаты фотометрирования обрабатывались на ЭВМ с использованием системы программного обеспечения автоматизации экспериментальных исследований. Всего исследовалось 45 признаков; из них было отобрано 29 наиболее информативных. Все признаки представляли собой математические ожидания (средние) значений некоторых функциональных характеристик, вычисленных на отдельных участках фотометрического сигнала. Таким образом, каждый признак описывал определенные характеристики структуры сигнала. В обучающей выборке присутствовало от 10 до 60 объектов на каждый класс.

Результаты экспериментов следующие:

1) установлено наличие объективных различий результатов фотометрирования для объектов различных классов и построен алгоритм их классификации;

2) вероятность ошибки (средняя) классификации, обусловленная неполнотой обучающей выборки, составила величину около 10%;

3) Средняя различимость (дешифрируемость) классифицируемых объектов составила величину около 80%.

Проведенное экспериментальное исследование показало не только работоспособность разработанной методики обнаружения классификационных закономерностей с использованием АРП, но и простоту ее реализации средствами вычислительной техники.

16.5. Теоретико-игровой подход к классификации текстурных изображений

Под текстурным изображением [106] на плоскости Q = X х Y понимается такое случайное поле оптической плотности D(x, y) : x € X, y € Y, для которого справедливо

Ne > 0)(3р > 0)Nu € Q)(VF(*))[mes(w) ^ р [-V- [[ Fdu - lim —[[ FdÇ] < d,

mes(w) УУ ç^n mes({) JJ

ш

где и —выпуклое, замкнутое подмножество О; тез(ш) —мера множества ш; F(^(ж,у),ж,у) -непрерывная функция.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Другими словами, это означает, что любая конечная часть изображения дает однозначное представление о текстуре всего изображения. При исследовании дистанционными методами текстурные изображения соответствуют площадным объектам изучаемой поверхности. Число типов объектов, характеризующихся изображениями, оценивается, по данным [97], величинами порядка 3000 классов, что говорит о большом значении текстурного анализа для интерпретации данных дистанционных исследований.

Рассмотрим следующую постановку задачи классификации текстур [100]. Пусть каждая реализация или ввод изображения задается набором структурно-статистических признаков [124] X = (ж1,...,жп). К числу признаков относятся кумулянты одномерной гистограммы, характеристики линеаризованной автокорреляционной функции, правдоподобие по двумерной гистограмме и другие. Признаки подбирались экспериментально для изотропных текстур. Для регулярных текстур наиболее эффективными признаками признаны спектральные [152]. Известна стандартная обучающая информация, то есть перечень объектов обучения с указанием их классовой принадлежности. Ее особенностью является фрагментарность выборки: каждый из классов Е1,..., Е представлен набором из К1,..., К подклассов или дифференциальных эталонов [125]. Фрагментация выборки вызвана как изменчивостью самого объекта, так и различными условиями его восприятия. Априорные вероятности классов Р(Е1),...,Р(Е) неизвестны. Адекватная параметрическая модель отсутствует в силу больших сложностей ее построения. В связи с этим решение отыскивается в рамках непараметрического подхода [110, 113]. В этом случае условные плотности подклассов Р(Х/£г), г = 1, N, где — номер подкласса, N — общее число подклассов во всех классах не определены [24].

Таким образом, с одной стороны, есть лицо, принимающее решение (ЛПР), задачей которого является выбор апостериорной вероятности Р(£г/Х), г = такой, которая бы минимизировала энтропию системы, с другой стороны, ему противостоит 2-е лицо — природа, которая, действуя согласно второму началу термодинамики, стремится увеличить энтропию системы путем выбора условных плотностей вероятностей подклассов Р(X/lг) и априорных вероятностей подклассов Выражение для энтропии, выступающей в качестве штрафа в

игре ЛПР против природы, имеет вид [110]:

N

Н = - р(ж) К^/ж) 1пр^/ж^ж, (16.5)

х ¿=1

где р(ж) — плотность вероятности наблюдения вектора признаков X. Преобразуем (16.5), выразив подлогарифменное выражение из формулы Байеса

N „ N

Н = — I р(ж) Е Р(1/ж) — J р(ж) Е Р(1/ж) 1пр(1г)^ж+

ж г=

N

+ / Р(х) Ер(1г/ж)1пр(ж)^ж.

N ж (16.6)

г=1

Из выражения (16.6) видно, что общая энтропия системы складывается из энтропий, обусловленных отсутствием информации о плотностях условных вероятностей, априорных вероятностей подклассов и возможности получения наблюдения X. После выполнения очевидных преобразований (16.6) имеем

г N N .

Н = — р(ж) Е р(1г/ж)1пр(ж/1г)^ж — Е р(1) 1пр(1) + / р(х) 1пр(ж)^ж. (16.7)

ж г—1 г—1 ж

Анализ (16.7) показывает, что энтропия распределения р(ж) не зависит от стратегий играющих и является величиной постоянной. Выбор априорных вероятностей принадлежит целиком природе, и, следовательно, для достижения максимума (16.7) очевиден выбор р(11) = = р(^2) = ••• = р(1п) = 1/Х. Оставшаяся часть (16.7) представляет собой математическое ожидание результата игры. Поскольку информация о распределении признаков отсутствует, полагаем их независимыми. Тогда

м

1п р(ж/1) = ^1п р(ж^ /1г). ;=1

Независимость стратегий ЛПР и природы позволяет представить математическое ожидание (16.7) как произведение математических ожиданий. В результате получим

N М

Н = — Е Р Е & 1п Кж;/11), (16.8)

¿=1 ;=1

где р = (ръ — .,^) — вектор смешанной стратегии ЛПР, то есть р — апостериорная вероятность подкласса I; д = (д1,...,дм) — вектор смешанной стратегии природы; ^ имеет смысл нормированного веса признака ж;. Величина логарифма плотности одномерного условного распределения для большинства распределений есть

— 1п(ж/1г) = / (ж;, Ш ;, <7;), (16.9)

где т— оценка среднего или медианы распределения признака х; подкласса I ; — оценка стандартного отклонения. Величины ти <7; оцениваются по стандартной обучающей информации. В качестве функции /(■) экспериментально подобрана в работе [124]:

|ж — т|

/(ж,т,<т) =-.

Обозначив /(ж;, Ш;,<7;) = и; после подстановки (16.9) в (16.8), имеем

N М

Н = ЕЕ рд; иг;. (16.10)

г=1 J=1

Выражение (16.10) есть цена игры двух лиц с нулевой суммой Г = (Р, В), где Р — совокупность стратегий ЛПР; ^ — совокупность стратегий природы; В = || — матрица игры размером N х М.

Использование неравенства Чебышева при формировании матрицы

Р(Щ > *) < ^ (16.11)

позволит сократить ее размерность. При выборе Ь =10 формула (16.10) гарантирует, что 99% массы распределения подкласса I по признаку будет участвовать в игре Г. Для М признаков в общем случае

М

P{3i = 1, М[иц >t}}< — , (16.12)

значит, при М = 20 гарантируется, что только 80% реализации I будет участвовать в игре Г. Однако практически из-за унимодальности и непрерывности распределений эта величина не бывает менее 97,5%.

В результате игры Г ЛПР проигрывает не более чем

а природа выигрывает не более чем

hj = min max p0q

peP qeQ

hjj = max min

qeQ peP

T

T

В общем случае по теореме фон Неймана-Моргенштерна [164] ситуация равновесия достигается при Ь/ = Л// = Л. Тогда вектор оптимальных смешанных стратегий ЛПР р = (р1,... , р^) определяется из решения задачи линейного программирования

N

52 PiVij ^ h] j = 1, М; h min;

i=1 n (16-13)

= 1, 0 < рг < 1.

i=1

Оптимальная стратегия природы определяется в результате решения задачи двойственной (16.13). Поскольку все элементы матрицы В практически различны, то согласно исследованию [130] число отличных от нуля компонент в векторах p и q будет одинаковым.

Таким образом, как и в случае известных условий вероятностей и заданной матрицы штрафов [195], в явном виде находится выражение для апостериорных вероятностей.

Учитывая, что в игре Г участвуют подклассы, а не сами классы, для получения вектора апостериорных вероятностей классов p* = (p1,..,pL) апостериорные вероятности подклассов суммируются:

ai+ki

p* = Е pj, (16.14)

j=ai

i-1

где а = £ Kj, ад = 1. j=i

Величины апостериорных вероятностей классов можно использовать непосредственно для решения задачи определения количественных характеристик объектов по их текстурным изображениям. Пусть для каждого из классов Ei,..., El задан вектор количественных характеристик ti = (tu,..., tmi), г = 1 ,L, где т — общее число исследуемых количественных характеристик. Все векторы tj сведены в матрицу количественных характеристик T = ||tj || размером L х m. В результате решения (16.13) с учетом (16.14) имеем вектор апостериорных вероятностей p*, который при умножении слева на T дает искомый вектор количественных характеристик R = (ri,..., Tl).

R = p*T.

Очевидно, что метод применим при следующих условиях: во-первых, незначительное изменение вектора количественных характеристик вызывает незначительное изменение вектора признаков текстуры, что практически всегда справедливо из-за интегрального характера изображения; во-вторых, в обучении должны быть представлены крайние значения характеристик, поскольку результирующий вектор R есть линейная комбинация векторов обучения T. Объем обучения определяется ошибкой определения характеристик и диапазоном линейности изменения признаков при вариации характеристик.

В традиционном распознавании образов принято делать однозначный вывод о принадлежности опознаваемого объекта одному из классов Ei,..., El . Вектор альтернатив p*, как правило, указывает на многозначное или альтернативное решение, которое необходимо привести к однозначному. Можно отметить три способа решения этой задачи: первый — исключить из решения части альтернатив, на основании имеющейся у исследователя другой информации помимо текстуры; второй — принять решение по максимуму апостериорной вероятности (принцип максимума аргумента [110]) (arg max(p*,.. .,pL), хотя из-за действия случайных факторов это решение нельзя считать удовлетворительным в случае близких значений апостериорных вероятностей; третий — повторно разыграть с использованием метода последовательного анализа [166, 195]. Как показано в статье [195], последовательность апостериорных вероятностей для одного из классов сходится к единице, а для остальных — к нулю. Поскольку при выводе (16.8) показано, что стратегия природы оптимальна при равных априорных вероятностях подклассов lj, то по формуле Байеса имеем

Р* = ьФ/Ег) , (16.15)

k- £ p(x/Ei)/fc/ j=i j

где Рг — апостериорная вероятность р(Е^/ж); р(ж/Е^) — условная вероятность класса Е^; ^, — число дифференциальных эталонов классов Ег и Е^, представленных в матрице в В силу (16.15) отношение правдоподобия имеет вид

= У(х/Ег) = Ргк[ Р{х/Ез) р.к/ '

В случае двух классов известно решение [166], основанное на последовательном критерии Вальда,

^ I л

Pik{

(i - pi)k

/

1 - £

^ А =-- ж € Е:;

£2

(16.16)

< в = —^-->хеЕ2,

1 - £2

где £1 — предельно допустимая ошибка отнесения объекта класса Е1 к классу Е2; £2 — предельно допустимая ошибка отнесения объекта класса Е2 к классу Е1.

В случае, если В < 2 < А и повторное наблюдение невозможно, принимается решение об отказе от классификации. Если повторный ввод возможен, отношение правдоподобия перевычисляется:

Pük

£¿+1 = г = 0,1,...; 20 = 1, (16.17)

(1 - Р1г)к2г

где Р1г — значение апостериорной вероятности класса Е1 после г -го разыгрывания;

— количества дифференциальных эталонов классов Е1 и Е2 в матрице в при г -м разыгрывании. Полученное значение (16.17) подставляется в (16.16), и цикл повторяется.

В случае Ь > 2 классов задается матрица предельно допустимых ошибок I = ||£у- || размером Ь х Ь, где — предельно допустимая ошибка отнесения объекта класса Е к классу

Полагаем в,-,- = 0.

Матрицу I назовем корректной, если для любого г = 1,Ь, £ < 1. В этом случае

¿=1

неравенства Вальда принимают вид

Е

p(xi,...,xk/Ei)dxi,...,dxk^Ai / p(xi, ...,xk/Ei)dxi, ...,dxk, (16.18)

p(xi, ...,xk/Ei)dxi, ...,dxk ^ Bi / p(xi, ...,xk/Ei)dxi, ...,dxk,

те

Е ,

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

где —последовательность наблюдений опознаваемой текстуры; р(х\,..., хк/Е^) —

плотность условной вероятности появления последовательности наблюдений Ж1,...,Ж&, при условии их непринадлежности классу Е^. Тогда выражение для порогов примет вид

ь

1 - £

А = - , (16.19)

¿=1

B, =

L

£

j=i

L '

1 - £ p(Ej j=1

где p(Ei) — априорная вероятность класса E,.

Поскольку, вообще говоря, априорные вероятности неизвестны, можно дать оценку порогов (16.19), оценив сумму в знаменателе как

L

^ min j • (16.20)

j=i j(j=ö

Однако (16.20) дает слишком жесткие ограничения для порогов A и С учетом допущений об априорных вероятностях, сделанных при переходе от (16.7) к (16.8), полагаем p(E,) =

= К^/N/, где N/ — число строк в матрице в. Для каждого класса Ei, i = 1, L вычисляется отношение правдоподобия из (16.18) как

Zi =-'Щ--. (16.21)

/

N1 - £ р к ¿=1(^=г)

Относительно каждого класса Е решение принимается по правилу (16.11) с порогами А и В из (16.19) и отношением правдоподобия (16.21). В случае, если не принято решение о зачислении опознаваемого объекта в один из классов Е^, для тех классов, которые не были исключены по (16.11), отношение правдоподобия перевычисляется по (16.12).

Можно показать, что если для всех г = 1, Ь, В^, что в свою очередь достигается для

любой корректной матрицы I, то решение, доставляемое правилом, основанным на последовательном критерии Вальда, корректно в смысле [38], то есть решение одновременно не даст как ни двух и более различных классов, так и ни одного из классов.

Приведенные алгоритмы реализованы на ЭВМ СМ-4 со специализированным устройством ввода текстурных изображений. Задача (16.13) для матрицы 100 х 20 решается не более чем за 10 секунд.

§17. Представление текстур для машинного анализа

В работах [51, 56, 58-60, 62] излагаются результаты решения проблемы представления текстур для машинного анализа.

Выбор способа представления текстуры существенно повышает как эффективность процедуры машинного анализа, так и последующей аппаратурной реализации алгоритмов распознавания.

17.1. Параметризация текстурных изображений

В работе [52] рассматриваются результаты исследований по машинным методам обнаружения скрытых закономерностей на текстурных изображениях, в частности решение задач качественного (типизация) и количественного распознавания (вычисление некоторых характеристик) объектов на изображениях.

Как качественное, так и количественное распознавание объектов сводится к измерению и оценке значений некоторых параметров текстурного изображения, то есть к задаче параметризации текстурного изображения.

В отличие от традиционных подходов параметризация тесно связывается с выбором математических моделей, адекватных изучаемым объектам, и в частности, исследуются подробно критерии принятия решений, работающие в условиях неполных обучающих последовательностей дискретной информации. Критерии допускают многоальтернативные решения, а схема принятия решения разбивается на 2 этапа: частное решение и общее.

Полученные теоретические оценки нашли согласованное подтверждение в экспериментах над текстурными изображениями [97].

В распознавании текстурных изображений в настоящее время сформировались два подхода: геометрический и лингвистический.

Геометрический подход, несмотря на общность и простоту, не дает хороших результатов при распознавании достаточно сложных изображений. Это объясняется тем, что классы таких изображений не обладают «хорошей» компактностью в пространстве рецепторов, а образуют так называемую «губку с водой». Сами же классы получаются в результате группировки близких областей, каждая из которых есть результат применения некоторого множества преобразований к отдельному изображению. За исключением случая аддитивной помехи, очевидно, нельзя ожидать компактности таких областей, а для других типов преобразований геометрические преобразования не эффективны. Однако геометрический подход можно все-таки распространить на гораздо более широкий класс задач, если найти линейное представление этих задач.

В рамках лингвистического подхода появляется возможность решать принципиально новые задачи, которые при геометрическом подходе не могли быть даже поставлены, однако при этом возникает также проблема эффективного представления объекта распознавания. Показано, что независимо от существующих подходов проблема представления текстур является пока нерешенной.

Из анализа существующих подходов в задачах распознавания текстурных изображений формируется обобщенный, так называемый спектрально-логический подход, сочетающий идейные установки геометрического и лингвистического подходов [103, 104].

Формализация основных понятий распознавания образов в рамках предложенного спектрально-логического подхода позволяет построить спектрально-логическую модель представления текстуры и изучить ее основные свойства.

Существующие в подавляющем большинстве практических задач распознавания функциональные представления текстур допускают непосредственное применение спектрально-логической модели путем разложения соответствующих функциональных зависимостей в спектры.

Спектрально-логическое представление текстур позволяет расширить класс решаемых традиционно трудных задач распознавания текстурных изображений.

17.2. Критерий текстурности фрагмента полутонового изображения

В ряде приложений задача неразрушающего контроля изделия сводится к анализу качества его поверхности. Для текстурных поверхностей это, в свою очередь, приводит к задаче классификации текстур [54]. Однако входное изображение поверхности не всегда бывает текстурным, то есть не выполняется критерий текстурности. Любая его конечная площадь изображения, превосходящая 50, несет с ошибкой е (50) (е ^ 0 при 50 ^ где 5 — вся поверхность изображения) информацию о всей текстуре. Следовательно, для любого признака ^ (5) имеем |<£> (5) — ^ (5о)| ^ е (50) • Поскольку первичным признаком изображения является его оптическая плотность В (5), то задача сводится к оценке величины Втах = |В1 (5) — В2 (5)| , которая имеет распределение Колмогорова-Смирнова.

Практически это реализуется следующим образом. С фрагмента изображения снимаются две параллельные трассы с расстоянием между ними, достаточным для выполнения условия независимости отсчетов. Тогда для гистограмм $1 (г) и $2 (г) условие текстурности есть

тах

р (£01(0 — £$2(г) ¿=1 ¿=1

.] = 1,п, (17.1)

где N — количество отсчетов в каждой из трасс; п — разрядность устройства ввода; а = 0, 9 -уровень значимости; — функция Смирнова, Е (г) =0, 5 [Е (г — 1) + 2Е (г) + Е (г + 1)] —

сглаживающая функция, введение которой необходимо для преодоления эффекта конечной разрядности гистограммы.

Нарушение (17.1) в некотором направлении свидетельствует о наличии аномалий в этом направлении на статистически однородном фоне или о наличии крупной структуры изображения. Способом аналогичным (17.1) проверяется также изотропность изображения, позволяющая в дальнейшем усреднять значения признаков по направлениям.

1 ( * * \

Пусть Ск (г) = — £ д\ (г) + £ (¿) — функция распределения в направлении к. Тогда

2 V 3 3 /

критерием анизотропии направлений и ^2 будет соотношение

тах (Си (г) — См (г))| < Кг^аъ (17.2)

где а\ = кг^/а, Ь = т ^ т ^—-, где кт — общее количество направлений. Наряду с оптической плотностью в (17.1), (17.2) можно использовать гистограмму контрастности на любом отрезке I : С (Р,1) = $ [В (_/) — В + I)] или спектральную плотность распределения 5 (г) = Е (В) • Однако практические эксперименты не показали их значимого преимущества по сравнению с оптической плотностью.

17.3. Сегментация текстурных изображений

Задачи автоматизации обработки текстурных изображений являются составными частями общей проблематики АСОИЗ (автоматизация систем обработки изображений).

На первом этапе автоматического анализа текстур — отборе представительной выборки реализаций текстур для последующего обучения ЭВМ (в случае распознавания с учителем)— возникает задача сегментации текстур, то есть выделения таких составных частей (фрагментов) текстур, которые, с одной стороны, достаточно представительно отображают общие свойства изучаемых текстур, а с другой стороны, представляют минимально необходимое по реализации поле для машинного анализа. Последнее обстоятельство является особенно существенным, так как позволяет сократить время ввода в ЭВМ фрагмента текстурного фотоизображения и последующего вычисления структурно-статистических характеристик исследуемых текстурных изображений.

В работе [100] излагаются результаты исследований по сегментации текстурных изображений с использованием теоретико-игрового подхода. Сформулируем основные требования при выполнении операции сегментации текстурных изображений. Сегментированный в текстурном

изображении фрагмент должен сохранять гомоморфизм текстур, то есть свойства, присущие всему текстурному изображению, проявляются в его конечной части и, наоборот, какая-либо конечная часть (фрагмент) отображает свойства всей текстуры.

Помимо гомоморфизма сегментированный фрагмент должен обладать свойствами изотропности (независимости от направления) в пределах допустимых деформаций исходного класса текстур и топологической инвариантности к местоположению.

Процедура сегментации выполняется следующим образом. Исходное множество текстур Т = {Т!,...,Тк} предварительно разбивается на основные типы: регулярные и нерегулярные. Для каждого класса текстур внутри типа вводится процедура обучения ЭВМ путем вычисления набора структурно-статистических признаков на произвольно заданном фрагменте для задания эталонов текстур. Начальное приближение размера фрагмента (ядра итерации) берется в зависимости от типа текстуры и допустимых деформаций реального изображения. Затем проверяются свойства изотропности и топологической инвариантности к местоположению фрагмента на текстуре. Далее строится итерационный процесс расширения ядра итерации за счет увеличения е — окрестности фрагмента:

где — надежность распознавания выбранного класса текстур, е — относительное увеличение фрагмента текстуры.

Процесс итерации сходится, когда в пределах заданной надежности распознавания достигаются устойчивые оценки параметров эталонов исследуемых классов текстур.

Проведенные теоретические и экспериментальные исследования по сегментации текстурных изображений на аппаратурно-программном комплексе обработки изображений, построенном на базе ЭВМ СМ-4, показали высокую эффективность процедуры сегментации на предварительном этапе обработки текстурной информации.

17.4. Представление двумерных дискретных изображений с помощью

Для того чтобы экономно использовать оперативную память ЭВМ при записи в нее дискретных двумерных изображений большой размерности, последние удобно «линеаризовы-вать» с помощью подходящей нумерации основного множества М ^ 1т х х 1г, где 1т ^ {1, 2,..., т} , ^ {1, 2,..., п} , 1г ^ {1, 2,..., г} , т, п, г € N ^ {0,1, 2,...} — множество натуральных чисел, что, в свою очередь, позволяет более компактно упаковывать исходную информацию [60, 64].

Для некоторой функции / : 1т х ^ 1г под тернарным отношением Е (/), таким, что Е (/) ^ {(ж, у; / (ж, у)) |(ж,у) € 1т х } , будем понимать двумерное дискретное изображение, соответствующее функции /.

При больших т и п изображение, соответствующее функции / в виде отношения Е (/), хранить в оперативной памяти невыгодно.

Используя нумерацию 7 (г, к) основного множества М такую, что 7 (г, к) = г + (_/ — 1) ■ т + (к — 1) ■ т ■ п, «линеаризуем» отношение Е (/) следующим образом: Е' (/) ^ {ж (ж) = и] , где (ж = 1, т ■ п ■ г) ,

фк-1 =

г_

Т

нумерации в виде одноместного отношения

^ (ж) = |

и, если ж = 7 (г, к) &/ (г, j) = к; и — «истина»; л, в противном случае, л — «ложь».

Количество записей в оперативной памяти уменьшилось втрое.

-1;

Пусть 7 (г, к) = р. Обозначим через 71 (р) = г, 72 (р) = 73 (р) = к обратные функции нумерации 7 (г, к). Эти функции можно вычислить следующим образом:

73(Р)=м(У> Ш) -1;

71 (р) = р - (72 (р) - 1) ■ т - (73 (р) - 1) ■ тп.

Здесь ^ — оператор минимизации, [■] — целая часть числа. По номеру р € Р' (/) однозначно восстанавливаются координаты отношения Р (/), что существенно для дальнейшей обработки указанного изображения.

Таким образом, изображение, соответствующее функции /, экономичнее хранить в памяти ЭВМ в виде одноместного отношения Р' (/).

17.5. Об одном методе распознавания текстурных изображений

Автоматический анализ текстурных изображений применяется в последние годы при исследовании таких объектов, как металлографические шлифы, биологические препараты, аэрокосмические снимки облачного покрова и земной поверхности и т.п. [152].

Однако существующие методы анализа текстур [52, 57, 172] обладают двумя недостатками. Первый — несогласованность этапов формирования признаков и принятия решений; при этом обычно решается задача создания системы признаков, достаточно полно описывающих текстуры, что не гарантирует оптимальности решающих правил. Второй — сложность аппаратурной реализации, обусловленная необходимостью ввода в ЭВМ всего изображения с достаточно высоким разрешением. Для одновременного устранения этих недостатков был разработан метод автоматического распознавания текстурных изображений. Метод предполагает выполнение следующих действий:

1) сканирование изображений;

2) вычисление первичных признаков сканограмм;

3) вычисление вторичных признаков сканограмм;

4) формирование классификационного решения.

Сканирование изображений осуществляется следующим образом. По полю изображения случайно (с равномерным распределением) размещаются п прямолинейных профилей, ори-

2п ■ г

ентированных под углами - (г = 1,2, ...,п) соответственно к произвольно выбранному

п

направлению. Указанная процедура повторяется т раз. Сечения изображений при профилировании (сканограммы) дискретизируются с достаточно высокой частотой с тем, чтобы обеспечить их обработку средствами цифровой техники; количество отсчетов каждой сканограммы I определяет длину профиля. Совокупность полученных сканограмм х ^ (к) (г = 1, 2,.. .,п; ] = 1, 2,..., т; к = 1, 2,...,1) является исходным материалом для дальнейшей обработки.

Первичные признаки характеризуют свойства текстуры по каждому выбранному направлению и вычисляются отдельно для каждого г . Все они строятся в соответствии с выражением

1 т 1 I—иг+1

¿=1 к=1

где г — номер признака у^-(к) = (х^(к),Ху(к + 1),...,Ху(к + V- - 1)); Сг — некоторый функционал от вектора у^-(к).

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Таким образом, каждый первичный признак есть среднее значение функционала Сг при «скольжении» интервала длиной V- по сканограмме, усредненное по всем коллинеарным профилям. Совокупность функционалов Сг однозначно определяет систему первичных признаков.

Вторичные признаки характеризуют интегральные свойства текстуры, инвариантные по отношению к ориентации изображений, и вычисляются по значениям первичных признаков. Схема вычислений следующая:

Ьв(дг) = Я [дг (1),дг (2),...,дг (п)],

где в — номер признака; И3 — некоторый функционал, инвариантный к циклической перестановке переменных. Таким образом, каждый вторичный признак характеризует форму «розы ветров» значений первичного признака безотносительной ориентации изображения. Совокупность функционалов Н однозначно определяет систему вторичных признаков, а совокупность Л (дг) при всех используемых в и г образует окончательную систему признаков для распознавания текстур.

Для распознавания применяются альтернативные решающие правила (АРП), позволяющие получить сколь угодно малую ошибку распознавания при достижении минимума возможных альтернатив решений. Формируются сначала частные решения по каждому признаку ), затем общее решение — в виде мультипликативного АРП. Способ распознавания на основе мультипликативных АРП описан в работе [102].

Поскольку в различных задачах свойства текстурных изображений различны, необходимо экспериментальное определение параметров метода: количества характеризуемых направлений п; кратности сканирования т, длин профилей I, длин скользящих интервалов V-, наборов функционалов Сг и В плане методики экспериментальной подстройки метода к конкретной решаемой задаче получены следующие рекомендации.

Первоначально (на этапе обучения) параметры п, т, I следует выбрать настолько большими, насколько это допускает используемое техническое оснащение; аналогично наборы функционалов следует выбрать по возможности более разнообразными (при разнообразных значениях V-). Затем путем отбора наиболее информативных признаков ) (по критерию

минимума альтернатив решений [102]) и определения максимальной длины соответствующих интервалов уточняется значение I = V- тах. Далее кратность сканирования т уменьшается до достижения границы устойчивости значений признаков дг. Наконец, значение количества профилей п снижается до такой величины, дальнейшее уменьшение которой приводит к неустойчивости признаков

Отметим основные особенности описанного метода. Во-первых, экспериментальная настройка метода осуществляется так, чтобы обеспечить по возможности более близкое к оптимальному решение классификационной задачи. Согласованность с этапом принятия решений определяет как систему признаков, так и параметры сканирования. Во-вторых, метод допускает простую аппаратурную реализацию, так как используется рандомизированное сканирование, не требующее высокой точности. В частности, отпадает необходимость применения дорогостоящих прецизионных устройств ввода изображений.

Метод был применен для экспериментального исследования аэрофотоизображений земной поверхности. При распознавании изображений четырнадцати типов растительного покрова достигнута вероятность различения объектов 76%. Кратность сканирования в экспериментах составляла единицу, количество направлений профилей равнялось девяти. Система первичных признаков содержала 25 характеристик, а вторичными признаками являлись среднее по направлениям и коэффициент анизотропии (разброс значений первичного признака по направлениям). Было отобрано 28 наиболее информативных признаков с максимальной длиной скользящего интервала 32 отсчета (при 256 отсчетах на всем профиле). Результаты экспериментов показали эффективность разработанного метода распознавания текстур при относительной простоте его реализации [97].

17.6. Алгоритмические и технические аспекты при автоматическом анализе текстурных изображений

В общем потоке исследований по распознаванию образов анализ текстурных изображений занимает особое место в силу следующих двух обстоятельств: во-первых, наиболее частая встречаемость текстур в практических задачах автоматизации распознавания образов (например, в задачах медицинской диагностики, материаловедения, биофизики, дистанционного исследования природных ресурсов и т.п.); во-вторых, текстурные изображения являются составными частями любых изображений [3].

Среди различных методов анализа текстурных изображений особое место принадлежит автоматическому (машинному) анализу, теоретической базой которого являются структурно-

статистические методы распознавания образов, а практические вопросы решаются в рамках создания распознающих устройств и комплексов [52, 97, 165, 166, 170, 172]. Алгоритмический аспект связан с формализацией описания текстурных изображений, приемами извлечения (измерения) полезной информации из текстурного изображения, выбором эффективной системы признаков, адекватной структуре текстурного изображения, выбором решающих правил, созданием банка эталонного описания текстур, механизмом формирования текстурных изображений.

В техническом аспекте актуальными являются вопросы построения аппаратурно-про-граммных комплексов для ввода, обработки и вывода информации о текстурном фотоизображении; построения подсистемы оптимального сканирования (извлечения) информации о текстуре; выбора функциональной структуры и элементной базы, а также технико-экономической эффективности создания аппаратурно-программных комплексов для анализа текстур. Ввиду отсутствия универсальных алгоритмов анализа текстур целесообразно выделять множество текстур заданной физической природы и рассматривать соответствующие способы их машинного анализа.

Рассмотрим более подробно некоторые составляющие аспектов. Формализация описания текстурных изображений, являющихся составными частями любых изображений, связана с выбором математических моделей, адекватных изучаемым объектам.

Подобно большинству методов решения задач, машинный анализ текстур требует, чтобы данные о текстурах, прежде всего, были представлены каким-либо определенным образом. В частности, представленные для анализа текстурные изображения объектов должны быть описаны какой-либо совокупностью чисел или других элементов-значений признаков, характеристик объектов. Обычно объекты представляются векторами в числовых пространствах признаков или словами, порожденными в некотором формальном алфавите, как, например, в структурных методах распознавания [165]. Представить реальные текстурные изображения объектов совокупностью характеристик — это самостоятельная задача со всеми присущими этому классу задач трудностями [31].

Наибольший интерес как теоретический, так и практический представляет описание реальных текстурных изображений как функций распределения оптической плотности, аппроксимируемых каким-либо образом в пространстве дискретного аргумента (набором решетчатых функций, сплайн-аппроксимация и т.п.) [3]. Формализация описания текстурных изображений тесно связана с механизмом их формирования.

Знание законов передачи информации об объекте на какой-либо регистратор (фотоноситель) позволяет более полно описать и учесть все детали текстурного изображения как некоторого гомоморфного отображения проектируемой оптической поверхности объекта на поверхность регистратора. Если в качестве регистратора используется какой-либо фотоноситель, то полученные текстурные фотоизображения несут в себе все те погрешности в передаче информации, которые присущи фотопроцессу. В частности, так как фотографические системы не являются технически идеальными, то текстурные фотоизображения, полученные с помощью технических фотографических систем, содержат практически как линейные (частотные) искажения, так и нелинейные (градационные) [56]. Частотные искажения связаны с неравномерной передачей пространственных частот в канале передачи информации, что приводит к ухудшению резкости изображения, то есть потере в конечном счете информации о текстуре. Градационные искажения вызываются нелинейным преобразованием яркости объекта в оптическую плотность на фотоносителе.

Учет и коррекция градационных и частотных искажений текстурных фотоизображений представляют собой самостоятельную научно-техническую проблему [56]. Алгоритмизация анализа текстурных изображений прежде всего связана с разрешимостью проблемы распознавания и классификации, то есть доказательством существования алгоритмов, гарантирующих решение проблемы (по аналогии теорем существования и единственности решений в классической математике) [9].

Алгоритмизация в данном случае возможна на некоторой единой методологической основе, в частности на теории нумераций — одного из разделов теории алгоритмов, позволяющей

сформулировать критерии разрешимости распознавания и классификации [9, 67, 68].

Приведем один из возможных способов кодирования текстур как конструктивных объектов. Каждый элемент исходного множества текстурных изображений или просто текстур обозначим функцией / (ж, у) с областью определения М и областью измерения значений оптической плотности Б, р/ С [а, Ь], где Б С #2, [а, Ь] С , — множество действительных чисел. Области Б и [а, Ь] квантуются таким образом, чтобы в пространстве наблюдений Р можно было бы ввести функцию /(ж,у) : Зт х Зп —Зг, где ^ {1,2, ...,т} ,

^ {1, 2,...,п} , 1Г ^ {1, 2,..., г} , п, т, г € N ^ {0,1, 2,...} — множество натуральных чисел. Каждой текстуре / € М ставится в соответствие отношение С 1т х х 1Г такое, что Рр = {(ж,у,/(ж,у)) | (ж, у) £ЗтхЗп} .

Данное отношение с помощью канторовской нумерующей тройки с3 (х, у, г), где

с3 (ж, у, г) ^ с(с(х,с(у, г))), с(х,у) = ^ ^—+ Зж + у ^ переБОдИТСЯ во множество натуральных чисел

с(*» — {с3 У>7(ж>2/)) Iу) € х Лга } .

Далее с помощью стандартной нумерации 7 : N — Ф, где Ф — множество всех конечных подмножеств натуральных чисел, такой, что 7 (0) = 0 и для любого п > 0, если п = 2П0 +2П1 + ... + 2Пк; по < п1 < п2 < ... < пк, то 7(п) = {по,п1, ...,пк} , и множеству с(Р/) ставится в соответствие натуральное число ^ = 7—1 (с(Р/)).

Таким образом, дискретная текстура Р, заданная в точках в виде натуральных чисел, есть конструктивный объект, а следовательно, применимы к работе с ним все приемы и методы конструктивной математики [67, 68, 115]. При таком подходе в пространстве наблюдений Р исходное множество наблюдаемых объектов М разбивается на конечное число классов М^, (г = 1, ¿) , а отображение (р : М —Р дает покрытие образа А = ц) (М) подобразами ц) (М^). Тогда проблема классификации для тройки (М, Я, , где Я = {М1,...,М^} — некоторое конечное разбиение множества конструктивных объектов (М, , сводится к отысканию для любого объекта а € М всех номеров подобразов пространства наблюдений, в которые элемент а попадает с помощью отображения

Частным случаем проблемы классификации является проблема распознавания: для произвольного конечного объекта а € Р определить принадлежность а множеству А € Р. В случае, когда в качестве Р взят натуральный ряд N данная проблема в теории алгоритмов известна как проблема вхождения [119].

Мы рассматриваем конструктивные множества объектов, то есть множества, которые допускают кодирование своих элементов конечными объектами: словами, матрицами, конечными множествами или кортежами натуральных чисел. Другими словами, конструктивные множества — это множества реально существующих объектов, которые в пространстве наблюдений воспринимаются как конечные объекты. Заметим, что любой конечный объект можно закодировать натуральным числом, а в качестве универсума Р конечных объектов взять натуральный ряд чисел N. Тогда алгоритмическую разрешимость проблем распознавания и классификации можно сформулировать на языке теории рекурсивных функций в виде критериев разрешимости для подмножеств натурального ряда, а для случая любого другого универсума конечных объектов необходимые и достаточные условия для разрешимости проблемы классификации можно перенести с помощью подходящих нумераций этих универсумов [119].

Указанные выше проблемы распознавания и классификации опираются на знание априорной информации о классах объектов. На практике, как правило, такая информация отсутствует, поэтому для решения задачи классификации приходится использовать обучение. Обучение может быть полным и неполным.

Пусть исходное множество объектов М отображается с помощью О в пространство конечных объектов Р. В этом пространстве мы наблюдаем конечную последовательность

0 ^ (О (а1),..., О(а^)). Априорно известна классифицирующая функция / : 1 —

1 ^ {1,2,...,1} , 1 ^ {1,2,...,£} , где € N ^ {0,1,2,...} — множество натуральных чисел, распределяющая элементы обучающей выборки О по классам М1, ...,М^.

Обозначим через А^О) множества А^О) ^ ОпП (М^), (г = . Тогда если (\/г €

[АДО) = П (Мг)|, то будем говорить, что обучающая выборка О полна; в противном случае -неполна.

Задача состоит в том, чтобы по любому а € М определить множество номеров тех подо-бразов П (Мг) , для которых П(а) € П(М^).

Для случая, когда в качестве Е взят натуральный ряд N и обучающая выборка полна, эту задачу решают используя предикаты следующего вида:

где ХАг(О) (х) — характеристическая функция множества А^(О).

Минимизация обучающей информации позволяет упростить выбор наиболее информативных признаков и построение адекватных решающих правил [118].

Таким образом, выделяя алгоритмические и технические аспекты при автоматическом анализе текстурных изображений конкретной физической природы, можно указать критерии разрешимости задачи классификации и конструктивные приемы ее наиболее эффективного решения.

17.7. Комплекс автоматизированного дешифрирования крупномасштабных

В системе картобеспечения рационального природопользования одно из ведущих мест принадлежит материалам космических съемок, обеспечивающим получение достоверной информации о больших площадях земной поверхности. Обладая очевидными преимуществами, космические фотоснимки (КФС) имеют ряд особенностей получения информации об объектах местности, которые должны учитываться при обработке. Прежде всего это мелкий масштаб и малый контраст изображения, не позволяющие надежно использовать при дешифрировании традиционные дешифровочные признаки объектов исследования (форма, размер, тени, особенности структуры и т.п.).

В связи с этим надежность визуального дешифрирования КФС по всем классам объектов не превосходит 35-40%, а по одному из самых распространенных классов — растительным покровам и грунтам (РПиГ) — 20-30%, что не обеспечивает полноту содержания многих тематических и топографических карт, составляемых (обновляемых) по КФС. Возникает необходимость проведения дополнительных камеральных и полевых работ. В результате одно из основных преимуществ космической съемки — оперативность получения информации — не может быть в полной мере реализовано. Следовательно, для решения задачи рационального природопользования по материалам космической съемки необходима разработка высокопроизводительных и надежных средств и методов оперативной обработки КФС.

Одним из таких средств является комплекс аппаратно-программных средств для автоматизированного дешифрирования интегральных черно-белых крупномасштабных (крупнее 1:200000) космических фотоснимков, обеспечивающих получение информации о площадных объектах (РПиГ) естественных и антропогенных ландшафтов, а также измерение ширины линейных объектов (ЛО).

В настоящей работе рассматривается аппаратно-программный комплекс АРМ-Д (автоматизированное рабочее место дешифровщика), который предназначен для автоматизированного дешифрирования по КФС объектов РПиГ и определения размеров ЛО (ширина дорог, рек, тальвегов и т. д.) при составлении и обновлении топографических и тематических карт [97].

Разработка методики автоматизированного дешифрирования КФС сводится к решению двух принципиальных задач:

разработка методики объективного анализа амплитудных и структурных особенностей фотоизображений (текстур) различных классов объектов и их сочетаний;

нахождение взаимосвязи между определяемыми по КФС объектами и (или) их элементами и объектами и характеристиками, не имеющими прямого отображения на КФС, то есть поиск связи между индикаторами и индицируемыми объектами [3, 54, 101].

0, в противном случае,

космических фотоснимков

Полученные в предыдущих главах 1-3 теоретические результаты послужили основой для корректной постановки задачи на разработку практических алгоритмов классификации (дешифрирования) и прикладного программного обеспечения комплекса АРМ-Д.

Выполняется ландшафтное районирование картографируемых территорий с выделением ландшафтов-аналогов. Затем в ландшафтах, доступных для производства полевых работ, составляются эталоны дешифрирования для каждого типа картографируемых объектов с полным описанием их качественных и количественных характеристик в объеме требований, предъявляемых к составляемым (обновляемым) картам. Изображения эталонов фотоснимков вводятся в ЭВМ, вычисляются их признаки и заносятся в память ЭВМ вместе с качественными и количественными характеристиками, то есть по каждому ландшафту формируется банк аналитических эталонов. По данным ландшафтной привязки реальных КФС производится автоматизированное дешифрирование участков изображений РПиГ путем аналитического сопоставления вычисленных признаков текущего изображения с эталонным и принятия решений по совпадению признаков эталонного и изучаемого изображений [100].

В комплексе АРМ-Д формируются два основных режима работы: эталонирование и дешифрирование.

В процессе эталонирования в ЭВМ с помощью диссекторного устройства ввода ДИП-14 (диссекторный измеритель плотностей) вводится информация о текстуре изображения, которую оператор-фотограмметрист дополняет полевыми данными. Формируется банк аналитических (машинных) эталонов на район дешифрирования.

К признакам, описывающим текстуру, можно отнести характеристики гистограммы оптической плотности (среднее значение, стандартное отклонение, коэффициенты асимметрии и эксцесса и др.); аналогичные характеристики гистограмм переходов на расстояниях 2, 8 и 20 м на местности (соответствующие понятиям мелкая, средняя и крупная текстуры); некоторые характеристики двумерной гистограммы; параметры кусочно-линейной аппроксимации автокорреляционной функции [101, 124].

В случае, если известны полевые данные для вводимого изображения, в результате ввода контура, содержащего 20-30 текстурных фрагментов, формируется аналитический эталон дешифрирования типа РПиГ (например, лес мезофитный, луг гигрофитный, болото грядово-мочажинное и т. д.). Физический эталон интерпретируется вектором

/ г 7 г 7 г 7 г 7 г 7 г 7 \

^ = (ш/; а{, ; а^, ...,т/; а/ ),

где ; а^ —устойчивые (робастные) значения среднего (параметр положения) и стандартного (параметр масштаба) отклонений для признака эталонного фрагмента.

В результате эталонирования формируется банк из аналитических эталонов дешифрирования

П = (ш1Ъ , ^21, ^2т2 , Ш^

где £ — число дешифрируемых типов объектов; ш», (г = — число эталонов типа

Обычно в результате предварительного районирования для выделения районов-аналогов выбирается 5-200 эталонов на район. Число эталонов каждого типа существенно зависит от степени разнообразия фаций данного типа в пределах рассматриваемого физико-географического комплекса (подрайона) и составляет порядка 3-30 эталонов на тип [125].

Непосредственно процесс дешифрирования сводится к сравнению неопознанного объекта, описанного вектором признаков X, с банком эталонов П, в результате чего устанавливаются тип объекта X и количественные характеристики, присущие данному типу.

Особенностью такого сравнения является экстраполяционный характер алгоритма, обусловленный тем, что дешифрирование выполняется в районе-аналоге. Следовательно, необходимо учитывать изменения на изображении, вызываемые естественными причинами в пределах типа объекта (вариации условий выполнения съемки, физико-географических условий и т. д.). Для учета этих изменений разработан специальный теоретико-игровой алгоритм (ТИРА), действие которого сводится на первом этапе к построению матрицы размером ш х п, каждый элемент которой характеризует отклонение по признаку г дешифрируемого объекта

от эталона На втором этапе с помощью этой матрицы определяется вектор вероятностей принадлежности объекта X эталонам и\,...,ит и типам РПиГ 01,..., 0t■ С помощью специальной последовательной процедуры принимается однозначное решение о типе объекта. Количественные характеристики объектов определяются как скалярное произведение РТ, где Р — вектор вероятностей, Т — матрица параметров эталонов.

В состав пакета прикладных программ дешифрирования РПиГ, кроме основных модулей дешифрирования и эталонирования, входят также:

подсистема фотометрической коррекции, позволяющая корректировать значения средней оптической плотности и средней контрастности в зависимости от условий фотохимической обработки и характеристик фотоматериалов, что позволяет уменьшить зависимость качества изображения от фотопроцесса;

подсистема оптимизации дешифрирования, позволяющая дать графическую интерпретацию системе эталонов, определить оптимальный состав эталонов и признаков и провести комплексную диагностику ошибок классификатора;

подсистема выбора оптимального состава структурно-статистических признаков; модуль определения мест дообучения и статистического анализа системы определения количественных характеристик;

система управления базой данных эталонов.

Пакет прикладных программ измерения параметров профиля линейного объекта основан на моделировании профиля набором прямоугольников, свернутых с некоторой рассеивающей функцией. Измерение параметров ЛО реализуется спектрально-логическим методом, основанным на теории сверхразрешения, позволяющим в явном виде определять параметры ширины ступеней в спектральной области.

Качество работы комплекса АРМ-Д оценивалось по результатам дешифрирования контрольных участков в различных ландшафтах (равнины плоские и холмистые со степной, полустепной или лесной растительностью; равнины песчано-бугристые, бугристо-грядовые с полупустынной растительностью; предгорья и горы средней высоты с горно-лесной и горно-степной растительностью и другие типы ландшафтов).

Для оценки качества работы комплекса АРМ-Д рассмотрено 47 типов РПиГ на 39 КФС, в пределах которых выделено 236 контуров, рассмотрено 528 фрагментов текстурных изображений РПиГ. Надежность их дешифрирования составила в среднем 77,4 ± 1,7%, в том числе для районов-аналогов — 77,2 ± 4,2%.

Значения достоверности дешифрирования на комплексе АРМ-Д приведены в табл. 17.1.

Таблица 17.1

Объект исследований Число фрагментов Достоверность, %

Класс (тип РПиГ) 125 91

Породный состав лесов 111 65

Количественные характеристики растительности 245 77

Литологический состав грунта (до 3 метров) 220 70

Уровень грунтовых вод в 3-метровой толще 125 88

Достигнутый уровень результатов дешифрирования соответствует требованиям, предъявляемым к комплексам автоматизированного дешифрирования космических фотоснимков при обновлении и составлении карт топографических и других видов.

Универсальность комплекса АРМ-Д позволяет применять его также для решения широкого круга нетопографических задач фотограмметрии в медицине, биологии, физике, космических исследованиях.

§ 18. Примеры из компьютеризации медицинских технологий

В работе [98] показан возможный подход к компьютеризации медицинских технологий, который учитывает возрастающую роль и тенденции применения персональных компьютеров в медицинской практике не только в плане контроля физиологических функций пациента, слежения (мониторирования) за ними, но и в плане прогностических функций, организационной статистики лечебно-профилактических учреждений и их отдельных служб.

Вычислительные и сервисные возможности современных персональных компьютеров, нарастающие тенденции их развития, а также высокая трудоемкость, отсутствие унификации в сопровождении медицины традиционной бумажной информацией ставят задачу компьютеризации медицинских технологий в число важнейших.

В связи с этим в работах [85, 86] определяется в первую очередь общая концепция компьютеризации в медицине и этапы ее реализации.

Приведем примеры применения полученных теоретических результатов в отдельных компонентах компьютерных медицинских технологий.

18.1. Алгебро-логические алгоритмы в распознавании, идентификации и классификации медицинских объектов

При построении компьютерных экспертных систем актуальны задачи распознавания, идентификации и классификации объектов. Предлагается конструктивный подход к решению указанных задач.

В современных медицинских компьютерных технологиях (МКТ) часто возникает задача выбора: найти по нескольким ключевым словам необходимый документ или его название, когда имеется большой объем ретроспективной разнородной информации, собранной в обучающую выборку медицинских экспертных систем (МЭС).

Порядок подачи ключевых слов в МЭС на входе, как правило, не фиксирован. Поэтому, формализуя процесс выбора путем кодирования ретроспективной информации и информации, подаваемой на распознавание в МЭС, приходят к общим для всех экспертных систем категориям (или понятиям).

Кодирование.

Пусть М — основное множество медицинских объектов (в частности, некоторые имена, паспорта и т.п.), К — множество конструктивных (или конечных) объектов.

Тогда введем отображение ^ : М ^ К как функцию кодирования медицинских объектов конечными множествами.

Обучающая выборка О ^ {Х1, ■ ■ ■, — семейство известных множеств Х^, г = 1, т.

Разбиение множества О на классы-эталоны N7, ] € I ^ {1,..., £}, 5 ^ {N1,..., N4}.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Закрепление номеров г € 3т ^ {1,2,...,ш} элементов обучающей выборки Хг € О за номерами ] € I ^ {1,2,...,£} классов N7 € 5 с помощью классифицирующей функции / : 3т ^ £ — количество классов-эталонов N7.

Множество X — неизвестная реализация (описание) объекта х на входе МЭС.

Целевые функции, известные в распознавании образов как задачи распознавания, идентификации, классификации, формулируются в данной работе на языке характеристических функций.

1. Распознавание — операция вычисления характеристической функции принадлежности объекта х множеству X :

случае.

2. Идентификация — операция вычисления характеристической функции равенства множеств: X — неизвестная реализация объекта х, Хг — описание объекта х в обучающей выборке О.

3. Классификация — операция вычисления характеристической функции принадлежности неизвестной реализации X одному из классов разбиений:

(V* € о) г* € N1 = ( 1,если Х € **€

0, в противном случае

1 0, в противном случае. Очевидно, задачи классификации являются более общим случаем задач распознавания и идентификации.

Отходя от комбинаторного (переборного) решения задач классификации, укажем ряд условий, наложенных на исходные данные, с тем, чтобы с минимальными вычислительными затратами определить характеристические функции Рг (X) = [X € N¿1, г € I путем эталонирования и таксономии в МЭС, работающих с сильно слипающимися множествами.

В известных работах по медицинской диагностике одной из задач является сокращение описания массивов обучающих статистических данных [140]. Поиск критериев отбора признаков и сокращения исходного описания медицинских объектов должен проходить с учетом структуры (морфологии) описания объекта и качества диагностики.

В настоящей работе такая задача решена с помощью эталонирования сильно слипающихся множеств в обучении.

1. Определение сильно слипающихся множеств. В качестве основного множества М возьмем семейство конечных подмножеств М ^ {*1, *2,..., Хт, }, где Хг С Ф, допускающих пересечение (сцепление) элементов этих подмножеств в каждом из классов эквивалентности; здесь Ф — множество всех конечных подмножеств натурального ряда N ^ {0,1, 2,...}.

Кодирование (редукция) ^ : М ^ Ф таково, что <^(М) = О и К = Ф.

Определение 18.1. Два множества Хг, Х? € М, г = ] называются сильно слипающимися, если:

1) Хг П Х? = 0,

2) Хг\Ху = 0,

3) Х?\Хг = 0, то есть два множества Хг, Х? отличаются между собой хотя бы на один элемент.

Пусть 5 ^ {N1, N2,..., N4} — разбиение множества М, где N — класс, содержащий не менее одного множества из М. В МЭС, работающей с множествами, требуется вычислять характеристические функции вида

1, если Х € Nk, к €

^Х € М)[Х € N1 =

0, в противном случае. Пусть Ег — эталонные множества, полученные по алгоритму эталонирования [79]. Введем вспомогательный предикат пересечения (сцепления) неизвестного множества Х с одним из эталонным множеств Ег :

к (х) — I ^ если ^ п ^ ^ 0' ^ = ^

г 0, в противном случае.

Предикат принадлежности неизвестного множества Х классу эквивалентности N :

1, если Х € г €

Рг(Х) = , п

0, в противном случае.

Логическую матрицу Q = \\Qij||, учитывающую пересечение («сцепление») эталона Ег с каким-либо из множеств обучения Хк € М, построим следующим образом:

Qгj —

1, если Ег П и Хк = 0;

кед

0, в противном случае,

где множество номеров эталонных объектов — Б? = {г|/(г) = _/}, г, к € Тогда имеют место следующие утверждения:

Лемма 18.1 [79]. (V? € 14)ГРг(Х) ^ Д*(Х)1.

Теорема 18.1 [79]. Если (Щг = ] € 34) = 1 ^ % =0], то ^ € М)(Щг € 34)

Рг (X) = Дф^-

V Д фЭДк

7е1(\{г}

Общее решение с учетом классифицирующей функции / примет вид: Д(X) = V Р/ (X),

где А = {г|/(г) = к}, к € I — множество номеров эталонных объектов.

Применим алгоритм эталонирования [79] к предобработанным данным Xг, где XI в N7

заменено на X', а X' = XI\ и и Xfc, г € 1т. г г ¿еЗД« кеД;

Применение алгоритма эталонирования [79] к Xг, г € 3т назовем процедурой специализированного эталонирования.

2. Процедура специализированного эталонирования. Пусть Xг = 0, г € 1т.

Возьмем г := 1, Ег' = 0 и маркер Лз := 0.

Метка МО. Записываем Л^ в первый список Н\ и берем второй список Н2 = 0. Эти два списка сопровождают еще два маркера := Н\ и к2 '■= Н2, то есть к2 : = 0.

Метка М1. Если = 1, то берем для эталонного множества £^ произвольный элемент из множества X € N1; Лз := Лз + 1.

Обнуляем первый список Н := 0 и идем на метку М3.

Если Ь 1 = 2, то есть N1 = {X!, X2 }, то образуем пересечение П 1 = X! П X2.

Если П 1 = 0, то берем произвольный элемент а € П 1 и заносим его в эталонное множество Е , маркер Лзг := Лз + 1 и идем на метку М3.

В противном случае в Е записываем произвольный элемент а1 € Xl и второй элемент а2 € X2 маркер Лз := Лз + 2.

Обнуляем первый список Н1, маркер Л := 0 и переходим на метку М3. Иначе переходим на метку М4.

Метка М4. Если ^ 3, то берем первый элемент — множество из списка Н\ и начинаем пересекать его со вторым элементом — множеством из списка Н1.

Если такое пересечение не пусто, то второе множество выбрасывается.

Метка МБ. := Ь 1 — 1. Если = 2, то идем на метку Мб. В противном случае само пересечение пересекается со следующим множеством списка

Если пересечение оказалось пустым, то оставляем предыдущее пересечение без корректировок, а элемент-множество, с которым получилось пустое пересечение, записываем во второй список Н2; Л-2 := Л-2 + 1. В противном случае это множество выбрасывается и идем на метку М5.

Метка Мб. Исчерпав все элементы первого списка Н\, строим эталонное множество £■, маркер Лзг := Лз + 1, в котором берем произвольный элемент из пересечения.

Заменяем первый список Н вторым Н2, то есть Н := Н2, Л := Л-2, а второй список обнуляем Л-2 := 0. Если Л = 0, то идем на метку М3. В противном случае идем на метку М1.

Метка МЗ. г := г + 1.

Если г ^ то идем на метку М0. В противном случае идем на метку М2.

Метка М2. Конец эталонирования.

Выходными параметрами алгоритма являются эталонные представления объектов в виде множеств £■, (г = где £ — число классов.

1, если Е П X = 0, г €

Пусть р'ф = \ "

г [ 0, в противном случае.

Тогда имеет место следующая

Теорема 18.2 [79]. Пусть (Щг € € М'^г = 0]. Тогда ^ € М) ^ € М) [[X = XI] ^ Р^)].

Когда освобождаются информативные зоны в исходных множествах XI при переходе к Xг

от присутствия элементов «чужих» классов ] € 3Д{г}, специализированное эталонирование

позволяет выявить чувствительные инвариантные относительно класса Nj эталоны, взятые из этих информативных зон.

Под инвариантностью описания эталонов понимается независимая от порядка следования исходных множеств в каждом классе Nj процедура выбора эталонов.

Под чувствительностью эталона понимается возможность обнаружения по этому эталону неизвестной реализации в каком-либо классе, без нарушения зоны перекрытия «чужих» классов.

Приведенная процедура эталонирования сильно слипающихся множеств носит эмпирический характер и в целом не дает оптимального (наименьшего) количества эталонов. Этот недостаток компенсируется алгоритмами оптимального построения эталонных множеств для ретроспективной информации с привлечением для этого бинарного отношения частичного порядка на множествах натуральных чисел.

3. Об оптимальном распознавании множеств натуральных чисел. Рассмотрим класс A всех конечных семейств конечных подмножеств натурального ряда N ^ {0,1, 2,...}, у которых существуют разбиения, содержащие не менее двух элементов.

Поскольку любое M € A конечно, то и всякое его разбиение S конечно.

С каждым разбиением S ^ {Ni, N2,..., Nt}, (t ^ 2) семейства M ^ {Xi, X2,..., Xm}, (m ^ 2) свяжем псевдомодель Mod = (M; а) с основным множеством M и псевдосигнатурой а ^ (Ri, R2, • • •, Rt), содержащей t функционалов — точечных характеристических функций:

R(X) = i 1, если X € Ni, i € It;

у 0, в противном случае.

Для любого семейства B через P(B) будем обозначать множество всех подмножеств множества B. Как и ранее (см. формулы (4.1), (4.2)), для любого семейства C = {X} введем операции объединения O(C) и пересечения П(С) следующим образом:

{0, если card C = 0; ( 0, если card C = 0;

X, если card C = 1; П(С) = < X, если card C = 1;

U X, если card C ^ 2 I П X, если card C ^ 2

хеС I хеС

(здесь card означает кардинал множества).

Пусть M € A на множестве P(O(M)).

Введем частичный порядок: Gi ^ G2 ^ Gi С G2.

Ставится следующая задача: для разбиения S ^ {Ni,N2,...,Nt} семейства M найти t минимальных эталонов £i,(i = 1 ,t), которые бы позволяли инвариантно описывать представителей i -го класса эквивалентности Ni разбиения S с последующим применением их в процессе вычисления характеристических функций псевдосигнатуры а.

Инвариантность здесь понимается как независимость (или устойчивость) информационных областей (зон) от номеров следования множеств в обучении.

Для решения вышеуказанной задачи введем следующие дополнительные обозначения.

Пусть Ci ^ {G\G € Р(ЩШ(С) ф 0}, (г = М).

Пусть в C i нашлось ti максимальных элементов-множеств G|,G|,...,Gt.. Тогда, выбирая по элементу из каждого множества (j = l,i), сформируем эталонные множества

Si, {г = М).

Далее построим логическую матрицу q = 11qij||txt, такую, что

( 1, если Ei П O(Nj) = 0, qij = 0, в противном случае;

и для VX € O(C) положим P(X) = ( 1 если X П E = 0, где i,j € It ^ {1, 2,...,t}.

0, в противном случае;

Имеют место следующие

Лемма 18.2 [79]. Если (Уг € 1т)[Х, = 0], то (УХ € М)|~Я'(Х) ^ Р'(Х)].

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Теорема 18.3 [79]. Для любого разбиения Б ^ {N1, N2,..., N4} семейства М = = 0(Б) € А, если (Уг = j € = 1 ^ = 0], то

(УХ € М)[Яг(Х) = Рг(Х)&-[ V Рк(Х)ЗД].

кеЗДМ

Пусть исходное множество М ^ {Х1, Х2, ..Хт} и некоторое разбиение его Б ^ {N1, N2,..N4} связаны классифицирующей функцией / : 1т ^ 1^; 1т ^ {1, 2.. .,т},

^ {1, 2..., ¿}, (т,£ ^ 2).

Положим Х' ^ ХД и и Хк; М' ^ {Х1,Х'2,...,Х^}; Б' ^ {N1,N2,...,N4}, где М' —

ЗеЗДМ

множество остатков(«осколков») — «чистых» представителей Х' (элементов) соответствующих одноименых множеств г после вычитания из множества Х' объединения представителей обучающей выборки Х&, то есть имеем

М' ^ {Х' = ХД и и Хк}, г € 1т.

ЗеЗДМ кед^

Пусть С' ^ {С'|С € Р(^)&П(С) = 0}, г €

Пусть в С' нашлось максимальных элемента множества С'1, С'2,..., С.

Тогда, выбирая по элементу из каждого множества П(С',), j € 1,^', построим эталонные множества £■, (г = 1, ¿).

1, если Е П ООД) = 0

Положим д' = Ид'- ||4х4, где д'3 = < ' ' 3 'и для каждого Х € 0(С)

'3 '3 [0, в противном случае

\ 1, если Е' П Х = 0,г € 14; положим Р/(Х) = < _ '

' [0, в противном случае.

Тогда справедливо следствие 18.1 теоремы 18.3.

Следствие 18.1. Если для любого разбиения Б ^ {N1, N2,..., N4} семейства М = 0(С)[[Х = Х'] ^ Х' = 0], то ЯДХ) = р'(Х),г € 14.

Введенный частичный порядок ^ ^2 ^ С ^2 на семействах подмножеств классов из Р(Шг) позволяет выделить максимальные подсемейства с непустыми зонами эталонных симптомов в перекрытии так, чтобы количество этих эталонов-симптомов было минимальным.

4. Таксономия как подзадача задачи классификации конечных объектов. Пусть К ^ {й1, а2,..., ар} — конечное множество конструктивных объектов и на множестве К задано некоторое отношение толерантности т и т подмножеств Х1, Х2,..., Хт С К.

Требуется выделить простой признак, по которому можно было бы решать задачу классификации для семейства Б ^ {N1, N2,..., N4}.

Для решения поставленной задачи предлагается взять Л,(Х) — количество связных по отношению толерантности т областей множества Х С К и построить следующий алгоритм таксономии [12].

Алгоритм таксономии. Пусть Х ^ {а1, а2,..., }, Х С К.

Метка Мо • Если X = 0, то полагаем Л,(Х) := 0. В противном случае идти на метку М2.

Метка М 2 • Если X = {а}, то Л,(Х) := 1 и мы имеем один таксон Т\ = {а}. Идти на метку М1. В противном случае идти на метку М3.

Метка М 3 . Если д ^ 2. Положим Ао : = {01}, Во := {а2, аз,..., ад}.

Для каждого Ь € Во, начиная с й2, проверяем отношение й1тЬ.

Если для некоторого Ь € Во отношение толерантности т выполнилось оцтЬ, то полагаем А := Ао и {Ь}, В1 := Во\{Ь}.

Если в В1 есть элементы, то проверяем каждый элемент из В1 по отношению толерантности т с элементами А1 и строим аналогично множества А2 и В2. Если на 1-м шаге такая

цепь оборвалась из-за отсутствия элементов в Вг, то полагаем Т1 := Аг и Л,^) := Л,^) + 1. Идти на метку М1. В противном случае на М 4.

Метка М4 . А0 := {а^}, а^ — первый элемент, Во = ВД{а Идти на метку М 6. В противном случае идти на метку М 5.

Метка М 5 . Если все элементы В^ перебраны, а связанных отношением толерантности т элементов с элементами множества Аг не оказалось, то Т1 = Аг, и если при этом Т2 = {а}, то получаем Л,^) := Л,^) + 2. Идти на метку М1. Иначе идти на метку М4. Метка М 1 . Конец таксономии.

Таким образом, создается своеобразное отношение эквивалентности =т на множестве X, фактор-множество которого есть таксоны — X / =т = { Т1, Т2,..., }.

Если взять Л,^) в качестве признака для множества X, то частное решение можно представить следующим образом: Дг(Х) = |~Л,(Х) = Л,(Хг)~|, г = 1,т и общее решение использует

классифицирующую функцию / : Зт —Зг и имеет вид = V Aj(3£), (к = где

_

Ок = {г\т=к}, (к = 1,1).

Здесь частное решение (X) находится в рамках задачи идентификации, а общее Л(X) — в рамках задачи классификации.

Сведение задач классификации к решению задач идентификации с использованием выбора простых признаков — эталонов и количества связных образований в сильно слипающихся множествах позволяет сократить вычислительные ресурсы для принятия решений в МЭС.

18.2. К вопросу построения медицинских экспертных систем

При построении компьютерных медицинских экспертных систем (МЭС) различного назначения и уровня сложности возникает первоочередная задача кодирования информации для создания баз данных, баз знаний и машины вывода.

Реализуемость сложных «высокоинтеллектуальных» МЭС при большом числе признаков (симптомов) достигается «линеаризацией» бинарной информации как ретроспективной (обучающей), так и подаваемой на вход МЭС.

Сложность решения проблемы кодирования информации в МЭС вызвана ее специфичностью — огромные объемы, неполнота, размытость, (подчас) противоречивость и некорректность описаний [135, 137, 161, 178, 179]. Разнообразие источников формирования информации в МЭС:

сигнальная, снимаемая в реальном масштабе времени с пациента, для диагностики, мониторинга и прогноза его состояния;

текстовая (смысловая) для описания различных диагнозов, показателей, нормативов, историй болезни, справочников и т.п.

В тоже время для указания конструктивных путей создания МЭС анализ входной информации, в первую очередь, должен дать ответы на следующие вопросы:

1) разрешимость задач распознавания, классификации, идентификации медицинских объектов с учетом разнообразия источников информации;

2) достижимость (реализуемость) медико-технических требований при построении МЭС. Предлагаемый в работе новый методологический подход в кодировании входной информации для МЭС с использованием идей теории нумерации позволяет указать пути решения поставленных вопросов [86].

18.2.1. О кодировании и разрешимости проблем распознавания, классификации и идентификации в МЭС

В стандартной постановке задачи распознавания рассматривается некоторое множество

объектов М, обязательно разбитое на Ь классов М1, М2,..., М^ так, что Мг П М7 = 0 для

г =

Создается конечная обучающая выборка О С М из представителей всех Ь классов М1, М2,..., М^. Используя выборку О, отыскивают решающие правила Д1, Д2,..., -Л;, которые бы позволяли для любого элемента х € М судить о принадлежности его к одному из

классов МЬМ2,...,М4.

В данной работе предлагается элементы основного множества М кодировать (переводить) с помощью редукции ^ : М ^ К в пространство конечных объектов К. При этом, если К\<р(М) = 0, то для всех <^(Мг), г € 1 ^ {1, 2, ..., Ь} возникает проблема классификации для семейства множеств 5 = {^(М1), ..., <^(М^)}, а также проблема разрешимости такой задачи, которая сводится к проверке проблемы распознавания для каждого множества <^(Мг),

г €

Пусть К = N ^ {0, 1, 2, ...}.

Если все <^(Мг), г € 1 — рекурсивны, то проблема классификации для 5 разрешима; в противном случае неразрешима [9].

Пусть Т ^ <^(М), где Т — теория, то есть множество каких-то правильно построенных конструкций (утверждений или конечных объектов).

Отсюда вытекает вопрос о разрешимости предиката Ду (х) :

и, если х Т, и — «истина» , (Щх € К)Лу (х) = [х € Т] = ^ ' т'

[л, если х € К \Т , л — «ложь»,

который интерпретируют как проблему распознавания.

Такая же проблема распознавания формулируется и для каждого класса Мг С М, г € 1 ^ {1, 2, ..., Ь} .

Следует заметить, что если К есть множество натуральных чисел N ^ {0, 1, 2, ...} , то эта проблема в теории алгоритмов известна под названием «проблема вхождения» [119].

В общем случае проблема распознавания для теории Т ( Т С К) сводится к проблеме вычислимости характеристической функции [а € Т] , где (V а € К)

[а € Т] = ( 1, если а € Т;

0 , в противном случае .

Проблема распознавания для теории Т С N разрешима тогда и только тогда, когда Т — рекурсивное множество [36, 119].

Пусть К ^ N Т2 — некоторая априорно взятая теория, для которой доказана разрешимость проблемы распознавания.

Теорема 18.4 [36]. Пусть имеются две теории Т1 и Т2, причем для теории Т2 проблема распознавания разрешима и Т1 ^т Т2 (^т —знак т -сводимости). Тогда проблема распознавания для теории Т1 также разрешима.

Если задано Ь теорий (классов) Т1 = ^ (М1) , ..., Т = ^ (М^), то говорят о проблеме классификации, а именно: существует ли алгоритм, который позволил бы для любого объекта х € М вычислить все характеристические функции [^ (х) € Тг] , г €

Множество классов Тъ Т2, ..., Т обозначим через 5 ^ {Т1, Т2, ..., Т }.

Для МЭС типа 5 ^ {Т1, Т2, ..., Т^} проблема классификации разрешима тогда и только тогда, когда (V А € 5) [ А — рекурсивное множество].

Пусть имеются МЭС: 51 ^ {Тц, Т12, Т^} и 52 ^ {Т21, Т22, Тй2}. Тогда для проблемы классификации МЭС типа 51 и 52 справедлива следующая теорема сравнения.

Теорема 18.5 [83]. Пусть 51 и 52 — два семейства, причем для семейства 52 проблема классификации разрешима. Тогда если (V А € 51) (ЗВ € £2) [А ^т В], то для семейства £1 проблема классификации также разрешима.

Проблему идентификации неизвестной реализации « относительно обучающей выборки О = («1, «2,..., иш) сформулируем так: существует ли алгоритм вычисления характеристической функции равенства [« = «г] , г € 1т ?

Теорема 18.6 [79]. Проблема идентификации и относительно обучающей выборки О разрешима, если разрешима проблема классификации для семейства Б = {{и/1}, {и2},..., |ит}}.

Приведем в 18.2.2 пример решения задачи идентификации в условиях большого числа симптомов (признаков) на входе МЭС.

18.2.2. Предельно быстрое принятие решения в МЭС

Рассмотрим МЭС, на вход которой подается большое количество п симптомов (признаков):

_ , , Г 1, если г -й признак присутствует, г = 1 ,п:

ж = (жь ж2,..., ж«) таких, что ж» = < _

[ 0, в противном случае .

В базу данных такой МЭС вносится обучающая выборка

ж11 ж12 . . ж1п

О= ж21 ж22 . . ж 2«,

жт1 жт2 . . жтга

которая создается из большого числа т кортежей ж» = (Жг1,Жг2, • • •, ж»«) ретроспективной информации, содержащей представителей из Ь классов (синдромов) К,, ] € 1 ^ {1, 2, ..., Ь}, т, Ь € N ^ {0, 1, 2,

Свяжем номера кортежей в обучающей матрице О с номерами классов К,, ] € 1 классифицирующей функцией / : 1т ^ где 1т ^ {1, 2, т} — множество объектов в обучении, 1 ^ {1, 2,... , Ь} — множество классов (синдромов), т, Ь € N ^ {0,1, 2,...} [90].

Подавая на вход МЭС кортеж симптомов ж = (ж1,ж2,... , ж«), необходимо найти его (указать номер г) среди кортежей из О, а также, используя классифицирующую функцию /, указать номер синдрома ] из К, такой, что /(г) = то есть решить задачи идентификации и классификации в МЭС.

Решая задачу «в лоб», следует найти значение характеристической функции [ж = ж»] , где г_ _ -, Г 1, если ж = ж»; ^

ж = ж» = < „ путем полного перебора и покомпонентного сравнения,

0, в противном случае ,

то есть вычислить функцию [ж = ж»] так: [ж = ж»] = & [ж, = ж,] .

Общее решение имеет вид: (ж) = V [ж = ж,] , где А = {г | /(г) = к}, к € 1 —

/еДк

множество номеров эталонных объектов.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Очевидно, что такой комбинаторный подход к решению задач МЭС, при котором предъявление большого количества значений признаков на входе и поэлементное сравнение с ретроспективной информацией в обучающей выборке О потребует огромных вычислительных ресурсов. Последнее обстоятельство оказывается серьезным ограничением при проектировании достаточно сложных «высокоинтеллектуальных» МЭС.

Чтобы снять это ограничение, необходимо найти условия, когда можно решить задачи идентификации и классификации в МЭС, используя предобработку исходных и ретроспективных данных с помощью аппаратных средств в предельно коротком цикле принятия решения. Такую предобработку назовем «линеаризацией».

Цель «линеаризации» — развести «слипающиеся» элементы ж» € {0, 1} путем перевода их из кортежа ж во множество X, которое будет учитывать номер признака с последующим получением эталонов в информативных зонах множеств X» в обучении.

Пусть и = (и1, и2, ..., и«), где и,- = ж, + 2 ■ ^ € 1«; и» = (иЙ, иЙ, ..., и«), и, = ж», + 2 ■ г € 1т, ^ € 1«; X = {иь и2, ..., и„}, X» = {и^, иЙ, ..., и«}.

Обозначим через У/ множества X», г € 1т, а через — информативные зоны мно-

жества X», которые вычисляются следующим образом:

, \ V/если V/= 0 , ^ = ( 1, если V/= 0 , г, ; € 1т ; г | V/, в противном случае; г/ \ 0, в противном случае.

Имеем индексные множества Для каждого множества X и логическую матрицу

Ц^-1| размером т х т. Условия, накладываемые на множества Хг, при которых возможно симультанное (одномоментное) принятие решения при классификации, даются в теореме 18.8 и следствии 18.2.

Базовой теоремой для применения принципа симультанности (учета существенных условий для задачи идентификации в МЭС) является

Теорема 18.7 [73]. Пусть (V г € 1т) [Хг = 0] (V г = ] € 1т) = 1 ^ ^ Яд = 0]. Тогда существует т информативных элементов а^ € таких, что преди-

кат Qi (X) = [ai € X] V [aj € X] & qj

jelm\{i}

тогда, когда X = Xi, X € O.

обращается в «единицу» тогда и только

Теорема 18.8 [79]. Логическая матрица q = У qj||mxm — единична тогда и только тогда, когда (Vi € 1m)[Xi\ |J Xj = 0].

je1m\{i}

Следствие 18.2. Если || qj ||mxm = Emxm, где Emxm — единичная матрица размером m x m, то существует m элементов из Vim+1, i € Im таких, что ац € Vim+1, и Qi(X) обращается в «единицу» тогда и только тогда, когда x = Xi. Здесь Qi(X) =

I 1 , если ai - ui7i , - Xi?i +2 ■ 7*i , . r -I

= < „ J J ^ индекс ji = n7- lai = Uj7-1, U — оператор миними-

[ U , в противном случае, i € Im ,

зации [119].

Симультанность в условиях следствия 18.2 достигается за счет параллельного вычисления информативных элементов логической матрицы q путем сравнения неизвестной реализации X, подвергнутой на входе «линеаризации», по одной компоненте с эталонной компонентой ai €

18.2.3. Синдромально-логическая МЭС

В качестве примера построения МЭС рассмотрим сложную динамическую систему x(t). Путем дискретизации и выбора области интереса получают матрицы с ретроспективной информацией (обучающей выборкой). Снятая информация в области интереса имеет вид матрицы, подаваемой на вход МЭС в качестве неизвестной реализации. Далее оценивают функциональную близость, интерпретируемую в рамках класса игровых решающих правил с использованием минимаксных критериев [18].

Пусть сложная МЭС х(t) описывается п симптомами (параметрами) х= (х\,х2, ■ ■ ■ ,хп), где известен диапазон варьирования параметров Xi : [xi m;n; ЖгтахЬ ( г = 1, п) и шаг квантования Д Xi.

Получим Ui

xi max xi

Д x.

здесь [ ■ ] — целая часть числа. Тогда u =

xi - xi А Xi

Пусть A = | Uij |l „ — неизвестная реализация, описанная n симптомами системы

^ '' j '' ui iriax x n 1

x(t), взятая из области интереса в точках отсчета времени t (t =1, 2, ..., Ui max), то есть МЭС x(t) описывается матрицей A, которая подается на вход распознающей системы, где заранее выбрана обучающая выборка O :

O = {Ai, A2, ..., Am}, Afc = ||ukj ||uimxn, k € Im ^ {1, 2,... , m} из представителей — матриц, взятых из f классов.

Пусть f — классифицирующая функция f : Im ^ где Im ^ {1, 2, ..., m}, ^ {1, 2, ..., s}, связывает номера матриц из обучающей выборки O с номерами классов

из

c(A, Ai) — функционал близости между матрицами Ai и A.

Примем Ti = c(A, Ai), i € Im, T0 = minTi.

i

При этом характеристические функции Дi(A) :

1, если Ti = To, (i € Im),

Д^) = J "m>

U, в противном случае

интерпретируются как частные решения задачи идентификации в МЭС.

Общее решение, имеющее вид Я/(А) = V А^(А), где р = {г | /(г) = j €

соответствует задаче классификации в МЭС.

18.3. Единый методологический подход при алгоритмизации и построении экспертных систем типа «норма—патология» в медицине

Исследуются общие алгоритмические приемы, позволяющие упростить построение экспертных систем типа «норма-патология» для любых компонентов организма, начиная от клеток крови, отдельного органа и включая описание состояния всего организма по системе функциональных параметров (давление, температура, частота сердечных сокращений и т.д.) [84, 85, 86, 135, 178].

Диагностирование в области патологии — это более сложная задача, чем разделение на норму и патологию. В ряде случаев удается решить эти задачи при построении экспертных систем типа «норма-патология» [90].

18.3.1. Таксономия изображений кровяных клеток

Известно, что изображения разных кровяных клеток на специально приготовленном препарате под некоторым увеличением с помощью оптического микроскопа можно отличать друг от друга полностью или частично по цвету.

Изображения кровяных клеток будем обозначать буквами — От, Ь, X Если требуется указать координаты (ж, у), где рассматривается изображение От, то этот факт будем обозначать как Сг (ж, у). В ЭВМ пиксел изображения с координатами (ж, у) представляется тройкой натуральных чисел (Я, Сг, В), где Я —красный цвет, От — зеленый, В —голубой.

Обучим ЭВМ различать п цветов: (Я1,Сг1,В1),..., (Яга,Сгга,Вга) с некоторым допуском на шум е.

Обозначим на изображении От зону интереса М х N. Для каждого г = 1,п, (х,у) € М х N вычислим предикат:

Р (ж, у) = [р(Я», Я) < е] & [р (Сг», Сг) < е] & [р (В», В) < е] ,

где

[ (С- С) < е] = { 1, если Р (С», С) < е; С» € {Я», Сгг, В»} , С € {Я, Сг, В} ; г' ^ I 0, в противном случае.

Таким образом, имеем п бинарных отношений, к которым можно применить таксономию по связным областям и получить описание изображений клеток в машинном виде п -множеств связных образований. (Таксономия — построение связных образований или кластеров.)

Если г — отношение нулевое, то кровяных клеток данного г -го цвета нет. В противном случае отыскиваются связные образования и подсчитываются их мощности (площади). Поставив «гребенку» по площади, можно рассортировать изображения клеток по заполняемости или объему (площадям).

Норма и патология определяются по некоторому порогу с помощью предиката

Р (Сг) = / 1 если < п < ^2;

0, в противном случае,

где От — изображение мазка крови; п — число таксонов; $1,02 - пороги — коридор нормы.

18.3.2. Выявление нормы или патологии на примере отдельного органа

(щитовидной железы)

Пусть задана обучающая выборка О = ||и,||г с бинарными значениями признаков и/ €

€ {0,1}, г еТ71, 3 е Т~п.

Если и/ = 1, то это означает, что j -й признак в г -й строке присутствует.

Пусть задано распределение номеров кортежей обучающей выборки по двум классам К1 и К2 с помощью функции / : 1 — {1,2}, где 1 ^ {1,2, ...,1} обозначим через Вк = {я |/ (я) = к, к = 1, 2 } — множество номеров эталонных объектов.

Признаки и, = (и, ,...,и/п) — независимые. Будем считать, что j -й признак информативен, если

( £ и/\

геДк

Л/ =

|р | V /

• 100% > 50%.

Утверждение 18.1 [18]. Пусть в обучающей выборке О все признаки независимы и информативны. Тогда существует граничный вектор-эталон 1 = (¿1, ¿2,..., 1«), где € {0,1} такой, что имеет место решатель

Я (_) Г 1, если Б > 0; 0 — некоторый порог; 2, в противном случае,

где _ = (ж1,ж2, ...,ж«), ж, € {0,1} — неизвестная реализация, Б — мера близости эталона и реализации:

Б = V Л/ ■ р (,, ж,); р (,, ж,) = { 1 если 1 ж/, j 1"

-1 -1 -1 [0, в противном случае

Приведенный в утверждении 18.1 решатель проверялся на двух классах больных и здоровых людей по 40 признакам онкологических заболеваний на примере щитовидной железы. Хотя была не 100%-я надежность распознавания на обучающей выборке, но этот решатель хорошо зарекомендовал себя на контрольной выборке, дав 90%-е качество распознавания.

18.3.3. Инвариантность нормы в условиях К варьирующихся параметров

Алгоритм основывается на том, что имеется К параметров, варьирующихся в пределах [а», Ь»] с нормой в точке С».

{+1, если ж > С» + е»;

0, если Сг — £г ^ X ^ Сг + £г, Где £г ^ 0, {% = 1, п) ; — 1, если ж < С» — е».

Для текущего значения параметра ж характеристическая функция / дает 3 значения параметра Р :

1) 0 — норма;

2) +1 — отклонение в большую область;

3) —1 — отклонение в меньшую область.

Считается, что система находится в норме, если варьируется до К параметров, а остальные параметры в норме. Возьмем кортеж, и = (0,0,..., 0) состоящий из нормы Р» = 0, (г = 1, гг) , и сравним его с текущим значением системы параметров х = (Р\, Р2, ■■■, Рп) ] Р» € {0, +1, —1} .

Вычислим предикат:

1, если Б ^ где Б = £ Р(и,, ж,), £ = п — К; 0, в противном случае,

ч Г 1, если и, = ж,; Р (и,, ж, ) = 4 п 7 7

0, в противном случае.

Будем говорить, что система находится в норме, если предикат С,) (х) равен 1, в противном случае система находится в патологии.

Таким образом, контроль за сохранением нормы в условиях варьирующихся параметров можно с помощью экспертной системы проводить в условиях, когда параметры не варьируются

(случай К = 0), то есть когда отклонение хотя бы одного параметра приводит к патологии, или при К варьирующихся параметрах из п, (К ^ п), то есть когда варьирование параметров не нарушает нормы.

Рассмотренные три задачи на любой степени подробности описания организма человека позволяют говорить о простоте реализации экспертной системы типа «норма-патология».

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

18.4. Применение спектрально-логического подхода в распознавании патологических состояний сердечно-сосудистой системы

При разработке методики оперативного обследования состояния системы кровообращения с использованием денсограмм важнейшей задачей является выбор методов анализа регистрируемой денсограммы [44].

Как при исследовании динамики денсограммы пациента в течение длительного времени, так и при рассмотрении больших массивов денсограмм возникают две задачи:

1) классификация денсограмм по группам, соответствующим характерным патологическим состояниям сердечно-сосудистой системы;

2) поиск решающего правила, по которому любую вновь полученную денсограмму можно отнести к той или иной классификационной группе.

В такой постановке указанные задачи анализа денсограмм можно интерпретировать как задачи распознавания образов и решать их соответствующими методами [140].

В данной работе излагаются результаты применения спектрально-логического подхода [104] к распознаванию патологических состояний в функционировании системы кровообращения.

Исследуемые денсограммы рассматривались как отображения динамических процессов [155] в гильбертовое пространство Т2[а, Ь], обладающее структурой, необходимой для применения спектрально-логического подхода.

Любая функция /(*) € Т2[а, Ь] представима в виде линейной комбинации базисных функций (*)

те

/(¿) = £ аг Р г (¿).

г=0

В качестве базиса наиболее удобной с точки зрения объема вычислений и простоты реализации на ЦВМ была выбрана полная ортонормальная система функций Уолша г (*)}, где

Жг(*) = (-1)(м), г = 0,1, 2,...,* € [0,1).

Спектр разложения функции /(*) в этом базисе (/(*)} = (ао, а1,..., аг) является изображением распознаваемой функции во входном пространстве распознающей системы. Отображение (/(*)} = (ао, а1,..., ат-1) является входным спектральным отображением, а пространство Е [$т] — входным спектральным пространством с эвклидовой метрикой. Размерность (т) входного пространства определяется при анализе функции на гладкость. При спектрально-логическом подходе к распознаванию образов [104] задача распознавания денсограмм решается в некотором разделяющем подпространстве Е ]г1'г2'"''гк входного пространства Е [5т]. Разделяющее подпространство Е ]г1'г2'"''гк отыскивается перебором

т

всех возможных ^ С^ подпространств входного пространства Е [5т] , причем совокупность г=1

подпространств упорядочивают для сокращения перебора. Перед началом распознавания устанавливается разрешимость процедуры распознавания. Существование распознающей процедуры для системы образов и = {М1,М2} в гильбертовом пространстве ^[0,1) определяется существованием в каком-то подпространстве Е [5т]г1'г2'"''гк гиперплоскости, разделяющей множества М1 и М2.

Из массива исследуемых денсограмм были выделены обучающие выборки (по 30 денсо-грамм в каждой):

1) Я1 = (ж11, Ж21, ..., 1 }; ж^-1 € А, ^ = 1, 2,..., к, где А — множество денсограмм больных атеросклерозом;

2) Я 2 = {ж12, ж2 2, ..., ж^ 2 }; ж, 2 € Н, j = 1, 2,...,к, где Н — множество денсограмм больных гипертонической болезнью;

3) Я з = {ж13, ж2 3, ..., 3 }; ж, 3 € N j = 1, 2, ...,к, где N — множество денсограмм практически здоровых людей.

Денсограммы ж, = /»(Ь), г * € {1, 2, 3} перед обработкой нормировались в целях исключения из рассмотрения постоянной составляющей /с, амплитуды /т и периода Т кривой /(Ь), зависящих от очень многих факторов, в том числе и условий регистрации с помощью преобразования

^ (Ь) =

/ (Т ■ Í + а) — /с

/т,

где а — расстояние от начала координат до систолического участка денсограммы; /,(Ь) — исходная денсограмма; (Ь) — приведенная денсограмма; Ь € [0,1), причем

^ (Ь) € Р2[0,1), тах ^ (Ь) = 1.

Каждая из приведенных денсограмм представлялась совокупностью входных признаков

{Р(»5},

Р(»5 [/(Ь)]= Б$М*)},

где г -й спектральный коэффициент в разложении по Уолшу Б^ {<£>(£)} определялся как

1

Б$М*)} = I ^(Ь) р(Ь)

о

При анализе первых 32 коэффициентов Уолша, представляющих функцию, было обнаружено, что последние 16 коэффициентов пренебрежимо малы, влияют лишь на гладкость функции и практически не изменяют ее форму. Они были отброшены, и в качестве входного спектрального отображения был взят набор

рт = р16 = (р(0) ,р(45),р15).

Сформированное входное пространство Е [р(т)] обладало размерностью т =16. С помощью ЭВМ были вычислены спектры Уолша для всех денсограмм во входном пространстве Е [р(16)] и произведена процедура перебора подпространств.

При анализе результатов расчетов установлено, что ни одно из одномерных пространств Е [р(16)]» , г =0,1,2,..., 15 не является разделяющим.

При переборе двумерных пространств Е [р(16)]г1'»2 было обнаружено, что пространство [ро,р»], где р» = р(г)[/(Ь)], является отделяющим для класса А, а пространство [р1,р7] — отделяющим для класса N.

В этих пространствах для соответствующих классов А, Н и N существует разделяющая гиперплоскость, и параметр, характеризующий расстояние до разделяющей плоскости, в первом случае определяется как

Уа 7 = [/(Ь)] = 33р(0) [/(Ь)] + 36р(45) [/(Ь)] — 22,

А/н

во втором случае как

Уж / = [/(ь)] = 13р(45) [/(ь)] — 46р(51) [/(Ь)] — 7.

Решающее правило, определяющее принадлежность исследуемой денсограммы к одному из классов:

/(Ь) € N = У* ^ 0, (18.1)

/(Ь) € А = Ум < 0&УА ^ 0, (18.2)

/(*) € Н = Ум < 0&УА < 0. (18.3)

Проверка выполнения условий (18.1)-(18.3) для каждой денсограммы позволяет отнести ее к тому или иному классу А, Н и N соответственно.

Следовательно, процедура классификации денсограмм разрешима. Сделаем выводы.

1. Спектрально-логический подход может быть успешно применен к решению многомерных задач распознавания.

2. Распознавание денсограмм в рамках спектрально-логического подхода позволяет выявить наличие и характер патологических изменений в системе кровообращения.

3. Денсограммы человека являются информативными характеристиками динамических процессов, протекающих в его организме, и объективно отражают функциональное состояние сердечно-сосудистой системы.

18.5. Диагностика эпилепсии в интерактивном режиме с использованием компьютерной технологии

Важнейшими задачами невропатологов и психиатров являются прогнозирование заболевания, постановка правильного диагноза и обеспечение оптимальной терапии. В структуре нервно-психических заболеваний эпилепсия занимает одно из центральных мест. Разработка вопросов ранней диагностики, лечения и реабилитации эпилепсии требует коренного пересмотра организации внебольничной психиатрической помощи.

Внедрение в психиатрическую практику «интеллектуальных» возможностей современных компьютеров и компьютерных технологий позволяет строить высокоэффективные диагностические и обучающие программы [94].

Реализация этих задач в отношении эпилепсии несколько облегчается благодаря высокой степени формализации симптоматики в сравнении с другими формами психических заболеваний.

Программная подсистема ЭДИТА, реализующая компьютерную технологию диагностирования эпилепсии, базируется на классификаторе (системе индивидуальных признаков пациента). Последний разработан в соответствии с классификацией эпилепсии, принятой Международной лигой по борьбе с эпилепсией (Киото, 1981 г.), на основании многолетнего клинического опыта диагностирования и лечения эпилепсии в Удмуртии.

Известно, что для каждого пациента характерен конечный набор индивидуальных классификационных признаков, совокупность которых позволяет врачу невропатологу и психиатру достаточно однозначно предсказать одну из возможных форм эпилепсии, в том числе и на этапе ранней диагностики. Компьютерная технология дает возможность уменьшить или даже исключить ошибки диагностирования в массовой врачебной практике, что особенно важно в связи с широким распространением заболевания и тяжелыми его последствиями.

Для ЭВМ «решающим правилом» при диагностировании является не только врачебный опыт (который в массовой практике не всегда достаточен), но и формализованная система весовых коэффициентов, составляющая неотъемлемую часть машинного классификатора.

При этом используется двухступенчатый принцип взвешивания (степень информативности) в целом по разделам классификатора и внутри каждой формы эпилепсии по отдельным признакам. Подобный алгоритм формулируется как «метод голосования» с заданными на основе экспертных оценок весами. Экспертами являлись ведущие специалисты Удмуртии по данному заболеванию.

Тренировка (оценка достоверности весовых коэффициентов) осуществлялась на репрезентативной обучающей выборке (260 больных с известными формами эпилепсии). По результатам машинного эксперимента потребовалась лишь незначительная коррекция весовых коэффициентов, что говорит о их высокой достоверности.

На этапе проверки классификатора и надежности компьютерной диагностики эпилепсии был реализован статистический метод на основе байесовского подхода с использованием той же обучающей выборки [23]. Контрольная независимая выборка для обоих методов была об-

щей и включала 60 больных. Результатом эксперимента стало практически полное совпадение машинного предсказания формы эпилепсии экспертного и статистических методов.

18.6. Статистический анализ медицинской информации по онкологическим заболеваниям

Проблема количественного и качественного анализа данных по онкологическим заболеваниям, стоящим на одном из первых мест по заболеваемости и смертности в ряду всех болезней, имеет большую научную и общественную значимость. В работе [48] описаны методы и приведены результаты, позволяющие на основе статистических данных прогнозировать показатели медицинской статистики на различные периоды, устанавливать факторы, влияющие на показатели заболеваемости, и связи между различными локализациями.

При исследовании статистического материала, связанного с анализом данных и прогнозированием медицинских показателей, возникают проблемы как традиционного математического характера (выбор модели и метода оптимизации внутри модели), так и вызванные необходимостью обработки больших массивов разнородной информации.

Исходными данными послужили следующие материалы:

1) данные официальной статистики по заболеваемости, смертности и контингентам онко-больных, а также данные из медицинских карт, хранящихся в архиве Удмуртского республиканского онкодиспансера с 1946 г. Учитывались место жительства, пол, возраст больных и т.д.;

2) данные о численности населения Удмуртии и ее территориальных единиц. Стандарты населения, используемые в онкостатистике.

Исходные медицинские данные были подвергнуты систематизации и обработке, чтобы для анализа и прогноза можно было использовать следующие показатели: абсолютные, обычные на 100 тыс. населения, стандартизованные показатели на 100 тыс. населения (для различных видов стандартов населения: мирового, европейского и т.д.).

Эти показатели могут рассчитываться разными способами: прямым, косвенным, обратным [171]. В данном случае был использован наиболее надежный прямой способ. Для ряда показателей из-за малого объема выборок применялось усреднение по нескольким годам наблюдений.

Для прогнозирования до 2015 г. показателей заболеваемости, смертности и контингента использовались регрессионные и авторегрессионные модели. Совокупность регрессионных моделей содержала многочлены первой и второй степени, экспоненты, логарифмические параболы, логарифмические кривые. Предусмотрена возможность ввода в модель обобщенных экспонент, кривых Гомперца, логистических кривых. Для расширения возможностей системы использовались также линейные комбинации пар функций /1, /2 :

/ = ^-/1 + ^-/2,

01 + 02 01 + 0 2

где 01, 02 — среднеквадратические отклонения функций /1, /2 соответственно.

Для каждой кривой, кроме того, определялся доверительный интервал среднего значения прогноза и интервал, учитывающий рассеяние вокруг среднего [23, 171].

Наряду с прямым методом прогноза экстраполяцией исходных данных применялся косвенный метод, использующий текущие и прогнозные данные по населению. Здесь прогноз по относительным показателям в расчете на 100 000 населения строится так же, как и в первом методе, а расчет для прогноза абсолютных показателей осуществляется по формуле

^абс(^) Уотн(^) ' ^дд )

где Уабс(г), Уотн(г) —значения абсолютного и относительного показателей за г -й год; N — численность населения за г -й год.

Для реализации этого способа были использованы данные прогноза населения Удмуртии, выполненного фирмой «Прогноз» (Пермский государственный университет). Результаты, полученные прямым и косвенным способами прогнозирования показателей заболеваемости, смертности и контингентов онкобольных, оказались близкими.

Пакет авторегрессионных моделей, рассматривающих исходные данные как временные ряды, содержит 5 линейных моделей авторегрессии с разным числом параметров. Для оптимального выбора моделей использованы критерии наилучшего выбора числа неизвестных параметров. Проведенный сравнительный анализ регрессионных и авторегрессионных моделей показал, что для основной части данных результаты обоих методов оказываются близкими. В то же время существуют определенные трудности при прогнозировании с помощью регрессионных моделей, например при неполноте информации, большой вариативности исходных данных и др. Для этих случаев методы авторегрессионных моделей обладают преимуществами.

Наличие зависимостей между различными локализациями заболеваний изучалось средствами корреляционного анализа. Данные рассматривались как числовые совокупности, распределенные по локализациям, годам и районам. Вычислялись коэффициенты корреляции между численными значениями заболеваемости и смертности, а также ранговые корреляции Спирмена и Кэндела по местам, занимаемым элементами выборки (например, районам).

Значимость найденных коэффициентов проверялась по критерию Стьюдента. Полученные значения коэффициентов корреляции могут использоваться для установления связей по выделенной группе локализаций для различных групп населения.

Для выяснения некоторых закономерностей и общих причин, влияющих на показатели заболеваемости, применялся факторный (дисперсионный) анализ. В качестве факторов рассматривались группировки районов по некоторым критериям (географические, по тенденциям роста заболеваемости, по признаку город-село и т.д.). Проверялось влияние фактора группировки. Если это влияние значительно, то можно рассматривать вопрос об общей причине, порождающей данную группировку, и ее влиянии на заболеваемость по данной локализации. Так, например, проведенный анализ показал, что для локализации «рак молочной железы» существенным фактором (коэффициент влияния на уровне 70%) является признак город-село. Значимость получаемых коэффициентов влияния проверялась по критерию Фишера.

Описанные методы были реализованы в компьютерной информационно-аналитической системе ОНКО, разработанной в НПФ НИОТК (Ижевск) и выполненной на основе IBM PC [169].

18.7. Анализ сигнала ЭКГ в компьютерном мониторном комплексе

Среди многочисленных методов исследования, наблюдения и контроля состояния пациента ведущее место принадлежит электрокардиографии. Необходимость мониторинга во время анестезиологического пособия, реанимации и интенсивной терапии не подлежит сомнению. Электрокардиографический сигнал несет большой объем информации, и детальный автоматический анализ сигнала ЭКГ пациента позволяет своевременно вырабатывать сигналы тревоги, предотвращающие летальный исход [95].

При анализе сигнала ЭКГ в первую очередь необходимо производить фильтрацию помех, выделять на нем кардиоциклы и подсчитывать частоту сердечных сокращений (ЧСС), учитывать артефакты.

Кроме того, в современных мониторных средствах дополнительно заложены некоторые диагностические методики обработки сигнала ЭКГ. В данном мониторном комплексе реализован анализ формы кардиоцикла, с выделением характерных зубцов (P, Q, R, S, T) и анализ вариабельности сердечного ритма, а также расчет необходимых параметров по этим методикам.

Автоматическая обработка сигнала ЭКГ выполняется программным обеспечением на персональном компьютере. Исходный сигнал ЭКГ представлен дискретными отсчетами разрядностью 10 бит с частотой 200 Гц.

Обработка сигнала ЭКГ пациента в мониторе производится в реальном масштабе времени с осуществлением фильтрации сигнала (режекторный фильтр на 50 Гц и ФНЧ с частотой среза 75 Гц), выделением кардиоциклов, генерацией звукового сигнала по каждому кардиоцик-лу. Периодически (каждые 2 секунды) производится анализ вновь пришедшего кардиоцикла, расчет функции корреляции его формы с другими кардиоциклами, расчет частоты сердечных сокращений (ЧСС).

При анализе вариабельности сердечного ритма за 5 минут (ритмография) производится построение кардиоинтервалограммы, гистограммы, скаттерограммы, спектрограммы по длительностям кардиоциклов (КК -интервалам) и с расчетом необходимых параметров по всем полученным графикам.

При анализе формы кардиоцикла (БТ -сегмент) производится отбраковка некачественных кардиоциклов по корреляции их форм друг с другом, построение эталонного кардиоцикла, выделение характерных зубцов, их вершины, начала и конца, расчет всех необходимых параметров.

Все полученные результаты обработки (все построенные графики и рассчитанные параметры) выводятся для медперсонала на экран дисплея, а также записываются на жесткий диск компьютера для последующего анализа.

Разработанные алгоритмы автоматического анализа сигнала ЭКГ программно реализованы в компьютерном мониторном комплексе, прошли необходимые этапы испытаний, отличаются простотой, нетребовательностью к ресурсам компьютера, надежностью и устойчивостью в работе [95].

ХИГ 5 мин

2 ■ с .

в)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Рис. 18.1. Сигнал ЭКГ: а) исходный сигнал ЭКГ; б) форма кардиоцикла; в) кардиоинтервалограмма

Выводы

1. Рассмотрены проблемы разрешимости и вычислимости моделей классификации конечных объектов как первоочередные при конструктивизации.

2. В основу разрешимости проблемы классификации конечных объектов положен тезис Чёрча.

3. Предложенный переход (кодирование) от реальных объектов к натуральным числам позволяет алгоритмически сформулировать критерии разрешимости на моделях с частично рекурсивным основным множеством и сигнатурами многоальтернативных решающих предикатов.

4. Конструктивизация основных понятий моделей классификации выполняется в рамках т -сводимости нумерованных семейств натуральных чисел к произвольному множеству конечных объектов классификации.

5. Доказанные критерии разрешимости на моделях классификации позволяют ответить на вопросы эффективной вычислимости конструктивизируемых объектов с помощью подходящей нумерации.

6. При неразрешимости модели классификации т -сводимость предопределяет критерий регуляризации в смысле эффективной вычислимости для указания путей расширения свойств конструктивизируемых объектов или усиления рекурсивности алгоритмов классификации.

7. Оптимальность выбора конструктивных моделей классификации достигается с учетом дополнительных критериев эффективности вычислений предикатов классификации (компактность, параллелизм, симультанность).

8. Пролонгация языков распознавания образов на языки теории конечных автоматов должна учитывать особенности описаний конечных объектов и требования к синтезу соответствующего распознающего автомата (языки ФАЛ, функции Уолша).

9. Полученные прикладные результаты по классификации наиболее трудных и широко распространенных в природе объектов подтвердили правильность конструктивизации моделей классификации конечных объектов.

Список литературы

1. Айзерман М.А., Гусев Л.А., Розоноэр Л.И., Смирнова И.М., Таль А.А. Логика. Автоматы. Алгоритмы. М.: Физматгиз, 1963. 556 с.

2. Айзерман.М.А., Браверманн Э.М., Розоноэр Л.И. Метод потенциальных функций в теории обучения машин. М.: Наука, 1970. 384 с.

3. Андреев Г.А., Базарский О.В., Глауберман А.С., Колесников А.И., Коржик Ю.В., Хлявич Я.А. Анализ и синтез случайных пространственных текстур // Зарубежная радиоэлектроника. 1984. № 2. С. 3-33.

4. Араманович И. Г., Лунц Г.Л., Эльсгольц Э.Э. Операционное исчисление. М.: Наука, 1968. 416 с.

5. Барабаш Ю.Л., Варский Б.В., Зиновьев В.Т. Автоматическое распознавание образов. Киев: Изд-во КВАИУ, 1963. 173 с.

6. Барабаш Ю.Л., Варский Б.В., Зиновьев В.Т. Вопросы статистической теории распознавания. М.: Сов. радио, 1967. 241 с.

7. Белоусов В.А., Калядин Н.И. Дискретные функции Уолша при произвольном конечном числе точек определения // Автоматические устройства учета и контроля: Межвуз. сб. Ижевск: Изд-во ИМИ, 1975. Вып. 10. С. 59-67.

8. Белоусов В.А., Калядин Н.И. К вопросу о разрешимости некоторых задач распознавания // Автоматические устройства учета и контроля: Межвуз. сб. Ижевск: Изд-во ИМИ, 1976. Вып. 11. С. 94-99.

9. Белоусов В.А., Калядин Н.И. Алгоритмический подход к проблемам распознавания и классификации // Дискретные системы обработки информации: Межвуз. сб. Ижевск: Изд-во ИМИ, 1982. Вып. 4. С. 86-93.

10. Белоусов В.А., Калядин Н.И. Конечные модели и их применение к построению классификатора отношений последовательно-параллельного действия // Дискретные системы обработки информации: Межвуз. сб. Ижевск: Изд-во ИМИ, 1983. Вып. 5. С. 83-88.

11. Белоусов В.А., Калядин Н.И. Конечная модель классификации текстур с порожденными отношениями-образами // Обработка изображений и дистанционные исследования: Тез. докл. Всесоюз. конф. (Новосибирск, 18-20 июня 1984 г.). Новосибирск: Изд-во ИМ СО АН СССР, 1984. Ч. 1. С. 38, 39.

12. Белоусов В.А., Калядин Н.И. Таксономия по связным областям как задача построения признаков для текстурных изображений // Дискретные системы обработки информации: Межвуз. сб. Устинов: Изд-во УМИ, 1986. Вып. 6. С. 4-10.

13. Белоусов В.А., Калядин Н.И. О нумерации клеток карт Вейча // Дискретные системы обработки информации: Межвуз. сб. Ижевск: Изд-во ИМИ, 1987. Вып. 7. С. 51-56.

14. Белоусов В.А., Калядин Н.И. Обобщенная симультанная модель распознавания изображений // Методы и средства обработки сложной графической информации: Тез. докл. III Всесоюз. конф. (Горький, 18-20 сент. 1988 г.). Горький: Изд-во ГГУ, 1988. Ч. 1. С. 34-35.

15. Белоусов В.А., Калядин Н.И. Распознающие автоматы на базе конечных моделей с полными сигнатурами / Ижевский мех. ин-т. Ижевск, 1989. 15 с. Деп. в ВИНИТИ 14.02.89, № 1483-В89.

16. Белоусов В.А., Калядин Н.И. Распознающий алгоритм на базе нелинейного перцептрона // ОИДИ-90: Тез. докл. Междунар. конф. (Новосибирск, 19-21 авг. 1990 г.). Новосибирск: Изд-во ИМ СО АН СССР, 1990. С. 37, 38.

17. Белоусов В.А., Калядин Н.И. Формализованное определение основных операций над изображениями // Системы технического зрения: Межвуз. сб. Ижевск: Изд-во ИМИ, 1991. С. 28-31.

18. Белоусов В.А., Калядин Н.И., Шумилов К.Е. Игровые решающие правила для отношений и распознавания конечных множеств / Ижевский гос. тех. ун-т, НПФ «НИОТК». Ижевск, 1996. 18 с. Деп. в ВИНИТИ 15.01.96, № 333-В96.

19. Бенерджи Р. Теория решения задач. М.: Мир, 1972. 224 с.

20. Бонгард М.М. Проблема узнавания. М.: Наука, 1976. 320 с.

21. Вапник В.Н., Червоненкис А.Я. Теория распознавания образов. М.: Наука, 1974. 400 с.

22. Васильев В.И. Распознающие системы: Справочник. Киев: Наук. думка, 1969. 292 с.

23. Вентцель Е.С. Теория вероятностей. М.: Физматгиз, 1962. 237 с.

24. Воробьев Н.Н. Теория игр. Л.: Изд-во ЛГУ, 1974. 160 с.

25. Ворончихина Т.Л., Калядин Н.И., Култышева Т.Ю. Децимация по времени для случая n -мерного преобразования Фурье // Специализированные и комбинированные вычислительные устройства: Межвуз. сб. Рязань, 1975. Вып. 2. С. 28-31.

26. Гилл А. Введение в теорию конечных автоматов / Пер. с англ. М.: Наука, 1966. 272 с.

27. Глезер В.Д. Механизмы опознания зрительных образов. М.; Л.: Наука, 1966. 204 с.

28. Глушков В.М., Летичевский А.А. Язык для описания алгоритмических структур вычислительных машин и устройств // Теория автоматов: Семинар. Киев, 1966. Вып. 2. С. 14-31.

29. Горбатов В.А. Теория частично упорядоченных систем. М.: Сов. радио, 1976. 336 с.

30. Горелик А.Л. Общая постановка задачи распознавания объектов и явлений. М.: Кибернетика, 1980. № 16. С. 72-75.

31. Гренандер У. Лекции по теории образов: В 3 т. М.: Мир, 1979-1983. Т. 1. 1979. 383 с.; Т. 2. 1981. 446 с.; Т. 3. 1983. 430 с.

32. Дмитриев А.Н., Журавлев Ю.И., Кренделев Ф. П. О математических принципах классификации предметов и явлений // Дискретный анализ. Новосибирск: Изд-во ИМ СО АН СССР, 1966. Вып. 7. С. 3-15.

33. Дуда Р., Харт П. Распознавание образов и анализ сцен. М.: Мир, 1976. 511 с.

34. Ершов Ю.Л. Теория нумераций. Новосибирск: Изд-во НГУ, 1974. Ч. 1. 174 с.

35. Ершов Ю.Л. Теория нумераций. Новосибирск: Изд-во НГУ, 1974. Ч. 3. 140 с.

36. Ершов Ю.Л. Теория нумераций. М.: Наука, 1977. 416 с.

37. Ершов Ю.Л. Проблемы разрешимости и конструктивные модели. М.: Наука, 1980. 416 с.

38. Журавлев Ю.И. Корректные алгебры над множеством некорректных (эвристических) алгоритмов // Кибернетика. Ч. 1, 1977. № 4. С. 5-17; Ч. 2, 1977. № 6. С. 17-24; Ч. 3, 1978. № 2. С. 35-43.

39. Журавлев Ю.И. Об алгебраическом подходе к решению задач распознавания или классификации // Проблемы кибернетики. М.: Наука, 1978. Вып. 33. С. 5-69.

40. Забашта Ю.П., Разин В.М. Функциональный преобразователь Уолша // Известия ТПИ. Томск, 1973. Т. 202. С. 17-27.

41. Загоруйко Н.Г. Методы распознавания и их применение. М.: Сов. радио, 1972. 208 с.

42. Златкис В.М., Калядин Н.И., Леменков В.А., Лосев И.Р., Тихонов Г.А. Об общности языка теории конечных автоматов и теории опознавания образов // Автоматика и опознание образов: Межвуз. сб. Ижевск: Изд-во ИМИ, 1969. Вып. 4. С. 89-97.

43. Златкис В.М., Калядин Н.И., Леменков В.А., Лосев И.Р., Тихонов Г.А. Распознавание образов и конечные автоматы // Автоматика и опознание образов: Межвуз. сб. Ижевск: Изд-во ИМИ, 1969. Вып. 4. С. 83-88.

44. Ипатова Э.Н., Калядин Н.И., Мурынов А.И. Применение спектрального логического подхода в распознавании патологических состояний сердечно-сосудистой системы // Автоматические устройства учета и контроля: Межвуз. сб. Ижевск: Изд-во ИМИ, 1974. Вып. 9. С. 141-145.

45. Ицков А.Г., Калядин Н.И. О продолжении некоторых сюръективных отображений // Топология и теория множеств: Сб. науч. тр. Ижевск: Изд-во УдГУ, 1982. С. 100-103.

46. Ицков А.Г., Калядин Н.И. Классификация бинарных изображений по методу тестов // Обработка изображений и дистанционные исследования: Тез. докл. Всесоюз. конф. (Новосибирск, 18-20 июня 1984 г.). Новосибирск: Изд-во ИМ СО АН СССР, 1984. Ч. 1. С. 40-41.

47. Ицков А.Г., Калядин Н.И. О полноте алгебраического замыкания пространства распознающих операторов с тестовыми опорными множествами // Журн. вычислит. математики и мат. физики. М.: Изд-во АН СССР, 1984. Т. 24, № 4. С. 579-586.

48. Ицков А.Г., Калядин Н.И., Ходырева М.Д., Шумилов К.Е. Статистический анализ медицинской информации по онкологическим заболеваниям // Медицинская техника. М.: Медицина, 1996. № 2. С. 38-40.

49. Калядин Н.И. Организация памяти перцептрона при распознавании абстрактных отношений типа ФАЛ из класса Р2 // Автоматические устройства учета и контроля: Межвуз. сб. Ижевск: Изд-во ИМИ, 1968. Вып. 3. С. 61-71.

50. Калядин Н.И. Некоторые вычислительные аспекты в задачах распознавания булевых функций // Машинные методы обнаружения закономерностей: Материалы Всесоюз. симпозиума (Новосибирск, 5-7 апреля 1976 г.). Новосибирск: Изд-во ИМ СО АН СССР, 1976. С. 128-138.

51. Калядин Н.И. Интерпретация фотоизображений микроструктур в виде СД-полей // Проблемы автоматизации анализа изображений микроструктур: Тез. докл. VI совещания (Пу-щино, 17-18 июня 1984 г.). Пущино: Изд-во ИБФ АН СССР, 1984. С. 17.

52. Калядин Н.И. Обзор методов и технических средств сбора и обработки информации об изображениях текстур // Проблемы автоматизации анализа изображений микроструктур: Тез. докл. VI совещания (Пущино, 17-18 июня 1984 г.). Пущино: Изд-во ИБФ АН СССР, 1984. С. 14.

53. Калядин Н.И. О соотношении интуитивного и формального в задачах принятия решений // Логическое управление в промышленности: Материалы VII симпозиума (Ижевск, 13-15 июня 1984 г.). Ижевск: Изд-во ИМИ, 1984. С. 67, 68.

54. Калядин Н.И. Алгоритмические и технические аспекты при автоматическом анализе текстурных изображений // Возможности исследования природных ресурсов дистанционными методами: Межвуз. сб. Л.: Изд-во ЛГУ, 1986. С. 55-61.

55. Калядин Н.И. Использование понятий размытости в задачах классификации // Логическое управление с использованием ЭВМ: Тез. докл. Х Всесоюз. симпозиума (Москва-Устинов, октябрь 1987г.). Люберцы: Изд-во ВИНИТИ, 1987. С. 77, 78.

56. Калядин Н.И. Автоматизация обработки фотоинформации // Космическая антропоэколо-гия: техника и методы исследования: Материалы 2-го Всесоюз. совещания по космической антропоэкологии (Ленинград, 2-6 июля 1984 г.). Л.: Изд-во ЛГУ, 1988. С. 315-322.

57. Калядин Н.И. Алгоритмизация в анализе текстурных фотоизображений // Дискретные системы обработки: Межвуз. сб. Ижевск: Изд-во ИМИ, 1988. Вып. 8. С. 4-8.

58. Калядин Н.И. Машинный анализ текстур // Применение микропроцессоров и микро-ЭВМ в радиоэлектронной аппаратуре: Тез. докл. науч.-техн. семинара (Ижевск, 20-21 ноября 1988 г.). Ижевск: Изд-во ИМИ, 1988. С. 45, 46.

59. Калядин Н.И. Спектрально-логическое представление изображений // Методы и средства обработки сложной графической информации: Тез. докл. III Всесоюз. конф. (Горький, 18-20 сент. 1988 г.). Горький: Изд-во ГГУ, 1988. Ч. 1. С. 120, 121.

60. Калядин Н.И. К задаче представления при распознавании изображений // Математические методы распознавания образов: Тез. докл. IV Всесоюз. конф. (Рига 24-26 окт. 1989 г.). Рига: Изд-во РПИ, 1989. Ч. 3. С. 45-47.

61. Калядин Н.И. Разрешимость на моделях классификации // Проблемы создания систем обработки, анализа и распознавания изображений: Тез. докл. II Респ. семинара (Ташкент, 6-8 июня 1989 г.). Ташкент: Изд-во ТПИ, 1989. Ч. 2. С. 115-116.

62. Калядин Н.И. Автоматизация анализа малоразмерных малоконтрастных текстурных фотоизображений // Труды IX науч. чтений по космонавтике. (Москва, 29-31 января, 1985 г.). М.: Изд-во ИИЭТ АН СССР, 1998. С. 138-142.

63. Калядин Н.И. Конструктивизация классифицируемых множеств // Вестн. ПГТУ. Прикладная математика и механика. Пермь: Изд-во ПГТУ, 2006. № 1. С. 8-15.

64. Калядин Н.И. Основы теории алгоритмов и нумераций: Учеб. пособие для студентов по спец. 230401. Ижевск: Изд-во ИжГТУ, 2006. 68 с.

65. Калядин Н.И. Нумерации в проблеме классификации // Вестн. ПГТУ. Математика и прикладная математика. Пермь: Изд-во ПГТУ, 2007. С. 51-55.

66. Калядин Н.И., Белоусов В.А. О некоторых классах разбиений конечных множеств // Автоматические устройства учета и контроля: Межвуз. сб. Ижевск: Изд-во ИМИ, 1976. Вып. 11. С. 84-94.

67. Калядин Н.И., Белоусов В.А. Конструктивные модели классификации / Удм. ун-т. Ижевск, 1983. 17 с. Деп. в ВИНИТИ 21.02.83, № 1142-83.

68. Калядин Н.И., Белоусов В.А. Нумерованные совокупности конечных объектов и проблема классификации / Удм. ун-т. Ижевск, 1983. 13 с. Деп. в ВИНИТИ 04.03.83, № 1287-83.

69. Калядин Н.И., Белоусов В.А., Липовецкий Ю.М. Классификация текстур методом коллективного голосования // Методы и средства обработки сложноструктурированной, семантически насыщенной графической информации: Тез. докл. I Всесоюз. конф. (Горький, сент., 1983 г.). Горький: Изд-во ГГУ, 1983. С. 145, 146.

70. Калядин Н.И., Белоусов В.А. Некоторые модели принятия решений, работающие в условиях неопределённости / Удм. ун-т. Устинов, 1985. 20 с. Деп. в ВИНИТИ 20.06.85, № 4693-85.

71. Калядин Н.И., Белоусов В.А. Минимизация предикатных форм в конечных моделях / Удм. ун-т. Устинов, 1985. 19 с. Деп. в ВИНИТИ 29.03.85, № 2381-85.

72. Калядин Н.И., Белоусов В.А. Об одной модели классификации текстур на основе метода голосования с отношениями толерантности // Методы и средства обработки сложной графической информации: Тез. докл. II Всесоюз. конф. (Горький, сент. 1985 г.). Горький: Изд-во ГГУ, 1985. С. 14.

73. Калядин Н.И., Белоусов В.А. Теоремы существования и единственности в системах принятия решений / Устиновский мех. ин-т. Устинов, 1987. 17 с. Деп. в ВИНИТИ 6.05.87, № 3462-В87.

74. Калядин Н.И., Белоусов В.А. Представление точечных изображений предикатами Радема-хера // Дискретные системы обработки информации: Межвуз. сб. Ижевск: Изд-во ИМИ, 1989. Вып. 9. С. 3-12.

75. Калядин Н.И., Белоусов В.А. Распознающий автомат перцептронного типа // Математические методы распознавания образов: Тез. докл. IV Всесоюз. конф. (Рига, 24-26 окт. 1989 г.) Рига: Изд-во РПИ, 1989. Ч. II. С. 17-19.

76. Калядин Н.И., Белоусов В.А. Относительная полнота в конечных моделях // Дискретные системы обработки информации: Межвуз. сб. Ижевск: Изд-во ИМИ, 1990. Вып. 10. С. 5-12.

77. Калядин Н.И., Белоусов В.А., Ходырева М.Д. Связь адамаровского упорядочивания функций Уолша с секвентным и диадным / Ижевский мех. ин-т. Ижевск, 1990. 31 с. Деп. в ВИНИТИ 16.05.90, № 3559-В90.

78. Калядин Н.И., Белоусов В.А. Оптимизация игровых решающих правил на базе теории моделей / Ижевский тех. ун-т, НПФ «НИОТК». Ижевск, 1995. 18 с. Деп. в ВИНИТИ 15.01.96, № 1440-В95.

79. Калядин Н.И., Белоусов В.А. О задаче классификации множеств по классам эквивалентности / Ижевский тех. ун-т, НПФ «НИОТК». Ижевск, 1995. 48 с. Деп. в ВИНИТИ 15.11.94, № 356-В95.

80. Калядин Н.И., Белоусов В.А. Теория предикатов Радемахера и их применения // Ижевский тех. ун-т, НПФ «НИОТК». Ижевск, 1996. 18 с. Деп. в ВИНИТИ 15.06.95, № 45-В96.

81. Калядин Н.И., Белоусов В.А. Условия существования обобщенной симультанной модели распознавания изображений // Дискретные системы обработки информации: Межвуз. сб. Ижевск: Изд-во ИжГТУ, 1996. Вып. 11. С. 20-25.

82. Калядин Н.И., Белоусов В.А. О задаче классификации множеств натуральных чисел // Распознавание образов и анализ изображений: новые информационные технологии: Тез. докл. III конф. РОАИ (Н. Новгород, 1-7 декабря 1997 г.). Н.Новгород: Изд-во НИИ ПМК, 1997. Ч. I. С. 94-97.

83. Калядин Н.И., Белоусов В.А. Проблемы распознавания и классификации для семейств подмножеств натуральных чисел // Распознавание образов и анализ изображений: новые информационные технологии: Тез. докл. III конф. РОАИ (Н. Новгород, 1-7 декабря 1997 г.). Н.Новгород: Изд-во НИИ ПМК, 1997. Ч. I. С. 8-10.

84. Калядин Н.И., Белоусов В.А. Синдромально-логическая экспертная система // Методы и средства обработки сложной графической информации: Тез. докл. VI Всерос. с участием стран СНГ конф. (Н. Новгород, 25-27 сентября 2001 г.). Н. Новгород: Изд-во ННГУ, 2001. С. 13, 14.

85. Калядин Н.И., Белоусов В.А. Алгебро-логические алгоритмы в распознавании, идентификации и классификации медицинских объектов // Вестн. ПГТУ. Математика и прикладная математика. Пермь: Изд-во ПГТУ, 2005. С. 61-66.

86. Калядин Н.И., Белоусов В.А. К вопросу построения медицинских экспертных систем // Вестн. ПГТУ. Прикладная математика и механика. Пермь: Изд-во ПГТУ, 2005. № 1. С. 113119.

87. Калядин Н.И., Белоусов В.А. К вопросу существования симультанной модели классификации объектов // Вестн. УдГУ. Математика. Ижевск: Изд-во УдГУ, 2006. № 1. С. 151-160.

88. Калядин Н.И., Белоусов В.А. Об одном существенном условии в распознавании конечных множеств // Изв. ин-та математики и информатики УдГУ. Ижевск, 2006. Вып. 2(36). С. 113-116.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

89. Калядин Н.И., Белоусов В.А., Бурков С.А. Нелинейный персептрон для распознавания цифровой информации // Дискретные системы обработки информации: Межвуз. сб. Ижевск: Изд-во ИжГТУ, 1996. Вып. 11. С. 5-12.

90. Калядин Н.И., Белоусов В.А., Филатова С.В. Единый методологический подход при алгоритмизации и построении экспертных систем типа «норма-патология» в медицине // Медицинская техника. М.: Медицина, 1996. № 3. С. 6-7.

91. Калядин Н.И., Кацман В.Е. Планирование эксперимента при оптимизации некоторых этапов автоматизированного проектирования печатных плат // Планирование и автоматизация эксперимента в научных исследованиях «Математическая теория эксперимента»: Тез. докл. V Всесоюз. конф. (Москва, 10-12 декабря 1976 г.). М.: Изд-во МЭИ, 1976. С. 157-160.

92. Калядин Н.И., Кацман В.Е. О минимальном разбиении растрового изображения на прямоугольные элементы // Автоматические устройства учета и контроля: Межвуз. сб. Ижевск: Изд-во ИМИ, 1977. Вып. 12. С. 23-28.

93. Калядин Н.И., Кацман В.Е. Эвристический алгоритм трассировки многоконтактных цепей на печатной плате // Автоматические устройства учета и контроля: Межвуз. сб. Ижевск: Изд-во ИМИ, 1978. Вып. 13. С. 89-91.

94. Калядин Н.И., Лекомцев В.Т., Сунцов А.А., Шейнин А.Н., Куликова Н.П. Диагностика эпилепсии в интерактивном режиме с использованием компьютерной технологии // Медицинская техника. М.: Медицина, 1996. № 3. С. 40-42.

95. Калядин Н.И., Леменков В.А., Коробейников А.В. Автоматический анализ сигнала ЭКГ в компьютерном мониторном комплексе // Методы и средства обработки сложной графической информации: Тез. докл. VI Всерос. с участием стран СНГ конф. (Н. Новгород, 25-27 сентября 2001 г.). Н. Новгород: Изд-во ННГУ, 2001. С. 98-100.

96. Калядин Н.И., Леменков В.А., Кучуганов В.Н., Моченов С.В. О структурной связности признаков // Автоматика и опознание образов: Межвуз. сб. Ижевск: Изд-во ИМИ, 1969. Вып. 4. С. 11-23.

97. Калядин Н.И., Леменков В.А., Липовецкий Ю.Л., Липовецкий Ю.М., Паклина Н.В., Смо-ляков Б.С. Комплекс автоматизированного дешифрования крупномасштабных космических фотоснимков // Геодезия и картография. М., 1991. № 8. С. 18-23.

98. Калядин Н.И., Леменков В.А., Лосев И.Р., Пилина М.В., Чалый П.И. Компьютеризация медицинских технологий // Медицинская техника. М.: Медицина, 1996. № 2. С. 21-24.

99. Калядин Н.И., Леменков В.А., Рассказов Ю.П., Тихонов Г.А. Построение полного спектра структурных связей между признаками // Автоматика и опознание образов: Межвуз. сб. Ижевск: Изд-во ИМИ, 1969. Вып. 4. С. 61-75.

100. Калядин Н.И., Липовецкий Ю.М. Теоретико-игровой подход к классификации текстурных изображений // Тр. IX науч. чтений по космонавтике. (Москва, 29-31 января, 1985 г.). М.: Изд-во ИИЭТ АН СССР, 1998. С. 143-150.

101. Калядин Н.И., Милич В.Н., Мурынов А.И. Математическое обеспечение для анализа двумерных случайных полей // Перспективные методы планирования и анализа экспериментов при исследовании случайных полей и процессов: Тез. докл. Всесоюз. конф. (Москва, 1-3 нояб. 1982 г.). М.: Изд-во МЭИ, 1982. Ч. 2. С. 11, 12.

102. Калядин Н.И., Милич В.Н., Мурынов А.И. Интерактивная оптимизация принятия решений при классификации текстур // Автоматизация в тематической картографии: Тез. докл. VIII Всесоюз. конф. по тематическому картографированию (Москва, 23-25 янв. 1984г.). М.: Изд-во МГУ, 1984. С. 81.

103. Калядин Н.И., Мурынов А.И. О спектрально-логическом подходе к опознаванию изображений // Проблемы автоматизации анализа изображения микроструктур: Тез. докл. IV Всесоюз. совещания (Пущино, 6-8 июня 1974 г.). Пущино: Изд-во ИБФ АН СССР, 1974. С. 39, 40.

104. Калядин Н.И., Мурынов А.И. Спектрально-логический подход в задачах распознавания образов // Автоматические устройства учета и контроля: Межвуз. сб. Ижевск: Изд-во ИМИ, 1974. Вып. 9. С. 146-150.

105. Калядин Н.И., Мурынов А.И. Об эффективности различных подходов в распознавании образов // Автоматические устройства учета и контроля: Межвуз. сб. Ижевск: Изд-во ИМИ, 1977. Вып. 12. С. 3-5.

106. Калядин Н.И., Мурынов А.И. Об одном методе распознавания текстурных изображений // Дискретные системы обработки информации: Межвуз. сб. Ижевск: Изд-во ИМИ, 1979. Вып. 2. С. 3-6.

107. Калядин Н.И., Наймушина А.Г. Алгоритм быстрого двумерного преобразования Уолша-Адамара // Автоматические устройства учета и контроля: Межвуз. сб. Ижевск: Изд-во ИМИ, 1975. Вып. 10. С. 74-77.

108. Калядин Н.И., Оленчикова Т.Ю. Аналитический метод расчета Т- и Х-спектров // Автоматические устройства учета и контроля: Межвуз. сб. Ижевск: Изд-во ИМИ, 1974. Вып. 9. С. 111-114.

109. Катленд Н. Вычислимость. Введение в теорию рекурсивных функций / Пер. с англ. М.: Мир, 1983. 256 с.

110. Ковалевский В.А. Методы оптимальных решений в распознавании изображений. М.: Наука, 1976. 328 с.

111. Кокрен В.Т., Кули Дж.В. Что такое быстрое преобразование Фурье? // ТИИЭР. 1967. Т. 55, № 10. С. 7-17.

112. Колмогоров А.Н., Фомин С.В. Элементы теории функции и функционального анализа. М.: Наука, 1968. 496 с.

113. Кондратьев А.И. Теоретико-игровые распознающие алгоритмы. М.: Наука, 1990. 272 с.

114. Кулинкович А.Е., Ющенко Е.Л. О базовом алгоритмическом языке // Кибернетика. Киев, 1965. № 2.

115. Кушнер Б.А. Лекции по конструктивному математическому анализу. М.: Наука, 1973. 448 с.

116. Летичевский А.А. Синтаксис и семантика формальных языков // Кибернетика. Киев, 1968. № 4. С. 17-25.

117. Логинов В.П. Функции Уолша и области их применения (обзор) // Зарубежная электроника. 1973. № 4. С. 73-95.

118. Макаров И.М., Виноградская Т.М., Рубчинская А.А., Соколов В.Б. Теория выбора и принятия решений. М.: Наука, 1982. 327 с.

119. Мальцев А.И. Алгоритмы и рекурсивные функции. М.: Наука, 1965. 391 с.

120. Мальцев А.И. Алгебраические системы. М.: Наука, 1970. 392 с.

121. Мамиконов А.Г. Принятие решений и информация. М.: Наука, 1983. 182 с.

122. Мендельсон Э. Введение в математическую логику / Пер. с англ. М.: Наука, 1976. 320 с.

123. Миленький А.В. Классификация сигналов в условиях неопределенности. М.: Сов. радио, 1975. 328 с.

124. Милич В.Н. К задаче выбора эффективных признаков текстурных изображений // Дискретные системы обработки информации: Межвуз. сб. Ижевск: Изд-во ИМИ, 1982. Вып. 4. С. 71-78.

125. Милич В.Н., Мурынов А.И. Дифференциальная форма представления эталонов при распознавании текстурных изображений // Дискретные системы обработки информации: Межвуз. сб. Ижевск: Изд-во ИМИ, 1983. Вып. 5. С. 64-68.

126. Минский М. На пути к созданию искусственного разума. Вычислительные машины и мышление / Пер. с англ. М.: Мир, 1967. 417 с.

127. Минский М., Пейперт С. Персептроны. М.: Мир, 1971. 261 с.

128. Мучник И.Б., Паморозский Е.И., Эльман Р.И. Автоматизированная обработка полутоновых изображений (обзор состояния проблемы) // Автоматика и телемеханика. 1980. № 2.

129. Новиков П.С. Элементы математической логики: М.: Наука, 1973. 400 с.

130. Оуэн Г. Теория игр. М.: Мир, 1971. 231 с.

131. Параллельная обработка информации: В 2 т. / Под ред. А.Н. Свенсона. Киев: Наук. думка, 1985. Т. 2. 279 с.

132. Патрик Э. Основы теории распознавания образов. М.: Наука, 1980. 365 с.

133. Поляк Б.Т., Шрейдер Ю.А. Применение полиномов Уолша в приближенных вычислениях // Вопросы теории математических машин. М.: Физматгиз, 1962. С. 174-191.

134. Полякова М.П., Вайнцвайг М.Н. Об использовании метода «голосования» признаков в алгоритмах распознавания // Моделирование обучения и поведения. М.: Наука, 1975. С. 2529.

135. Попов Э.В. Экспертные системы: Решение неформализованных задач в диалоге с ЭВМ. М.: Наука, 1987. 288 с.

136. Поспелов Д.А. Логические методы анализа и синтеза схем. М.:Энергия, 1964. 320 с.

137. Построение экспертных систем / Под ред. Ф. Хейса-Рота, Д. Уотермена, Д. Лената. М.: Мир, 1987. 441 с.

138. Пратт У., Кейн Д., Эндрюс Х. Кодирование изображений посредством преобразования Адамара // ТИИЭР. 1969. Т. 57, № 1. С. 66-83.

139. Прэтт У. Цифровая обработка изображений. М., 1982. Кн. 1. 384 с.

140. Распознавание образов и медицинская диагностика / Под ред. Ю.И. Неймарка. М.: Наука, 1972. 382 с.

141. Рвачев В.Л. Геометрические приложения алгебры логики. Киев: Техника, 1967. 212 с.

142. Роджерс Х. Теория рекурсивных функций и эффективная вычислимость / Пер. с англ. М.: Мир, 1972. 624 с.

143. Розенблатт Ф. Принципы нейродинамики (перцептроны и теория механизмов мозга) / Пер. с англ. М.: Мир, 1965. 517 с.

144. Розенфельд А. Распознавание и обработка изображений с помощью вычислительных машин. М.: Мир, 1972. 243 с.

145. Рот Д.П. Прагматическая теория алгоритмов // Синтез релейных структур. М.: Наука, 1965. С. 68-87.

146. Рудин У. Основы математического анализа. М.: Мир, 1976. 319 с.

147. Самохвалов К.Ф. Об аксиоматическом представлении эмпирических теорий // Эмпирическое предсказание в распознаваемых образах. Вычислительные системы. Новосибирск: Изд-во ИМ СО АН СССР, 1978. Вып. 76. С. 15-25.

148. Ситников О.П. Представление сигналов разложениями в неаналитических базисах и анализаторы обобщенных спектров // Теория автоматического управления. Киев, 1969. Вып. 3. С. 17-38.

149. Слупецкий Е., Борковский Л. Элементы математической логики и теория множеств / Пер. с польск. М.: Прогресс, 1965. 368 с.

150. Соболь И.М. Многомерные квадратурные формулы и функции Хаара. М.: Наука, 1969. 288 с.

151. Сороко Л.М., Стриж Т.А. Спектральные преобразования на цифровых вычислительных машинах // Сообщение ОИЯИ. Р.10-6702. Дубна, 1972. С. 20-26.

152. Статические свойства микроструктур // Тез. докл. 1-й Всесоюз. конф. М., 1978. 423 с.

153. Торопов Н.Р. Синтез оптимальных алгоритмов распознавания булевых функций // Проблемы синтеза цифровых автоматов. М.: Наука, 1967. С. 119-127.

154. Трахтенброт Б.А. Сложность алгоритмов и вычислений. Новосибирск: Изд-во НГУ, 1967. 167 с.

155. Трахтман А.М. Введение в обобщенную спектральную теорию сигналов. М.: Сов. радио, 1972. 237 с.

156. Трахтман А.М., Трахтман В.А. Основы теории дискретных сигналов на конечных интервалах. М.: Сов. радио, 1975. 276 с.

157. Турбович И.Т. О классификации задач и методов опознания образов // Опознание образов. М.: Наука, 1968. С. 7-11.

158. Турбович И.Т. О применении детерминированных методов принятия решений при опознании частично пересекающихся образов // Опознание образов. М.: Наука, 1968. С. 216-219.

159. Турбович И.Т., Книппер А.В., Юрков Е.Ф. Схема опознания образов, использующая как детерминированные методы (метод эталонов), так и статические свойства выборки // Опознание образов. М.: Наука, 1968. С. 11-17.

160. Турбович И.Т., Гитис В.Г., Маслов В.К. Опознание образов (детерминированно-статистический подход) М.: Наука, 1971. 246 с.

161. Уотермен Д. Руководство по экспертным системам. М.: Мир, 1985. 388 с.

162. Успенский В.А. Лекции о вычислимых функциях. М.: Физматгиз, 1960. 492 с.

163. Файн В.С. Опознавание изображений (непрерывно-групповая теория). М.: Наука, 1967. 296 с.

164. Фон Нейман Дж., Моргенштерн О. Теория игр и экономическое поведение. М.: Наука, 1970. 708 с.

165. Фу К. Структурные методы в распознавании образов. М.: Наука, 1977. 319 с.

166. Фукунага К. Введение в статистическую теорию распознавания образов. М.: Наука, 1979. 368 с.

167. Харалик Р. М. Статистический и структурный подходы к описанию текстур // ТИИЭР. 1979. Т. 67, № 5. С. 98-121.

168. Харкевич А. А. Спектры и анализ. М.: ТТЛ, 1957. 194 с.

169. Ходырева М. Д., Ицков А. Г., Шумилов К. Е. Программная система «Статистика» // Дискретные системы обработки информации: Межвуз. сб. Ижевск: Изд-во ИжГТУ, 1996. Вып. 11. С. 68-70.

170. Хо-Ю-Изи, Агравала А. Об алгоритмах классификации образов. Введение и обзор // ТИИЭР. 1978. Т. 66, № 12. С. 46-93.

171. Четверкин Е. М. Статистические модели прогнозирования. М.: Статистика, 1977. 200 с.

172. Шейнин Р.Л. Автоматический анализ текстурных изображений: Дис. ... канд. техн. наук. М., 1975.

173. Шенфилд Дж. Степени неразрешимости. М.: Наука, 1977. 192 с.

174. Шрейдер Ю.А. Математическая модель классификации // НТИ. 1968. Сер. 2, № 10. С. 714.

175. Шрейдер Ю.А. Равенство, сходство, порядок. М.: Наука, 1971. 255 с.

176. Щедрин Н.И., Кархов А.Н. Экономико-математические методы в торговле. М.: Экономика, 1980. 173 с.

177. Эдельман С.Л. Математическая логика. М.: Высш. шк., 1975. 176 с.

178. Экспертные системы в медицине // HARD и SOFT. М., 1995. № 7. С. 63-67.

179. Экспертные системы: Принципы работы и примеры / Под ред. Р.Форсайта. М.: Радио и связь, 1987. 224 с.

180. Яблонский С.В. Введение в дискретную математику. М.: Наука, 1979. 272 с.

181. Яблонский С.В. Функциональные построения в k -значной логике // Тр. мат. ин-та им. В.А. Стеклова. М.: Изд-во АН СССР, 1958. Т. 51. С. 5-142.

182. Яблонский С.В., Гаврилов Г.П., Кудрявцев В.Б. Функции алгебры логики и классы Поста. М.: Наука, 1966. 119 с.

183. Andreus H.C. Computer Processing of Natural Images. Conf. Rec. Eng. Conserv. Menhing IEEE heg. 6 Sacramento, Calif. 1971. N.Y. 1971 2C1/1-2c1/6.

184. Andreus H.C. Multi-demensional Notations in Feature Selection. IEEE Conference Record of the Symposium of Feature Extraction and Selection in Pattern Recognition (10-18) October. 1970.

185. Andreus H.C. Walsh Functions in Image Processing, Feature Selection and Pattern Recognition. University of Southern California/ Los Angeles. Calif. 1971.

186. Clockin W.F., Mellish C.S. Programming in Prolog. Berlin-Hidelberg-New York: Springer Verlag, 1981. 327 p.

187. Feferman S. Systems of presicative analysis //J. Symbolic Log. 29, № 1, 1964. P. 1-30.

188. Gusev V., Ghuzharova N. The Algoritms of Recognition of the Functional Sites in Genetic Texts // Proc. of the Workshop on Algoritmic Learning Theory, Japan, Tokio, 1990. P. 109119.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

189. Hart P.E., Nillson N.J., and Raphael B.A. A Formal Basis for the Heuristic Determination of Minimum Cost Paths. IEEE Transactions on System Cybernetics, 1968. Vol. SSC-4, July.

190. Hartmanis J., Hopcroft J.E. An Overviev of the Theory of Computational Complexity //J. Assoc. Computing Machinery 18, 1971. P. 444-475.

191. Knight K. Unification: A Multidiscriplinary Survey // ACM Computer Survey, 1989. Vol. 21, № 1. P. 93-124.

192. Lee C.Y. An Algorithm for Path Connections and its Applications. IEEE Transactions on Computers, 1961. Vol. EC-10, Sept.

193. Martelli A., Mpntanary V. An Efficient Unification Algorithm // ACM Trans. Program. Lang. Syst. 1982. Vol. 4. P. 258-282.

194. Michael L. Fredman and Dan E. Willard. Trans-dichotomous Algorithms for Minimum Spanning Trees and Shortest Paths // Journal of Computer and System Sciences. Vol. 48(3). 1994. P. 533-551.

195. Pau L.F. Game Teoretical Pattern Recognition. Aplicatoin to Imperfect Noncooperativ Learning and to Multiclass Classification. IEEE Transactions on Pattern Analysis and Machine Intelligence. Vol. PAMI-6, № 1, 1984.

196. Paul W. Purdom, Jr., and Cynthia A. Brown. The Analysis of Algorithms. Holt, Rinehart and Wiston, 1985. 213 p.

197. Rubin F. The Lee Path Connection Algorithm. IEEE Transactions on Computers. 1974. Vol. 23, № 9.

198. Samochwalov K. The Impossibility Theorem for Universal Theory of Prediction // Reports of Formal Methodology of Empirical Sciences, PAN, Wroclaw, 1974. 19 p.

199. Walther C.A. A Classification of Many-Sorted Unification Problems // LNCS. 1986. № 230. P. 525-537.

Калядин Николай Иванович Ижевский государственный технический университет, Россия, Ижевск e-mail: [email protected]

Известия Института математики и информатики. Ижевск. 2007. №1(38)

Реферат

УДК 519.712:510.25:510.67

Конструктивизация моделей классификации конечных объектов / Калядин Н.И. // Известия института математики и информатики УдГУ. Ижевск, 2007. Вып. 1(38). С. 3-231.

Рассмотрены проблемы разрешимости и вычислимости в конструктивизации моделей классификации конечных объектов. Сформулированные критерии разрешимости позволяет создать эффективные алгоритмы для решения традиционно трудных реальных задач классификации.

Библиогр. 199.

i Надоели баннеры? Вы всегда можете отключить рекламу.