Научная статья на тему 'Многоуровневые описания классов для уменьшения числа шагов решения задач распознавания образов, описываемых пропозициональными формулами'

Многоуровневые описания классов для уменьшения числа шагов решения задач распознавания образов, описываемых пропозициональными формулами Текст научной статьи по специальности «Математика»

CC BY
144
54
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по математике, автор научной работы — Косовская Т. М.

Представлено многоуровневое описание классов, которое позволяет свести решение задач распознавания к последовательному решению однотипных задач меньшей размерности. Доказаны условия, при которых использование многоуровневого описания классов при использовании признаков, глобально характеризующих распознаваемые объекты, уменьшает число шагов работы алгоритмов, решающих рассматриваемые задачи распознавания образов. Рассмотрен модельный пример применения полученных условий к формированию многоуровневого описания классов.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Level descriptions of classes for decreasing of step number of solving of a pattern recognition problem described by propositional formulas

In the frameworks of logic-axiomatical approach to the pattern recognition problem level descriptions of classes are regarded. Such descriptions allow to reduce some pattern recognition problems to a sequential solving of one-type problems of the less dimension. For problems which may be described by means of propositional (boolean) formulas conditions of step number decreasing for an algorithm solving such a problem using a level description are proved.

Текст научной работы на тему «Многоуровневые описания классов для уменьшения числа шагов решения задач распознавания образов, описываемых пропозициональными формулами»

МАТЕМАТИКА

УДК 004.93.51

Т. М. Косовская

МНОГОУРОВНЕВЫЕ ОПИСАНИЯ КЛАССОВ ДЛЯ УМЕНЬШЕНИЯ ЧИСЛА ШАГОВ РЕШЕНИЯ ЗАДАЧ РАСПОЗНАВАНИЯ ОБРАЗОВ,

ОПИСЫВАЕМЫХ ПРОПОЗИЦИОНАЛЬНЫМИ ФОРМУЛАМИ Введение

В условиях все более широкого применения вычислительной техники для решения массовых задач по обработке большого объема данных актуальной остается проблема уменьшения числа шагов работы алгоритмов, решающих такие задачи. Наличие доказанных верхних границ шагов таких алгоритмов позволяет отнести задачу к тому или иному классу сложности (линейные, полиномиальные, экспоненциальные по времени, NP). При этом даже в рамках известного класса сложности для решения конкретных задач можно найти более эффективные алгоритмы. Например, уменьшить коэффициент в линейной верхней оценке числа шагов алгоритма или уменьшить показатель степени полинома в полиномиальной верхней оценке, или уменьшить показатель экспоненты в экспоненциальной оценке.

Определению верхних оценок сложности решения тех или иных задач, а также разработке алгоритмов, более эффективно, чем имеющиеся, решающих известные задачи, посвящены усилия многих ученых (см., например, [1, 2]). В [3] приведены оценки сложности решения некоторых задач распознавания.

В [4] были доказаны верхние оценки числа шагов алгоритмов, решающих задачи распознавания образов, имеющих логические описания. Так, например, для решения задач идентификации и классификации объектов, имеющих глобальные характеристики, то есть таких, которые могут быть описаны в терминах пропозициональных (булевых) переменных, доказаны линейные оценки числа применений правил вывода. Для этих же задач в [4] доказаны полиномиальные оценки числа шагов работы машины Тьюринга. Однако на практике количество признаков, характеризующих объекты, может быть настолько велико, что даже алгоритмы с полиномиальными малой степени оценками числа шагов их работы оказываются малоэффективными.

В [5] предложено многоуровневое описание классов, которое позволяет свести ре© Т. М. Косовская, 2008 шение задач распознавания к последовательному решению однотипных задач меньшей размерности.

В настоящей статье доказаны условия, при которых использование многоуровневого описания уменьшает число шагов работы алгоритмов, решающих рассматриваемые задачи распознавания образов. Рассмотрен модельный пример применения полученных условий к формированию многоуровневого описания классов.

1. Постановка задач распознавания

В [6] различные задачи распознавания образов были сведены к доказательству выводимости формул исчисления высказываний и исчисления предикатов из совокупности атомарных формул. В настоящей статье будут рассмотрены только задачи, решение которых может быть сведено к доказательству выводимости формул исчисления высказываний.

Пусть Q —множество распознаваемых объектов и. Пусть также задан набор признаков p1,... ,pn, характеризующих свойства объекта и.

Пусть задано разбиение множества Q на K (возможно пересекающихся) классов, то есть Q = Ufc=i Qfc.

Логическим описанием в(и) объекта и называется набор всех истинных формул вида pOA, где а$ — значение

переменной pj для объекта и.

„_ ,_ а f p, если а = true,

Здесь и далее будем использовать обозначение р" = < . ,

J [ -р, если а = raise.

Логическим описанием класса (ОК) Qfc называется формула в дизъюнктивной нормальной форме (ДНФ) Afc с

пропозициональными переменными р1,... ,pn, такая что если на наборе значений а1,..., ап истинна формула Afc, то и G Qfc.

С помощью построенных описаний предлагается решать следующие задачи распознавания образов.

Задача идентификации. Проверить, принадлежит ли объект и классу Qfc.

Эта задача в [6] сведена к доказательству выводимости формулы Ас из описания распознаваемого объекта в(и).

Задача классификации. Найти все такие номера классов к, 'что и О Qfc.

Эта задача в [6] сведена к доказательству выводимости формулы \/А= Ас из описания распознаваемого объекта в(и) с указанием всех таких номеров к, для которых соответствующий дизъюнктивный член истинен на и.

Заметим, что в рассматриваемом в настоящей статье случае, когда объекты характеризуются глобальными признаками, описывающими свойства этих объектов, а не свойства и отношения между частями объектов, проверка выводимости объекта из описания и проверка истинности соответствующих формул на наборе значений признаков имеют одинаковую оценку сложности.

2. Многоуровневое описание классов

Рассмотрим описания классов, структура которых позволяет выделить более простые их подформулы и дать описания классов в терминах новых признаков, определяемых совокупностью исходных. В частности, это можно сделать, выделяя «часто» встречающиеся подформулы формул Ас «небольшой сложности». При этом записывается система

эквивалентностей вида

р1 - Р11,

где Р11 —новые переменные, которые будем называть переменными 1-го уровня.

Зафиксируем целые положительные числа г и N. Они будут отражать формализацию таких нечетких понятий, как «небольшая сложность» подформулы (если количество вхождений переменных в подформулу меньше г) и «часто» (если количество вхождений данной подформулы в описания классов больше ЭД.

Следующая операция не носит алгоритмического характера, то есть может быть выполнена различными способами. В настоящей статье доказываются условия, при которых результат ее проведения дает экономию времени при решении задач распознавания образов.

Выделим часто встречающиеся подформулы небольшой (по тем или иным критериям) сложности формул Ас и обозначим их Р11. Как указано выше, обозначим признаки, задаваемые этими подформулами, посредством р1 (1 = 1,..., ш) и назовем их признаками первого уровня. То есть эти признаки определяются равносильностями Р11 — Р11 при 1 = 1,..., П1.

Обозначим формулы, полученные из Ас путем замены всех вхождений формул Р11 на пропозициональные переменные р1, посредством А1. Такие формулы можно рассматривать как описания классов в терминах признаков исходного (нулевого) и первого уровней.

Процедуру выделения часто встречающихся подформул небольшой сложности можно повторить с формулами А1.

Пусть определены признаки 1-го, 2-го,..., (1 — 1)-го уровней. Выделим все часто встречающиеся подформулы небольшой сложности формул А1-1 и обозначим их Р11. Обозначим признаки, задаваемые этими подформулами, посредством р1 (1 = 1,... ,п;) и назовем их признаками 1-го уровня. Эти признаки определяются равносильностями Р11 — Р11 при 1 = 1,..., п;.

Формулы, полученные из А1-1 с помощью замены всех вхождений формул вида Р11 на пропозициональные переменные р1, обозначим посредством А1. Такие формулы можно рассматривать как многоуровневые описания классов в терминах признаков 1-го, 2-го,..., 1-го уровней.

В любой момент можно прекратить выделение пропозициональных переменных очередного уровня, но не позднее, чем когда среди подформул не найдется N одинаковых подформул.

В результате построения составных признаков и многоуровневого описания классов исходная система ОК может быть записана с помощью равносильной ей многоуровневой системы описаний классов вида

р1 А а Р11

рл л 1

РпЧ

Рі

Рг

Л

. РАЬ

РЬг

Рассмотрим условия уменьшения верхней оценки числа шагов работы алгоритмов решения описанных задач распознавания образов при использовании многоуровневого описания классов.

3. Условия уменьшения верхней оценки

числа шагов работы алгоритмов решения задач распознавания с использованием многоуровневого описания объекта при глобальной характеризации объекта

Отметим, что любая подформула формул в ДНФ Аі,..., Ак, входящая в них по крайней мере два раза, является простой конъюнкцией.

Определение. Атомом называется переменная или ее отрицание. Определение. Простые конъюнкции Ві, .. ., Вп называются непересекающимися, если не существует такого атома, который входит одновременно в две различные простые конъюнкции.

Определение. Простые конъюнкции Ві,...,Вп называются д-пересекающимся, если всякая общая подформула двух различных простых конъюнкций содержит не более д вхождений переменных.

Л

Определение. Простые конъюнкции Р/, .. ., Рщ, являющиеся подформулами формул А1, .. ., Ак, называются правильно выделенными, если они либо не пересекаются, либо являются 1-пересекающимися, и в каждую простую конъюнкцию формул А1, .. . ,Ак входит не более двух пересекающихся простых конъюнкций. Используем следующие обозначения. Пусть

Р/,..., Рп1 — непересекающиеся подформулы формул А1,..., Ак, У]1 — количество вхождений

пропозициональных переменных в Р]1, ЭД1 количество вхождений Р]1 в А1,..., Ак,

а — суммарное количество вхождений пропозициональных переменных в формулы в

ДНФ А1,...,Ак,

а& —количество вхождений пропозициональных переменных в формулу А& (| А& | = а&), а1 — суммарное количество вхождений пропозициональных переменных в формулы в ДНФ А1,..., Ак, полученных при двухуровневом описании классов.

Теорема 1. Если формулы Р11,. .. ,Рп не пересекаются, то для того, чтобы при двухуровневом описании классов в терминах предикатов исходного и первого уровней при некотором d выполнялось 'равенство а1 = ё ■ а, необходимо и достаточно, чтобы

ш

]Т(у - 1) ■ N1 = (1 - ф ■ а. (1)

]=1

ДОКАЗАТЕЛЬСТВО. Так как А;1,..., Ак — формулы, полученные из А1,..., Ак заменой непересекающихся подформул Р]1 на новые переменные _р], при записи формул А1,..., Ак было удаленоА а= 1 У]1 ■ ^ и добавленоА а= 1 эд1 пропозициональных переменных. Таким образом, количество а1 вхождений пропозициональных переменных в формулы А; 1,..., Ак равно а1 = а -А"= 1(У1 — 1) ■ ЭД1.

Подставив в равенство а1 = ф ■ а это выражение и перегруппировав члены получим условие (1). ■

Следствие 1. При выполнении условий теоремы 1 для того, чтобы количество вхождений пропозициональных переменных в А1,. .., Ак уменьшилось по сравнению с количеством вхождений пропозициональных переменных в А1, .. ., Ах, необходимо и достаточно, чтобы

п1

В] — 1) ■ ^ > а. (2)

]=1

Следствие 2. При выполнении условий теоремы 1 и ограничении N > N при некотором заданном N для того, чтобы при двухуровневом описании классов описание класса в терминах предикатов исходного и первого уровней имело длину записи меньшую, чем длина записи исходного описания, достаточно, чтобы

ДОКАЗАТЕЛЬСТВО. Неравенство N > N равносильно тому, чтоА"= ^у]1 — 1) ■ ЭД1 > N 'Х]= 1(] — 1). Поэтому выполнение условия N 'Х]=1(] — 1) > а, равносильное условию (3), влечет необходимое и достаточное условие, доказанное в следствии

1. ■

Следующая теорема дает необходимое условие уменьшения длины записи двухуровневого описания классов по сравнению с исходным, если формулы Р/,..., Р]1 пересекаются.

Теорема 2. Если РА...,РА —правильно выделенные подформулы формул А1, .. ., Ах, то для того, чтобы при двухуровневом описании классов описание класса в терминах предикатов исходного и первого уровней при некотором ф выполнялось 'равенство а1 = ф ■ а, необходимо, чтобы

п1

Е(у — 1) ■ Ы]1 > (1 — ф) ■ а (4).

]=1

ДОКАЗАТЕЛЬСТВО. Пусть N11 —количество одновременных вхождений пересекающихся формул Р1 и Р] в простые конъюнкции формул А1,..., Ах. Учитывая то, что Р1 и Р] пересекаются разве лишь по одному атому, при записи формул А1,... ,АК было

удаленоА"= 1 У]1 ■ ЭД1 — Д, где Д = Х]= а 1=]+ N1], и добавленоХ"= 1 ЭД1 пропозициональных переменных.

Заметим, что Д > 0, причем равенство достигается только в случае, если пересекающиеся подформулы не входят одновременно ни в одну простую конъюнкцию формул А1,...,АК.

Таким образом, количество а1 вхождений пропозициональных переменных в формулы А1,..., Ах равно а1 = а—(А"= 1 У]1 -^1 — Д) + Х]]= 1 ] То есть а1 = а — А"= ^у] — 1) ■ К]1 +Д.

Подставив в равенство а1 = ф ■ а это выражение и перегруппировав члены, получим условиеХ ]=1(У] — 1) ■ ^ = (1 — ф) ■ а + Д. Из этого следует требуемое необходимое условие (4). ■

Замечание. Теорема 2 остается справедливой, если подформулы Р/,..., Р] являются д-пересекающимися при любом натуральном д. При этом в доказательстве теоремы слагаемое Д учитывает суммарное количество вхождений общих подформул формул Р/,...,РА в А1,...,АК.

Доказано [4], что при глобальной характеризации признаками объекта как задача идентификации, так и задача классификации может быть решена на машине Тьюринга, число шагов которой не превосходит длины записи исходных данных. Также было доказано, что каждая из этих задач может быть решена с помощью применения метода резолюций или построения вывода в секвенциальном исчислении высказываний с количеством применений соответствующих правил, не превосходящем количества вхождений пропозициональных переменных в формулу Ас (формулы А,..., Ак для

задачи классификации). Заметим, что оценка числа шагов вычисления значения р1 совпадает с оценкой числа шагов решения задачи классификации, если вместо формул Ас берутся формулы Р]1.

Теорема 3. Пусть число ф определяется 'равенством а1 = ё ■ а. Тогда для того, чтобы при двухуровневом описании классов верхняя оценка числа применений правил вывода секвенциального исчисления высказываний или правила резолюций для решения задачи классификации была меньше, чем при исходном описании, достаточно, чтобы

Ш

]Ту < (1 - ф) ■ а. (5)

]=1

ДОКАЗАТЕЛЬСТВО. Проверка выводимостихоть одной из формул А1,..., Ак из описания объекта может быть сведена к последовательной проверке

— выводимости формул Р]1 из описания объекта (с последующим добавлением пропозициональных переменных _р] к описанию объекта),

— выводимости хоть одной из формул А;1,... ,АК из расширенного описания объекта.

По теоремам 3 и 4 из [4] первый этап может быть осуществлен не более чем за Х]= 1 У]1 применений правил вывода, второй этап — не более чем за а1 = а1 + ■ ■ ■ + аК применений правил вывода.

Для того чтобы количество применений правил вывода при решении задачи классификации с двухуровневым описанием классов не превосходило количества применений соответствующих правил вывода при одноуровневом описании классов, достаточно, чтобы А2"Ь1 у] + ф ■ а < а. Это неравенство равносильно условию (5). ■

4. Пример применения изложенных результатов

Проиллюстрируем применение полученных условий на модельном примере построения двухуровневого описания классов по имеющимся описаниям.

Пусть множество объектов разбито на три класса А1, П2, Оз. Имеется пять исходных бинарных признаков х,у^,и,у. В результате исследований было построено опознающее дерево, позволяющее идентифицировать и классифицировать объекты, характеризуемые этими признаками (см. рис.).

По этому опознающему дереву можно построить формулы в ДНФ, задающие описания классов:

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

А1 = —х&—у У x&-y&z У x&y&z&-у,

А2 = -х&у&^&-и У -х&у&и&-у У х&^&-и У x&z&u&-у,

Аз = -x&y&z&-u У —х&у&и&у У х&^&и&у У x&y&z&v.

Количество вхождений пропозициональных переменных в формулы А1, А2, Аз равно, соответственно, а1 = 9, а2 = 15, аз = 16. Общее количество вхождений пропозициональных переменных в описания классов равно 40.

Пример 1.

Пусть из этих формул выделены подформулы

Р1 = x&y&z,

Р21 = —х&у&и,

Рз1 = -х&у&-и,

Р 41 = x&z,

Р51 = y&z.

Количество вхождений пропозициональных переменных в эти подформулы равно, соответственно, У]1 = з, У2 = з, Уз = з, у| = 2, У5 = 2. Количество вхождений каждой из этих подформул в формулы А1, А2, Аз одинаково и равно 2 (ЭД1 = 2 при всех ] = 1, 2, з, 4, 5).

Так как подформулы пересекаются, можно воспользоваться необходимым условием уменьшения количества вхождений пропозициональных переменных в двухуровневое описание классов (4). В этом примереХ5=1(л — 1) ■ Nj1 = 16. Следовательно, если изменение длины записи произошло, то 16 > (1 — d) 40, то есть заведомо d > 0.4.

Действительно, при таким образом выделенных подформулах двухуровневое описание классов имеет вид

A1 = -x&-y V -y&p4 V -V&p1&p4&p1,

A1 = -z&p1 V -v&p2 V x&-z&-u V u&-v&p4,

A3 = P3&P5 V v&p2 V X&-Z&U&V V V&p1&p4.

Количество вхождений пропозициональных переменных в формулы A1, A2, Аз равно соответственно, а1 = 8, а2 = 10, аз =

11. Общее количество вхождений пропозициональных переменных в описания классов равно а1 = 29. Из равенства а1 = dа получаем d = 29/40 = 0.725, что согласуется с оценкой, полученной выше.

Проверим, можно ли гарантировать уменьшение верхней оценки числа шагов решения задачи классификации при так выбранных подформулах, задающих двухуровневые описания классов, то есть выполнено ли достаточное условие (5). В

этом примере Xj=1 Vj1 = 13, (1 — d) ■ a = 11. Следовательно, условие (5) не выполнено и нельзя гарантировать уменьшение

верхней оценки числа шагов решения задачи классификации.

Пример 2. Пусть из приведенных формул выделены подформулы

P11 = -x&y, P21 = x&z, P31 = y&z.

Количество вхождений пропозициональных переменных в каждую из этих подформул одинаково и равно 2 (Vj1 = 2 при всех j = 1, 2, 3). Количество вхождений каждой из этих подформул в формулы A1, A2, A3 равно, соответственно, N-j1 = 4, N2 = 4, N31 = 3.

Так как подформулы пересекаются, можно воспользоваться необходимым условием уменьшения количества вхождений пропозициональных переменных в двухуровневое описание классов (4). В этом примереА3=!(л — 1) ■ Nj1 = 11. Следовательно, если изменение длины записи произошло, то 11 > (1 — d) 40, то есть заведомо d > 0.725.

Действительно, при таким образом выделенных подформулах двухуровневое описание классов имеет вид

A1 = x& y V -y&p2 V -V&p2&P3,

A1 = -z&^u&p1 V u&v&p1 V x&-z&-u V u&-v&p2,

A1> = м&р1&л V u&v&p1 V x&-z&u&v V v&p2&p3.

Количество вхождений пропозициональных переменных в формулы A1, A2, A3 равно, соответственно, a1 = 7, a2 = 12, a3 = 13. Общее количество вхождений пропозициональных переменных в описания классов равно a1 = 32. Из равенства a1 = da получаем d = 32/40 = 0.8, что согласуется с оценкой, полученной выше.

Проверим, можно ли гарантировать уменьшение верхней оценки числа шагов решения задачи классификации при так выбранных подформулах, задающих двухуровневое описания классов, то есть выполнено ли достаточное условие (5). В этом примере Лj=l Vj1 = 6, (1 — d) ■ a = 8. Следовательно, условие (5) выполнено и можно гарантировать уменьшение верхней оценки числа шагов решения задачи классификации.

Summary

T. M. Kossovskaya. Level descriptions of classes for decreasing of step number of solving of a pattern recognition problem described by propositional formulas.

In the frameworks of logic-axiomatical approach to the pattern recognition problem level descriptions of classes are regarded. Such descriptions allow to reduce some pattern recognition problems to a sequential solving of one-type problems of the less dimension. For problems which may be described by means of propositional (boolean) formulas conditions of step number decreasing for an algorithm solving such a problem using a level description are proved.

Литература

1. Гэри М., Джонсон Д. Вычислительные машины и труднорешаемые задачи. М.: Мир, 1982. 416 с.

2. Monien B., Speckenmeyer E. Solving satisfiability in less then 2n steps // Discrete Applied Mathematics, 10, 1985. P. 287-295.

3. Wang Lusheng, Zhao Hao, Dong Guozhu, Li Jianping. On the complexity of finding emergin patterns // Theor. Comput. Sci. 2005, 335, N1. P.15-27.

4. Косовская Т. М. Доказательства оценок числа шагов решения некоторых задач распознавания образов, имеющих логические описания // Вестн. С.-Петерб. ун-та. Сер. 1. 2007. Вып. 4. С. 82-90.

5. Косовская Т. М. Многоуровневые описания классов для принятия решений в задачах распознавания образов // Тр. III Междунар. конф. «Дискретные модели в теории управляющих систем». М., Диалог-МГУ, 1998.

6. Косовская Т. М., Тимофеев А. В. Об одном новом подходе к формированию логических решающих правил // Вестник ЛГУ, 1985, №8. С. 22-29. №1. C. 160-176.

Статья поступила в редакцию 13 сентября 2007 г.

i Надоели баннеры? Вы всегда можете отключить рекламу.