Научная статья на тему 'Об одном подходе к решению задач различения и отождествления кортежей признаков'

Об одном подходе к решению задач различения и отождествления кортежей признаков Текст научной статьи по специальности «Математика»

CC BY
87
20
i Надоели баннеры? Вы всегда можете отключить рекламу.
Журнал
Auditorium
Область наук
Ключевые слова
распознавание образов / нечеткая логика / дескриптор / множество / носитель / кортеж / обучающая выборка / функция принадлежности / pattern recognition / fuzzy logic / descriptor / set / support / cortege / training set / membership function

Аннотация научной статьи по математике, автор научной работы — А. Ю. Дорошенко

В данной статье описывается алгоритм распознавания классов с использованиемносителей их множеств в общем случае и нечетких функций принадлежности для областейпересечения множеств классов. Данный подход обеспечивает существенное увеличениескорости классификации за счет уменьшения избыточных вычислений, присутствующих всуществующих аналогах. Классы задаются множеством кортежей признаков.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

AN APPROACH TO SOLVING THE PROBLEMS OF DISCRIMINATION AND IDENTIFICATION SIGNS TUPLES

This article describes a pattern recognition algorithm classes using the support of their sets in general and fuzzy membership functions for the areas of intersection of the sets of classes. This approach provides a significant speed increase for the classification by reducing redundant calculation present in existing analogues. Classes are given by a variety of attributes of tuples.

Текст научной работы на тему «Об одном подходе к решению задач различения и отождествления кортежей признаков»

УДК 001.4

ОБ ОДНОМ ПОДХОДЕ К РЕШЕНИЮ ЗАДАЧ РАЗЛИЧЕНИЯ И ОТОЖДЕСТВЛЕНИЯ КОРТЕЖЕЙ ПРИЗНАКОВ

© 2015 А. Ю. Дорошенко

аспирант кафедры ПОиАИС e-mail: doroshenkoav@bk.ru

Курский государственный университет

В данной статье описывается алгоритм распознавания классов с использованием носителей их множеств в общем случае и нечетких функций принадлежности для областей пересечения множеств классов. Данный подход обеспечивает существенное увеличение скорости классификации за счет уменьшения избыточных вычислений, присутствующих в существующих аналогах. Классы задаются множеством кортежей признаков.

Ключевые слова: распознавание образов, нечеткая логика, дескриптор, множество, носитель, кортеж, обучающая выборка, функция принадлежности

Актуальность данной работы заключается в том, что в существующих системах принятия решений на основе распознавания образов скорость решения задач является высокозатратной по времени. Такие проблемы могут возникать, например, в медицинской или технической диагностике, когда критически важно вовремя распознать состояние сложных систем и их изменения. В данной статье предлагается подход, позволяющий существенно сократить временные затраты за счет разделения случаев однозначной (детерминистской) и неоднозначной (недетерминистской) классификации в процессе решения задачи распознавания образов в условиях лингвистической неопределенности, что является целью данной работы. При использовании такого разбиения процесса при возникновении первого случая отсутствуют избыточные вычисления, присутствующие в современных системах, обобщающих вычисление результата для всех возможных вариантов. Аналогами предлагаемой системы являются системы, основывающиеся на нейронных сетях [Хайкин 2006; Рутковская и соавт. 2006], системы нечеткого вывода [Штовба 2007], системы, использующие вероятностные меры и другие [Ту, Гонсалес 1978].

Постановка задачи распознавания образов выглядит следующим образом: на наборе признаков Р = РгХ Р2Х ...X Рт (X — обозначение прямого произведения

множеств в значении признаков, т — количество признаков) определяется множество классов К = {К1,К2,...,КП} (п — количество классов), как множество кортежей

АТ, = {< р1,р2, —,Рт >}i, где i = 1,2,... , п; для всех i. Результатом работы

системы являются разграничение или отождествление любого кортежа X =< рг,р2, —,рт >, включая те, которые не входят в обучающую выборку, с одним

из классов их заданного множества.

В настоящей статье предлагается использование функции минимума в качестве T-нормы для вычисления принадлежности к классам, включенным в P, и функции максимума в качестве S-нормы для вычисления принадлежности элементов к пересечению классов, включенных в пространство признаков.

В основе предлагаемого подхода к классификации лежат дескрипторы, то есть вербальные формы представления данных. Для класса АТ, дескриптор Dl есть

ТЕХНИЧЕСКИЕ НАУКИ

объединение нечетких подмножеств W}- Р (/= 1,2,... ,t;t — количество

подмножеств), описывающих признаковое пространство классов. Каждое подмножество W; задается с помощью функции принадлежности <pWj: Р —> {0,1} (1) ,

формируемой при настройке системы на обучающей выборке, представленной набором кортежей. С учетом (1) можно записать, что

т - количество признаков. Функция принадлежности <pw. определяется как минимальное значение среди функций принадлежности проекций подмножества W} на множества признаков:

<PWj(Pl>P2> - >Рт) = т1пГ=1 I

PV(pk) О).

Данные функции принадлежности принимают значения или 0 или 1, то есть

<pPkwi: Рк —> {ОД} и являются носителями (support) подмножеств IV. на признаке Рк.

wi 1

При подстановке (3) в формулу (2) получается следующая запись формулы для расчета значения дескриптора:

где т - количество признаков; t - количество дискретных подмножеств IV1, задающих подмножество класса АТ,.

Решение задачи распознавания в общем случае сводится к определению класса АТ,, дескриптор Dt которого имеет ненулевое значение для кортежа признаков нового

объекта X.

При недостаточной полноте обучающей выборки в некоторых областях множеств образов в общем случае могут возникать пересечения. Если кортеж признаков распознаваемого объекта X входит в пересечение подмножеств классов, то возникает неоднозначность классификации и несколько дескрипторов классов будут равны 1. В таком случае необходимо ввести некоторый критерий, разрешающий возникшую неоднозначность. На примере данной статьи рассматривается использование совокупности нечетких функций принадлежности [Штовба 2007; Рутковска и соавт. 2006] (р* -Рк [О..1] (5). Функции задаются экспертами для

множеств, являющихся проекциями пересечений множеств классов К. Объем

экспертной работы при этом имеет минимально необходимый уровень.

В случае возникновения неоднозначности при классификации объекта в рамках предлагаемого подхода, дескрипторы, имеющие ненулевое значение, переформируются с учетом заданных нечетких функций принадлежности (5) по следующей формуле:

Auditorium: электронный научный журнал Курского государственного университета. 2015. № 3 (07)

Дорошенко А. Ю. Об одном подходе к решению задач различения и отождествления

кортежей признаков

В качестве решения выбирается класс Л',, дескриптор Dl которого принимает большее значение: X £ К„ если Dt — max "-1^, где п - количество классов.

Рассмотрим предложенный подход на упрощенном примере распознавания объектов двух классов А и В по признакам Рг и Рг. Пусть обучающая выборка задана

следующим множеством кортежей:

А = {< 1,1 >, < 1,2 >, < 1,4 >, < 2,1 >, < 2,3 >, < 3,4 >, < 4,1 >, < 4,2 >}

5

В = {< 3,3 >, < 3,5 >, < 4,3 >, < 4,4 >, < 4,5 >, < 5,3 >, < 5,5 >}

Количество дискретных подмножеств W в данном примере равно 1 как для класса А, так и для класса В. Функции принадлежности для множества WA класса А и

WB класса B согласно (3) запишутся следующим образом:

ФнА (Рг.Рг) = min

4>wB (Pi-P2) = min (<Pwb(p1),<P^b(p2))^

На основе обучающей выборки сформируем функции принадлежности проекций множеств WA и WB:

Ф^а (Pi) =

Ф„Б (Pi) =

1 для 1 < х < 4 О для х < 1 или х > 4 1 для 3 < х < 5 О для х < 4 или х > 5

Р,

' <f>WA

для 1 < х < 4 для х < 1 или х > 4

(Рг) = {о д!

1,

для х < 3 или х > 5

р f 1 для 3 < х < 5

■<»М = (0дл:

В данном примере множества WA и WB пересекаются, поэтому необходимо задать нечеткие функции принадлежности:

рг — 3 для 3 < х < 4

*Р (Р^ (Pi) Для х < 3 или х > 4 ’

р1 — 3 для 3 < х < 4

Ф ^Р2-^ I (р2) для х < 3 или х > 4

<Р*%в(Р i)

4 — рг для 3 < х < 4 <р^в (Pi) для х < 3 или х > 4 ’

Ф* (р2) = 1 Р,

4 — pj для 3 < х < 4 1 Ф^уВ (р2) Для х < 3 или х > 4 .

Классифицируем объекты Хг =< 2,3 >, Х2 =< 5,4 >, Х3 =< 3.4,3.8 >.

Для значений кортежа Х1 дескриптор класса A DA = min (1,1) = 1, дескриптор класса В DB = min(0,0) = 0. Объект Хг можно однозначно отнести к классу А.

ТЕХНИЧЕСКИЕ НАУКИ

Для значений кортежа Х2 дескриптор класса A DA = min (ОД) = 0, дескриптор класса В DB = min(l,l) = 1. Объект^ можно однозначно отнести к классу В.

Для значений кортежа Х3 дескриптор класса A DA = min(l,l) = 1, дескриптор класса В DB = min(l,l) = 1. Возникла неоднозначность, необходимо пересчитать дескрипторы согласно формуле (6): DA = min(0.4,0.8) = 0.4, DB = min(0.6,0.2) = 0.2. Объект X3 относится к классу А, так как его дескриптор DA принимает большее

значение.

Резюме

Предлагаемый подход к разработке систем распознавания позволяет уменьшить количество избыточных вычислений в случае однозначного распознавания объекта, тем самым увеличивая скорость обработки данных без каких-либо существенных ресурсных затрат или алгоритмических сложностей.

Библиографический список

Хайкин Саймон. Нейронные сети: полный курс. 2-е изд. : пер. с англ. М.: Издат. дом «Вильямс», 2006. 1104 с.

Рутковская Д., Пилиньский М., Рутковский Л. Нейронные сети, генетические алгоритмы и нечеткие системы/ пер. с польск. И.Д. Рудинского. М.: Горячая линия -Телеком, 2006. 452 с.

Штовба С.Д. Проектирование нечетких систем средствами MATLAB. - М.: Горячая линия - Телеком, 2007. 288 с.

Ту Дж., Гонсалес Р. Принципы распознавания образов. М.: Мир, 1978. 414 с.

Auditorium: электронный научный журнал Курского государственного университета. 2015. № 3 (07)

i Надоели баннеры? Вы всегда можете отключить рекламу.