УДК 519.713
ПРЕДСТАВЛЕНИЯ МНОГОМЕСТНЫХ ОТНОШЕНИЙ В ВИДЕ КОМПОЗИЦИИ БИНАРНЫХ ОТНОШЕНИЙ
СИНЕЛЬНИКОВА О.И., ВЕЧИРСКАЯ И.Д.
Рассматривается идея представления и обработки многоместных отношений в виде композиции бинарных отношений. Проводится метод разбиения многоместного отношения на бинарные, а также исследуется подход к построению многоместного отношения по бинарным. Рассматривается проблема формализации естественного языка с точки зрения бинарного представления.
Введение
При попытке формально описать какое-либо отношение, явление реального мира сталкиваемся с многоместными отношениями. Арность отношения определяется предметной областью, а также решаемой задачей. В большинстве случаев практически невозможно построить сразу многоместное отношение, т.е. учесть одновременно влияние всех факторов. Для того чтобы построить такое отношение, нужно досконально знать предметную область, причем не в виде законов, действующих на данной предметной области, а в виде существующих в ней наборов значений. Такой подход не эффективен и неприменим к задачам с большим количеством факторов и/или широкой предметной области.
Однако человек, сам того не подозревая, реализует постоянно в реальной жизни свой особый алгоритм. Суть этого алгоритма в том, что он сначала строит отношение между парами, группами факто -ров, а затем анализирует отношение между полученными группами. Таким образом, мозг человека строит многоуровневую экспертную систему, результатом которой является ответ на вопрос с учетом большого количества факторов.
Так в чем же состоит интерес идеи?
Во-первых, в том, что многоместное отношение можно представить, как комбинацию бинарных отношений. Это в значительной мере облегчает задачу формализации отношений. Работа с бинарными отношениями довольно простая с точки зрения представления их математическими моделями.
Во-вторых, при таком подходе возможна параллельная обработка информации, что существенно повышает эффективность процесса решения.
В-третьих, можно решать большое количество задач , заданных на одной предметной области.
Однако возникает вопрос о правомерности такого подхода. В данной работе проведен анализ процесса бинаризации, осуществлена попытка выявить условия, при которых это возможно, а также найти методы решения проблемы, когда эти условия не выполняются. Кроме того, осуществлена попытка применить концепцию бинаризации к конкретной
задаче, а именно, к проблеме формализации отношений естественного языка, в частности, процесса формирования окончаний непритяжательных, полных имен прилагательных.
Бинаризация
На практике, при обработке информации или построении модели какого-нибудь процесса, приходится обрабатывать многомерные отношения. С помощью какой бы модели данных мы не попытались это реализовать, получаются довольно сложные конструкции. Однако можно попытаться представить многоместное отношение в виде комбинации более простых отношений, т.е. произвести декомпозицию, что значительно упростит работу с ними, а также позволит осуществлять параллельную обработку данных.
Рассмотрим процесс декомпозиции с точки зрения такой модели данных, как алгебра конечных предикатов. В терминах данной модели многоместное отношение можно описать с помощью и-арного предиката P (x l3x2,...,xn), определенного на декартовом произведении множеств:
A = A1 х A2 х... х An,
где x1 є Al3x2 є A2,...,xn є An . Идея декартовой декомпозиции состоит в том, что и-арный предикат представляется в виде конъюнкции бинарных предикатов, отсюда название бинаризация — представление и-арного предиката в виде системы бинарных предикатов. Восстановление предиката P(x1, x 2,..., x n ) из системы бинарных предикатов называется его декартовой композицией — ребинаризацией.
Процесс бинаризации состоит в следующем. Каждому набору (al3a2,...,an) є P, где Р есть и-местное отношение, для которого задан предикат P (x1,x2,...,xn) , ставим в соответствие свое един -ственное имя. Из всех имен образуем множество В. Вводим переменное имя у є B и функцию у = S(x13x2,...,xn) (S : P ^B), определяющую имя любого набора из Р.
Функции у = S(x 1,x2,...,xn) соответствует некоторый предикат s(x1,x2,...,xn 3 у) , задающий пространство S в координатной системе А. Предикат S(x13x23...,xn3y) определен на A х B, имена у рассматриваем как векторы пространства А, а соответствующие им наборы (a13a23...3an) — как их координатное представление.
Предикат S(x13x23...3xn3y) однозначен (каждому набору отвечает не более одного имени), инъекти-вен (каждому имени соответствует не более одного набора), сюръективен (каждому имени отвечает хотя бы один набор), поэтому пространство S — квазидекартово.
Любой инъективный предикат S(x13x23...3xn 3 у) раскладывается в конъюнкцию его проекционных предикатов G13 G2 3...3 Gn :
S(xvx2’■■■’xn 3 у) = G/У3 x1) л
Л G2(y3 X2) Л... л Gn(У3 xn) . (1)
РИ, 2001, № 3
147
Предикаты G1, G2Gn определены на
B x Aj ,B x A2 ,...,B x An .
В результате декартовой декомпозиции й+1-арный предикат S заменяется равносильной ему системой бинарных предикатов G- (i = 1, n ) . Следует отметить тот факт, что бинаризацию предиката P (x 1,x2,...,xn) мы провели через его усложнение, так как вводили дополнительную переменную у и й+1-арный предикат S(x1,x2,...,xn, у) , а только потом осуществляли его декомпозицию.
Однако возникает вопрос: на самом ли деле достигнута таким способом декомпозиция предиката P (x1,x2,...,xn) ? Ведь мы производили декомпо -зицию не предиката P, а какого-то совсем другого предиката S • Да, достигнута, поскольку от предикатов G1, G2,..., Gn всегда можно возвратиться к предикату р.
Восстановление предиката P(x 1, x 2,..., x n ) по предикатам G1, G 2,..., G n , т.е. декартова композиция, осуществляется по формуле:
P(x1,x2,...,xn) = Зу є В S(x1,x2,...,xn,y) , (2)
где предикат S(x1,x2,...,xn,у) предварительно восстановлен по формуле (1).
Для перехода к предикату P(x1,x2,...,xn) в предикате S(x 1,x 2 ,...,x n, у) элиминируем переменную у , исключаем ее с помощью квантора существования.
Проекционные предикаты могут быть найдены по формуле:
Gi(y,xi) = 3x! Є A! 3x2 Є A2 ...,
3xi—1 є Ai-1 3xi+1 є Ai+1... 3xn є An, (3) S(x!,x2,...,xi,...,xn,y), i = 1,n .
Таким образом, осуществляется процесс бинаризации й-местного отношения.
Ре-бинаризация
Однако кроме проблемы упрощения многоместного отношения, существует задача создания формального описания какой-либо предметной области, т.е. именно построение предиката P(x 1,x2,...,xn) . Иногда просто невозможно сразу учесть взаимосвязь всех факторов в совокупности и построить адекватную модель реального процесса. Для решения данной проблемы предложен следующий подход, который также сводится к бинарным предикатам, т.е. рассмотрим процесс ребинаризации.
Пусть задано пространство A = A1 х A2 х ... х An, а также существует набор предметных переменных x1,x2,...,xn, такой что
x1 Є A1 , x 2 Є A2,...,xn Є An .
В виде формул алгебры предикатов области определения xt есть множества, описываемые формулой вида:
M(x-) = v xa,i = 1,2,...n . (4)
Пусть также на рассматриваемом пространстве существует отношение Р, которое является подмножеством декартового произведения A1 х A2 х... х An, т.е. если (a1,a2,...,an) є P, то можно говорить, что x1,x2,...,xn связаны отношением Р, где
x1 = a1 , x 2 = a2,.,xn = an , (a1,a2,.,an) - Набор возможных значений переменных x1,x2,...,xn,
который принадлежит множеству A=A XA>х-[1].
Кроме того, предметная область такова, что можно формально, в виде бинарных предикатов, описать отношения между любыми двумя переменными из набора x1,x2,...,xn . Тогда на пространстве A можно построить й-арный предикат P'(x1,x2,...,xn), который будет минимальной совершенной дизъюнктивной нормальной формой предиката, описывающего й-местное отношение, существующее на данной предметной области. Предикат P' (x1,x2,...,xn) строится по следующей формуле:
P'(x1,x2,...,xn) = ЛFij^i^jX i,j = l,n , (5)
i,J
где Fij(xi,xj) i,j = 1,n — предикаты, описывающие все возможные бинарные отношения между переменными xi и xj.
Итак, обсудим процесс построения предиката
P' (x1,x2,...,xn) .
На введенном пространстве существует система отношений между xi и xj , I,j = 1,...,n предметной переменной. Обозначим эти отношения Fj, что означает: I-я переменная находится в некотором отношении с переменной xj, или можно записать xiFijxj . В общем случае F^ различные
отношения, каждое из них определено на декартовом произведении A; х Aj.
Рассмотрим теперь введенные отношения xiFijxj на Aj X Aj , как преобразование x; = Fjj(x j) предмета xi є Ai в предмет xj є Aj, такое преобразование называется отображением [2]. Между отношениями xiFijxj и отображениями xj = F^xJ существует взаимно-однозначное соответствие, выражаемое условием: для любых xi є Ai, xj є Aj, если xjFijxj, то xj = Fij(xi) ; если же xiFijxj, то x j ^ Fij(xi) . Потребуем выполнения некоторых свойств для полученных отображений. Пусть рассматриваемое пространство таково, что отображения xiFijxj являются всюду определенными:
Vxi є ^3xj є Aj :xj = Fij(xi),
а также сюрьективными:
Vxj є Aj, 3xi є Ai :xj = Fij(xi).
Выполнение сюрьективности эквивалентно всюду определенности только для обратного отображения.
148
РИ, 2001, № 3
Следующим шагом в построении структуры бинарных отношений является переход к предикатам, соответствующим введенным отношениям [1]. Переход осуществляется путем введения предиката, как характеристической функции P(x;, x j) = Е,, отображающей множество Ai х Aj в множество £ = {0,1} , т.е. если xt и Xj находятся в отношении Fj, то Р(х;, x j) = 1, иначе Р(х;, x j) = 0 . Обозна-
чим
эти предикаты Р;: (х;, х j) . Введенные
таким
образом предикаты будут иметь вид, например:
Pij(xi,xj) = x^1 v x-3xb2
V ... V x^xj
где a j —элементы множества Ai, а bj —элементы множества Aj, т.е. предикат Pjj (xi, x j) представляет собой дизьюнкцию возможных на данной предметной области пар значений переменных x i и xj , соответственно из множеств Ai и Aj .
Введем понятие тождественно истинного предиката. Значение такого предиката Pjj (x i, x j) при любых наборах значений переменных xi и xj будет равно 1. На рассматриваемом пространстве такой предикат будет конъюнкцией предикатов, соответствующих областям определения переменных xi и xj:
Pij(xi,xj) = M(xi) ЛM(xj) = 1, (6)
для любых наборов значений переменных xi и xj.
Рассмотрим теперь следующую конструкцию, образованную коньюнкцией всех возможных на данном пространстве бинарных отношений, выраженных соответствующими предикатами. При размерности пространства п, образованного системой переменных x1rx2,...,xn, определенных на A = A1 х A2 х ... х An, соответственно, таких предикатов будет n2. В результате такой конъюнкции получили n-арный предикат, которому соответствует некоторое отношение. Смысл этого предиката в том, что он определяет существование в данном n-мерном пространстве набора из п значений переменных x1,x2,...,xn . Таким образом, мы получили n-местное отношение в виде конъюнкции бинарных отношений.
Однако при размерности пространства больше 3 такая конструкция очень громоздка и избыточна. Приведем некоторый алгоритм, позволяющий минимизировать такую формулу:
Р' (x1,x2,...,xn) = Л Fij (xi,xjX У = 1,n . (7)
i,j
Строим таблицу, которая будет устанавливать характер отношения между переменными xi и Xj .
— По вертикали и горизонтали расположены переменные x1,x2,...,xn .
— На пересечении i-й строки j-го столбца стоит идентификатор соответствующего бинарного отношения Fy.
В таблице наглядно виден процесс упрощения. Далее проведем ее преобразование, в результате
которого полученный по таблице предикат будет значительно проще построенного по формуле (7)
Р (x1,x2,...,xn) :
1. Заменим все элементы таблицы, которые соответствуют отношению, описываемому предикатом, тождественно равным 1, прочерками.
Как минимум, таких отношений будет п, т.е. те отношения xjFjixi, где i = j , в силу тождественной истинности предиката:
x1 X2 Xn
x1 F„ F\2 Fn
x2 F21 F22 F2n
Xn F„1 Fn 2 Fnn
Pii(xi,xi) = M(xi) лM(xi) = 1. (8)
В результате таких преобразований получим конь-юнкцию не более чем п2 - n предикатов.
2. Ввиду всюду определенности и сюрьективности можно рассматривать только половину таблицы, либо выше, либо ниже главной диагонали, т.е. отношение x iFijx j равнозначно отношению xjFjixi .
Таким образом, количество предикатов, входящих
в конъюнкцию, будет не более, чем
n2 - n
2
После описанных преобразований таблицы построим по ней предикат Р'(xb x2,..., xn) путем образования конъюнкции из всех оставшихся в таблице предикатов. В итоге мы получили минимальную дизьюнктивную нормальную форму п-местного отношения, описанного n-арным предикатом.
Описанный метод позволяет построить n-местное отношение при заданных областях определения каждой предметной переменной и знании законов, существующих между любыми двумя предметными переменными. На практике существует множе -ство задач, исходными данными для которых будут перечисленные выше условия.
Следует отметить, что полученный таким путем предикат Р' (x1,x2,...,xn) описывает все возможные сочетания значений предметных переменных. Однако реальные отношения, которые существуют на этой предметной области, могут задавать меньшее количество сочетаний:
P(xbx2,...,xn) С Р'(xbx2,...,xn) , (9)
что означает — предикат — Р содержится в предикате Р'.
Таким образом, для пространств, где нет так называемых “условных” сочетаний, процесс создания формального описания многопараметрического явления, т.е. построение n-местного отношения можно осуществлять путем ре-бинаризации.
Рассмотрим, для примера, процесс построения описания окончаний имен прилагательных, т.е. задачу формализации естественного языка.
РИ, 2001, № 3
149
Формальное описание естественного языка
Рассмотрим в качестве предметной области естественный язык. Попытаемся формально представить процесс формирования окончаний непритяжательных полных имен прилагательных с помощью бинарных отношений.
Для начала опишем математическую модель склонения полных непритяжательных имен прилагательных.
В русском языке наблюдается большая степень согласованности между смыслом, формой и структурой слова, т.е. существует своего рода морфологическое отношение, которое связывает между собой грамматические признаки, форму слова и другие признаки. Таким образом, проведя анализ русского языка, можно выявить те признаки, которые влияют на вид окончания. Поэтому данный процесс можно описать в виде предиката, который отображает множество сочетаний признаков на множество £ = {0,1} . Если в отношении, описываемом этим предикатом, существует данный набор, то предикат равен 1, иначе нулю.
В результате анализа окончаний непритяжательных полных имен прилагательных выявлено одиннадцать основных признаков, определяющих вид окончания [3], т.е. необходимо получить предикат
Р'(xi,хп) .
Рассмотрим эти признаки и введем следующие предметные переменные, обозначающие их: х1 — первая буква окончания; Х2 — вторая буква окончания; Х3 — третья буква окончания; Х4 — последняя буква основы; х5 — род; х6 — число; x 7—падеж; х8—ударность, при чем имеется в виду ударность самого окончания; х9 — мягкость, определяется по буквам, входящим в окончание; хш — современность; хп — одушевленность.
Таким образом, решение задачи нахождения формы окончания в рамках определенного текста сводится к нахождению таких значений переменных x^,i = 1,2,...,11, при которых предикат
Р(х1,х2,---,Х11) = 1 .
Предикат Р'(х1,Х2,...,Хц) является формальным описанием сочетаний одиннадцати признаков, всех, которые возможны в русском языке.
Предикат Р'(x 1, x 2,..., x11) = Р'(х) определен на декартовом произведении множеств M1,M2,...,M11, которые являются областями определения соответствующих переменных. Представим формальное описание некоторых из этих областей.
Согласно алгоритму ре-бинаризации необходимо построить бинарные отношения, существующие на данной предметной области, между всеми признаками.
Проведенные исследования показали, что многие предикаты, описывающие бинарные отношения между некоторыми признаками, являются тождественно-истинными.
Далее была построена таблица, проведена ее обработка, в результате чего выявлено сл едущее: чтобы
описать все возможные сочетания этих признаков, достаточно 25 бинарных таблиц. Однако это будут все возможные сочетания, но с точки зрения русского языка некоторые наборы будут лишними, т.е. необходимо учитывать “условные” сочетания для построения именно предиката Р (х1, х2,..., хп), соответствующего правилам русского языка. Однако для некоторых признаков все же удается построить тринарные предикаты Р (Xi, x j, x k ), которые совпадают с Р(xi,xj,xk) . Например, предикат Р(х1, х2, х3) , устанавливающий зависимость таких признаков, как первая, вторая и третья буквы окончания, найден в следующем виде:
Р(х 1, Х 2, Х3 ) = Р12 (х1 , Х 2 )Р13 (x1, Х3 )Р23 (х2 , Х3 )• Он задает такие наборы значений признаков Х1, Х2 и Х3, которые соответствует реальным закономерностям русского языка.
Итак, подведем некоторые итоги. В результате анализа таблицы можно сделать вывод, что десятиместное отношение, описывающее окончания непритяжательных полных имен прилагательных, можно получить в виде конъюнкции 25 бинарных предикатов. Такой результат свидетельствует о том, что нахождение возможных сочетаний значений одиннадцати признаков — довольно трудоемкая задача, но реализуемая.
Заключение
Идея обработки информации в виде бинарных отношений находит свое отражение во многих моделях представления данных: бинарные деревья, бинарные отношения в многокритериальной оптимизации, реляционные модели и др. Эти концепции могут быть реализованы с помощью различных программных, технических и других средств. Так, идеи бинаризации и ре-бинаризации можно с успехом применять при организации реляционных баз данных, при схемном моделировании интеллектуальных процессов, при обработке статистических данных, а также при построении информационных систем обработки естественного языка.
Литература: І.Дударь З.В., Мельникова Р.В., Шабанов-Кушнаренко Ю.П. Отношения как объекты формульного описания // Радиоэлектроника и информатика. 1998, № 1. С. 115-119.2.Дударь З.В., Самуйлик И.Г.,Ша-банов-Кушнаренко Ю.П. Отображения как объекты формульного описания / / Радиоэлектроника и информатика. 1998, № 1. С. 56-60. З.Шабанов-Кушнаренко Ю.П., Бондаренко М.Ф. Математическая модель склонения полных непритяжательных имен прилагательных // Информационный анализ. 1979, № 6. С. 10-12.
Поступила в редколлегию 11.04.2001
Рецензент: д-р техн. наук, проф. Шабанов-Кушнаренко Ю.П.
Синельникова Ольга Игоревна, студентка ХНУРЭ. Научные интересы: искусственный интеллект, методы оптимального управления. Увлечения: туризм. Адрес: Украина, 61166, Харьков, пр. Ленина, 14, тел. 13-17-13.
Вечирская Ирина Дмитриевна, студентка ХНУРЭ. Научные интересы: искусственный интеллект, логическая математика, естественный язык. Адрес: Украина, 61166, Харьков, пр. Ленина, 14, тел. 93-56-98.
150
РИ, 2001, № 3