Научная статья на тему 'Об алгебрологическом аппарате морфологического пространства'

Об алгебрологическом аппарате морфологического пространства Текст научной статьи по специальности «Математика»

CC BY
90
626
i Надоели баннеры? Вы всегда можете отключить рекламу.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Козяев Л. Л.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Об алгебрологическом аппарате морфологического пространства»

УДК 519.7

Л.Л. КОЗЯЕВ, ХНУРЭ (г. Харьков)

ОБ АЛГЕБРОЛОГИЧЕСКОМ АППАРАТЕ

МОРФОЛОГИЧЕСКОГО ПРОСТРАНСТВА

Стаття присвячена розробці логіко-алгебраїчних моделей та методів для формалізації різних семантичних структур природної мови на базі поняття морфологічного простору. З метою удосконалення математичної бази штучного інтелекту ставиться задача формального опису математичних понять на мові алгебри предикатів та предикатних операції, в тому числі й понять, що вводяться самою логічною математикою.

The development of algebrologycal models and methods for formalization of various semantic structures of a natural language is considered. The concept of morphological space was proposed. The task of formal description of mathematical concepts on language of predicates algebra and predicate operations was set in order to refine mathematical base of an artificial intellect.

Постановка проблемы. Невозможно построить полноценный искусственный интеллект пока не будут формализованы основные понятия. Особое значение имеет описание математических понятий. А описание понятий логической математики составляет одну из важнейших задач самой логической математики [1, 2].

Формальное описание объектов дает неизмеримо более полное их описание, иногда даже, исчерпывающее описание. Если мы можем по этому описанию воспроизвести этот процесс так, что искусственная система будет вести себя неотличимо от изучаемой естественной, значит, мы получили исчерпывающее описание данного процесса. Фактически исследователь прибегает к огрублению, схематизации изучаемых процессов и явлений. Такое огрубление приводит к понятию объекта или процесса. Формально каждое описываемое понятие заменяется соответствующим ему предикатом и описывается уже этот предикат [3].

Одно из важнейших практических применений логической математики состоит в формальном описании на ее языке математических понятий, в том числе и понятий, вводимых самой логической математикой.

Анализ литературы. Данная работа является логическим продолжением исследований, опубликованных в работах [4 - 7]. В [6] была предложена идея логической сети - абстрактной структуры, позволяющей обрабатывать дискретную информацию параллельно [8]. В результате исследований по алгебраизации логики была разработана специальная алгебра для формульного представления отношений и действий над ними. Отношения интерпретируются как мысли интеллекта, а действия над ними - как мышление. Схемная реализация формул этой алгебры приводит к

характерным инженерным сетям, которые называются логическими сетями.

Целью статьи является разработка аппарата алгебры конечных предикатов для описания структуры обобщенных морфологических пространств. Рассмотреть вопросы формализации различных соответствий, предложить варианты абсолютного и неабсолютного, однозначного и неоднозначного предикатных определений некоторых необходимых понятий. Дать определения проекционного предиката и проектора. На морфологических примерах показать координатные представления векторов в обобщенных пространствах. Предложить методы построения проекционного предиката и сопровождающих квазитолерантностей для заданного пространства. Рассмотреть метод преобразования предикатов к экономной скобочной форме.

1. Понятия как предикаты. Определим формально понятие равенства двух предикатов. Равенство предикатов Р = Q представляет собой

двуместный предикат второй ступени = (Р, Q), аргументами которого

являются предикаты первой ступени Р и Q. Пусть Р и Q - предикаты

Р(XI, Х2, ...,хт) и Q(x1, Х2, ...,хт), заданные на ит . Сокращенно записываем (хь х2,...хт) = х, тогда: = (Р, Q) о Vx(P(x) ~ Q(x)).

Прямым определением предиката Q через предикаты Д, Р2, ...,Рп называется связь вида:

Vx(Q(x) ~ Е (Р1 (х), Р (X), ...Рп (X))) = 1,(Х1, Х2, . ..,Хт ) = X. (1)

Здесь Р1,Р2,...,Рп - известные предикаты. Они называются параметрами логического уравнения (условия). Q - определяемый предикат; Е - некоторая предикатная операция. Уравнение (1) имеет единственное решение, и оно решается в явном виде: предикат Q выражается прямо через предикаты

Р1,Р2, ...,Рп : Q = Е(Р1,Р2, ...,Рп), или в развернутой форме:

X X

Q(X) = Е(Р1(X),Р2(X), ...,Рп(X)). Знак = означает равенство предикатов (значения предикатов равны при всех наборах значений аргументов X).

Определим формально понятие области определения соответствия. Соответствие - это некоторое отношение, заданное на М х N. М - область отправления, N - область прибытия. Определяем понятие соответствия предикатом Р( X, у) на М х N. Область определения соответствия: А(X) = 3у е NF (X, у). Предикат А( X) задан на М . В полной записи это определение запишется в виде: Vx(A(x) ~М(X) лЗу е N Е^,у)); М, N, Е -параметры условия (определяющие понятия); А - определяемое понятие. Оно

запишется в виде А^) =М(X) л Зу е Е(X,у).

Определим формально понятие области значений соответствия:

X

Vy(B( у) ~ N(у) лЗx е М Е (X, у)); В (у) = N (у) лЭx е М Е (X, у); В = Е (М, N, Е) . Косвенным определением предиката Q через предикаты РьР2, ...,-Рп называется связь вида

Е (Р1 (X), Р2 (X), . ..,Рп (X), Qn (X)) = 1. (2)

Единица, стоящая справа от знака равенства, играет в логических уравнениях роль аналога нуля числовых уравнений. В более общем случае имеем: Р(Р1,Р2,...,Рп, Q1,Q2, ...,Qr) = 1, где Р - предикат второго порядка.

Прямое определение с дополнительными условиями: Е -

эквивалентность, Е - функция. Прямое определение является частным случаем косвенного. При прямом определении предикат Q всегда выражается

однозначно через определяющие его предикаты Д,Р2, ...,-Рп . При косвенном - не обязательно. Q может не существовать, или же может существовать много вариантов решения уравнения (2) для Q . Непрямое определение - это

такое косвенное определение, которое не является прямым. Не исключен случай, когда непрямое определение даст единственный предикат Q. Примером является аксиоматическое определение сложения натуральных чисел: определение непрямое, но оно определяется единственным образом.

Определим формально понятия всюду определенного соответствия. В частном случае, когда А = М, имеем: Vx(M(X)« лЗу е N Е^,у)).

Запишем формально определение сюръективного соответствия:

Vy е N Эx е М Е^, у).

Определение предиката Q называется однозначным или коэкстенсивным, если задающее его условие (то есть уравнение алгебры предикатных операций) имеет единственное решение относительно переменной Q. В противном случае оно называется неоднозначным. Все прямые определения однозначны.

Существуют непрямые однозначные определения, например, определение сложения натуральных чисел (рекурсивное). Так что нельзя отождествить прямые определения с однозначными, а непрямые - с неоднозначными.

Определение предиката Q называется абсолютным, если предикат Q не

зависит от параметров Р[, Р2, . ,Рп. В противном случае определение предиката Q называется неабсолютным. Абсолютное определение характеризуется условием Е ^) = 1, где Е - некоторая предикатная операция. В частном случае Р^) = 1, где Р - некоторый предикат второй ступени.

Обычно для записи условий используются замкнутые кванторные выражения, но можно, в принципе, использовать и незамкнутые: P з Q = 1«(P ^ Q) ; P ~ Q = 1 ^ (P ^ Q). Предикат 1 играет в логических уравнениях такую же роль (правой части уравнения (=1)), как 0 - в уравнениях классической (числовой) математики (=0).

Пример абсолютного неоднозначного определения: УхР (x, x),

рефлексивность предиката Р, заданного на фиксированном универсуме. Ух, у єМ(Р(х, у) з Р(у, х)) - симметричность предиката, заданного на фиксированном множестве М.

Пример неабсолютного неоднозначного определения: Ух є М Р(х, х), где М с и - произвольное подмножество фиксированного универсума и .

2. Построение проекционных предикатов морфологического пространства. Возьмем предикат £(х^х2,...хи,у) на Лі хх...х Лп хВ. Предикат £ задает над множеством В пространство £ в координатной системе Л = Лі х Л2 х ...х Лп. Число п называется размерностью пространства £. Множества Лі хЛ2 х...хЛп называются координатными осями пространства £. Предикат £ называется характеристикой пространства £. Множество В называется носителем пространства £. Элементы множества В называются векторами или точками пространства £. Элементы хі є Лі, х2 є Л2 , ..., хп є Лп, удовлетворяющие условию

£ (хі, х2,...хп, у) = і, (3)

называются координатами точки у є В в системе Л . Набор (хі,х2,...хп), удовлетворяющий условию (3), называется координатным представлением точки у. Отображение £ (хі, х2,...хп) = у, Л в В , соответствующее предикату £ , называется отображением координатной системы Л пространства £ в его носитель В. Предикат £(хьх2,...хп,у) связывает каждую точку у є В с набором (хі, х2,...хп) ее координат хі є Лі, х2 є Л2 , ..., хп є Лп (одним, многими или ни одним). Отображение £(хі, х2,...,хп ) = у каждому набору координат (хі,х2,...хп) є Л ставит в соответствие точку у є В (одну, много или ни одной).

і-м проекционным предикатом пространства £ называется предикат 0і (у, хі) на В х Лі (і = і, п), значения которого при любых у є В и хі є Лі определяются равенством

0(у,х) = 3хі є 43*2 є Л2..3х_і є Лі_іЗхі+і є Лі+і ..Зхп є Лп £(xl, х2,...,хі ,...,хп, у) .

Предикату 0і (у, хі) соответствует отображение gi (у) = хі из В в Лі,

іі5

называемое 1-м проектором пространства £ над В . Проекционный предикат (у, xi) связывает каждую точку у е В пространства £ с ее координатой xi е А1■ (одной, многими или ни одной). Проектор gi (у) = xi каждой точке у е В ставит в соответствие ее координату xi е Ai (одну, много или ни одной). Иногда, в зависимости от применений, вектор у е В пространства А называют его предметом, а переменные ^, x2,...,xn) - признаками предметов; значения переменной xi ( = 1, п) называют оттенками /'-го признака; множество А/ - /-м полем оттенков.

Например, словоформы большого, большому и т.д. - это предметы. Признаки: слово большой, род - (мужской, женский, средний), число (единственное, множественное), падеж (именительный, родительный, дательный, винительный, творительный, предложный), оттенки - мужской и т.п. В классической математике точки плоскости отождествляют с их координатными представлениями в силу наличия биективной связи между ними. Здесь же этого делать нельзя. Дорогой дядя, дорогой тете, дорогой тетей, на дорогой тете - разные координатные представления у вектора. Сук

сучья, суки - разные векторы соответствуют одному и тому же координатному представлению.

3. Экономные скобочные формы. Скобочными формами называются произвольные формулы дизъюнктивно-конъюнктивной алгебры предикатов. Многие информационные объекты имеют иерархическую структуру, которая отражается при записи предиката в виде скобочной формы. Переход к скобочным формам позволяет до предела уменьшить длину формулы предиката. Для хранения в памяти машины информации о предикате нет ничего более экономного, чем его скобочная форма.

Рассмотрим преобразование к экономной скобочной форме предиката окончаний полных непритяжательных имен прилагательных. Отправляемся от таблицы предиката (т.е. от его СДНФ). Всего имеется 26 трехбуквенных окончаний, т.о. СДНФ предиката имеет 26x3=78 предикатов узнавания предмета. Такова сложность исходной формулы. Сложность формулы оцениваем числом вхождений в нее предикатов узнавания предмета. Все окончания парные, в каждой паре последние две буквы окончания одинаковы. Учитывая это обстоятельство, переходим к скобочной форме:

Р(^, X2, Xз) = К1 V X!1)((XйX— V XмX— V x2X— V XхX— V Xмx3) V

/ о е\/ го му / м — й — ю — е —\

V (X! V Xl)( X2 Xз V X2 Xз V X Xз V X2 Xз V X2 Xз V X2 Xз) V

V (Xlа V XlЯ ) ^2 X— V (xlу V x10 X— .

Число предикатов узнавания предмета сократилось с 78 до 32, т.е. получили более, чем двукратную экономию. Это - огромная экономия. Но это

еще не предел, т.к. в таблице имеются глубокие закономерности. Можно вынести за скобки еще X—, где только возможно:

Р^1, X2, Xз) = (XlЬI V ^)((Xй V Xм V x2 V Xх )*— V XмXзи ) V V ^ V Xе )(X-!, V XмXз V (Xм V Xй V Xю V Xе ^з ) V X V Xя ^я V X V Xю )x0 ^з .

Для каждой из них в формуле предиката должно фигурировать хотя бы одно вхождение предиката узнавания. Дальнейшее сокращение формулы возможно за счет выделения в ней общих частей. Имеется только одна общая

часть А = Xм V Xй V XI. Заменяем ее именем А.

Р^1,X2,Xз) = (XЬI V Xя)((А V XхX V XмXзи) V

V (Xl0 V Xlе )(X2X! V xMXзи V (А V X^ )X— ) V (X* V *я )xЯ V (xlу V Xlю )xЮ )X— .

Окончательный результат в сокращенном виде:

(ы V и)(( А V х) V ми (о V е) (го V ми)(А V ю)) V (а V я)я V (у V ю)ю;

А = м V й V е .

Выводы. В результате работы формализован ряд основных понятий алгебры конечных предикатов, что позволило ввести структуру обобщенных морфологических пространств. Даны и проиллюстрированы на примерах важные определения морфологического пространства, в частности, проекционного предиката и проектора. Рассмотрен метод преобразования предикатов к экономной скобочной форме. Перспективы дальнейших исследований в данном направлении определяются эффективностью полученных методов при параллельной обработке логических связей и возможностью моделирования любых лингвистических объектов в виде логических сетей.

Список литературы: 1. Дударь З.В., Пославский С.А. и др. Предикаты эквивалентности в задачах компараторной идентификации // Проблемы бионики. - 1999. - Вып. 51. - С. 19-26. 2. Дударь З.В., Мельникова Р.В., Шабанов-Кушнаренко Ю.П. Отношения как предмет формульного описания // Проблемы бионики. - 1997. - Вып. 48. - С. 94-10з. 3. Шабанов-Кушнаренко Ю.П. Теория интеллекта. Математические средства. - Харьков: “Вища школа”, 1984. - 142 с. 4. Бондаренко М.Ф. Математические модели морфологических отношений и их применение для автоматизации обработки речевых сообщений. - Дис. ... докт. техн. наук: 05.13.01. - Харьков, 1984.- 349 с. 5. Шабанов-Кушнаренко Ю.П. Теория интеллекта - Ч.2: Технические средства. - Харьков: Вища школа, 1986. - 144 с. 6. Бондаренко М.Ф., Дударь З.В., Ефимова И.А., Лещинский В.А., Шабанов-Кушнаренко С.Ю. О мозгоподобных ЭВМ. // Радиоэлектроника и информатика. - 2004. - № 3 (04).

- С. 24-з2. 7. Дударь З.В., Калиниченко О.В., Козяев Л.Л., Мельникова Р.В. О формальной структуре логических сетей // Радиоэлектроника и информатика. - 2005. - № 2. - С. 45-51. 8. Козяев Л.Л., Шабанов-Кушнаренко С.Ю. Бинаризация морфологического отношения склонения полных имен прилагательных // Радиоэлектроника и информатика. - 2005. - № 2. - С. 36-44.

Поступила в редакцию 17.03.2005

i Надоели баннеры? Вы всегда можете отключить рекламу.