Научная статья на тему 'ФОРМАЛЬНЫЕ СВОЙСТВА СОВМЕСТИМОСТИ СПИСКОВ'

ФОРМАЛЬНЫЕ СВОЙСТВА СОВМЕСТИМОСТИ СПИСКОВ Текст научной статьи по специальности «Математика»

CC BY
58
6
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
УПРАВЛЕНЧЕСКИЕ СПИСКИ / СЕМАНТИКА УПРАВЛЕНЧЕСКИХ СПИСКОВ / ПРЕДИКАТ УПРАВЛЕНЧЕСКОГО СПИСКА / СОВМЕСТИМОСТЬ УПРАВЛЕНЧЕСКИХ СПИСКОВ / СОЕДИНИМОСТЬ УПРАВЛЕНЧЕСКИХ СПИСКОВ / ЛИНГВИСТИЧЕСКАЯ ПЕРЕМЕННАЯ

Аннотация научной статьи по математике, автор научной работы — Гладков Сергей Львович

Целью настоящей статьи является построение теоретической модели автоматического соединения управленческих списков различных ведомств. Тема статьи актуальна для организации межведомственного взаимодействия в части обмена данными. На основе остова (общей части) управленческих списков в статье даны формальные определения атомарных и структурированных управленческих списков с атомарными и лингвистическими атрибутами, представляющих собой расширение отношений, введенных Эдгаром Коддом. Рассмотрены признаки совместимости таких списков. Методы исследования: логическая категоризация управленческих списков от простых к сложным. Рассмотренные в статье формальные определения однородных и структурированных списков, содержащих атомарные и лингвистические атрибуты, а также признаки их совместимости могут лечь в основу разработки стандартов автоматизированного обмена данных между информационными системами. В частности, определения однородных и структурированных списков могут использоваться в процессе разработки обменных форматов, а также сервисов обмена данными между различными информационными системами.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

FORMAL COMPATIBILITY FEATURES OF REGISTERS

The purpose of this article is build a theoretical model of automatic connection of various departmental managerial lists. The topic of the article is relevant for organizing interagency cooperation in terms of data exchange. Basing on the framework (common part) of management lists the article provides formal definitions of atomic and structured management lists with atomic and linguistic attributes. The latter are an extension of the relations introduced by Edgar Codd. The article also views the compatibility signs of such lists. It uses such a research method as logical categorization of management lists from simple to complex ones. The formal definitions of homogeneous and structured lists considered in the article containing atomic and linguistic attributes as well as signs of their compatibility can form the basis for the development of standards for automated data exchange between information systems. In particular the definitions of homogeneous and structured lists can be used in the development of exchange formats and for data exchange services between various information systems as well.

Текст научной работы на тему «ФОРМАЛЬНЫЕ СВОЙСТВА СОВМЕСТИМОСТИ СПИСКОВ»

УДК 004.652;510.62

ФОРМАЛЬНЫЕ СВОЙСТВА СОВМЕСТИМОСТИ СПИСКОВ

Гладков Сергей Львович1,

e-mail: gladkovs@list.ru, 1Общество с ограниченной ответственностью «Айгео», г. Красноярск, Россия

Целью настоящей статьи является построение теоретической модели автоматического соединения управленческих списков различных ведомств. Тема статьи актуальна для организации межведомственного взаимодействия в части обмена данными. На основе остова (общей части) управленческих списков в статье даны формальные определения атомарных и структурированных управленческих списков с атомарными и лингвистическими атрибутами, представляющих собой расширение отношений, введенных Эдгаром Коддом. Рассмотрены признаки совместимости таких списков. Методы исследования: логическая категоризация управленческих списков от простых к сложным.

Рассмотренные в статье формальные определения однородных и структурированных списков, содержащих атомарные и лингвистические атрибуты, а также признаки их совместимости могут лечь в основу разработки стандартов автоматизированного обмена данных между информационными системами. В частности, определения однородных и структурированных списков могут использоваться в процессе разработки обменных форматов, а также сервисов обмена данными между различными информационными системами.

Ключевые слова: управленческие списки, семантика управленческих списков, предикат управленческого списка, совместимость управленческих списков, соединимость управленческих списков, лингвистическая переменная

FORMAL COMPATIBILITY FEATURES OF REGISTERS

Gladkov S.L.1,

e-mail: gladkovs@list.ru, 1Aygeo Limited, Krasnoyarsk, Russia

The purpose of this article is build a theoretical model of automatic connection of various departmental managerial lists. The topic of the article is relevant for organizing interagency cooperation in terms of data exchange. Basing on the framework (common part) of management lists the article provides formal definitions of atomic and structured management lists with atomic and linguistic attributes. The latter are an extension of the relations introduced by Edgar Codd. The article also views the compatibility signs of such lists. It uses such a research method as logical categorization of management lists from simple to complex ones.

The formal definitions of homogeneous and structured lists considered in the article containing atomic and linguistic attributes as well as signs of their compatibility can form the basis for the development of standards for automated data exchange between information systems. In particular the definitions of homogeneous and structured lists can be used in the development of exchange formats and for data exchange services between various information systems as well.

Keywords: managerial registers, semantics of managerial registers, registers predicate, compatibility registers, connectivity registers, linguistic variable

DOI 10.21777/2500-2112-2021-3-60-71

Введение

Федеральный закон РФ от 27 июля 2010 года № 210-ФЗ «Об организации предоставления государственных и муниципальных услуг» устанавливает требование автоматического межведомственного взаимодействия между базами данных различных государственных и муниципальных органов власти. Но пока эта возможность реализуется только специальными приложениями, организующими обмен данными между двумя (или больше) заранее определенными базами данных.

Начнём с анализа отношения (relation), введенного Эдгаром Коддом [1], как ближайшего «родственника» управленческого списка. Для этого рассмотрим упрощенное определение отношения. (Точное определение отношения приведено в книге Кристофера Дейта «Введение в системы баз данных» [2, с. 207].)

Определение 1. Отношение r состоит из заголовка и тела, которые соответствуют определениям, приведенным ниже.

- Заголовок отношения h(r) представляет собой полное множество атрибутов r.

- Атрибут - упорядоченная пара <A., T >, где A . - имя атрибута, T . - имя типа атрибута;

- Тело отношения b(r) представляет собой множество кортежей, имеющих один и тот же заголовок.

- Кортеж t отношения r - множество упорядоченных троек в форме <A,T,v>, где A. - имя атрибута, T . - имя типа и v. -значение атрибута A. с типом T . из коллекции типов T . (i = 1, 2, . . ., п), которые не обязательно все должны быть разными.

Здесь обозначение r имеет два значения. С одной стороны, r - это отношение в целом. С другой стороны, r - это название отношения. Пока такая двойственность обозначения не приводит к противоречивости изложения, r будет пониматься как пара: отношение и его наименование. В особых случаях, когда будет обсуждаться именно название отношения, будет использоваться обозначение N(r).

Определение 2. Подмножество атрибутов k отношения r является потенциальным ключом этого отношения, тогда и только тогда, когда соответствует следующим условиям1

- а) Уникальность. Ни одно допустимое значение r никогда не содержит два разных кортежа с одним и тем же значением k.

- б) Несократимость. Никакое строгое подмножество k не обладает свойством уникальности.

Теперь оценим, насколько определение отношения годится для представления управленческого

списка, попытавшись на его основе сформулировать условия совместимости списков.

Допустим, что управленческие списки L и M - это синонимы отношений r; и r для которых признаком совместимости по атрибутам <A.(r), T.(r1)> и <A.(r), T.(r)> следует считать:

- совпадение названий типов этих отношений T(r) = T.(r2);

- домен, т.е. множество значений атрибутаA(r) является подмножеством домена A.(r2) или A.(r2) является подмножеством домена A.(r). Другими словами

DOMAIN (A. (r)) с DOMAIN [Aj (r2 ))v DOMAIN [Aj (r2)) с DOMAIN (At (r)).

Если считать списки L и M тождественными отношениям, то окажется, что их возможно соединить, например, по атрибутам POCT(L) и ВЕС(М) на том основании, что их значения относятся к одному и тому же числовому типу. Но здесь исследуется возможность совместимости списков по данным об одних и тех же объектах.

Если же дополнить приведенный выше признак совместимости требованием совпадения названий атрибута <A(L), T.(L)> списка L с названием атрибута <A. (M), T(M)> списка M, то окажется что списки L и M окажутся формально несовместимыми по атрибутам ИМЯ СТУДЕНТА^) и ИМЯ ШКОЛЬНИКА(М). А значит из-за несовпадения названий родственных атрибутов в списках студентов и школьников мы можем не найти данные об учёбе в школе нынешнего студента.

Определение отношения включает сведения о синтаксисе и структуре, соответствующей списку (таблице), что обеспечивает широкие возможности и гибкость при его практическом использовании

1 Подробнее о точном определении ключей отношений [2, с. 356].

как единицы хранения данных. Но в нашем случае это определение оказалось слишком широким, чтобы стать фундаментом для определения совместимости управленческих списков.

Управленческие списки

Одним из препятствий на пути совместимости списков является разнообразие наименований, как самих списков, так и их атрибутов. Так в разных организациях один и тот же по смыслу список может называться по-разному, например, «Граждане», «Люди», «Население». Более подробный анализ проблем работы с управленческими списками приведен в статье «Списки» на сайте автора. Поэтому дальнейшее изложение будет вестись в предположении истинности следующего утверждения, принятого без доказательства.

Аксиома о смысле списка. Для каждого списка L с одним (или более) потенциальными ключами существует по крайней мере одно родовое понятие С, обладающее следующими свойствами:

- каждому идентифицирующему понятие набору характеристик (Гк(С)} соответствует один потенциальный ключ списка (К.^)}, где К^) - атрибут списка Ь в ключе;

- каждой идентифицирующей характеристике (свойству) понятия Р(С) соответствует, по крайней мере, один атрибут, входящий в состав соответствующего потенциального ключа (К.^)};

- каждый набор значений такого потенциального ключа позволяет однозначно идентифицировать любой чувственно воспринимаемый объект (предмет, вещь и т.д.) из полного множества объектов, объединенных этим понятием.

Заметим, что в аксиоме нет требования взаимной однозначности набора идентифицирующих понятие характеристик и атрибутов соответствующего потенциального ключа списка, т.к. список и соответствующее ему понятие формализованы (нормализованы [3]) обычно в разной степени.

Аксиома о смысле списка позволяет представить признак совместимости двух списков через ссылку на общую характеристику общего родового понятия этих списков. Аксиома также утверждает наличие у каждого списка потенциального ключа соответствующего набору идентифицирующих характеристик родового понятия. На практике далеко не каждый список в силу принципа минимальности [3, с. 9] содержит такой ключ. Но такой ключ всегда может быть добавлен, поэтому в этой работе считается, что каждый список им обладает.

Реальные управленческие списки часто используются не только по основному назначению, но, например, как место для записок на память. Поэтому вместо универсального определения управленческого списка будет дана серия определений списков различной формы по мере увеличения уровня их сложности. Под сложностью формы списка понимается неоднородность записей списка, сложность значений атрибутов списка (наличие структуры значения), а также сложность разделения «не атомарных» атрибутов, т.е. атрибутов, значения которых разделяются на отдельные осмысленные части, к атомарным [1, с. 150].

Вместе с каждым уровнем списка будут рассматриваться вопросы совместимости таких списков, а также вопросы их преобразования к спискам более простой формы.

Предварительные определения

Начнем с базового определения остова [4, с. 108] списка, которое в дальнейшем будет уточняться.

Определение 3. (Базовое). Список Ь состоит из названия списка ЭДЬ), заголовка, тела, а также родового понятия С с набором его характеристик, которые соответствуют определениям, приведенным ниже.

- Заголовок списка Н^) представляет собой полное множество атрибутов L, включающее характеристический ключ списка.

- Атрибут - упорядоченная пара (А, D ), где Л. - имя атрибута, D . - имя домена (множества допустимых значений атрибута), i -целочисленный индекс из интервала [1, п], п - количество атрибутов списка.

- Характеристический ключ списка - подмножество полного множества атрибутов

{(А,, ) | ¡к е [1, к ] & к < п} с {(Л1, D¡) | / е [1, п]}, обладающее свойствами уникальности и несократимости. (В дальнейшем для удобства атрибуты, входящие в состав ключа, будут обозначаться К.)

- Тело списка B(L) представляет собой множество записей, имеющих один и тот же заголовок.

- Запись R списка - множество упорядоченных троек в форме (A,,D ,,v ), где A. - имя атрибута, D . - имя домена и v. -значение атрибута A . из множества D .

- Родовое понятие C списка - пара, состоящая из имени понятия N(C) и множества характеристик понятия Fk(C), где j е [1, p].

Дополнительно приведем полезное определение общего атрибута двух списков.

Определение 4. Списки L и M обладают общим атрибутом A (L, M), если

- Совпадают их родовые понятия C = C (L) = C (M) .

- Существует характеристика F (C) общего понятия C, которая соответствует как атрибуту (A(L), D(L)) списка L, так и атрибуту (A(M), D(M)) списка M, т.е.

(3 (A (L), D (L)) е {(At (L), D, (L))} л (F (C) ^ A (L)) л (3 (A (M), D (M)) е {(A. (M), Dj (M))} л (F (C) ^ A (M)).

- СписокL принадлежит списку Mпо общему атрибуту A (L, M), если домен, т.е. множество значений атрибута, A(M) является подмножеством домена A(L) или домен A(L) является подмножеством домена A(M), т.е. DOMAIN (A (M)) с DOMAIN (A (L))

Предикат списка

Понятие C обладает логической формой, которая называется предикатом [5, с. 103]. Следовательно, можно определить логическую форму каждого списка L, для которого C - родовое понятие.

Определение 5. Предикат списка L - логическая функция P (L) - P (C), определяющая принадлежность набора значений { v.} характеристик {Fk(C) } понятию C, имеющая следующую структуру:

P (C) - Pi (Fi (C)) л p2 (F2 (c )) л...л p (F (c )) л...л pm (Fm (C)) , где p (Fj (C)) - предикат над одним атрибутом F. (C) (одноместный предикат[5, с. 92]);

{f. (C)} - набор характеристик, идентифицирующий понятие C.

Таким образом, предикат P (C) списка L является средством верификации (подтверждения) и фальсификации (опровержения) принадлежности набора значений соответствующих характеристикам атрибутов списка L понятию C, т.к. каждому набору значений списка атрибутов ставит в соответствие одно из логических значений «истина» или «ложь».

Характеристики {f. (C)}, идентифицирующие понятие C, подразделяются на родовые и видовые отличия понятий [5, с. 92]. При этом видовые характеристики преобладают при идентификации понятий, соответствующих спискам.

Набор значений идентифицирующих характеристик неявно задает последовательность сужающихся понятий, и тем самым может быть представлен как путь образования понятия С.

На рисунке 1 для наглядности использованы атомарные предикаты вида P. (F. (C)) = F. (C) = a., где a. - константа, которые представляют собой звенья пути образования (формирования) понятия. Например, в составе предиката понятия «Улицы Красноярска» присутствует атомарный предикат F] («Город») = « Красноярск». Этот атомарный предикат соответствует понятию «населённые пункты» и указывает на то, что среди его объектов должен быть выбран «город Красноярск».

Определение 6. Пусть понятие C занимает место n на пути его образования, тогда последовательность понятий {C1;C2;...Cn-1}, называется контекстом понятия C. Контекст родового понятия C списка L будем называть контекстом списка [6]. Контекст списка L, дополненный родовым понятием C списка будем называть путем списка

{C1; C2 >. • • Cn-1 } U C = {C1 > C2 >. • • Cn-1, C} = {C1 > C2 >. • • Cn-1, Cn } .

Рисунок 1 - Путь образования понятия

Из предыдущих рассуждений следует, что каждому понятию пути списка соответствует один или несколько атомарных предикатов. Число атомарных предикатов списка должно быть больше или равно числу понятий в пути списка, т.к. каждый атомарный предикат соответствует одному из понятий контекста или родовому понятию списка.

Контекст списка Ь будет использован в дальнейшем для сведения (преобразования) к списку, соответствующему одному из понятий контекста С (путем сокращения числа атрибутов списка, а также удаления одинаковых записей, возникших из-за удаления атрибутов). Наличие такого преобразования позволит совмещать списки, пути которых содержат общие понятия. Например, для выделения адресов из списков объектов недвижимости.

Записи списка

С точки зрения теории множеств список - это множество записей, которые могут быть представлены точками этого множества. Но с логической и смысловой точки зрения, записи - это единичные списки, т.е. списки, состоящие из одной записи. Поэтому к ним применимы все предыдущие рассуждения.

Родовое понятие С списка L всегда определяет класс объектов. При этом каждая запись списка соответствует понятию с. Поэтому в определении однородности понятия введено требование неразделимости его на подклассы.

Родовое понятие С списка L может быть представлено как синтез понятий об объектах, соответствующих записям списка:

С = с1 + с2 +... с + ... + сю, где с - понятие записи списка, ю - мощность (объём) С, а «+» операция «обобщения» [7] или «синтеза» понятий [6].

Для того чтобы преодолеть возможную неопределённость в дальнейшем прописными буквами ( С ) будут обозначаться понятия о классах объектов, а строчными буквами единичные понятия.

Каждое понятие записи списка с., как и всякое понятие, обладает набором идентифицирующих характеристик, подразделяющихся на две части: идентифицирующие характеристики понятия С и характеристики, определяющие видовые особенности с., как подвида. Характеристикам видовых особенностей понятия с. соответствует ключ записи ^, значения которого уникальны в пределах списка Ь.

Каждому понятию записи списка с соответствует предикат

Р (с. Р (С )л р1 (/1 (с ))л р2 (/2 (с. ))л...л Р] (/. (с. ))л...л Рт (/т (с. )) ,

где Р (С) - предикат списка; Р- (/■ (с.)) - одноместный предикат над одной характеристикой записи атрибутом /] (с1); {/■ (с.)} - набор видовых особенностей понятия с., соответствующего записи ^ .

Ну и наконец, каждое понятие c¡ записи обладает контекстом и путем образования. Контекст понятия записи начинается с пути образования родового понятия списка C и дополняется подвидами класса C, которым принадлежит единичное понятие c¡. Путь записи списка получается объединением ее контекста с характеристиками, идентифицирующими запись в пределах списка.

Каждый список может содержать 2 типа записей: обычные и итоговые записи.

Независимо от уровня списка контекст и путь образования итоговой записи t¡ списка L совпадают с контекстом и путём образования самого понятия. Т.е. итоговая запись списка L содержит характеристики списка как объекта, порожденного совокупностью обычных записей. Значения характеристик итоговой записи получаются путем применения к соответствующим характеристикам обычных записей агрегатных функций, например, SUM(), MAX(), MINO, AVG(). На этом основании в [6] операция C = c1 + c2 + ... c¡ + ... + cw, называется операцией синтеза или порождения понятий.

Таким образом, итоговая запись списка может быть создана из набора обычных записей списка L, поэтому при изучении возможности совместимости списков, наличие в них итоговых записей будет игнорироваться.

Замечание. В определение атрибута списка можно добавить соответствующую ему агрегатную функцию, тогда операция соединения списков может порождать и одну итоговую запись.

Однородные списки

Однородное понятие C - это неразделенное в пределах списка на подклассы понятие [5, с. 203], т.е.

$m > 1 | C = C + C2 + ... + Cm , где «+» операция «обобщения» [7] или «синтеза» понятий [6].

Рисунок 2 демонстрирует различные примеры операций «обобщения». В пределах этого рисунка однородными понятиями являются: «Вагончик», «Земельный участок», «Жилое здание», «Гараж».

Гараж

Рисунок 2 - Структура понятий (рисунок из [6])

Однородность класса C , может быть определена через понятия этого класса. Понятие C однородно, если не существует понятия с.1, принадлежащего C , которое принадлежит и подвиду С] сC .

е С|ЗС; с С л с, е С]. Определение 7. Список Ь называется однородным, если он соответствует однородному понятию С. Следствие 1. Контекст каждой записи однородного списка совпадает с путем образования этого списка.

Однородные атомарные списки

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Атомарный атрибут (Л., D.) - это атрибут, значения которого не разделяются на отдельные осмысленные части, т.е.

$m > 1 | D = D. x D x...x Dim .

Атомарному атрибуту списка L соответствует атомарный одноместный предикат.

Поясним на примере. Пусть A, -дата в формате «ДД.ММ.ГГГГ». Этот атрибут в общем случае не атомарный, т.к. может быть разделен на три: день, месяц и год. Предикат в накладывающий условие правильности значения этого атрибута не будет одноместным, т.к. в качестве переменных такого предиката должны быть как месяц, так и год.

А теперь разделим атрибут A, на три: Aid - «день», Aim - «месяц», Aiy - «год». В этом случае общий предикат Aiy = 2021 л Aim = 2 л Ad < 28 представляется тремя одноместными предикатами, соединенными логической операцией «и» (см. рисунок 1).

Определение 8. Список L - атомарный список, если содержит только атомарные атрибуты. Если однородный список L, обладающий свойством атомарности, называется однородным атомарным списком.

Из аксиомы о смысле списка следует, что каждому набору характеристик, идентифицирующему понятие С списка L, соответствует потенциальный ключ {K (L)} этого списка.

Следствие 1. Если L - однородный атомарный список, то каждой характеристике F^(C) соответствует только один атрибут списка {A;(L)}.

Если отношение между списком характеристик С и соответствующим подмножеством атрибутов L не взаимно-однозначно, то либо список содержит не атомарный атрибут, либо понятие С не однородно.

Записи атомарного списка

Все обычные записи l¡ однородного атомарного списка обладают одним и тем же контекстом, который соответствует пути образования списка. Что следует из определения контекста и однородности списка L.

Итоговые записи однородного атомарного списка могут содержать характеристики родового понятия Fj (C) = aj, со значениями пути образования понятия, а также атрибуты, значения которых получены путем применения агрегатных функций, например, SUM(), MAX(), MIN(), AVG().

Заметим, что перечисленные выше функции могу быть применены только к атомарным атрибутам.

Совместимость однородных атомарных списков

Признак совместимости по атрибуту. Пусть даны однородные атомарные списки L и M. Будем говорить, что список M совместим со списком L по атрибуту, если

— списки L и Mобладают общим атрибутом (см. данное выше определение общего атрибута списков);

— домены атрибутов, соответствующих общему атрибуту, A (L, M) обладают следующим свойством: DOMAIN (A (M)) с DOMAIN (A (L)) _

Например, пусть M - список объектов недвижимости города Красноярска, а L - список объектов недвижимости Красноярского края. Тогда список M совместим со списком L по атрибуту «Адрес объекта недвижимости», если список адресов объектов недвижимости города Красноярска полностью содержится в списке адресов объектов недвижимости Красноярского края. Подчеркнем, что здесь «Адрес объекта недвижимости» - это характеристика общего родового понятия списков, на которую ссылаются их атрибуты с возможно различными названиями.

Признак совместимости списков. Список M совместим по ключу со списком L, если M совместим с L по каждому атрибуту (K(M) , D), входящему в потенциальный ключ списка M.

Признак совместимости списков неявно содержит требование эквивалентности потенциальных ключей K(L), K(M) на основании эквивалентности каждого из них одному и тому же набору характеристик {Fj (C)}, идентифицирующих понятие C . Поэтому совмещение списков можно представлять как взаимную замену ключей в описаниях совместимых списков M и L. Тогда совместимость списков может

быть определена как L-взаимозаменяемость по ключам в терминах Рудольфа Карнапа [8, с. 90]. При этом взаимозаменяемыми по ключам можно считать списки при полном совпадении доменов их ключей.

Лингвистические списки

На практике полностью атомарные списки скорее исключение, чем правило. Поэтому рассмотрим атрибуты списков с неатомарными значениями, т.е. значениями, обладающими некоторой формальной структурой, описанной предложениями на некотором формальном языке. Для этого воспользуемся определением лингвистической переменной, введенной Лотфи Заде [9, с. 71], приспособив его к излагаемому материалу.

Определение 9. Лингвистический атрибут (Д, G¡ D¡) - это атрибут списка, которому в соответствие поставлена порождающая грамматика Хомского [10, с. 169].

Gi V, Р, S) [11, с. 36], где и - основной и вспомогательный словари (или множество переменных) грамматики Gi соответственно. Объединение и составляет полный словарь V - VN и У1, грамматики Gi,

VN п Vт-0;

Р - конечное множество правил вывода или правил подстановки, обозначаемых как а ^ в , где а и в цепочки символов из V, причем а содержит по крайней мере один символ из VN;

S ^ е VN - начальный символ, к которому начинают применяться правила вывода.

Особенность лингвистического атрибута в том, что он не обязан быть атомарным, а значит для

него может выполняться условие Вт > 1 | D¡ - D¡ х D¡ х .. .х Di . Отсюда следует, что предложения языка, порождаемого грамматикой Gi , - это списки строк следующего формата {строка1 \строка2 |... | строкат}е VT . В этом случае словарь VN должен содержать названия

А, \ ] < т} для строк из порожденных грамматикой списков.

Значит, грамматика нашего лингвистического атрибута в результате преобразования его значения порождает набор дополнительных атомарных атрибутов списка {(Д1 , V¡. ) \ ] < т} вместе с их значениями.

Определение 10. Производные атрибуты {(Д , D¡ ) | у < т} лингвистического атрибута (Д, G¡ D¡) - это атрибуты, порожденные грамматикой G 1 . Полный набор атрибутов, порожденных грамматикой G¡ , будем называть расширением лингвистического атрибута.

Определение 11. Список Ь - лингвистический список, если наряду с атомарными содержит лингвистические атрибуты. Однородный и лингвистический список Ь, называется однородным лингвистическим списком.

Совместимость однородных лингвистических списков

Пусть даны два однородных лингвистических списка М и Ь. Каждый из них может содержать как лингвистические, так и атомарные атрибуты. При этом список М может содержать лингвистический атрибут, значения которого в списке L соответствуют набору значений нескольких атрибутов или наоборот.

Для большей общности дальнейших рассуждений будем считать, во-первых, что расширение атомарного атрибута совпадает с самим этим атрибутом.

Это позволит в дальнейшем рассуждении пользоваться термином расширение атрибута лингвистического списка или, если это не приводит к неопределенности, то расширение атрибута списка.

Во-вторых, определим эквивалентность списков по расширению атрибута.

Определение 12. Список Ь эквивалентен списку М по расширению атрибута {(Д], Dj) | у < т}, если совпадают их родовые понятия С - С (L) = С (М) и существует набор характеристик

{^ (С)}, который соответствует одному или нескольким базовым или расширенным атрибутам каждого из списков

- (з{(А, (£),В>Д£))}с{(д. (X),D¡ (£))}л

- (С)Н{(А,(£), В,, (£))}) л

- (З{( (М) В (М ))}с {(Д (М), D] (М))} л

- (К (С)Н(А') (М), В, (М))}).

Признак совместимости по атрибуту. Пусть даны два однородных лингвистических списка М и Ь. Лингвистический список М совместим списком Ь по расширению атрибуту, если

- списки Ь и М 'эквивалентны по расширению атрибута;

- домены общего расширения атрибута, {(А] ]) |) < т} обладают следующим свойством:

V/ е [1, т] | БОМАт (А] (М)) с БОМАШ (А] (£)) _

Как уже отмечалось, совместимые по расширению атрибута списки £ и М не обязаны иметь по лингвистическому атрибуту, которые должны совпадать. Но они должны иметь по совпадающему набору базовых или расширенных атрибутов, соответствующему набору характеристик их общего родового понятия.

Например, пусть М - список объектов недвижимости города Красноярска, а Ь - список объектов недвижимости Красноярского края. Тогда список М совместим со списком Ь по атрибуту «Адрес объекта недвижимости», если

- атрибут или группа атрибутов с общим названием «Адрес объекта недвижимости» обоих списков преобразуется к расширению одной и той же форме, например, {район или городской округ края |

Населенный пункт | улица\ дом} ;

- справочники районов (городских округов), населённых пунктов, улиц, номеров домов города Красноярска содержатся в соответствующих справочниках Красноярского края.

Признак совместимости лингвистических списков. Лингвистический список М совместим по

ключу со списком Ь, если М совместим с Ь по каждому расширению атрибута (К (М), D¡ (М)), входящему в потенциальный ключ списка М.

Структурированные списки

В этом разделе будут рассматриваться списки, соответствующие неоднородным понятиям, т.е. понятиям, разделенным в пределах своих списков на дочерние понятия, т.е. виды и подвиды. Примером такого списка может служить список субъектов права, состоящий из записей как о юридических, так и физических лицах.

Как следует из предыдущих рассуждений, неоднородное понятие С - это понятие, полученное путем обобщения нескольких понятий, т.е.

Зт > 1| С = С1 + С2 + ... + Ст , где «+» операция «обобщения» понятий [6].

Структурированные атомарные списки

Определение 13. Неоднородный атомарный список Ь - это объединение нескольких как однородных, так и неоднородных атомарных списков.

Лемма 1. Путь образования понятия С неоднородного списка Ь есть пресечение путей образования понятий, соответствующих подклассам Ь.

Доказательство.

Утверждение справедливо для однородного списка Ь, т.к. контексты его записей образуют путь образования родового понятия С, а значит самого списка. Напомним также, что путь образования итоговой записи ti однородного списка Ь, совпадает с путем образования самого списка.

Пусть Ь - объединение только однородных списков, т.е. все подвиды С { понятия С - однородные.

Преобразуем Ь в L , каждую группу обыкновенных записей, соответствующую виду С 1 итоговой записью. Путь образования каждой итоговой записи равен пересечению путей образования обыкновенных записей, из которых эта запись получена.

По условию построения списка Ь, вновь образованный список L окажется однородным, для которого утверждение леммы верно. Но оно верно и для Ь, т.к. результат применения операций пересечения множеств, составляющих пути образования записей списка, не зависит от порядка выполнения этих операций.

Пусть виды и подвиды родового понятия С списка L образуют дерево высотой h |Л > 2. И будем считать, что для любого дерева понятий высотой утверждение истинно. Заменим все обычные неоднородные записи, расположенные на уровне к - 1 списка, соответствующими итоговыми записями. Полученному списку 11 будет соответствовать дерево понятий высотой к - 1, а значит для него условия леммы выполняются. Т.к. предельная вложенность записей h, то все подсписки на уровне к - 1 - однородные. Следовательно, пересечение путей образования понятий всех записей будет равен пути образования родового понятия списка Ь, даже после замены путей образования итоговых записей пересечением путей образования обычных записей подсписков уровня к -1

В процессе доказательства леммы выяснилось, что виды и подвиды родового понятия списка образуют дерево понятий, т.е. неоднородный атомарный список Ь обладает структурой, соответствующей структуре подвидов его родового понятия. Структура списка представляется в виде дерева. Поэтому неоднородные атомарные списки далее именуются структурированными атомарными списками.

Совместимость структурированных атомарных списков

В процессе доказательства леммы в предыдущем разделе использовался прием понижения высоты дерева списка путем замены обыкновенных записей итоговыми.

Далее списки L , полученные в результате понижения высоты исходного списка Ь, будем называть приведенными списками, а саму операцию понижения высоты - приведением списка.

Если над списком Ь выполнить ^1 раз выполнить операцию приведения, то полученный список

L станет однородным. Такой приведенный однородный список будем обозначать - .

Признак полусовместимости. Пусть даны структурированные атомарные списки Ь и М с высотами кЬ и км соответственно. Будем говорить, что список М полусовместим со списком Ь, если

- км < кь;

- ВС(Ь)с С(Ь) \С(Ь)- С(М);

- каждый приведенный однородный подсписок списка М совместим с соответствующим ему

приведенным подсписком Ь , следовательно, Ь1^ совместим с Мк .

Другими словами, список М полусовместим со списком Ь, если в последнем можно выделить подсписок, совпадающий с М.

Формулировка признака требует пояснений. Во-первых, эквивалентность деревьев С (М) и

С (Ь) означает, что они совпадают по высоте. Во-вторых, совпадают структуры деревьев, т.е. совпадают понятия в соответствующих узлах этих деревьев. В-третьих, пути образования обоих деревьев совпадают.

Признак совместимости. Пусть даны структурированные атомарные списки L и M такие, что M полусовместим со списком L, тогда эти списки совместимы, если

— К = hL;

— C (L ) = C (M).

Интересен также особый случай совместимости структурированных списков, когда совместимость устанавливается между одним из приведенных списков M' и подсписком L , такая совместимость структурированных списков будет называться частичной совместимостью или полусовместимостью.

Заключение

Рассмотренные в статье формальные определения однородных и структурированных списков, содержащих атомарные и лингвистические атрибуты, а также признаки их совместимости могут лечь в основу разработки стандартов автоматизированного обмена данных между информационными системами. В частности, определения однородных и структурированных списков могут использоваться в процессе разработки обменных форматов, а также сервисов обмена данными между различными информационными системами.

В качестве направлений для будущего исследования управленческих списков можно назвать:

— построение следующих категорий управленческих списков, в частности, списки с нечеткими значениями атрибутов [9];

— разработка вопросов соединимости управленческих списков с классификаторами и справочниками;

— разработка формальных грамматик для различных лингвистических атрибутов;

— разработка методики преобразования управленческих списков к отношениям Кодда.

Список литературы

1. Кодд, Е.Ф. Реляционная модель данных для больших совместно используемых банков данных // Системы Управления Базами Данных. - 1995. - № 1. - С. 145-150.

2. Дейт, К.Дж. Введение в системы баз данных / 8-е издание; перевод с английского. - Москва: Ви-льямс, 2005. - 1328 с.

3. Потапов, А.С. Распознавание образов и машинное восприятие: Общий подход на основе принципа минимальной длины описания. - Санкт-Петербург: Политехника, 2011. - 548 с.

4. Цаленко, М.Ш. Моделирование семантики баз данных. - Москва: Наука, 1989. - 288 с.

5. Войшвилло, Е.К. Понятие как форма мышления: логико-гносеологический анализ. - Москва: Изд-во МГУ, 1989. - 239 с.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

6. Гладков, С.Л. О требованиях к интеллектуальной модели данных // Образовательные ресурсы и технологии. - 2015'2(10). - С. 63-70.

7. Джон М. Смит, Диана К. Смит. Абстракция баз данных: Агрегация и обобщение // СУБД. - 1996. -№ 2.- С. 141-160.

8. Карнап, Р. Значение и необходимость. Исследование по семантике и модальной логике. - Москва: Изд. иностр. литературы, 1959. - 384 с.

9. Заде, Л.А. Понятие лингвистической переменной и его применение к принятию приближенных решений / перевод с английского Н.И. Ринго; под редакцией Н.Н. Моисеева и С.А. Орловского. - Москва: Мир, 1976. - 165 с.

10. Noam Chomsky. On certain formal properties of grammars // Information and Control. - Vol. 2. - Issue 2, 1959. - Рр. 137-167.

11. Фу Кинг-Сун. Структурные методы в распознавании образов / К. Фу; перевод с английского Н.В. За-валишина [и др.]; под редакцией М.А. Айзермана. - Москва: Мир, 1977. - 319 с.

Reference

1. Kodd, E.F. Relyacionnaya model' dannyh dlya bol'shih sovmestno ispol'zuemyh bankov dannyh // Sistemy Upravleniya Bazami Dannyh. - 1995. - № 1. - S. 145-150.

2. Dejt, K.Dzh. Vvedenie v sistemy baz dannyh / 8-e izdanie; perevod s anglijskogo. - Moskva: Vil'yams, 2005. - 1328 s.

3. Potapov, A.S. Raspoznavanie obrazov i mashinnoe vospriyatie: Obshchij podhod na osnove principa minimal'noj dliny opisaniya. - Sankt-Peterburg: Politekhnika, 2011. - 548 s.

4. Calenko, M.Sh. Modelirovanie semantiki baz dannyh. - Moskva: Nauka, 1989. - 288 s.

5. Vojshvillo, E.K. Ponyatie kak forma myshleniya: logiko-gnoseologicheskij analiz. - Moskva: Izd-vo MGU, 1989. - 239 s.

6. Gladkov, S.L. O trebovaniyah k intellektual'noj modeli dannyh // Obrazovatel'nye resursy i tekhnologii. -2015'2(10). - S. 63-70.

7. Dzhon M. Smit, Diana K. Smit. Abstrakciya baz dannyh: Agregaciya i obobshchenie // SUBD. - 1996. -№ 2. - S. 141-160.

8. Karnap, R. Znachenie i neobhodimost'. Issledovanie po semantike i modal'noj logike. - Moskva: Izd. inostr. literatury, 1959. - 384 s.

9. Zade, L.A. Ponyatie lingvisticheskoj peremennoj i ego primenenie k prinyatiyu priblizhennyh reshenij / perevod s anglijskogo N.I. Ringo; pod redakciej N.N. Moiseeva i S.A. Orlovskogo. - Moskva: Mir, 1976. - 165 s.

10. Noam Chomsky. On certain formal properties of grammars // Information and Control. - Vol. 2. - Issue 2, 1959. - Pr. 137-167.

11. Fu King-Sun. Strukturnye metody v raspoznavanii obrazov / K. Fu; perevod s anglijskogo N.V. Zavalishina [i dr.]; pod redakciej M.A. Ajzermana. - Moskva: Mir, 1977. - 319 s.

i Надоели баннеры? Вы всегда можете отключить рекламу.