Научная статья на тему 'Семантичне моделювання та комбінаторна оптимізація'

Семантичне моделювання та комбінаторна оптимізація Текст научной статьи по специальности «Математика»

CC BY
63
30
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
комбінаторна оптимізація / семантичне моделювання / цільова функція / таксономія / кластеризація / класифікація / combinatorial optimization / semantic modeling / objective function / taxonomy / clusterization / classification.

Аннотация научной статьи по математике, автор научной работы — Н. К. Тимофієва

Показано, що при семантичному моделюванні виникають задачі комбінаторної оптимізації, зокрема, задача покриття об’єктів певними ознаками, аргументом цільової функції в якій є розбиття n-елементної множини на підмножини. Побудовано математичну модель пошуку еталону заданого об’єкта в базі даних з використанням теорії комбінаторної оптимізації. Необхідна інформація знаходиться або за певними ознаками, або за заданим об’єктом.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

SEMANTIC MODELING AND COMBINATORIAL OPTIMIZATION

For the intellectualization of database systems is used semantic modeling, which allows you to define the essence of a given object more deeply. It consists in the fact that the object (essence) must be covered with signs, which characterize it as much as possible. In this case arises a covering problem which applies to the problems of combinatorial optimization. The argument of the target function in it is a partition n-element set on a subset. The coverage of objects by certain signs is carried out in such a way that they completely cover it. These signs can characterize both one object and several. Among them you can select solvable problems and insoluble ones. The essence of this problem is this: it is necessary to find a partition n-element set on a subset in which a given object is maximally covered by the minimum number of signs when the condition is fulfilled, namely: the number of the same elements in different clusters must be minimal. The paper presents the mathematical model of this problem. In addition to the problem of covering by appropriate signs of a given object, it is necessary to conduct its search in the database. At the same time, it is necessary to solve such combinatorial optimization problems as classification and clustering. Search in the database of information is carried out in two ways, namely: on certain signs, which are described by the input data, one or more objects are looking for, or the object is compared with one or more standards, the search object is set. The problem of finding the necessary information is divided into two subproblems: the search for information in the database and comparison of the input information with the standard. The objective function in it depends on two variables. The problem of finding information in databases is regular and refers to NP-full. To find the optimal result in real time proposed approach, which allows you to solve this problem to solvable.

Текст научной работы на тему «Семантичне моделювання та комбінаторна оптимізація»

УДК 519.816

Н.К. ТИМОФ1СВА

Мiжнародний науково-навчальний центр шформацшних технологш та систем НАН та МОН Украши

СЕМАНТИЧНЕ МОДЕЛЮВАННЯ ТА КОМБ1НАТОРНА ОПТИМ1ЗАЦ1Я

Показано, що при семантичному моделювант виникають задач1 комбтаторно1 оптимгзацп, зокрема, задача покриття об 'ектгв певними ознаками, аргументом цшьово! функцП в якш е розбиття n -елементно'1 множини на пгдмножини. Побудовано математичну модель пошуку еталону заданого об 'екта в баз1 даних з використанням теорИ комбтаторно1 оптимгзацИ. Необх1дна iнформаця знаходиться або за певними ознаками, або за заданим об 'ектом.

Ключовi слова: комбтаторна оптимiзацiя, семантичне моделювання, цшьова функщя, таксономiя, кластеризаця, класифжащя.

Н.К. ТИМОФЕЕВА

Международный научно-учебный центр информационных технологий и систем НАН и МОН Украины

СЕМАНТИЧЕСКОЕ МОДЕЛИРОВАНИЕ И КОМБИНАТОРНАЯ ОПТИМИЗАЦИЯ

Показано, что при семантическом моделировании возникают задачи комбинаторной оптимизации, в частности, задача покрытия объектов определенными признаками, аргументом целевой функции в которой является разбиение n -элементного множества на подмножества. Построена математическая модель поиска эталона заданного объекта в базе данных с использованием теории комбинаторной оптимизации. Необходимая информация находится или по определенным признакам, или по заданному объекту.

Ключевые слова: комбинаторная оптимизация, семантическое моделирование, целевая функция, таксономия, кластеризация, классификация.

N.K. TIMOFEEVA

International Scientific Training Cente for Information Technologses and Systems

SEMANTIC MODELING AND COMBINATORIAL OPTIMIZATION

For the intellectualization of database systems is used semantic modeling, which allows you to define the essence of a given object more deeply. It consists in the fact that the object (essence) must be covered with signs, which characterize it as much as possible. In this case arises a covering problem which applies to the problems of combinatorial optimization. The argument of the target function in it is a partition n -element set on a subset. The coverage of objects by certain signs is carried out in such a way that they completely cover it. These signs can characterize both one object and several. Among them you can select solvable problems and insoluble ones. The essence of this problem is this: it is necessary to find a partition n -element set on a subset in which a given object

is maximally covered by the minimum number of signs when the condition is fulfilled, namely: the number of the same elements in different clusters must be minimal. The paper presents the mathematical model of this problem.

In addition to the problem of covering by appropriate signs of a given object, it is necessary to conduct its search in the database. At the same time, it is necessary to solve such combinatorial optimization problems as classification and clustering. Search in the database of information is carried out in two ways, namely: on certain signs, which are described by the input data, one or more objects are looking for, or the object is compared with one or more standards, the search object is set. The problem of finding the necessary information is divided into two subproblems: the search for information in the database and comparison of the input information with the standard. The objective function in it depends on two variables.

The problem of finding information in databases is regular and refers to NP-full. To find the optimal result in real time proposed approach, which allows you to solve this problem to solvable.

Keywords combinatorial optimization, semantic modeling, objective function, taxonomy, clusterization, classification.

Постановка проблеми

У теори моделювання даних при реальному проектуванш структури бази даних застосовуеться метод, який названо семантичним моделюванням. Вш являе собою моделювання структури даних,

спираючись на 1хнш змют, що важливо для iнтелектyалiзацil рiзних систем. яке дозволяе визначати глибше сутшсть певного об'екта. При цьому виникають задачi комбшаторно1 оптимiзацil, виявлення яких дозволяе пояснити природу цих задач та для 1хнього розв'язання використовувати модифшацш ввдомих методiв та алгоритмiв комбшаторно! оптишзаци.

Анaлiз останшх дослiджень та публжацш

Iснyючi системи баз даних зазвичай володiють досить обмеженими ведомостями про семантичш характеристики даних, яш в них зберiгаються. Найчастiше вони дозволяють лише манiпyлювати даними певних простих типiв [1-2]. Бiльш складна штерпретащя покладаеться на користувача. Для iнтелектyалiзацil системи необхiдно розширювати обсяг знань ll бази та шдтримувати високорiвневi iнтерфейси користувача. З щею метою використовують семантичне моделювання, яке дозволяе визначати глибше сутшсть певного об'екта. Воно полягае в максимальному визначенш семантичних ознак, якими вш описуеться.

Як iнстрyмент семантичного моделювання використовуються рiзнi варiанти дiаграм сутшсть-зв'язок або ER-дiаграми [1, 3]. Для адекватного застосування моделi "cyтнiсть-зв'язок" створюються рiзнi математичнi моделi, формулювання яких базуеться на основi таких математичних понять як теорiя множин, теорiя решiток, теорiя графiв. Тип сутносл iнтерпретyеться як множина, а сутшсть - як елемент ще1 множини. Модель "сyтнiсть - зв'язок" - це модель даних, яка використовуеться при проектуванш рiзноманiтних моделей (шформацшних систем, баз даних, архiтектyр комп'ютерних додатк1в та iнших систем). Дана модель грунтуеться на деяк1й важливш семантичнiй шформаци про реальний свгг. Концептуальна модель даних, спроектована засобами модел1 "сутшсть - зв'язок", складаеться з документаци до модел1, в яшй вiдображенi основнi об'екти та !х властивостi.

Мета дослiдження

Для розв'язання поставлено1 задачi необхiдно провести аналiз семантичного моделювання та видшити задачi комбшаторно1 оптишзаци, якi тут виникають. Розв'язання видшених задач в рамках теорп комбшаторно1 оптишзаци в подальшому дозволить досить строго описати пердметну область. Оск1льки задачi пошуку шформаци в базах даних - перебiрнi i вiдносяться до NP -повних, то для знаходження оптимального результату в реальному чай запропонований шдхвд дозволяе зводити нерозв'язнi задачi до розв' язних.

Викладення основного мaтерiaлу дослщження

Семантичне моделювання та зaдaчi комбшаторноТ оптимiзaщi. Семантичне моделювання являе собою моделювання структури даних, спираючись на змют цих даних. Одним iз способiв представлення знань е семантична мережа, яка являе собою шформацшну модель предметно1 областi, що мае вигляд орiентованого графа. Об'ектами можуть бути поняття, поди, властивостi, процеси.

Семантичне моделювання формал1зуе як поняття моделей "сутшсть - зв'язок", в яких видiляють: слабк та сильш типи сутностей, слабк1 та сильш типи зв'язк1в, типи сутностей суперклас, тдклас та категорiя, обмеження кардинальносп типiв зв'язк1в, обмеження yчастi та неперетину, що накладаються на типи сутностей суперклас та тдклас, бшарних та багатостороншх типiв зв'язк1в. Тип сутносп iнтерпретyеться як множина, а сутшсть - як елемент ще1 множини. Тобто, семантичне моделювання полягае в тому, що предмет (сутшсть) необхщно покрити певними ознаками, яш його максимально характеризуют В цьому разi виникае задача покриття, яка вщноситься до задач комбiнаторноl ошгашзацп.

При пошуку певного об'екта в базi даних також виникають задачi комбiнаторноl оптимiзацil, як1 наведемо нижче. Мае мiсце два типи задач: пошук об'екта проводиться в базi даних за ознаками, як1 задаються як вхiднi данi, та пошук проводиться за вхщним об'ектом, для якого шляхом порiвняння знаходиться вщповщний еталон.

Оск1льки оговоренi задачi ввдносяться до задач комбiнаторноl оптимiзацil розглянемо 1хню загальну математичну постановку.

Загальна математична постановка зaдaчi комбiнaторноl оптимiзaцil. Задачi комбшаторно1 оптимiзацil, як правило, задаються на однш або к1лькох множинах, наприклад A = (oi,...,an} та B = (¿>i,...,b~}, елементи яких мають будь-яку природу [4]. Назвемо щ множини базовими. Наявш два типи задач. В першому тиш кожну з цих множин подамо у виглядi графа, вершинами якого е ll елементи, а кожному ребру поставлено у ввдповщшсть число cit е R, яке називають вагою ребра (R - множина дшсних чисел); l е (1,...,n}, t е (1,..., n} , n - шльшсть елементiв множини A, n - к1льк1сть елеменпв множини B . Покладемо, що n = n . Мгж елементами цих множин iснyють зв'язки, числове значения яких назвемо вагами. Величини cit е R назвемо exidHUMu даними i задамо !х матрицями. В другому типi задач мгж елементами задано1 множини зв'язшв не iснyе, а вагами е числа Vj е R, j е (1,..., n}, яким у

ввдповвдшсть поставлено деяш властивостi цих елементiв, числовi значення яких задаються ск1нченними посл!довностями, що також е вхвдними даними. Щ величини визначають значення цiльовоl функци.

Для обох тишв задач iз елеменпв одше! або к1лькох базових множин, наприклад а1 е А, I е {1,..., п}, утворюеться комбiнаторна множина Ж - сукупшсть комбiнаторних конфiгурацiй певного типу

(перестановки, вибiрки рiзних типiв, розбиття тощо). На елементах м комбшаторно! множини Ж

*

вводиться цшьова функцiя Г(м). Необхвдно знайти елемент м множини Ж, для якого Г(м) набувае екстремального значення при виконанш заданих обмежень.

Пiд комбiнаторною конфцуращею розумiемо будь-яку сукупнiсть елементiв, яка утворюеться з уах або з деяких елеменпв задано! базово! множини А = {,..., ап} [4]. Позначимо 11 впорядкованою

множиною = (шк,...,), де пе{1,..,п} - к1льк1сть елементiв у , Ж = {мк- множина

комбiнаторних конфiгурацiй. Верхнш iндекс к (к е{1,..., д}) у м>к позначае порядковий номер м>к у Ж ,

д - кiлькiсть у Ж.

Означення 1. Рекурентним комбiнаторним оператором назвемо сукупшсть правил, за якими з

елеменпв базово! множини А утворюеться комбшаторна конфiгурацiя м>к.

Рiзноманiтнi типи комбшаторних конфiгурацiй утворюються за допомогою трьох рекурентних комбiнаторних операторiв: вибирання, транспозицiя, арифметичний.

Справедливiсть цього твердження випливае з аналiзу комбiнаторних конф^рацш. Найпростiшi вiдомi комбiнаторнi конфiгурацi!. так! перестановки, вибiрки, розбиття натурального числа, розбиття п -елементно! множини А на шдмножини, бiнарнi послiдовностi, блок-схеми, графи тощо.

Для !хнього позначення використовуемо м>к е Ж або символи, що описанi в класичнш лiтературi. Нижче наведемо лише п, як1 мають мiсце в семантичному моделюваннi.

Вибiрки. З поняттям вибiрки пов'язують як саму операцш видшення пвдмножин задано! множини, так i !! результат: вибрану пiдмножину. В подальшому маемо на увазi друге поняття. Нехай задано базову множину А = {а1 ,..., ап}. З не! одержимо п -вибiрку. Число п називають об'емом вибiрки. В п -вибiрках в залежностi в1д умов задачi або ураховуеться порядок розташування в них елементiв (тодi !х називають п -перестановками або п -розмiщеннями) або не ураховують. У цьому разi вони називаються п -сполученнями.

Оскiльки потужнiсть множини неупорядкованих вибiрок без повторень дорiвнюе 2п, то Г! порiвнюють з бiнарними послвдовностями.

Отже, юнують такi типи вибiрок: упорядкованi та неупорядковаш Неупорядкованi - це сполучення без повторень i з повтореннями. Упорядкованi - це розмiщення з повтореннями та без повторень.

Осшльки будь-яка вибiрка утворюеться вибиранням вщповвдних елементiв iз базово! множини

А = {а1 ,..., ап}, то цю операцш назвемо операцiею вибирання i позначимо !! а(А0), А0 с А .

Сполучення як з повтореннями, так i без повторень утворюються единою операщею - вибиранням.

Розбиття п -елементног множини А на пiдмножини. Розбиттям п -елементно! множини А на п

щдмножин (кластерiв) назвемо множину тдмножин р = (р1 ,..., Рп) таку, що Р1 и ... и Рп = А , ру П Р1 = 0, j ^ I, Ру , ], I е{1,..., п} . Непуста тдмножина ру = {а1,..., а^ }, а5 е А, 5 е{1,..., п}, може мати в1д 1 до п елементiв (у е{1,..., п} ). Кшьшсть пiдмножин ру у розбитп р також може бути в1д 1 до п (пе{1,..., п}). 1хню множину позначимо © .

Нескладно помггити, що при генеруваннi множини © у деяких р елементи змiнюють порядок !хнього слiдування, тобто для утворення розбитпв ре© необхвдно, кр1м арифметичного рекурентного комбiнаторного оператора використовувати i транспозицiю.

Таким чином, розбиття р у множит © утворюеться двома рекурентними комбшаторними операторами: або арифметичним або транспозищею.

Комбiнаторнi конф^рацп м>к i ^, як1 складаються з кластерiв (пвдмножин рк , рк ) назвемо

к • к ■ г •• • к к

тотожними, якщо к1льк1сть ру i р1 у них однакова i для будь-яко! шдмножини ру с м можна знайти у множинi ^ тдмножину р^ , яка не в!др!зняеться в1д рк н1 кшькютю елементiв н1 самими елементами.

гт к г • •• • к • г

Якщо порядок елеменпв у м та м при визначеннi !хньо! тотожносп не ураховуеться, то м i м

тотожн1.

к г ■ к г 1 к , п ¡1

!, якщо п = п ! му = ^ для у = 1, г) , t е{1,...,п}.

Означення 2. Двi нетотожш комбшаторш конф^рацп wk i wi назвемо iзоморфними, якщо

k г П =п .

Означення 3. Пвдмножину Ж^ с Ж назвемо пiдмножиною iзоморфних комбiнаторних

конфiгурацiй, якщо и елементи - iзоморфнi комбiнаторнi конфцураци.

Множина Ж складаеться з пвдмножин iзоморфних комбiнаторних конфiгурацiй Ж^ .

Зауваження. Осшльки операцiя транспозици змiнюе лише порядок слщування елементiв у wk е Ж, то множина перестановок Ж е множиною iзоморфних комбiнаторних конфiгурацiй.

Задача покриття об'сктш певними ознаками. При семантичному моделюванш виникае задача максимального покриття об'екта певними ознаками, як його характеризуют Ознаки роздiляються на так1, як характеризують лише заданий об'ект, за якими досить просто його визначити в базi даних. В цьому випадку задача е розв'язною. Якщо однаковi ознаки описують рiзнi об'екти, але за допомогою диференщального анатзу можна знайти потрiбний об'ект, то така задача е частково розв'язною. Якщо одш i тi ж ознаки характеризують рiзнi об'екти i за ними не можна вдентиф^вати пошукуваний, то виникае ситуацiя невизначеносл. В цьому разi для розв'язання поставлено! задачi необхiдно уводити додатковi умови або розробляти iншi правила пошуку.

Розглянемо детальнiше задачу покриття заданими ознаками певного об'екту. Змоделювавши И в рамках теорп комбшаторно! оптимiзацi! можна побачити, що вона вщноситься до задач розбиття, аргументом цшьово! функци в як1й е розбиття п -елементно! множини А на пвдмножини як з повторениями так i без повторень.

Нехай задано базу даних з об'ектами рiзно! природи. Позначимо !х множиною А. Також задано ознаки, яш характеризують щ об'екти. Позначимо !х множиною В. Видшимо так1 пiдзадачi:

• об'екти iз множини А покриваються ознаками iз В так, щоб остаинi не перетиналися.

• об'екти iз множини А покриваються ознаками iз В так, щоб останш повнiстю покривали задаш об'екти. В цьому разi один i той же елемент iз В може характеризувати рiзнi об'екти (ввдноситься до рiзних кластерiв).

Для обох оговорених задач розбиття w еЖ утворюеться з елеменпв ск1нченно1 множини В .

В першш задачi утворенi кластери не перетинаються, тобто Wp П Wl = 0. Задача полягае в

*

знаходженш такого розбиття w еЖ , при якому об'ект максимально покриваеться мшмальною кiлькiстю ознак.

У другш задачi утворенi кластери перетинаються, тобто Wp П Wl Ф0. Необх1дно мiнiмiзувати

к1льк1сть ознак, яш характеризують вибраиi об'екти так, щоб вони повнютю 1х покривали, а шльшсть однакових у рiзних кластерах елементiв була б мшмальною.

*

Оговорена задача полягае в знаходженш такого розбиття w еЖ , при якому об'ект максимально покриваеться мшмальною шльшстю ознак при виконанш умови, а саме: шльшсть однакових у рiзних кластерах елеменпв була б мiнiмальною.

В обох задачах цшьова функцiя оптимiзуеться за двома критерiями. При цьому виникае проблема мшмаксу (максимiну).

Оц1мка складноси розв'язання задач штучного iнтелекту. Оцшка ефективностi розв'язку з урахуванням вибраних критерив у перебiрних задачах проводиться за обчислювальною складнiстю, яка полягае у визначенш кiлькостi операцiй, затрачених на розв'язання певно! задачi. В цьому разi глобальний розв'язок теоретично юнуе та може знаходитися або полiномiально або експоненцiально. Але в штучному штелекп задачi характеризуються нечггшстю вхiдних даних та крiм шлькосп операцiй, затрачених на знаходження глобального розв'язку, необхщно ураховувати мiри подiбностi, якi тут вiдiграють основну роль i вiд вибору яких в значнш мiрi залежить сам розв'язок. В цьому разi при знаходженш глобального розв'язку виникае ситуащя невизначеносп рiзноl природи.

За способом визначення складностi розв'язання задач роздiлимо !х на так1 типи: 1) задач^ в яких вхiднi даиi задано в шльшсному вимiрi, а оцшка обчислювально! складностi проводиться за шльшстю затрачених на знаходження глобального розв'язку операцш; 2) задачi, вхiднi даш в яких задано у яшсному значеннi, а оцiнка обчислювально! складносп проводиться як за кiлькiстю затрачених на знаходження глобального розв'язку операцш так i за способом оцшки якосп розв'язку.

Складнiсть розв'язання задач штучного штелекту полягае в тому, що одш i тi ж саш ознаки можуть характеризувати рiзнi об'екти. Якщо певнi ознаки характеризують один i той же об'ект, то мiра подiбностi

g+(х,у) = 1, де х- об'ект, який необхщно розпiзнати, у - еталонний об'ект. В цьому разi задача е розв'язною як за ознакою подiбностi так i за структурою вхщних даних. Вважатимемо, що вони утворюють

щдкласи розв'язнт зaдaч y штучному штелекл. Якщо одш i ri ж ознaки описують рiзнi об^кти, то мiрa подiбносгi gj(x,y) e {x,...,0}, де x - знaчення мiри подiбностi, при як1й можливий допустимий розв'язок.

Якщо g (x, y) = 0, то зaдaчa e нерозв'язною внаслщок виникнення ситyaцiï невизнaченостi. До того ж зaдaчa пошуку певного об'eктa в бaзi дaниx повним перебором e NP -повна. Але вонa CTae полiномiaльно розв'язною, якщо зa певними ознaкaми проведено стрyктyризaцiю бiблiотеки етaлонниx ознaк, як1 xaрaктеризyють зaдaнi об^кти.

Змходження об'eктiв у бaзi дaних зa зaдaними ознaкaми. Необxiдний об^кт у бaзi дaниx можнa знaxодити зa зaдaними ознaкaми, якi його описують, aбо зa сaмим об^ктом. Побyдyeмо мaтемaтичнy модель зaдaчi пошуку об^кпв у бaзi дaниx зa ознaкaми, якi ïx xaрaктеризyють, з використанням теорй' комбiнaторноï оптимiзaцiï. Позначимо A = {ai,..., an ) множину об'eктiв, описання якт знaxодиться в бaзi дaниx (множина еталошв), де елемент as e A, s e {i,...,n}, вiдповiдae певному об'eктy, якому поставлено у

вщповвдшсть xaрaктернi його ознаки V(t) = (v(t), v2t),..., v(^)), qt - к1льк1сть ознак t -го об^кта. Вxiдною

i 2 qt

шформа^ю в цiй зaдaчi e множина ознак V = (vi, v2,..., v~), що може описувати один або шлька рiзниx

*

об'eктiв. Позначимо ïx B = {¿i,...,¿n*}, де Ьа e B - об^кт, який потрiбно визначити, n - кльюстъ можливиx об'eктiв, a qt > ~ . Ознаки ~r eV вxiдноï iнформaцiï мають той же змют, що i етaлоннi ознаки

v() eV(t), r e {i,...,q} , l e{i,...,qt} , ae {i,...,n }. Може бути ситуащя, коли в бiблiотецi етaлонiв ввдсутнш об'eкт, ознаки якого поступають iз вxiдною iнфомaцieю.

Задача полягae у знaxодженнi для B iз множиною ознак V нaйбiльш прaвдоподiбного одного або кiлькоx етaлонiв iз множини A = {ai,...,an), тобто за вxiдними ознаками встановлюeться один або калька об^кпв Ьа e B . Ознаки в цш зaдaчi вiдiгрaють роль критерив, за якими оцiнюeться ïï розв'язок.

Для розв'язання цieï зaдaчi необxiдно провести пошук певного еталону в бiблiотецi та порiвняти його iз вxiдними ознаками. Тобто, основна задача роздiляeться на двi шдзадач^ Вxiдними даними в нiй e шформац1я, яка постyпae на вxiд, та еталонна iнформaцiя, яка знaxодиться в бiблiотецi. Для встановлення 1\ньо1' подiбностi уводяться мiри подiбностi. В процей розв'язання зaдaчi значення обчислениx мiр подiбностi e вxiдними даними для наступн^ етaпiв пошуку оптимального розв'язку. Вони задаються матрицями, а обидвi зaдaчi зводяться до першого типу. Аргументом цiльовоï функцй' в нт e рiззнi тии вибiрок.

Задача пошуку бiблiотечного еталону, який вiдповiдae вxiдним ознакам, полягae у знaxодженнi такого сполучення без повторень, для якого значення yведениx цшьовт фyнкцiй, за якими оцiнюeться результат розв'язку, були б найбшьшими. Задача порiвняння еталону та вxiдноï шформацп полягae в знaxодженнi такого розмщення без повторень, для яого задана цшьова фyнкцiя також нaбyвae найбшьшого значення.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Як видно з постановки зaдaчi перебору пошук еталону, подiбного до вxiдного V , потребye повного перебору. Цю задачу можна звести до розв'язно1' шляxом структуризацп бiблiотеки етaлонiв за певними ознаками, яш визначають предметну область. Тобто, на етат стрyктyризaцiï бiблiотеки розв'язyeться задача кластеризацй', аргументом цiльовоï функцй' в якш e розбиття n -елементно1' множини на п1дмножини. Вона полягae в розбиттi елементiв зaдaноï множини A на кластери так, щоб змодельована цшьова функщя набувала оптимального значення. Вxiднi дaнi в нш e числове значення мiри подiбностi м1ж певними ознаками, якими e елементи зaдaноï бaзовоï множини.

Розглянемо задачу класифшацп, яка мae мiсце при yтвореннi подiбниx клaстерiв в семантичному моделювaннi. Як правило, в зaдaчi клaсифiкaцiï аргументом цiльовоï фyнкцiï вважають вxiднi дaнi. Але, якщо змоделювати цю задачу в рaмкax теорiï комбiнaторноï оптимiзaцiï, то можна побачити, що вона вщноситься до класу задач розбиття, аргументом цiльовоï фyнкцiï в якиx e розбиття n -елементноï множини A на тдмножини з повтореннями. В зaдaчi клaсифiкaцiï видiлимо так1 шдзадачг

• задано ск1нченну базову множину A . Класи можуть бути як задано так i не задано. Необxiдно розподшити елементи бaзовоï множини по клaсax так, щоб останш не перетиналися. Ця задача зводиться до зaдaчi клaстеризaцiï;

• задано сшнченну базову множину A . Класи можуть бути як задано так i не задано. Елементи множини A розподшяються так, що один елемент може належати рiзним класам. В даному рaзi аргументом цiльовоï фyнкцiï e розбиття n -елементноï множини A на тдмножини з повтореннями;

• задано нескшченну базову множину A, частина елеменпв якоï вiдомa, а частина визнaчaeться в процесi розв'язання задач^ тобто iнформaцiя постyпae в процеа розв'язання зaдaчi та змiнюeться в чaсi.

Аргументом цшьово! функцп в нш е часткове розбиття неск1нченно1 множини A на шдмножини з повтореннями. В цьому pa3i уводиться часткова щльова функцiя та часткове розбиття.

Висновки

Отже, при семантичному моделювaннi виникають зaдaчi комбiнaторноï оптимiзaцiï. Це - задача покриття ознаками певного об'екта, кластеризащя, клaсифiкaцiя, задача встановлення подiбностi еталонного та входного об'ектiв роздшяеться на пiдзaдaчi, В цьому рaзi для ïï розв'язання необхiдно розробляти пбридш алгоритми. Аргументом цшьово1! функци в них е розбиття n ^лемешно)! множини A на шдмножини як з повтореннями, так i без повторень, рiзнi типи вибiрок. Для зведення зaдaчi пошуку шформаци в бaзi даних до розв'язноï за певними ознаками проводиться ïï структуризащя, яка зводиться до зaдaчi клaстеризaцiï.

Список використано!' лiтератури

1. Дейт К. Дж. Введення в системи баз даних, 8-е видання: пер. с англ. / К. Дж. Дейт. - М: Видавничий дiм "Вiльямс", 2005. - 1328 с:

2. Кудрявцев Д.В. Системы управления знаниями и применение онтологий / Д.В. Кудрявцев. - Санкт-Петерб: Политехн. ун-т, 2010. - 340 с.

3. Ольвейструк Л.М. Формaлiзaцiя моделi "сутшсть-зв'язок": типи сутностей, типи зв'язшв та ï\ обмеження: автореф. дис ... канд. фiз-мaт. наук: 01.05.03 - математичне та програмне забезпечення обчислювальних машин та систем. - К., 2009. - 18 с.

4. Тимофiевa Н.К. Теоретико-числовi методи розв'язання задач комбшаторно].' оптишзаци. Автореф. дис... докт. техн. наук. 1н-т кибернетики iм. В.М. Глушкова НАН Украши. - К., 2007. - 32 с.

i Надоели баннеры? Вы всегда можете отключить рекламу.