Научная статья на тему 'Подход к созданию модели управления знаниями на основе методов генетического поиска'

Подход к созданию модели управления знаниями на основе методов генетического поиска Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
242
63
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ИНТЕЛЛЕКТУАЛЬНЫЕ ИНФОРМАЦИОННО-АНАЛИТИЧЕСКИЕ СИСТЕМЫ / СИСТЕМЫ УПРАВЛЕНИЯ ЗНАНИЯМИ / МОДЕЛЬ КОМПЕТЕНЦИЙ / КЛАССИФИКАЦИЯ И КЛАСТЕРИЗАЦИЯ ОБЪЕКТОВ ЗНАНИЙ / ГЕНЕТИЧЕСКИЙ АЛГОРИТМ / МОДЕЛЬ ОНТОЛОГИИ / INTELLIGENT INFORMATION-ANALYTICAL SYSTEMS / KNOWLEDGE MANAGEMENT SYSTEM / COMPETENCY MODEL / CLASSIFICATION AND CLUSTERING OBJECTS OF KNOWLEDGE / GENETIC ALGORITHM / ONTOLOGICAL MODEL

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Бова Виктория Викторовна

Рассматривается новый подход к формированию корпоративных стратегий управления знаниями на основе модели компетенций как актуального метода повышения конкурентноспособности предприятий. Модель компетенций выполняет системообразующую и интегрирующую роль в задачах управления корпоративными знаниями, на ее основе реализуются процедуры оценки, подбора, развития и обучения персонала, работа с кадровым резервом, отдельные аспекты формирования системы мотивации. Рассматриваются проблемы выявления профилей компетентности специалистов, задачи их формализованного описания и формирования на этой основе базы знаний интеллектуальных информационно-аналитических систем предприятий, использующих онтологическую систематизацию как инструмент классификации объектов корпоративных знаний. Описана модель компетенций, интерпретируемая в терминах онтологии предметной области и обладающая способностью к отбору существенных признаков классифицируемых объектов знаний. Разработана модель управления знаниями, основанная на использовании эвристических методов описания и классификации профилей компетентности специалистов. Для решения задач классификации корпоративных знаний применяется метод кластеризации объектов в многомерном пространстве признаков, в котором используется генетический алгоритм, позволяющий получить эффективное решение для классификационной процедуры по нескольким известным критериям. Генетический алгоритм представляет собой итерационный вероятностный эвристический алгоритм поиска, особенностью которого является одновременное использование множества точек поиска (популяции) из пространства потенциальных решений. Преимуществом предложенного подхода является гарантированное отсутствие перекрытия для всех кластеров и отсутствие необходимости априори задавать количество кластеров. Экспериментальные исследования разработанного генетического алгоритма по трем критериям продемонстрированы на тестовых задачах и подтвердили теоретическую значимость и перспективность применения предложенного метода.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Бова Виктория Викторовна

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

APPROACH TO THE CREATION OF KNOWLEDGE MANAGEMENT MODEL BASED ON GENETIC SEARCH METHODS

The article discusses a new approach to the formation of the corporate knowledge management strategy based on the competency model as the current method of increasing the competitiveness of enterprises. Competency Model performs backbone and integrating role in enterprise knowledge management tasks on the basis of its assessment procedures are implemented, selection, development and training, work with the personnel reserve, some aspects of the formation of the system of motivation. The problems of identifying profiles of competence of experts, the problem of formalized description and formation on this basis of the knowledge base of intelligent information-analytical systems of enterprises using ontological ordering of objects as a tool for classification of corporate knowledge. The model of competencies, interpreted in terms of the domain ontology and having the ability for the selection of the essential features of classified objects of knowledge. A knowledge management model based on the use of heuristic methods of description and classification of experts competence profiles. To solve the problems of classification of corporate knowledge objects used clustering method in the multidimensional space of attributes, which uses a genetic algorithm to obtain an effective solution for the classification procedure for several well-known criteria. A genetic algorithm is an iterative probabilistic heuristic search algorithm feature is the simultaneous use of multiple search points (population) in the space of potential solutions. The advantage of this approach is the lack of a guaranteed ceiling for all clusters and there is no need to set a priori the number of clusters. Experimental studies have developed a genetic algorithm based on three criteria are shown in the test problems and confirmed the theoretical significance and application prospects of the proposed method.

Текст научной работы на тему «Подход к созданию модели управления знаниями на основе методов генетического поиска»

Раздел II. Управление знаниями

УДК 004.822

В.В. Бова

ПОДХОД К СОЗДАНИЮ МОДЕЛИ УПРАВЛЕНИЯ ЗНАНИЯМИ НА ОСНОВЕ МЕТОДОВ ГЕНЕТИЧЕСКОГО ПОИСКА*

Рассматривается новый подход к формированию корпоративных стратегий управления знаниями на основе модели компетенций как актуального метода повышения конкурентноспособности предприятий. Модель компетенций выполняет системообразующую и интегрирующую роль в задачах управления корпоративными знаниями, на ее основе реализуются процедуры оценки, подбора, развития и обучения персонала, работа с кадровым резервом, отдельные аспекты формирования системы мотивации. Рассматриваются проблемы выявления профилей компетентности специалистов, задачи их формализованного описания и формирования на этой основе базы знаний интеллектуальных информационно-аналитических систем предприятий, использующих онтологическую систематизацию как инструмент классификации объектов корпоративных знаний. Описана модель компетенций, интерпретируемая в терминах онтологии предметной области и обладающая способностью к отбору существенных признаков классифицируемых объектов знаний. Разработана модель управления знаниями, основанная на использовании эвристических методов описания и классификации профилей компетентности специалистов. Для решения задач классификации корпоративных знаний применяется метод кластеризации объектов в многомерном пространстве признаков, в котором используется генетический алгоритм, позволяющий получить эффективное решение для классификационной процедуры по нескольким известным критериям. Генетический алгоритм представляет собой итерационный вероятностный эвристический алгоритм поиска, особенностью которого является одновременное использование множества точек поиска (популяции) из пространства потенциальных решений. Преимуществом предложенного подхода является гарантированное отсутствие перекрытия для всех кластеров и отсутствие необходимости априори задавать количество кластеров. Экспериментальные исследования разработанного генетического алгоритма по трем критериям продемонстрированы на тестовых задачах и подтвердили теоретическую значимость и перспективность применения предложенного метода.

Интеллектуальные информационно-аналитические системы; системы управления знаниями; модель компетенций; классификация и кластеризация объектов знаний; генетический алгоритм; модель онтологии.

V.V. Bova

APPROACH TO THE CREATION OF KNOWLEDGE MANAGEMENT MODEL BASED ON GENETIC SEARCH METHODS

The article discusses a new approach to the formation of the corporate knowledge management strategy based on the competency model as the current method of increasing the competitiveness of enterprises. Competency Model performs backbone and integrating role in enterprise knowledge management tasks on the basis of its assessment procedures are implemented, selection, development and training, work with the personnel reserve, some aspects of the formation of the system of motivation. The problems of identifying profiles of competence of experts, the prob-

* Исследование выполнено за счет гранта Российского научного фонда (проект № 14-11-00242) в Южном федеральном университете.

lem offormalized description and formation on this basis of the knowledge base of intelligent information-analytical systems of enterprises using ontological ordering of objects as a tool for classification of corporate knowledge. The model of competencies, interpreted in terms of the domain ontology and having the ability for the selection of the essential features of classified objects of knowledge. A knowledge management model based on the use of heuristic methods of description and classification of experts competence profiles. To solve the problems of classification of corporate knowledge objects used clustering method in the multidimensional space of attributes, which uses a genetic algorithm to obtain an effective solution for the classification procedure for several well-known criteria. A genetic algorithm is an iterative probabilistic heuristic search algorithm feature is the simultaneous use of multiple search points (population) in the space ofpoten-tial solutions. The advantage of this approach is the lack of a guaranteed ceiling for all clusters and there is no need to set a priori the number of clusters. Experimental studies have developed a genetic algorithm based on three criteria are shown in the test problems and confirmed the theoretical significance and application prospects of the proposed method.

Intelligent information-analytical systems; knowledge management system; competency model; classification and clustering objects of knowledge; genetic algorithm; the ontological model.

Введение. Технологии управления знаниями сегодня рассматриваются как мощное конкурентное преимущество в организациях (предприятиях, компаниях), ориентированных на постоянные изменения деловых процессов. Эффективность функционирования которых может быть достигнута трансформацией имеющейся в их распоряжении информации в знания [1-4]. Таким образом, чтобы обратить на пользу предприятию всю имеющуюся у него информацию, опыт и квалификацию сотрудников, повысить качество принимаемых решений и сократить время реакции на меняющиеся рыночные условия, необходимо создание единой информационной среды поддержки жизненного цикла знаний организации и целостной модели знаний специалиста для решения задач управления знаниями в корпоративных информационно-аналитических системах (КИАС).

Несмотря на большой объем публикаций по системам управления знаниями (СУЗ), их проблематика посвящена в основном разработке инструментальных средств и технологий, реализующих определенные функции и сервисы в операциях с информацией и знаниями [1-5]. Результатов исследований, посвященных научному обоснованию корпоративных стратегий управления знаниям, обеспечивающих вовлечение в бизнес-процессы организации не только явных, но и неявных (скрытых) знаний специалистов пока недостаточно. В условиях современной экономики неявные знания являются стратегическим и интеллектуальным ресурсом организаций, но все еще слабо использующихся в задачах управления знаниями КИАС [6-8].

Одной из ключевых проблем вовлечения в бизнес процессы организаций значительных ресурсов неявных знаний, является проблема выявления профилей компетентности специалистов, их формализованного описания и формирования на этой основе соответствующей базы знаний (БЗ) СУЗ. В связи с этим актуальной является разработка модели управления знаниями, основанной на использовании эвристических методов описания и классификации профилей компетентности специалистов в многомерном пространстве признаков корпоративных компетенций КИАС. Сложность модели выбирается, исходя из необходимой ее выразительной возможности и заданного набора семантических зависимостей.

Анализ и формулировка проблемы исследования. Широкое проникновение компетентностного подхода в бизнес-среде диктует необходимость построения структурно-информационных моделей управления знаниями в КИАС, главным компонентом которых является БЗ моделей компетенций. Многие успешные организации применяют модель компетенций для интеграции стратегических задач корпоративных стратегий и тактическую работу со специалистами средствами унификации требований к компетенциям сотрудников [2, 6-8]. В результате ана-

лиза функций и свойств моделей компетентности специалистов [9], можно выделить основные задачи, в которых модель компетенций и ее моделирование может быть полезно для совершенствования функциональности СУЗ (рис. 1).

Рис. 1. Задачи, решаемые с использованием моделей специалистов в КИАС

Компетенция - термин предметной области субъекта труда, обладающий поведением в пространстве, образованном тремя векторами [6-9]: 1) качества человека (личности), формируемые под влиянием деятельности, но распространяющиеся на личность в целом; 2) содержание деятельности, в которой проявляются качества личности; 3) состояния признания (оценки) качества деятельности. Поведение компетенции представляет собой последовательное изменение ее свойств через процессы взаимного влияния качеств личности и содержания деятельности - траекторию развития компетенции. Таким образом, описание требований к поведению специалистов с помощью моделирования компетенций, их описания и выявления индикаторов поведения - это инструмент, который может применяться во всех областях знаний, где требуется работать с неявными знаниями в рамках корпоративной стратегии управления знаниями [4, 8-10].

Корпоративная модель знаний включает в себя следующие элементы (рис. 2):

♦ кластеры компетенций - наборы тесно связанных между собой корпоративных компетенций;

♦ таксономии корпоративных компетенций;

♦ профили компетентности специалистов, выделенные под конкретные роли пользователей для выполнения ряда практических задач управления знаниями;

♦ индикаторы поведения.

Корпоративные стратегии

Модель объектов корпоративных знаний

Репозиторий БЗ

Таксономии компетенций

Модели компетенций

Семантические метаданные профилей компетентности

Рис. 2. Модель корпоративной стратегии управления знаниями

Одной из важных задач построения таких моделей является обеспечение их семантической функциональности (интероперабельности) как в рамках самой модели СУЗ (информационная система предприятия), так и при взаимодействии с внешними моделями (отраслевые или корпоративные информационные системы). Наиболее перспективным подходом к созданию корпоративных моделей знаний являются семантические технологии [3, 5, 11-15].

Использование методов онтологического моделирования позволяет конкретизировать модель компетенции [12, 13] и предоставляет возможность использовать модель при решении ряда прикладных задач КИАС. Онтологическая модель объектов корпоративных знаний состоит из словаря терминов таксономии компетенций, модели корпоративных знаний в проекции конкретной компетенции и семантических метаданных профиля компетентности специалиста.

В качестве модели компетентности специалиста, представленной на рис. 3 принимается следующий набор показателей МБ = {0,К,Р}, где О — общие характеристики специалиста; 1\ показатели компетентности специалиста в соответствующих областях знаний организации; Р — характеристики поведения специалиста в СУЗ.

Рис. 3. Модель профиля компетентности специалиста

Общая характеристика специалиста включает декларативные данные о пользователе.

Компетентность специалиста К = {Ко, Кс}, включает показатели компетентности специалиста (квалификацию, навыки, опыт) по областям знаний Ко и их семантическое описание Кс на основе онтологий областей знаний; Ко = {(01, к), ... , (0п, кп)}, где (О, к) - область знания г и уровень компетентности специалиста в этой области знаний; Кс - описание специалиста в виде набора семантических метаданных.

Под семантическими метаданными понимаются данные, описывающие контекст и/или содержание объекта в БЗ СУЗ с помощью понятий предметной области, определенных на языке описания онтологии [3]. Семантические метаданные для специалиста ^ можно определить, как конечное множество, упорядоченных пар (е^к.т.е. MetaD(si) = {(сг1,кг1), ... , (сгп,кгп)}, где спп ЕС - понятие

онтологии, относящееся к объекту описания я,; кп Е [0,1] - коэффициент, обозначающий релевантность понятия спп объекту

Поведение специалиста в КИАС - понятие, которое описывает некоторые характеристики взаимодействия специалиста с СУЗ. Для начала предлагается описывать поведение специалиста в СУЗ двумя параметрами Р = (Я, 2}, где Я, - роль для выполнения конкретного набора задач, которые соответствуют квалификации конкретного специалиста; 2, - практические задачи, составляющие бизнес-процесс СУЗ.

Моделирование профилей компетентности и формирование на этой основе БЗ СУЗ имеет существенное значение для решения проблемы повышения эффективности реализации стратегий управления знаниями в КИАС [2, 8].

Постановка задачи. В настоящее время построению корпоративных систем управления знаниями на основе моделей компетенций отводится немаловажная роль в политике управления персоналом современных организаций. В одних компаниях профили компетенций используются в качестве прикладных инструментов конкретных HR-функций, а в других - система прописанных компетенций является ключевой в задачах управления знаниями организации [6]. Так как при группировке компетенций, требуемых для выполнения бизнес-процессов заранее неизвестно, в какие именно группы должны быть объединены эти компетенции, то задача их классификации сводится к задаче кластеризации.

Кластеры компетенций - модели компетенций, организованные в группы на основе базового намерения (интенции) [16]. Каждая компетенция - это набор родственных поведенческих индикаторов, объединенных в блоки в зависимости от смыслового объема компетенции.

Задача кластеризации заключается в определении групп объектов, которые являются наиболее близкими один к другому по некоторому критерию. При этом никаких предварительных предположений об их структуре, как правило, не делается. Задаче кластеризации сопутствуют две проблемы: определение оптимального количества кластеров и получение их центров и границ. Исходными данными для постановки задачи кластеризации являются значения параметров (признаков) объектов исследования и отыскании способа принятия оптимального решения о принадлежности проверяемого экземпляра к тому или иному классу в условиях неопределенности, т.е. в условиях действия случайных факторов, маскирующих связь между признаками и классом экземпляра [16]. В связи со сказанным выше представляет интерес применение методов решения задач кластеризации, основанных на эвристических алгоритмах [17-19].

Кластеризацию можно рассмотреть как задачу построения оптимального разбиения объектов на группы [20]. При этом оптимальность может быть определена как требование максимизации плотности кластеров или минимизации среднеквадратичного расстояния между центром кластера и всеми его объектами:

/ = ! I г! I е з ^ (ВД) , (1)

где I - номер кластера (I = 1,2,...к); X - центр 1-го кластера; X - вектор значений переменных для /-го объекта, входящего в 1-й кластер; d (X Ь,Х{) - расстояние между 1-м объектом и центром 1-го кластера.

Формализуем постановку задачи. Представим модель компетенций пользователя как и=<¥, К>, где V/ (и) = {(/;, w¡(и),((2, ^(и),..., (/п, wn(u)} - векторное пространство модели знаний специалиста, включающее и - термин компетенции в модели, wi - соответствующий вес и; Я (и) = {(г , q (и),(г # (и),..., (г (и)} - роли пользователя при решении конкретных задач г, поддерживаемые бизнес процессами ^ - индикатор компетенции для поддержки определенной роли; К/ - кластеры модели компетенций.

Представим (и) точкой в п-мерном пространстве терминов. Для каждого

термина рассчитывается его вес wi, т.е. для каждого ^ мы можем определить его координату, состоящую из частот встречаемости терминов компетенции в роли пользователя при решении конкретных задач. Координатными осями в данном случае выступают термины. Число их определяется числом терминов, по которым проводится взвешивание, т.е. каждому ti в роли Яг ставится в соответствие некоторый неотрицательный вес Wi и д - индикатор (степень соответствия) компетенции для поддержки определенной роли.

ИИ = ' (2)

где 8' - коэффициент пропорциональности частоте встречаемости термина компетенции ^ в роли пользователя, N - общее количество определяемых задач с ti для роли Яг, пг - номер задачи гг в которой требуется компетенция ti.

в1 = (3)

где У1( С/) = К/, В/ - показатели экспертной оценки иг сотрудника на Яг роль по ti компетенции. Вектор К' = (К,..., К',..., К'), К'е [0,1] - нормированный показатель, определяющий коэффициент важности ^ компетенции для Яг роли. Вектор В/ = (В[, ...,В/,. . .,Вп), В/е [0,1] - нормированный показатель, определяющий баллы полученные в результате экспертного анкетирования иг сотрудника по ^ компетенции.

Термин компетенции представляется точкой в п-мерном пространстве. В каждый кластер входит какое-то количество терминов. Для определения центра кластера №1, предполагаем, что центр - это первый термин.

Рассчитываем сумму расстояний от него до всех остальных терминов, входящих в кластер №1. Сохранив полученную величину, предполагаем, что второй термин из кластера №1 - это центр. Рассчитываем сумму расстояний для него. Сохраняем результат. Проделываем то же самое для каждого термина, представленного в хромосоме и входящего в кластер №1. Тот объект, для которого сумма расстояний до всех остальных терминов выборки будет минимальной, признается центром кластера №1. Аналогично находятся центры остальных кластеров.

В рассматриваемой задаче целевая функция (1) является мультимодальной (многоэкстремальной), поэтому предпочтительно выбрать адаптивный метод случайного поиска с помощью генетического алгоритма (ГА), который позволяет эффективно находить квазиоптимальные решения для полиномиальное время [17-19]. Процесс генетического поиска (рис. 4) заключается в последовательном преобразовании одного конечного множества альтернативных решений в другое, используя для этого механизмы и принципы генетики и эволюции живой природы [18].

Целью работы является разработка эвристического метода кластеризации, основанного на применении ГА и отвечающего следующим требованиям.

1. Метод должен работать с метрическим пространством признаков достаточно большой размерности.

2. Алгоритм, построенный по данному методу, должен быть достаточно простым в реализации и потреблять минимум ресурсов.

3. Участие пользователя в процессе кластеризации должно сводится к минимуму.

Рис. 4. Схема генетического поиска

3. Эвристический метод построения модели компетенций на основе ГА.

Далее рассмотрим стратегию адаптации ГА к задаче кластеризации. Гипотеза данного исследования заключается в том, что увеличить скорость поиска глобального экстремума можно за счет усиления изменчивости популяции с одной стороны и интенсификации процесса отбора лидеров с другой стороны.

Представим задачу кластеризации в терминах эволюционных вычислений. Рассмотрим ГА, работающий с популяцией, каждая их хромосом которой представляет собой возможное решение данной задачи. В нашем случае решение - это разбиение неупорядоченного набора компетенций специалистов на кластеры, определяющие профиль компетентности и релевантный список поведенческих индикаторов (ролей), необходимых для успешного решения задач управления корпоративными знаниями.

Для того чтобы применить ГА в качестве метода решения задачи кластеризации, должны быть определены следующие элементы алгоритма [17]:

♦ способ кодировки решения (хромосомы);

♦ функция оптимальности (оценки) каждой хромосомы;

♦ содержание операторов отбора (селекции), рекомбинации и мутации;

♦ условие завершения эволюции;

♦ вероятностные параметры управления сходимостью эволюции.

Хромосома представляет собой массив (вектор компетенций специалиста,

поведение - роль, кластер). Длина такого массива всегда будет такой, сколько корпоративных компетенций требуется разбить на кластеры. Эта информация представлена в БД моделей компетенций (рис. 2) идентификатором компетенции и номером кластера. Соответственно, если стоит задача разбить набор компетенций на L кластеров, то его значения варьируются от 1 до K.

Генерация альтернативных решений P производится на основе инициализации хромосом. Хромосома особи содержит в закодированном виде (или в виде массива чисел с плавающей точкой) значения пороговых коэффициентов модели компетенций пользователей U.

Каждая хромосома оценивается мерой ее «приспособленности» (fitness-function - FF). FF для каждой хромосомы определяется суммой евклидовых расстояний от каждого термина до центра соответствующего кластера и рассчитывается по формуле:

f = Z ?= ijz Г= 1 2 - (4)

где X - центр 1-го кластера; Xi - координата i-го термина компетенции, k - количество терминов, которое одновременно определяет и длину хромосомы, n - количество координатных осей, по которым формируется общая координата термина.

Наиболее приспособленные особи получают большую возможность участвовать в воспроизводстве потомства. После того, как для каждой хромосомы получено значение FF, они упорядочиваются в соответствии с его величиной. В самое начало списка попадают те, мера приспособленности которых наибольшая, в конец - наименьшая. Далее при выборе потенциальных родителей применяется линейно убывающая функция случайного числа.

Пропорциональный отбор (селекция) назначает каждой i-ой хромосоме вероятность P(i), равную отношению ее приспособленности к суммарной приспособленности популяции.

Следующим этапом работы ГА является выполнение оператора кроссингове-ра. Многоточечный кроссинговер в данном случае работает следующим образом. Точка разрыва представляет собой границу между соседними элементами массива (т.е. случайным образом выбирается номер компетенции). Количество их будет на единицу меньше, чем количество генов в хромосоме или количество кластеризуемых объектов. Родительские хромосомы разрываются в этих точках на сегменты. Затем соответствующие сегменты различных родителей склеиваются, и получаются генотипы потомков.

Далее выполняется операция мутации, которая в данной задаче представляет собой обмен двух случайных номеров кластеров. Номера компетенций ti, для которых значения кластеров меняются местами, выбираются случайным образом.

В результате применения генетических операторов получается хромосома, представляющая собой возможный вариант решения. Для принятия решения об остановке алгоритма необходимо провести анализ качества полученных решений оценив их идентичность CSi по критериям плотности cpi (мера компактности - внутри-кластерное расстояние) и сеперабельности spi (межкластерное расстояние) [16].

Не исключено, что в группе полученных решений имеются точки, принадлежащие области одного и того же экстремума. Для сравнения по двум упомянутым критериям требуется выполнить следующие вычисления:

sp¿ = min г [£ iuijeLk d{x^xj)2 ] , (5)

где d (xj,xj) - расстояние между точками - «ближайшими соседями» из кластеров h и lj.

cpt = maxi [£ у 6Lk d {x, Xj)2 ] , (6)

где d ( x^, xj) - расстояние между крайними точками кластера Lk.

CSi = spixcpi. (7)

Таким образом «наихудший» кластер будет иметь наименьшее значение CSi. Для осуществления обратной связи в архитектуре поиска введен блок эволюционной адаптации (БЭА), который на основе взаимодействия с внешней средой (лицом, принимающим решение) управляет процессом поиска и настройкой параметров ГА [16-19]. Он оказывает влияние на переформирование текущей популяции альтернативных решений и создание новой популяции.

4. Экспериментальные исследования. Программная реализация предложенного метода позволила провести его сравнительные испытания на задачах малой и средней размерности. Для сравнения результатов кластеризации по разработанному методу и по методу k-means использовались среднеквадратичное расстояние между центром кластера и всеми его объектами (4), минимальное межкластер-

ное расстояние (5) и максимальное внутрикластерное расстояние (6). В сравниваемых алгоритмах использовались одни и те же метрики признакового пространства модели компетенций и целевая функция.

В результате сравнения результатов автоматической кластеризации, полученной с помощью ГА, с результатами кластеризации, полученной с помощью алгоритма к-тват, были сделаны выводы. При кластеризации с приоритетом точности поиска при малом количестве кластеров существенных преимуществ одного из алгоритмов не наблюдается (рис. 5). При увеличении числа кластеров наблюдается существенное преимущество ГА, что видно из графика (рис. 6).

О.в 0.6 0.4 0,2 О

л

"'"ГА

" Алгоритм Ä-means

7 9 11 t3 15 Кластеры

Рис. 5. Сравнение результатов кластеризации для тестовых задач малой

размерности

Следует добавить, что предлагаемый метод всегда обеспечивает сепарабельность кластеров по всем координатам, что имеет весомое значение при решении задач распознавания.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

ЦФ

0.4 0.35 0.3 0.25 0.2 0.15 0.1 0.05 О

л

Алгоритм К-шеаш

2 1 ■[' С l! Ü 2? .:■! Кластеры

Рис. 6. Сравнение результатов кластеризации для тестовых задач средней

размерности

Отметим также, что преимуществом ГА, как инструмента решения задачи оптимизации, является не только ускорение процесса поиска глобального экстремума, но и за счет усиленной изменчивости возможность избежать стагнации процесса глобального поиска.

Заключение. В статье рассмотрено перспективное направление построения БЗ КИАС, использующих онтологическую систематизацию как инструмент классификации объектов знаний. Предложена модель компетенций, интерпретируемая в терминах онтологии предметной области и обладающая способностью к отбору существенных признаков классифицируемых объектов. Для решения задач классификации корпоративных знаний предложен эвристический метод кластеризации объектов знаний в многомерном пространстве признаков, в котором используется ГА, позволяющий получить эффективное решение для классификационной процедуры по нескольким известным критериям. Преимуществом предложенного подхо-

да является гарантированное отсутствие перекрытия для всех кластеров и отсутствие необходимости априори задавать количество кластеров. Экспериментальные исследования разработанного ГА по трем критериям продемонстрированы на тестовых задачах и подтвердили теоретическую значимость и перспективность применения предложенного метода.

БИБЛИОГРАФИЧЕСКИЙ СПИСОК

1. Бова В.В. Концептуальная модель представления знаний при построении интеллектуальных информационных систем // Известия ЮФУ. Технические науки. - 2014. - № 7 (156).

- С. 109-117.

2. Bova V.V., Kureychik V.V., Legebokov A.A. The integrated model of représentation model of représentation oriented knowledge in information systems // Application of Information and Communication Technologies - AICT 2014. Astana, Kazakhstan. - P. 111-115.

3. Bova V. V., Kravchenko Y.A., Kureichik V. V. Development of distributed information systems: Onto-logical approach // Advances in Intelligent Systems and Computing. - 2015. - Vol. 349.

- P. 113-122.

4. Кравченко Ю.А. Бова В.В. Нечеткое моделирование разнородных знаний в интеллектуальных обучающих системах // Открытое образование. - 2013. - № 4 (99). - С. 70-74.

5. Кравченко Ю.А., Марков В.В. Онтологический подход формирования информационных ресурсов на основе разнородных источников знаний // Известия ЮФУ. Технические науки. - 2013. - № 7 (144). - С. 116-120.

6. Граецкая О.В., Корохова Е.В., Сомов А.С., Петракова А.В. Модели принятия решений адаптации профессиональных компетенций к управлению высокотехнологичным проектом // Известия ЮФУ. Технические науки. - 2013. - № 5 (142). - С. 236-241.

7. Михайлова А.В. Понятие, сущность и виды компетенций при отборе и найме персонала // Экономика и социум. - 2012. - № 3. - С. 25-30.

8. Филатова Е.В. Профессиональная компетентность и оценка ее сформированности // Вестник Кемеровского государственного университета. - 2011. - № 1. - С. 65-70.

9. Субетто А.И. Онтология и эпистемология компетентностного подхода, классификация и квалиметрия компетенций. - М.: Исследовательский центр проблем качества подготовки специалистов, 2006. - 72 c.

10. Запорожец Д.Ю., Кравченко Ю.А., Лежебоков А.А. Способы интеллектуального анализа данных в сложных системах // Известия КБНЦ РАН. - 2013. - № 3. - С. 52-56.

11. Бова В.В., Лещанов Д.В. О вопросе интеграции ресурсов знаний на основе анализа и синтеза онтологий // Информатика, вычислительная техника и инженерное образование.

- 2014. - № 3 (18). - С. 14-22.

12. Кравченко Ю.А. Синтез разнородных знаний на основе онтологий // Известия ЮФУ. Технические науки. - 2012. - № 11 (136). - С. 216-221.

13. Вагин В.Н., Михайлов И.С. Разработка метода интеграции информационных систем на основе метамоделирования и онтологии предметной области // Программные продукты и системы. - 2008. - С. 22-26.

14. Родзина Л.С., Родзин С.И. Мобильные обучающие системы и онтологии // Онтология проектирования. - 2013. - № 3 (9). - С. 70-81.

15. Бова В.В., Лещанов Д.В., Кравченко Д.Ю., Новиков А.А. Компьютерная онтология: задачи и методология построения // Информатика, вычислительная техника и инженерное образование. - 2014. - № 4 (19). - С. 18-24.

16. Шевченко И.В., Минашкин А.О., Осипчук Л.Н. Эвристический метод кластеризации в метрическом пространстве признаков // Новые технологии. - 2009. - № 4 (26). - С. 101-106.

17. Бова В.В., Заруба Д.В., Курейчик В.В. Эволюционный подход к решению задачи интеграции онтологий // Известия ЮФУ. Технические науки. - 2015. - № 6 (167). - С. 41-56.

18. Zaporozhets D.Yu., Zaruba D. V., Kureichik V. V. Hybrid bionic algorithms for solving problems of parametric optimization // World Applied Sciences Journal. - 2013. - Vol. 23. - P. 1032-1036.

19. Бова В.В., Заммоев А. У., Дуккардт А.Н. Эволюционная модель интеллектуального анализа разнородных знаний // Известия КБНЦ РАН. - 2013. - № 4 (54). - С. 7-13.

20. Кулиев Э.В., Лежебоков А.А., Дуккардт А.Н. Подход к исследованию окрестностей в роевых алгоритмах для решения оптимизационных задач // Известия ЮФУ. Технические науки. - 2014. - № 7 (156). - С. 15-25.

REFERENCES

1. Bova V.V. Kontseptual'naya model' predstavleniya znaniy pri postroenii intellektual'nykh informatsionnykh sistem [Conceptual model of knowledge representation in the constructing intelligent information systems], Izvestiya YuFU. Tekhnicheskie nauki [Izvestiya SFedU. Engineering Sciences], 2014, No. 7 (156), pp. 109-117.

2. Bova V.V., Kureychik V.V., Legebokov A.A. The integrated model of representation model of representation oriented knowledge in information systems, Application of Information and Communication Technologies - AICT 2014. Astana, Kazakhstan, pp. 111-115.

3. Bova V. V., Kravchenko Y.A., Kureichik V. V. Development of distributed information systems: Onto-logical approach, Advances in Intelligent Systems and Computing, 2015, Vol. 349, pp. 113-122.

4. Kravchenko Yu.A. Bova V.V. Nechetkoe modelirovanie raznorodnykh znaniy v intellektual'nykh obuchayushchikh sistemakh [Fuzzy modeling heterogeneous knowledge intelligent tutoring systems], Otkrytoe obrazovanie [Open Education], 2013, No. 4 (99), pp. 70-74.

5. Kravchenko Yu.A., Markov V.V. Ontologicheskiy podkhod formirovaniya informatsionnykh resursov na osnove raznorodnykh istochnikov znaniy [Ontological approach formation of information resources based on knowledge disparate sources], Izvestiya YuFU. Tekhnicheskie nauki [Izvestiya SFedU. Engineering Sciences], 2013, No. 7 (144), pp. 116-120.

6. Graetskaya O.V., Korokhova E.V., Somov A.S., Petrakova A.V. Modeli prinyatiya resheniy adaptatsii professional'nykh kompetentsiy k upravleniyu vysokotekhnologichnym proektom [Models of decision-making of adapting of professional competences to handle of the hightech project], Izvestiya YuFU. Tekhnicheskie nauki [Izvestiya SFedU. Engineering Sciences], 2013, No. 5 (142), pp. 236-241.

7. Mikhaylova A. V. Ponyatie, sushchnost' i vidy kompetentsiy pri otbore i nayme personala [The concept, nature and types of competencies in the selection and hiring of personnel], Ekonomika i sotsium [Economy and Society], 2012, No. 3, pp. 25-30.

8. Filatova E.V. Professional'naya kompetentnost' i otsenka ee sformirovannosti [Professional competence and assessment of its formation], Vestnik Kemerovskogo gosudarstvennogo universiteta [Bulletin of Kemerovo State University], 2011, No. 1, pp. 65-70.

9. Subetto A.I. Ontologiya i epistemologiya kompetentnostnogo podkhoda, klassifikatsiya i kvalimetriya kompetentsiy [Ontology and epistemology of the competence approach, classification and qualimetry of competences]. Moscow: Issledovatel'skiy tsentr problem kachestva podgotovki spetsialistov, 2006, 72 p.

10. Zaporozhets D.Yu., Kravchenko Yu.A., Lezhebokov A.A. Sposoby intellektual'nogo analiza dannykh v slozhnykh sistemakh [Methods data mining in complex systems], Izvestiya KBNTs RAN [Izvestiya of Kabardino-Balkar scientific centre of the RAS], 2013, No. 3, pp. 52-56.

11. Bova V. V., Leshchanov D. V. O voprose integratsii resursov znaniy na osnove analiza i sinteza ontologiy [On the question of the integration of knowledge resources based on the analysis and synthesis of ontology], Informatika, vychislitel'naya tekhnika i inzhenernoe obrazovanie [Informatics, Computer science and Engineering Education], 2014, No. 3 (18), pp. 14-22.

12. Kravchenko Yu.A. Sintez raznorodnykh znaniy na osnove ontologiy [Synthesis of heterogeneous knowledge based on ontologies], Izvestiya YuFU. Tekhnicheskie nauki [Izvestiya SFedU. Engineering Sciences], 2012, No. 11 (136), pp. 216-221.

13. Vagin V.N., Mikhaylov I.S. Razrabotka metoda integratsii informatsionnykh sistem na osnove metamodelirovaniya i ontologii predmetnoy oblasti [Development of a method of integration of information systems based on metamodeling and ontology], Programmnye produkty i sistemy [Software Products and Systems], 2008, pp. 22-26.

14. Rodzina L.S., Rodzin S.I. Mobil'nye obuchayushchie sistemy i ontologii [The mobile learning system and ontology], Ontologiyaproektirovaniya [Ontology Design], 2013, No. 3 (9), pp. 70-81.

15. Bova V.V., Leshchanov D.V., Kravchenko D.Yu., Novikov A.A. Komp'yuternaya ontologiya: zadachi i metodologiya postroeniya [Computer ontology: objectives and methodology], Informatika, vychislitel'naya tekhnika i inzhenernoe obrazovanie [Information, Computing and Engineering Education], 2014, No. 4 (19), pp. 18-24.

16. Shevchenko I.V., Minashkin A.O., Osipchuk L.N. Evristicheskiy metod klasterizatsii v metricheskom prostranstve priznakov [Heuristic clustering method in metric feature space], Novye tekhnologii [New Technologies], 2009, No. 4 (26), pp. 101-106.

17. Bova V.V., Zaruba D.V., Kureychik V.V. Evolyutsionnyy podkhod k resheniyu zadachi inte-gratsii ontologiy [The evolutionary approach for ontologies integration problem], Izvestiya YuFU. Tekhnicheskie nauki [Izvestiya SFedU. Engineering Sciences], 2015, No. 6 (167), pp. 41-56.

18. Zaporozhets D.Yu., Zaruba D. V., Kureichik V. V. Hybrid bionic algorithms for solving problems of parametric optimization, World Applied Sciences Journal, 2013, Vol. 23, pp. 1032-1036.

19. Bova V.V., Zammoev A.U., Dukkardt A.N. Evolyutsionnaya model' intellektual'nogo analiza raznorodnykh znaniy [An evolutionary model for intelligent analysis of heterogeneous knowledge], Izvestiya KBNTs RAN [Izvestiya of Kabardino-Balkar scientific centre of the RAS], 2013, No. 4 (54), pp. 7-13.

20. Kuliev E.V., Lezhebokov A.A., Dukkardt A.N. Podkhod k issledovaniyu okrestnostey v roevykh algoritmakh dlya resheniya optimizatsionnykh zadach [Approach to research environs in swarms algorithm for solution of optimizing problems], Izvestiya YuFU. Tekhnicheskie nauki [Izvestiya SFedU. Engineering Sciences], 2014, No. 7 (156), pp. 15-25.

Статью рекомендовал к опубликованию д.т.н., профессор Ю.А. Гатчин.

Бова Виктория Викторовна - Южный федеральный университет; e-mail: [email protected];

347928, г. Таганрог, пер. Некрасовский, 44; тел.: 88634371651; кафедра систем автоматизированного проектирования; доцент.

Bova Victoria Victorovna - Southern Federal University; e-mail: [email protected];

44, Nekrasovskiy, Taganrog, 347928, Russia; phone: +78634371651; the department of computer

aided design; associate professor.

УДК 002.53:004.89

Ю.А. Кравченко, В.В. Марков, А.А. Новиков СЕМАНТИЧЕСКИЙ ПОИСК В SEMANTIC WEB*

Представлен механизм семантического поиска, основанного на сочетании методов распространения активации с традиционными поисковыми механизмами. Большинство пользователей привыкли выражать свои информационные потребности с точки зрения ключевых слов. В традиционных механизмах поиска, документ, как правило, извлекается, когда хотя бы одно из ключевых слов в строке запроса находится внутри концепта. В нашем подходе предполагается получение всех экземпляров концептов, которые связаны с введенным ключевым словом, даже если оно не встречается внутри самого концепта. Предлагаемый алгоритм может быть использован для онтологии, в которой все отношения между вершинами имеют как описание, основанное на определениях онтологии, так и весовой коэффициент, рассчитываемый методом отображения весовых коэффициентов. Алгоритм имеет в качестве отправной точки начальный набор концептов из онтологии, которые будут называться узлами или нодами. Исходный набор концептов получается в результате работы классических механизмов поиска. Все узлы имеют некоторое начальное значение активации. Алгоритм распространения активации используется для поиска понятий в онтологии на основе начального набора концептов с соответствующими начальными значениями активации. Алгоритм выполняется до тех пор, пока не будет достигнуто определенное состояние (например, заданный размер результирующего набора) или не осталось узлов, которые обрабатываются в приоритетной очереди.

Семантический поиск; онтология; Semantic Web; весовой коэффициент; алгоритм распространения активации.

Yu.A. Kravchenko, A.A. Novikov, V.V. Markov SEMANTIC SEARCH IN SEMANTIC WEB

This article presents the mechanism of semantic search based on a combination of activation methods of dissemination of traditional search engines. Most people are accustomed to express their information needs in terms of keywords. Traditional search engines, the document is

Работа выполнена при финансовой поддержке РФФИ (проект № 16-07-00703).

i Надоели баннеры? Вы всегда можете отключить рекламу.