Научная статья на тему 'МЕТОДЫ И СРЕДСТВА ПОСТРОЕНИЯ ОНТОЛОГИЧЕСКИ УПРАВЛЯЕМЫХ СИСТЕМ ПРИОБРЕТЕНИЯ ЗНАНИЙ'

МЕТОДЫ И СРЕДСТВА ПОСТРОЕНИЯ ОНТОЛОГИЧЕСКИ УПРАВЛЯЕМЫХ СИСТЕМ ПРИОБРЕТЕНИЯ ЗНАНИЙ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
83
15
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
БАЗА ЗНАНИЙ / ОНТОЛОГИЯ / АВТОМАТИЗАЦИЯ ПРИОБРЕТЕНИЯ ЗНАНИЙ / ОНТОЛОГИЧЕСКИ УПРАВЛЯЕМАЯ АРХИТЕКТУРА / ГЕНЕРАЦИЯ ПРОДУКЦИОННЫХ ПРАВИЛ ЭКСПЕРТНЫХ СИСТЕМ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Чуприна С.И., Минин А.С.

Рассматриваются методы и средства автоматизации процесса приобретения знаний, а также представлена концепция нового подхода к применению методов инженерии знаний для построения онтологически управляемых систем приобретения знаний. Предлагаемый подход автоматизирует процесс создания баз знаний на принципах адаптивности к специфике проблемной области экспертизы, особенностям решаемой задачи и внешним информационным ресурсам. Приводится онтологически управляемая архитектура инструментальной среды, автоматизирующей создание продукционных экспертных систем. Отличительной особенностью предлагаемого подхода является активный характер системы извлечения знаний, позволяющей в ходе общения с экспертом инициировать адекватный особенностям решаемой задачи естественно-языковый диалог, сценарий которого управляется онтологиями. Это призвано значительно сократить трудозатраты эксперта и инженера по знаниям на создание и отладку баз знаний экспертных систем. Акцентируется внимание на средствах, позволяющих инженеру по знаниям проверять качество разработанной базы знаний. Данная статья является расширенной версией работы, представленной на конференции ʺМатематика и междисциплинарные исследования 2021ʺ [1].

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Чуприна С.И., Минин А.С.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

METHODS AND TOOLS TO BUILD ONTOLOGY DRIVEN KNOWLEDGE ACQUISITION SYSTEMS

The article discusses the main existing methods and tools for automating the process of acquiring knowledge, and also presents the concept of an approach to the application of knowledge engineering methods of building the ontology driven knowledge acquisition systems. Automation of the process of production expert system knowledge base building uses the principles of adaptability to the specifics of the application domain and third-party information resources is demonstrated. A distinctive feature of the proposed approach is the active nature of the dialogue within the knowledge extraction system (dialogue script is generated in dynamics). This allows, during communication with an expert, to initiate a natural language dialogue adequate to the features of the problem being solved and focus on simplifying and automating the work of an expert and a knowledge engineer. The tools which allow the knowledge engineer to verify the quality of the developed knowledge base are discussed.

Текст научной работы на тему «МЕТОДЫ И СРЕДСТВА ПОСТРОЕНИЯ ОНТОЛОГИЧЕСКИ УПРАВЛЯЕМЫХ СИСТЕМ ПРИОБРЕТЕНИЯ ЗНАНИЙ»

ВЕСТНИК ПЕРМСКОГО УНИВЕРСИТЕТА

2021

Математика. Механика. Информатика

Вып. 4(55)

искусственный интеллект и машинное обучение

УДК 004.82

Методы и средства построения онтологически управляемых систем

знании

С. И. Чуприна, А. С. Минин

Пермский государственный национальный исследовательский университет; г. Пермь, Россия chuprinas@inbox.ru; ОЯСГО 0000-0002-2103-3771, АиШогГО 11124

Рассматриваются методы и средства автоматизации процесса приобретения знаний, а также представлена концепция нового подхода к применению методов инженерии знаний для построения онтологически управляемых систем приобретения знаний. Предлагаемый подход автоматизирует процесс создания баз знаний на принципах адаптивности к специфике проблемной области экспертизы, особенностям решаемой задачи и внешним информационным ресурсам. Приводится онтологически управляемая архитектура инструментальной среды, автоматизирующей создание продукционных экспертных систем. Отличительной особенностью предлагаемого подхода является активный характер системы извлечения знаний, позволяющей в ходе общения с экспертом инициировать адекватный особенностям решаемой задачи естественно-языковый диалог, сценарий которого управляется онтологиями. Это призвано значительно сократить трудозатраты эксперта и инженера по знаниям на создание и отладку баз знаний экспертных систем. Акцентируется внимание на средствах, позволяющих инженеру по знаниям проверять качество разработанной базы знаний. Данная статья является расширенной версией работы, представленной на конференции "Математика и междисциплинарные исследования 2021" [1].

Ключевые слова: база знаний; онтология; автоматизация приобретения знаний; онтологически управляемая архитектура; генерация продукционных правил экспертных систем

Поступила в редакцию 25.10.2021, принята к опубликованию 10.11.2021

Methods and tools to build ontology driven knowledge acquisition systems

S. I. Chuprina, A. S. Minin

Perm State University; Perm, Russia

chuprinas@inbox.ru; ORCID 0000-0002-2103-3771, AuthorlD 11124

The article discusses the main existing methods and tools for automating the process of acquiring knowledge, and also presents the concept of an approach to the application of knowledge engineering methods of building the ontology driven knowledge acquisition systems. Automation of the process of production expert system knowledge base building uses the principles of adaptability to the specifics of the application domain and third-party information resources is demonstrated. A distinctive feature of the proposed approach is the active nature of the dialogue within the knowledge extraction system (dialogue script is generated in dynamics). This allows, during communication with an expert, to initiate a natural language dialogue adequate to the features of the problem being solved and focus on simplifying and automating the work of an expert and a

© Чуприна С. И., Минин А. С., 2021

knowledge engineer. The tools which allow the knowledge engineer to verify the quality of the developed knowledge base are discussed.

Keywords: knowledge base; ontology; knowledge acquisition automation; ontology driven architecture; expert systems production rules generation

Received 25.10.2021, accepted 10.11.2021

DOI: 10.17072/1993-0550-2021-4-25-34

Введение

В эпоху всеобщей цифровизации широкое распространение получили системы, основанные на знаниях (СОЗ), так как они являются важнейшим инструментом получения достоверного решения слабо- и трудно-формализуемых задач для широкого круга проблемных областей. Особенно важно это для тех предметных областей, в которых обязательным условием задачи является наличие объяснительной компоненты решения (биомедицина, экология, военное дело и др.), ведь применение в таком случае альтернативных методов машинного обучения далеко не всегда позволяет сгенерировать адекватное объяснение полученным результатам.

Основу СОЗ составляет база знаний (БЗ). Процесс формирования БЗ является трудоемким как по временным затратам, так и по сложности преобразования знаний эксперта в соответствии с некоторой моделью представления знаний в вид, пригодный для их последующей автоматизированной обработки методами и средствами искусственного интеллекта. В связи с этим, оптимизация процесса приобретения знаний и разработка инструментальных средств для повышения эффективности данного процесса являются актуальными и востребованными задачами. Актуальность подтверждается также и потребностью в автоматизации процессов создания баз данных (БД) нормативно-справочного характера на базе неструктурированных информационных ресурсов. Обычно такие ресурсы представляют собой полнотекстовые справочники, словари, классификаторы, стандарты, регламенты и др., используемые в определенной сфере.

Автоматизированное извлечение из текстовых документов необходимых фактов и знаний создает основу для построения интеллектуальных информационных систем и сокращает сроки разработки таких систем.

Например, до сих пор в Федеральном реестре нормативно-справочной информации

в сфере здравоохранения, который является подсистемой Единой государственной информационной системы в сфере здравоохранения (ЕГИСЗ) Министерства здравоохранения Российской Федерации, отсутствуют справочники жалоб и симптомов по большинству групп заболеваний, что в известной мере сдерживает построение интеллектуальных медицинских информационных систем.

Для извлечения знаний из экспертов в некоторой узкой проблемной области или из электронных информационных ресурсов, научных публикаций существует целый ряд методов искусственного интеллекта. К основным из них относятся методы инженерии знаний, методы машинного обучения, методы автоматической обработки текстов на естественном языке с использованием паттернов и лексико-синтаксических шаблонов, а также различные комбинации указанных методов.

В статье рассматривается подход к извлечению знаний, комбинирующий методы инженерии знаний с методами автоматической обработки текстов на естественном языке (ЕЯ), так как данные методы позволяют извлекать знания напрямую из эксперта (или другого источника фактов и знаний) без необходимости длительных и многократных диалогов с инженером по знаниям и привлечения технологий Больших Данных, оставляя за инженером по знаниям функции по отладке и верификации БЗ.

1. Методы и средства автоматизации

процесса приобретения знаний

Как было сказано ранее, существует несколько основных подходов к автоматизации процесса приобретения знаний, которые отличаются применяемой группой методов для извлечения знаний или способом их комбинации.

Кратко охарактеризуем каждую группу методов в контексте автоматизированного построения баз знаний.

1.1. Методы машинного обучения для построения баз знаний

Для автоматизированного построения БЗ методами машинного обучения с учителем / с частичным привлечением учителя, необходим этап предварительной очистки и подготовки Больших Данных, их качественной разметки, либо наличие структурированных Больших Данных [2, 3], которые зачастую отсутствуют. Хорошо известно, что порядка 80% времени Data Scientist (ученого по данным) обычно тратится на очистку, подготовку и форматирование данных и только 20 % уходит на выбор и настройку самого алгоритма.

Методы машинного обучения без учителя (англ. Unsupervised Learning), в свою очередь, характеризуются неконтролируемостью процесса извлечения знаний и невозможностью на практике получить адекватное для человека-непрограммиста объяснение полученным результатам. Применение методов дистанционного наблюдения (англ. Distant Supervision) для решения задачи автоматического построения качественного набора размеченных данных за счет использования комбинации различных внешних уже существующих надежных и доступных информационных ресурсов (обычно баз данных) не гарантирует отсутствия зашумленности данных в построенном обучающем наборе.

1.2. Методы машинного обучения для построения онтологий

Направление "Ontology Learning" нацелено на автоматизацию процесса построения новых онтологий, их сопровождения и обогащения уже существующих онтологий [4]. Онтология или онтологии в данном случае могут выступать в качестве основы или составной части БЗ [5], так как онтология по своему определению [6] содержит набор понятий некоторой проблемной области, набор взаимосвязей между ними, описание закономерностей в форме аксиом. Кроме того, онтологии могут хранить и собственно сами экспертные правила [5].

Данное направление активно развивается, так как в современном мире сохраняется тенденция роста объема новой информации в различных сферах жизнедеятельности человека, а методы и средства Ontology Learning позволяют в автоматическом или полуавтоматическом режиме представить в удобном структурированном виде набор большой неструкту-

рированной информации, причем в виде, понятном как пользователю-человеку, так и машине. Применение Ontology Learning не ограничивается наборами входных неструктурированных текстов, данное направление также применимо и к структурированным (например, БД) и полуструктурированным (например, XML) наборам входных данных [7].

В Ontology Learning применяются различные комбинации методов машинного обучения, Data Mining, автоматической обработки текстов на ЕЯ, статистические методы, вследствие чего данный метод наследует и соответствующие недостатки указанных групп методов. К ним относятся, как отмечалось выше, необходимость в трудозатратной предварительной обработке входных данных, в наличии репрезентативной выборки достаточно большого объема качественных информационных ресурсов по соответствующей проблемной области знаний и отсутствие объяснительной компоненты. При этом сохраняется сложность адаптации к новой проблемной области, которая выражается в сложностях выбора подходящих под природу анализируемых данных методов машинного обучения, способов перестройки лексико-синтакси-ческих шаблонов и др.

Представляется весьма перспективным использовать результаты применения методов Ontology Learning, т.е. построенные на их основе онтологии, для генерации БЗ экспертных систем и соответствующего пользовательского интерфейса.

1.3. Методы Ontology Learning на базе лексико-синтаксических шаблонов

Для извлечения знаний из неструктурированных корпусов текстов, например извлечения понятий и отношений между ними, активно применяются методы Text Mining, в частности, методы на базе лексико-синтаксических шаблонов. По результатам анализа публикаций, связанных с современными методами автоматизированного приобретения знаний, можно сделать вывод, что данный подход в последнее время наиболее активно используется в описанном выше направлении Ontology Learning для построения онтологических баз знаний [8-11].

Преимуществом данного подхода по сравнению с методами машинного обучения является отсутствие требования к предварительной разметке неструктурированных тек-

стовых данных - извлечение понятий и отношений между ними выполняется на основе других методов, например, на базе лексико-синтаксических шаблонов. Лексико-синтакси-ческие шаблоны подходят для извлечения как таксономических отношений между понятиями (гипонимия, гиперонимия, меронимия и т.п.), так и нетаксономических [8].

Среди недостатков использования лек-сико-синтаксических шаблонов выделяют наличие неточностей при выявлении отношений между понятиями из-за сложностей учета контекста употребляемых понятий [8-10], сложность контролируемости процесса извлечения знаний. А также необходимость адаптации лексико-синтаксических шаблонов к определенному языку и решаемой задаче в определенной проблемной области, заключающуюся в поиске готового адекватного шаблона, создании нового или видоизменении существующего.

Нивелировать эти недостатки можно посредством реализации модельно-управля-емого подхода и так называемых интеллектуальных репозиториев лексико-синтаксических шаблонов по аналогии с репозиториями и всей соответствующей им инфраструктуре в случае виртуальной интеграции неоднородных информационных ресурсов [12].

1.4. Методы инженерии знаний

Классический подход к извлечению знаний из эксперта посредством прямого взаимодействия со специалистом-посредником (инженером по знаниям) характеризуется наличием узкого места в приобретении знаний. Проявление данного ограничения связано как собственно с проблемами человеческого общения, включая психологические и профессиональные (инженер по знаниям не является специалистом в узкой проблемной области экспертизы), так и, возможно, с его недостаточной квалификацией в части практического применения методик извлечения знаний, неполнотой извлекаемых знаний, некорректной их интерпретацией, значительных трудозатрат на разработку БЗ [13, 14].

Одним из подходов к решению указанных проблем является разработка новых инструментальных средств, автоматизирующих процесс извлечения знаний из эксперта на принципах активного диалога со стороны системы, адаптируемости к специфике решаемой задачи и проблемной области экспертизы.

Такие программные инструменты являются своего рода интеллектуальными помощниками и ориентированы на создание прототипа БЗ непосредственно самим непрограммирующим экспертом, что позволяет сократить трудозатраты инженера по знаниям на непосредственное общение с экспертом и собственно построение БЗ и переориентировать его деятельность на анализ, верификацию и отладку уже полученной БЗ.

В [13] выделяют три поколения систем приобретения знаний (СПЗ) с применением методов инженерии знаний.

Первое поколение (середина 1980-х гг.) представляют СПЗ по типу оболочек экспертных систем (без заполненных и отлаженных БЗ), например, EMYCIN с диалоговой системой TEIRESIAS для заполнения БЗ посредством применения структурированного интервьюирования эксперта.

Второе поколение систем (конец 1980-х гг.) - это СПЗ, основанные на применении KADS-методологии (англ. Knowledge Acquisition and Document Structuring), подразумевающий многоуровневый анализ проблемной области решаемой задачи в процессе проектирования системы (этапы идентификации, концептуализации, гносеологического анализа, логического анализа и анализа выполнения) [15] или использование методов психосемантики (например, применение методов для обработки репертуарных решеток -AQUINAS, KITTEN, KRITON).

СПЗ третьего поколения (KEATS, MACAO) ориентированы на инженера по знаниям, являются более сложными, гибкими системами, используют достижения CASE-технологий и позволяют формировать БЗ динамически.

Также были разработаны интегрированные среды приобретения знаний, представляющие собой комбинацию программных средств для извлечения экспертных знаний разными методами. Направление разработки систем приобретения знаний с применением инженерии знаний с тех пор продолжает развиваться, так как описанные выше поколения систем и существовавшие методологии того времени для извлечения структурированных знаний из экспертов в совокупности обладали рядом недостатков: слабая проработка методов структурирования, извлечения знаний; строгость модели представления знаний; сложность адаптации к проблемной области,

типу решаемой задачи; сложные и не интуитивно-понятные графические интерфейсы для экспертов; необходимость в посреднике (инженер по знаниям) между системой и экспертом; громоздкость методологии KADS и др.

Современная тенденция в автоматизации приобретения знаний с использованием методов инженерии знаний прослеживается в разработке инструментальных средств с применением модельно-управляемого подхода и ориентацией в первую очередь на непрограммирующего специалиста.

Работы [16-19] предлагают подходы с применением методов инженерии знаний к созданию инструментальных средств автоматизированного приобретения знаний и использованием концептуальных моделей, графических средств визуализации для этапов идентификации и концептуализации.

Отметим, что указанные инструментальные средства являются адаптируемыми к классу решаемой задачи, специфике проблемной области и ориентированы на непрограммирующего эксперта. Однако в рассматриваемых подходах отсутствуют развитые средства генерации и верификации БЗ, а сам процесс приобретения знаний все равно остается достаточно сложным ввиду того, что активная роль принадлежит в большей мере эксперту-человеку, а не программе-помощнику.

Таким образом, основными преимуществами современных методов инженерии знаний при их применении для автоматизации процесса построения БЗ являются наличие интеллектуальных помощников по извлечению знаний и способность объяснять ход дедуктивного вывода.

Важным при модельно-ориентиро-ванном подходе является то, что не требуется вносить изменений в исходный код экспертной системы (ЭС) в случае ее адаптации и настройки на новую проблемную область: требуется разработать и отладить только ее БЗ.

В качестве недостатков можно выделить возможную неполноту и противоречивость знаний из-за некорректной формализации, и интерпретации знаний; трудоемкий процесс поиска и привлечения высококвалифицированных экспертов; трудоемкий и длительный процесс извлечения знаний из эксперта в случае отсутствия активных интеллектуальных программных помощников по извлечению знаний.

1.5. Выводы по разделу

С учетом достоинств и недостатков рассмотренных выше средств и методов, автоматизирующих процесс приобретения знаний и построения баз знаний, можно сделать вывод о необходимости разработки новой концепции построения онтологически управляемых систем приобретения знаний, автоматизирующих процесс создания и проверки БЗ на основе интеграции методов инженерии знаний, автоматической обработки текстов на естественном языке и Ontology Learning.

Предлагаемая концепция ориентирована на разработку инструментальных средств, автоматизирующих создание продукционных экспертных систем на принципах онтологически управляемого процесса адаптации к специфике проблемной области решаемой задачи и внешним информационным ресурсам.

2. Концепция предлагаемого

подхода

Суть концепции заключается в том, что в ходе ЕЯ-диалога автоматически запускается последовательный процесс генерации с использованием встроенных в систему метазнаний промежуточных предметных онтологий, на основе которых в конечном счете генерируется предметно-зависимый код ЭС с интегрированной продукционной БЗ, неразрывно связанной с механизмом логического вывода (МЛВ). Последнее необходимо для защиты от обратной разработки: содержимое БЗ представлено в виде неотъемлемой части всего кода ЭС, включая МЛВ, и выполнена обфуска-ция исходного кода ЭС.

Новизна предлагаемого подхода заключается в том, что активная роль по извлечению знаний отведена системе, т.е. не эксперт заносит свои знания в систему, а система посредством интервьюирования эксперта и анализа его ответов, самостоятельно строит БЗ экспертной системы. При этом сценарий диалога строится системой в динамике и управляется т.н. легковесными онтологиями (англ. Lightweight Ontology). Такой подход является разновидностью MDA (англ. Model Driven Architecture), т.е. архитектур, управляемых моделями, где ранее превалировали UML-модели. Сейчас все активнее развивается управляемый онтологиями подход к разработке программных систем на принципах ODA (англ. Ontology Driven Architecture).

На рис. 1 показаны управляемые онто-логиями этапы генерации диалога на ЕЯ.

Рис. 1. Этапы активного диалога, генерируемого в среде Knowledge Acquisition System

На втором этапе генерируется сценарий диалога на основе базы знаний понятий, полученных на предыдущем шаге: эксперт отвечает на вопросы, связанные с типом и доменом допустимых значений каждого понятия, а также, при необходимости, накладывает ограничения на эти значения, выбирая необходимый вариант из предлагаемого системой встроенного набора возможных видов ограничений.

Сам интерфейс диалога с пользователем также генерируется системой автоматически и является онтологически управляемым.

На рис. 4 приведен фрагмент пользовательского интерфейса среды Knowledge Acquisition System для определения допустимого значения интервального типа для понятия "Систолическое артериальное давление" из предметной онтологии.

Наша концепция предполагает, что первоначальная адаптация сценария диалога к специфике проблемной области решаемой задачи осуществляется на метауровне системы посредством автоматизированного подбора онтологии общих вопросов из репозитория онтологий (имеется иерархический каталог с возможностью навигации по предметным категориям и классам решаемых задач).

Далее, по результатам диалога, генерируемого на базе онтологии общих вопросов (фрагмент иерархии наиболее общих вопросов представлен на рис. 2) и анализа ответов эксперта выполняется автоматическое формирование таксономии понятий в виде предметной онтологии (см. рис. 3), что необходимо для дальнейшего построения прикладной онтологии решаемой ЭС задачи.

Рис. 3. Пример фрагмента предметной онтологии (2-й этап диалога) на примере определения стадии гипертонической болезни

Рис. 2. Пример фрагмента онтологии общих вопросов (1 этап диалога)

Рис. 4. Фрагмент пользовательского интерфейса среды Knowledge Acquisition System для определения допустимого значения интервального типа

Сокращение временных затрат, например, при определении домена допустимых значений, обеспечивается за счет средств интеграции с внешними информационными ресурсами (справочники, открытые базы данных и др.). А минимизация уровня ошибок эксперта и частичный контроль вводимых им данных на всех этапах переноса экспертных знаний в СПЗ выполняется за счет взаимодействия эксперта с графическим пользовательским интерфейсом системы, автоматически генерируемым на основе полученных онтоло-гий, через соответствующие формы и элементы управления.

На заключительном этапе процесса извлечения знаний выполняется определение комбинаций для посылок продукционных правил.

Данный шаг также ориентирован на эксперта-непрограммиста: формирование посылок продукций выполняется с помощью сгенерированного высокоуровневого пользовательского интерфейса (см. рис. 5) с возможностью визуального анализа сгенерированных правил либо в виде традиционного текстового представления, либо в виде семантической сети в среде разрабатываемой нами системы приобретения знаний Knowledge Acquisition System.

Рис. 5. Фрагмент сгенерированного пользовательского интерфейса для формирования посылок продукций в среде Knowledge Acquisition System

Далее следует этап автоматической генерации продукционной БЗ в формате JSON и ее верификация инженером по знаниям при помощи высокоуровневых визуальных средств либо в среде текстового редактора (см. рис. 6).

IF ("систолическое артериальное давление" - {>=140 и <=159}

AND "диастолическое артериальное давление" ■ {<96})

("систолическое артериальное давление" ■ {>>140 и <«159}

AND "диастолическое артериальное давление" - {>»90 и <=99})

("систолическое артериальное давление" = {<140}

AND "диастолическое артериальное давление" = {>=90 и <=99}>

Рис. 6. Фрагмент представления продукционных правил в текстовом формате

Результатом взаимодействия пользователя с Knowledge Acquisition System является сгенерированная онтологическая база знаний, которая затем автоматически преобразуется в продукционную БЗ в JSON-формате определенной структуры.

Предложенная концепция обеспечивает упрощение и автоматизацию труда инженера по знаниям.

Во-первых, выполняется сужение спектра задач, решаемых инженером по знаниям в процессе создания БЗ (вместо извлечения и формализации знаний - проверка и комплексная отладка разработанной БЗ).

Во-вторых, для упрощения и ускорения проверки БЗ инженеру по знаниям предоставляется ряд вспомогательных средств, таких как модуль для обратной трансформации сгенерированных продукционных правил в онтологию, модуль для генерации текстового представления продукционной БЗ, модуль для генерации рабочей версии продукционной ЭС (на входе - продукционная БЗ определенной структуры в формате JSON, на выходе - экспертная система с интегрированной в нее БЗ), а также компонента объяснения на ЕЯ.

Обобщенная архитектура Knowledge Acquisition System и ее взаимодействие с внешними подсистемами представлена на рис. 7.

Рис. 7. Обобщенная архитектура Knowledge Acquisition System и ее взаимодействие с внешними подсистемами

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Компонента объяснения позволяет представить ход логического вывода заданной цели, сгенерированной ЭС в понятном и наглядном виде: графическое представление в виде дерева целей и текста объяснений со сведениями о сработавших правилах и означенных переменных.

Таким образом, инженер по знаниям имеет в своем распоряжении для целей анализа и отладки базы знаний рабочий прототип ЭС, сгенерированный по результатам диалога с экспертом, сценарий которого автоматически генерируется в ходе активного диалога со стороны системы. Описание модуля генерации ЭС выходит за рамки данной статьи.

Заключение

Использование онтологий для управления работой инструментального средства позволяет разработать систему приобретения знаний с автоматически генерируемым интуитивно-понятным графическим пользовательским интерфейсом, адаптируемым к специфике проблемной области и решаемой задачи без необходимости внесения изменений в исходный код компонентов ЭС.

Системы приобретения знаний, разработанные согласно предлагаемой концепции, позволяют изменить роль и место как инженера по знаниям, так и эксперта в процессе создания ЭС. Инженер по знаниям выступает в роли контролера результатов приобретения знаний (проверка и комплексная отладка разработанной БЗ) вместо активного помощника эксперта по извлечению знаний, роль которого при нашем подходе выполняет сама программная система.

В настоящее время Knowledge Acquisition System находится на стадии исследовательского прототипа. В ближайших планах - продолжение разработки и реализации предложенных в рамках данной статьи проектных решений до стадии действующего прототипа.

Список литературы

1. Минин А.С., Чуприна С.И. Концепция применения методов инженерии знаний для построения онтологически управляемых систем приобретения знаний: материалы Всерос. науч.-практ. конф. молодых ученых с междунар. участием "Математика и междисциплинарные исследования". 2021. С. 158-162.

2. Krzywicki A., Wobcke W., Bain M., Martinez J. C., Compton P. Data mining for building knowledge bases: techniques, architectures and applications // The Knowledge Engineering Review. 2016. Vol. 31, № 2. P. 97123.

3. Большакова Е. И. Автоматическая обработка текстов на естественном языке и анализ данных: учеб. пособие / Е.И. Большакова, К. В. Воронцов, Н. Э. Ефремова, Э. С. Клышинский, Н. В. Лукашевич, А.С. Сапин. М.: Изд-во НИУ ВШЭ. 2017. 269 с.

4. Cimiano P., Maedche A., Staab S., Volker J. Ontology learning In: Handbook on ontologies. Berlin, Heidelberg: Springer. P. 245-267. DOI: 10.1007/978-3-540-92673-3_11.

5. Загорулько Ю. А., Загорулько Г. Б. Онтологии и их практическое применение в системах, основанных на знаниях // Задания-Онтологии-Теории: сб. тр. конф. Новосибирск, 2011. С. 132-141.

6. Gruber T. R. A Translation approach to portable ontology specifications // Knowledge Acquisition. 1993. Vol. 5, № 2. P. 199-220.

7. Ghosh M., Naja H., Abdulrab H., KhalilM. Ontology learning process as a bottom-up strategy for building domain-specific ontology

from legal texts // Proceedings of the 9th International Conference on Agents and Artificial Intelligence. 2017. P. 473-480. DOI: 10.5220/0006188004730480.

8. Asim M. N., Wasim M., Khan M. U. G., Mahmood W., Abbasi H. M. A survey of ontology learning techniques and applications // Database: The Journal of Biological Databases and Curation. 2018. Vol. 2018. DOI:10.1093/database/bay 101.

9. Костарева Т. А. Инструментальная среда для автоматизированного построения он-тологий на базе лексико-синтаксических шаблонов // Математика и междисциплинарные исследования: сб. докл. конф. Пермь, 2019. С. 191-194.

10. Klaussner C., Zhekova D. Lexico-syntactic patterns for automatic ontology building // Proceedings of the Second Student Research Workshop associated with RANLP. Hissar, Bulgaria. 2011. P. 109-114.

11. Maynard D., Funk A., Peters W. Using lexi-co-syntactic ontology design patterns for ontology creation and population // WOP'09: Proceedings of the 2009 International Conference on Ontology Patterns. 2009. Vol. 516, № 1. P. 39-52.

12. Тузовский А. Ф., Ямпольский В. З. Интеграция информации с использованием технологий Semantic Web // Проблемы информатики. 2011. № 2. С. 51-58.

13. Гаврилова Т. А. Базы знаний интеллектуальных систем: учебник для вузов / Т. А. Гаврилова, В. Ф. Хорошевский. СПб.: Питер, 2000. 384 с.

14. Richardson M., Domingos P. Building Large Knowledge Bases by Mass Collaboration // K-CAP '03: Proceedings of the 2nd international conference on Knowledge capture. 2003. P. 129-137.

15. Vlaanderen, M. J. PhD thesis. Faculty of Philosophy. Erasmus University, Rotterdam. 1990.

16. Загорулько Ю. А. Семантическая технология разработки интеллектуальных систем, ориентированная на экспертов предметной области // Ontology of Designing. 2015. № 1. С.30-46.

17. Колобашкина М.В., Рыбина Г.В., Сергиевская О.Г., Смирнов В.В. Задачно-ориенти-рованная методология приобретения знаний для компьютерного построения интегрированных экспертных систем. КИИ-96 // V нац. конф. с междунар. участием "Искусственный интеллект-96": сб. науч.

тр. в 3 т. Казань: ЗАО ПО "Спецтехника", 1996. Т. 2. С. 270-274.

18. Рыбина Г. В., Дейнеко А. О. Распределенное приобретение знаний для автоматизированного построения интегрированных экспертных систем // Искусственный интеллект и принятие решений. 2010. № 4. С. 55-62.

19. ГрищенкоМ. А., Николайчук О. А., Павлов А. И., Юрин А. Ю. Инструментальное средство создания продукционных экспертных систем на основе MDA // Образовательные ресурсы и технологии. 2016. №2. С. 144-151.

References

1. Minin A.S., CHuprina S.I. Koncepcia prime-

neniya metodov inzhenepii znaij dlya postroeniya ontologicheski upravlyaemyh system priobreteniya znanij // materialy Vse-rossijskoj nauch.-prakt. konf. molodyh uchenyh s mezhdunar. Uchastiem "Matema-tika i mezhdisciplinarnye issledovaniya". 2021. S.158-162.

2. Krzywicki A., Wobcke W., BainM., Mar-

tinez J. C., Compton P. Data mining for building knowledge bases: techniques, architectures and applications // The Knowledge Engineering Review. 2016. Vol. 31, № 2. P. 97-123.

3. Bol'shakova E. I. Avtomaticheskaya obrabotka tekstov na estestvennom yazyke i analiz dannyh: ucheb. posobie / E. I. Bol'shakova, K. V. Voroncov, N. E. Efremova, E.S. Klyshinskij, N. V. Lukashevich, A. S. Sapin. M.: Izd-vo NIU VSHE. 2017. 269 s.

4. Cimiano P., Maedche A., Staab S., Volker J. Ontology learning In: Handbook on ontologies. Berlin, Heidelberg: Springer. P. 245267. DOI: 10.1007/978-3-540-92673-3_11.

5. Zagorul'ko YU. A., Zagorul'ko G. B. Ontologii i ih prakticheskoe primenenie v sistemah, osnovannyh na znaniyah // Zadaniya-Ontologii-Teorii: Sbornik trudov konferencii. Novosibirsk. 2011. S. 132-141.

6. Gruber T. R. A Translation approach to portable ontology specifications // Knowledge Acquisition. 1993. Vol. 5, No. 2. P. 199-220.

7. Ghosh M., Naja H., Abdulrab H., Khalil M. Ontology learning process as a bottom-up strategy for building domain-specific ontology from legal texts // Proceedings of the 9th International Conference on Agents and Artificial Intelligence. 2017. P. 473-480. DOI: 10.5220/0006188004730480.

8. Asim M. N., Wasim M., Khan M. U. G., Mahmood W., Abbasi H. M. A survey of ontology learning techniques and applications // Database: The Journal of Biological Databases and Curation. 2018. Vol. 2018. DOI: 10.1093/database/bay 101.

9. Kostareva T. A. Instrumental'naya sreda dlya avtomatizirovannogo postroeniya ontologij na baze leksiko-sintaksicheskih shablonov // Matematika i mezhdisciplinarnye issledova-niya: Sbornik dokladov konferencii. Perm'. 2019.S.191-194.

10. Klaussner C., Zhekova D. Lexico-syntactic patterns for automatic ontology building // Proceedings of the Second Student Research Workshop associated with RANLP. Hissar, Bulgaria. 2011. P. 109-114.

11. Maynard D., Funk A., Peters W. Using lexi-co-syntactic ontology design patterns for ontology creation and population // WOP'09: Proceedings of the 2009 International Conference on Ontology Patterns. 2009. Vol. 516, №1. P. 39-52.

12. Tuzovskij A. F., YAmpol'skij V. Z. Integraciya informacii s ispol'zovaniem tekhnologij Semantic Web // Problemy informatiki. 2011. № 2. S. 51-58.

13. Gavrilova T. A. Bazy znanij intellektual'nyh sistem: uchebnik dlya vuzov / T.A. Gavrilova, V.F. Horoshevskij. SPb: Piter. 2000. 384 s.

14. Richardson M., Domingos P. Building Large

Knowledge Bases by Mass Collaboration // K-CAP '03: Proceedings of the 2nd international conference on Knowledge capture. 2003. P. 129-137.

15. Vlaanderen, M. J. PhD thesis. Faculty of Philosophy. Erasmus University, Rotterdam. 1990.

16. Zagorul'ko YU. A. Semanticheskaya techno-logiya razrabotki intellektual'nyh sistem, orien-tirovannaya na ekspertov predmetnoj oblasti // Ontology of Designing. 2015. № 1. S. 30-46.

17. Kolobashkina M. V., Rybina G. V., Sergiev-skaya O. G., Smirnov V. V. Zadachnoorienti-rovannaya metodologiya priobreteniya znanij dlya komp'yuternogo postroeniya integriro-vannyh ekspertnyh sistem. KII-96 // pyataya nacional'naya konferenciya s mezhdunarod-nym uchastiem "Iskusstvennyj intellect-96". Sbornik nauchnyh trudov v trekh tomah. Kazan': ZAO PO "Spectekhnika". 1996. T. 2. S. 270-274.

18. Rybina G. V., Dejneko A. O. Raspredelen-noe priobretenie znanij dlya avto-matizirovannogo postroeniya integrirovannyh ekspertnyh sistem // Iskusstvennyj intellekt i prinyatie reshenij. 2010. № 4. S. 55-62.

19. GrishchenkoM. A., Nikolajchuk O. A., Pavlov A.I., YUrin A. YU. Instrumental'noe sredst-vo sozdaniya produkcionnyh ekspertnyh sis-tem na osnove MDA // Obrazovatel'nye resursy i tekhnologii. 2016. № 2. S. 144-151.

Просьба ссылаться на эту статью:

Чуприна С.И., Минин А.С. Методы и средства построения онтологически управляемых систем приобретения знаний // Вестник ПГУ. Математика. Механика. Информатика. 2021. Вып. 4(55). С. 25-34. DOI: 10.17072/1993-0550-2021-4-25-34.

Please cite this article as:

Chuprina S.I., Minin A.S. Methods and tools to build ontology driven knowledge acquisition systems // Bulletin of Perm University. Mathematics. Mechanics. Computer Science. 2021. № 4(55). P. 25-34. DOI: 10.17072/1993-0550-2021-4-25-34.

i Надоели баннеры? Вы всегда можете отключить рекламу.