Научная статья на тему 'Программная реализация технологии генерации лексико- синтаксичеких паттернов для поддержки решения задач обучения онтологий'

Программная реализация технологии генерации лексико- синтаксичеких паттернов для поддержки решения задач обучения онтологий Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
311
61
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ОНТОЛОГИЯ / ЛЕКСИКО-СИНТАКСИЧЕСКИЕ ПАТТЕРНЫ / ОБУЧЕНИЕ ОНТОЛОГИЙ / ОНТОЛОГИЧЕСКИЕ ПАТТЕРНЫ СОДЕРЖАНИЯ / ONTOLOGY / LEXICAL-SYNTACTIC PATTERNS / ONTOLOGY LEARNING / ONTOLOGICAL CONTENT PATTERNS

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Ломов Павел Андреевич

Работа посвящена применению онтологических паттернов проектирования в рамках решения задач генерации, расширения и наполнения онтологий на основе анализа тематических естественно-языковых текстов. Рассмотрена технология автоматизированной генерации и применения лексикосинтаксических шаблонов для наполнения онтологии, а также ее программная реализация.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Ломов Павел Андреевич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

SOFTWARE IMPLEMENTATION OF THE TECHNOLOGY FOR GENERATION OF LEXICAL-SYNTACTIC PATTERNS FOR SUPPORT OF ONTOLOGY LEARNING

The work is devoted to the application of ontological design patterns for solving problems of generation, expansion and population of ontologies based on the analysis of natural language texts. The technology of automated generation and use of lexicosyntactic patterns for ontology population, as well as its software implementation, are considered.

Текст научной работы на тему «Программная реализация технологии генерации лексико- синтаксичеких паттернов для поддержки решения задач обучения онтологий»

УДК 004.832

DOI: 10.25702/KSC.2307-5252.2018.10.120-129 П.А. Ломов

Институт информатики и математического моделирования ФИЦ КНЦ РАН

ПРОГРАММНАЯ РЕАЛИЗАЦИЯ ТЕХНОЛОГИИ ГЕНЕРАЦИИ ЛЕКСИКО-СИНТАКСИЧЕКИХ ПАТТЕРНОВ ДЛЯ ПОДДЕРЖКИ РЕШЕНИЯ ЗАДАЧ ОБУЧЕНИЯ ОНТОЛОГИЙ*

Аннотация

Работа посвящена применению онтологических паттернов проектирования в рамках решения задач генерации, расширения и наполнения онтологий на основе анализа тематических естественно-языковых текстов. Рассмотрена технология автоматизированной генерации и применения лексико-синтаксических шаблонов для наполнения онтологии, а также ее программная реализация.

Ключевые слова:

онтология, лексико-синтаксические паттерны, обучение онтологий, онтологические паттерны содержания

P.A. Lomov

SOFTWARE IMPLEMENTATION OF THE TECHNOLOGY FOR GENERATION OF LEXICAL-SYNTACTIC PATTERNS FOR SUPPORT OF ONTOLOGY LEARNING

Abstract

The work is devoted to the application of ontological design patterns for solving problems of generation, expansion and population of ontologies based on the analysis of natural language texts. The technology of automated generation and use of lexico-syntactic patterns for ontology population, as well as its software implementation, are considered.

Keywords:

ontology, lexical-syntactic patterns, ontology learning, ontological content patterns Введение

На сегодняшний день онтологические модели (онтологии) стали распространенным средством представления машиночитаемых знаний. Однако их разработка и сопровождение подразумевают решения целого ряда разноплановых задач, что требует существенных затрат труда и времени квалифицированных специалистов. Одной из таких задач является наполнения онтологии (ontology population) [1]. Она рассматривается в литературе как одна из подзадач обучения онтологий (ontology learning) [2] и заключается в добавлении в нее экземпляров к заданным в ней классам и определения отношений между этими экземплярами. При этом каких-либо структурных изменений иерархии классов, а также набора отношений не производится. Для автоматизации решения данной задачи могут использоваться лексико-синтаксические паттерны (шаблоны), которые обычно применяются в компьютерной лингвистике для решения задач автоматической обработки текстов. В

* Работа выполнена при финансовой поддержке РФФИ (проект № 16-07-00562) и поддержке РФФИ и Министерства образования и науки Мурманской области (проект № 17-47-510298 р_а).

рассматриваемом же случае они выступают абстрактными описаниями фрагментов текста, содержащих лексемы, которые могут рассматриваться как экземпляры классов онтологии и отношения между ними.

Такое применение лексико-синтаксических паттернов выступило предпосылкой появления еще одного вида онтологических паттернов проектирования (Ontology Design Patterns, ODP)[3] - лексико-синтаксических онтологические паттернов (Lexico-Syntactic ODPs, LSOP). Они представляют собой своего рода надстройку над лексико-синтаксическими паттернами. Отличие состоит в том, что LSOP позволяют не только распознавать языковые конструкции, но определяют соответствие между их составляющими и онтологическими элементами (классами, экземплярами, отношениями). В ряде случаев для отдельного LSOP даже может быть задан определенный онтологический паттерн содержания (Content ontology Design Patterns, CDP), который представляет фрагмент онтологии, описывающий типовую ситуацию (например, участие объектов в событии, выполнение роли объектом, наличие частей у объекта и др.) в предметной области. Наличие такого соответствия между синтаксическими конструкциями и структурными элементами онтологий позволяет применять LSOP при решении задач их автоматического построения и наполнения на основе текстовых корпусов.

В предыдущей работе [4] был рассмотрен вопрос автоматизированного синтеза разработчиком составных CDP, которые определяют более сложный онтологический фрагмент, позволяющий обеспечить представление знаний о некотором объекте предметной области с необходимой степенью детализации. В рамках данной работы предлагается технология генерации лексико-синтаксических паттернов на основе CDP для последующего получения текстовых фрагментов, которые могут содержать факты, удовлетворяющие ему. Генерация именно LSOP на данном этапе исследования не рассматривается. Комбинирование возможности автоматизированного синтеза CDP и последующей генерацией на его основе лексико-синтаксических паттернов позволит разработчику не только получить структуру представления понятий предметной области в онтологии, но и обеспечит его поддержку в решении задачи наполнения онтологии.

Использование лексико-синтаксических паттернов в задачах обучения и наполнения онтологии

Наиболее ранней зарубежной работой, в которой рассматривается применение лексико-синтаксическим паттернов для решения задач генерации и наполнения онтологий считается работа Марти Херста [5]. В ней анализировалась встречаемость в специализированном англоязычном текстовом корпусе фрагментов, удовлетворяющих паттернам, которые указывают на наличие родовых отношений между объектами. Например, из выражение «... works by authors such as Herrick, Goldsmith, and Shakespeare.», на основе паттерна «NP1 such as NP» (NP - именная группа) определяется отношение гипонимии между объектами, заданными лексемами «Herrick», «Goldsmith», «Shakespeare» и объектом, заданным лексемой «authors». Спецификой, отмечаемой автором, данных паттернов является их высокая точность и как следствие небольшое количество распознаваемых гипонимов/гиперонимов.

В последующих работах другие авторы часто используют паттерны Херста и делают попытки расширить их с учетом специфических языковых конструкций, характерных для предметной области [6,7], других видов отношений [8, 9], а также

дополнительных правил и эвристик [10]. Так, например, в работе [10] помимо лексико-синтаксическим паттернов Херста применялись некоторые LSOP [11]. Наряду с этим, были заданы контекстные паттерны (context patterns), которые позволяют при анализе текста учитывать классы, уже существующие в наполняемой онтологии. Дополнительно были определены смысловые ограничения, заданные на основе семантических групп англоязычного тезауруса WordNet.

Необходимо также отметить ряд успешных российских проектов, ориентированных на извлечение информации из русскоязычных текстов с применением лексико-синтаксическим паттернов. Данную задачу можно рассматривать как составляющую задачи наполнения онтологии, так как в результате ее решения из текстовых источников извлекаются структурированные описания фактов, которые потенциально могут быть использованы для формирования содержания онтологий. К таковым проектам относятся LSPL [12], RCO Pattern Extractor [13], Alex[14], Tomita-парсер [15]. Каждая из данных систем обладает своим языком записи паттернов, обладающих примерно одинаковой выразительностью. Среди них свободно доступными для использования в исследовательских целях являются системы LSPL и Tomita-парсер.

Особенности генерации лексико-синтаксических паттернов для наполнения онтологии

Как правило решение задачи наполнения онтологии предполагает наличие целевой онтологии, мультимедийного корпуса (обычно текстового) и средства извлечения (extraction engine) [16-18]. Средство извлечения используется для распознавания в корпусе наименований сущностей с целью последующего их представления в виде экземпляров классов, а также экземпляров отношений, заданных между классами. Оно также может дополнительно включать некоторые абстрактные описания структуры текстовых фрагментов, а также различные правила и эвристики, отражающих специфику предметной области.

В рассматриваемом нами случае основной задачей является анализ CDP и последующее построение на основе полученных результатов соответствующего лексико-синтаксического паттерна, который мог бы быть использован в рамках средства извлечения. При этом генерация такого паттерна должна производится без учета какой-либо предметной специфики текстов, так как заранее неизвестно онтологию какой предметной области или задачи будет наполнять пользователь.

Заметим также, что представленные в каталоге [11] LSOP ориентированы на обработку отдельных предложений для извлечения из них фактов наличия единичного отношение между понятиями. Например, участие объекта в событии или выполнение некоторой роли объектом. Таким LSOP соответствуют простые CDP, включающие не более двух понятий, связанных отношением, например, паттерн «Участие в событии» (CDP Participation) или «Роль объекта» (CDP ObjectRole). В случае же синтезированного пользователем составного CDP, он может включать в виде частей несколько других паттернов. Тогда в нем будет представлено несколько понятий, связанных разными отношениями. Это в свою очередь будет приводить к необходимости поиска связанных по смыслу текстовых фрагментов, описывающих эти понятия, при этом каждый из них может включать несколько предложений.

Данная проблема установления кореферентных связей [19] представляет высокую сложность, так как требует выявления смысловых отношений между лексемами, которые далеко не всегда явно представлены в синтаксической

структуре содержащих их фрагментов текста. Поэтому решение данной проблемы за счет описания таких связей с помощью только лексико-синтаксических паттернов затруднительно и специально в рамках данного этапа исследование не рассматривается. В рамках ее решения в дальнейшем для улучшения результатов применения сформированных ЛСП планируется осуществлять дополнительный анализ текста помимо применения анализатора с набором лексико-синтаксических паттернов и/или производить дополнительную обработку результатов работы последнего с целью определения связанных по смыслу текстовых фрагментов среди найденных.

Еще одной особенностью генерации лексико-синтаксических паттернов является необходимость использования языка их описания, который принят в используемом анализаторе. Он как правило позволяет задавать иерархию правил распознавания лексических конструкций, указывать условия извлечения из них отдельных лексем, а также определять дополнительные ограничения, такие как морфологические признаки лексем и требования их согласования. В данной работе для выполнения анализа текста будет использоваться LSPL-анализатор [20] и соответственно его язык формального описания языковых конструкций для распознавания и извлечения цепочек лексем из текста. Такой выбор обусловлен наличием доступной программной реализации и поддержки со стороны действующего коллектива разработчиков. По сравнению с tomita-парсером, обладающим сходными возможностями, LSPL-анализатор отличает отсутствие фиксированного размера фрагмента текста, сопоставляемого с паттерном на каждом шаге анализа. В tomita-парсере такой размер равен одному предложению, поэтому поиск цепочки лексем, удовлетворяющей некоторому лексико-синтаксическому паттерну, будет производиться только в его рамках. Это не позволяет применять tomita-парсер для выявления фрагментов текста, между лексемами которых могут присутствовать кореферентные связи.

Генерация лексико-синтаксических паттернов для основе заданного CDP

Решение задачи наполнения онтологии заключается в добавлении в нее экземпляров классов и задании отношений между найденными экземплярами. В этом случае некоторый лексико-синтаксический паттерн должен позволять найти в тексте фрагменты, которые можно было бы проинтерпретировать в виде дуг: «экземпляр - отношение -экземпляр».

В рамках различных CDP, такие дуги обычно представляются логическими выражениями (OWL аксиомами) следующего вида:

ClassA SubClassOf relationX some ClassB (1)

ClassA EquivalentTo relationX some ClassB (2)

где ClassA, ClassB - классы онтологии (Ontology classes), relationX - отношение между экземплярами класса ClassA и экземплярами класса ClassB.

Смысл первой аксиомы состоит в том, что если какой-либо экземпляр причисляется к классу ClassA, тогда он должен быть связан хотя бы с одним экземпляром класса ClassB. Вторая аксиома определяет более сильное ограничение, которое состоит в том, что экземпляр причисляется к классу ClassA, тогда и только тогда, когда он связан хотя бы с одним экземпляром класса ClassB.

Данные аксиомы часто применяются для описания структуры CDP, поэтому их можно использовать для формирования основы соответствующего лексико-

синтаксического паттерна. В общем случае основным индикатором фрагмента текста, соответствующего аксиомам рассмотренного вида, является глагол, согласованный по числу и роду с существительным или местоимением, которое (отдельно или в составе именной группы) предшествует ему. Наряду с этим следует учитывать сходную ситуацию с глаголом в страдательном залоге, а также возможность употребления в тексте синонимов лексем. Таким образом, во фрагментах такого вида глагол будет представлять отношение, а существительные или местоимения - экземпляры классов.

Рассмотрим представление лексико-синтаксического паттерна, соответствующей рассмотренным аксиомам (1) и (2) на языке LSPL. Подробное описание синтаксиса языка приведено на сайте разработчиков [20]. Лексико-синтаксический паттерн на языке LSPL записывается в виде расширенных формул Бэкуса-Наура (правил грамматики) и задает лексический состав и поверхностно -синтаксические свойства искомой языковой конструкции для ее распознавания. Дополнительно для каждого лексико-синтаксического паттерна указывается паттерн извлечения, который определяет какие компоненты найденной синтаксической конструкции должны быть извлечены. Таким, образом общий вид паттерна на языке LSPL будет следующим: имя_ паттерна =

паттерн распознавания [=text> паттерныизвлечениятекста] Лексико-синтаксические паттерны, соответствующие OWL-аксиоме вида (1) или (2) на языке LSPL будут выглядеть следующим образом:

• BranchAB = ClassA Space Relation Space ClassB =text> ClassA Relation ClassB

• BranchBA = ClassB Space RevRelation Space ClassA =text>

ClassB RevRelation ClassA

• Space = {W}<0, N> =text> Space

• ClassA = {N1 | Pn1 | N1 <synonymA1> | ... | N1 <synonymAn> }<1> =text>

N1 Pn1

• ClassB = {N2 | Pn2 | N2 <synonymB1> | ... | N2 <synonymBn> }<1> =text>

N2 Pn2

• Relation = {V<synonymRel1> <N1.n=V.n, N1.g=V.g> | ... | V<synonymReln> <N1.n=V.n, N1.g=V.g> | V<synonymRel1> <Pn1.n=V.n, Pn1.g=V.g> | ... | V<synonymReln> <Pn1.n=V.n, Pn1.g=V.g>}<1> =text> V

• RevRelation = {V<synonymRel1> <N1.n=V.n, N1.g=V.g, V.r=yes> | ... | V<synonymReln> <N1.n=V.n, N1.g=V.g, V.r=yes> | V<synonymRel1> <Pn1.n=V.n, Pn1.g=V.g, V.r=yes> | ... | V<synonymReln> <Pn1.n=V.n, Pn1.g=V.g, V.r=yes>}<1>

=text> V

Среди приведенных паттернов основными являются паттерны «BranchAB» и «BranchBA». Они задают общую структуру распознаваемых цепочек, состоящих из лексем, которые представляют экземпляры классов и отношение между ними. При этом паттерн «BranchAB» определяет цепочку с глаголом, в активном залоге, а «BranchBA» - в пассивном. Остальные паттерны описывают их отдельные элементы.

Паттерн «Space» соответствует цепочке, состоящей из N-го числа любых лексем. Использование данного шаблона в основных позволяет распознавать те цепочки, в которых между лексемами, представляющими экземпляры классов, и лексемами, представляющими отношения, могут быть предлоги, прилагательные, наречия. Например, это позволяет распознать цепочку «Емкость является нежелательной величиной», где между глаголом «является» и существительным

«величиной» присутствует прилагательное «нежелательной», которое соответствует паттерну «Space». Число N устанавливается равным среднему числу лексем в предложениях текста, так как предполагается, что искомая цепочка будет в пределах одного предложения.

Лексико-синтаксические паттерны «ClassA» и «ClassB» ориентированы на обнаружение лексем, соответствующих вероятным экземплярам классов. Это могут быть существительные (N1, N2), местоимения (Pn1, Pn2) или конкретные синонимы наименований классов (N1 <synonymAn>, N2 <synonymBn>). Набор синонимов при генерации лексико-синтаксического паттерна берется из внешнего словаря. На данный момент используется онлайн словарь от компании «Яндекс» Яндекс.Словарь, доступ к которому осуществляется через его программный интерфейс (API).

Паттерны «Relation» и «RevRelation» позволяют обнаружить в тексте глагол, соответствующий отношению между классами. Он должен быть согласован по роду и числу (условия N1.n=V.n и N1.g=V.g) с лексемой (существительным или местоимением), обнаруженной с помощью паттерна «ClassA». Паттерн «RevRelation» обнаруживает цепочки с глаголом в страдательном залоге (условие V.r=yes). Паттерны извлечения позволяют получить из распознанных цепочек отдельные лексемы, соответствующие вероятным экземплярам классов и отношениям. Полученный набор лексико-синтаксических паттернов, сохраняется в онтологии того CDP, по которому производилась его генерация.

Программная реализация технологии

Представленная технология была реализована на языке Java в виде настольного приложения - генератора лексико-синтаксических паттернов LSPatGen. Для разработки графического интерфейса использовалась платформа JavaFX. Приложение состоит из 2 основных модулей: модуля генерации паттернов и модуля текстового анализа.

Модуль генерации паттернов включает java-классы, реализующие функции анализа онтологии и выявления подходящих для генерации OWL-аксиом, настройки параметров генерации (корректировка лексем, полученных из онтологии, их лемматизация и формирование списка их синонимов) и формирования лексических паттернов. Лемматизация производиться с путем вызова программы mystem - лемматизатора от компании Yandex. Список синонимов исходных лексем для включения в формируемый лексико-синтаксический паттерн формируется путем обращения к веб-сервису «Яндекс.Словарь» - https://dictionary.yandex.net.

Модуль текстового анализа выполняет функции вызова внешнего лексико-синтаксического анализатора LSPL для анализа указанного пользователем текста с применением сформированного паттерна, обработку полученных результатов и представление найденных текстовых фрагментов.

Графический интерфейс включает 3 оконные формы, соответствующие этапам формирования и использования лексико-синтаксического паттерна. Первая форма отображается при загрузке онтологии и позволяет выбрать аксиомы, которые необходимо использовать при генерации (рис. 1).

Рис. 1. Форма выбора аксиом для генерации

Рис. 2. Настройка параметров генерации паттернов

Далее производиться преобразование выбранных аксиом в дуги и определение параметров генерации паттернов для каждой дуги. Это предполагает корректировку лексемы - наименования названия класса (Label), ее лемматизацию, получение и редактирование списка ее синонимов. После чего

производится генерация лексико-синтаксических паттернов и их применение для анализа выбранного пользователем текста (рис. 2, рис. 3)

% LSPatGen | гп || В ||~-v-|

File Edit Help

Branches: Matches:

BranchABPIanSpecificationAObjectiveSpecificationA РЕЗУЛЬТАТЕ БЫТЬОВУ □

brat idibAUbj ecli j peti 1 ltd liunAPIditbpeu 1 Kd LiunA IJMP^^nH^ffiJ^^ffl^KM^I

KranchABHanipeciticationBActian'ripeciticatianB Г^ПнГиГтеРЕСА БЫЛИ МЕХАНИЗМЫ

Fragment:

Описание будет включать для паттернов и их комбинаций

Extended fragment

За первый год выполнения проекта планируется получить: Библиотеку, включающую описание задач онтологического моделирования сопряженных с определенными комбинациями паттернов и их реализаций на языке описания онтологии OWL Описание грамматики языка запросов на основе онтологических паттернов. Описание будет включать для паттернов и их комбинаций формальные грамматики, позволяющие автоматически построить запрос на специализированном языке запросов к онтологии (предположительно на языке SPARQL),

LSPL pattern:

Space = {W]<0,4> =text> Space BranchABPIanSpecificationAObjectiveSpecificationA = PlanSpecificationA Space RelationHasPartA Space ObjectiveSpecificationA =text> PlanSpecificationA RelationHasPartA ObjectiveSpecificationA BranchBAObjectiveSpecificationAPIanSpecificationA = ObjectiveSpecificationA Space Rev RelationHasPartA Space PlanSpecificationA =text> ObjectiveSpecificationA RevRelationHasPartA PlanSpecificationA PlanSpecificationA = {N11 Pnl | N1 <ncc/ieflOBaHMe> | N1 <H3VHeHne> | N1 <aHa/iH3> | N1 <npoBeAeHwe> | N1 <n3bicKaHMe> | ISI1 <oÖ3op> | N1 <ocBoenne> P

Load pattern Save pattern

Text file: | D:\Working\_Eclipse\ontExti nt\lspl\res\text.tsd: Choose file

Result file: | D:\Working\_Eclipse\ontExti nt\lspl\res\result.txt Set result file

Back Perform processing

| Processing finished - results were saved to [mod-resull.txt]

Рис. 3. Анализ текста с помощью полученных паттернов

В результате пользователю для каждого правила (список - Branches) сгенерированного паттерна представляется список найденных цепочек лексем (Matches), а также фрагменты текста, содержащие выбранную цепочку.

Заключение

В данной статье была представлена технология генерации лексико-синтаксических паттернов на основе заданного CDP, а также ее программная реализация в виде настольного приложения. Были рассмотрены основные проблемы формирования лексико-синтаксических паттернов, возникающие в общем случае при последующем использовании полученных паттернов для поиска фрагментов текста, которые могут содержать элементы онтологии. К каковым были отнесены: отсутствие возможности опоры на предметную специфику текста, необходимость обнаружения кореферентных связей между лексемами, различие языков описания паттернов в зависимости от применяемого анализатора.

Наряду с этим был определен общий вид OWL-аксиом, которые могут использоваться для формирования лексико-синтаксических паттернов, было рассмотрено их обобщенное представление в виде паттерна на языке LSPL, а также принципы формирования и использования сгенерированных паттернов с применением разработанного приложения LSPatGen.

Литература

1. Petasis G., Karkaletsis V., et al. Ontology Population and Enrichment: State of the Art,. In Knowledge-Driven Multimedia Information Extraction and Ontology Evolution - Bridging the Semantic Gap, Paliouras G., Spyropoulos C.D., Tsatsaronis G., Lecture Notes in Artificial Intelligence, n. 6050, pp. 1-17, Springer-Verlag, 2011.

2. Lehmann J., Voelker J. Introduction to Ontology Learning Perspectives on Ontology Learning, AKA / IOS Press, (2014).

3. Blomqvist E., Hitzler P., Janowicz K., Krisnadhi A., Narock T., Solanki M. (2015). Considerations regarding Ontology Design Patterns. Semantic Web, 7 (1), pp. 1-7.

4. Ломов, П.А., Автоматизация синтеза составных онтологических паттернов содержания / П.А. Ломов, // Научный журнал «Онтология проектирования» -Том6, №2(20)/2016. - Самара: Новая техника, 2016, сс. 162-172 ISSN 22239537.

5. Hearst M., Automatic acquisition of hyponyms from large text corpora. In Proceedings of the Fourteenth International Conference on Computational Linguistics, pp. 539--545, Nantes, France, July 1992.

6. Liu K., Chapman W., Savova G., Chute C., Sioutos, N., Crowley R. (2011). Effectiveness of Lexico-Syntactic Pattern Matching for Ontology Enrichment with Clinical Documents. Methods of Information in Medicine, 50(5), pp. 397-407.

7. Mukherjea S., Sahay S. Discovering biomedical relations utilizing the World-Wide Web. Proceedings of Pacific Symposium on Biocomputing; Maui, HI. 2006. p. 164175.

8. Berland M., Charniak, E. Finding parts in very large corpora. Proceedings of the 37th Conference on Computational Linguistics; College Park, MD. 1999. p. 57-64.

9. Sundblad H. Automatic acquisition of hyponyms and meronyms from question corpora. Proceedings of the 15th European Conference on Artificial Intelligence; Lyon, France. 2002.

10.Maynard D., Funk A., Peters W. (2009). Using Lexico-Syntactic Ontology Design Patterns for ontology creation and population. Proceedings of WOP2009, Nov.: CEUR-WS.org.

11.Web portal dedicated to ontology design patterns (ODPs) [Электронный ресурс]. - URL: http://ontologydesignpatterns.org/

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

12.Ефремова Н.Э., Большакова Е.И., Носков А.А., Антонов В.Ю. Терминологический анализ текста на основе лексико-синтаксических шаблонов // Компьютерная лингвистика и интеллектуальные технологии: Труды Международной конференции Диалог'2010. - М.: Изд-во РГГУ, 2010. -C. 124- 129.

13.Ермаков А.Е., Плешко В.В., Митюнин В.А. RCO Pattern Extractor: компонент выделения особых объектов в тексте // Информатизация и информационная безопасность правоохранительных органов: XI Международная научная конференция. Сборник трудов. М.: 2003.

14.Жигалов В. А., Жигалов Д.В., Жуков А. А., Кононенко И.С., Соколова Е.Г., Толдова С.Ю. Система Alex как средство для многоцелевой автоматизированной обработки текстов // Труды международного семинара Диалог 2002 «Компьютерная лингвистика и интеллектуальные технологии». М.: Наука, 2002. Т.2. С. 192-208.

15.Томита-парсер - Режим доступа: http://api.yandex.ru/tomita/

16.Buitelaar P., Cimiano P., Racioppa S., Siegel M.: Ontology-based Information Extraction with SOBA. In: Proceedings of the International Conference on Language Resources and Evaluation, pp. 2321-2324. ELRA (May 2006)

17.Kim S., Son W., Park B., Park Y., Lee C., Wang H., Jang G., Park G.: OPTIMA: An Ontology Population System. In: 3rd Workshop on Ontology Learning and Population (July 2008)

18.Weber N., Buitelaar P. Web-based Ontology Learning with ISOLDE. In: Proceedings of the Workshop on Web Content Mining with Human Language at the International Semantic Web Conference, USA (2006)

19.Мальковский М. Г., Старостин А. С., Шилов И. А. Метод разрешения местоименной анафоры в процессе синтаксического анализа // Сборник научных трудов SWorld по материалам международной научно-практической конференции. 2013. Т. 11, № 4. С. 41—49.

20.Lexico-Syntatic Pattern Language - Режим доступа: https://github.com/cmc-msu-ai/lspl

Сведения об авторах

Ломов Павел Андреевич - к.т.н, старший научный сотрудник

е-mail: lomov@iimm.ru

Pavel A. Lomov - Ph.D., senior researcher

i Надоели баннеры? Вы всегда можете отключить рекламу.