Научная статья на тему 'Ассоциативно-онтологический подход к обработке текстов на естественном языке'

Ассоциативно-онтологический подход к обработке текстов на естественном языке Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
816
197
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
INFOLOGICAL APPROACH / ONTOLOGY / SEMIOLOGICAL APPROACH / TEXTS PROCESSING / SEMANTICS / VISUALIZATION / ИНФОЛОГИЧЕСКИЙ ПОДХОД / ОНТОЛОГИЯ / СЕМИОЛОГИЧЕСКИЙ ПОДХОД / ОБРАБОТКА ТЕКСТОВ / СЕМАНТИКА / ВИЗУАЛИЗАЦИЯ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Кулешов С. В., Зайцева А. А., Марков В. С.

Статья посвящена обобщению разработанных методов обработки текстов на естественном языке, в основе которых лежит формирование и использование ассоциативно-онтологического представления данных. Показано, что предложенные методы обработки текстов на естественном языке подходят для выделения признаков текста для построения поисковых индексов, автоматического реферирования научных и технических документов, отнесения текста к предметной области, поиска в коллекции документов.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Кулешов С. В., Зайцева А. А., Марков В. С.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Associative-Ontological Approach to Natural Language Texts Processing

The paper considers the generalization of natural language texts processing methods based on the associative-ontology data representation forming. It is shown that the proposed methods of natural language text processing are suitable for the tasks of text attributes extraction for search indexes creation, automated scientific and technical texts annotation, determining texts subject area, search through the text collections.

Текст научной работы на тему «Ассоциативно-онтологический подход к обработке текстов на естественном языке»

Intellectual Technologies on Transport. 2015. No 4

Ассоциативно-онтологический подход к обработке текстов на естественном языке

Кулешов С. В., Зайцева А. А.

СПИИРАН

Санкт-Петербург, Россия [email protected]

Марков В. С. СПбНЦ РАН Санкт-Петербург, Россия [email protected]

Аннотация. Статья посвящена обобщению методов обработки текстов на естественном языке, в основе которых лежит формирование и использование ассоциативно-онтологического представления данных. Показано, что предложенные методы обработки текстов на естественном языке подходят для выделения признаков текста для построения поисковых индексов, автоматического реферирования научных и технических документов, отнесения текста к предметной области, поиска в коллекции документов.

Ключевые слова: инфологический подход, онтология, семио-логический подход, обработка текстов, семантика, визуализация.

Введение

Данная статья обобщает и систематизирует разработанные ранее подходы к обработке естественно-языковых текстов.

При обработке естественно-языковых текстов наиболее распространен лингвистический подход, использующий анализатор текстов, основанный на синтаксисе.

Сложность реализации высокоточного анализатора русскоязычных текстов вызвана тесной связью синтаксиса и семантики, множеством синтаксически омонимичных конструкций, не допускающих однозначной интерпретации без привлечения знаний о семантической сочетаемости слов.

Изначально предложенный в [1-5] подход отличается от лингвистического приближением и адаптацией к реализационным возможностям компьютерных систем. Он назван семиологическим.

Семиология как наука в интерпретации У. Эко рассматривает совокупность информационных процессов как знаковые системы, предполагая, что они таковыми и являются, будучи, таким образом, также феноменами коммуникации. Тем самым она отвечает потребностям разнообразных современных научных дисциплин, как раз и пытающихся свести явления разного порядка к факту коммуникации [6]. Предметная ориентированность текстов показывает, что для коммуникативного акта не важны некоторые компоненты лингвистики.

Онтология предметной области проявляется не в словах, а в связях между понятиями. В качестве основного типа связи в такой онтологии используется ассоциативная связь между понятиями [7]. Словом, обозначающим понятие в некоторой онтологии, могут служить произвольные идентификаторы, а способы их связи определяются только структурой языка. Кроме того, семиологический подход к визуальной коммуникации проявился в попытке наглядно представить в иконографическом виде содержимое текстовых сообщений (проекты «визуальный словарь», «визуальный поиск») [8-10].

Впоследствии данный подход был расширен путем добавления к обработке текстов специального вида (энциклопедических и словарных) для выделения денотативных связей обработки текстов произвольного вида с выделением коннотативных связей, и стал упоминаться в литературе как «инфологический» [11-17] и «ассоциативно-визуальный».

Такой модифицированный подход предполагает использование методов обработки текстов специального вида, а также текстов на естественном языке с применением автоматически формируемой в процессе работы системы онтологии. Принципиальным отличием такого подхода является именно автоматическое формирование онтологии (семантического окружения) в процессе работы системы, в отличие от априорно заданной онтологии, используемой в подходах, основанных на применении Semantic Web [18, 19].

Есть группа подходов автоматизированного построения онтологий [20], которые базируются на поиске структур по шаблонам в предопределенной структуре.

В отличие от них, в разработанном подходе происходит ассоциативное формирование онтологий в процессе работы системы, а в качестве понятийного графа используется граф ассоциативных связей, формируемый непосредственно на самих текстах тематической антологии. Под антологией (в ряде работ под частным случаем антологии понимается корпус текстов) понимается набор текстов, отобранный с учетом некоторого условия (тематической близости, единства источника, близости времени появления и т. д.).

Многие авторы предлагают для выбора базовых терминов и задания связей между этими терминами использовать экспертные методы [21]. Следует сказать, что привлечение экспертов в данной задаче необходимо, но полностью полагаться на них нецелесообразно, так как могут появиться ошибки, поскольку у всех людей понятия ассоциируются с разными объектами, а применяемая в каждом конкретном случае терминология очень сильно зависит от сферы деятельности эксперта.

Описываемый в статье метод расширяет методы лингвистической статистики и логико-статистические методы [22, 23] для извлечения знаний и построения ассоциативной онтологии заданной предметной области.

Построение семантического окружения и его

ВИЗУАЛИЗАЦИЯ В ВИДЕ АССОЦИАТИВНОГО ГРАФА

Будем считать словом (лексемой) идентификатор w, состоящий из последовательности знаков, являющихся элементами множества букв. Символом конца предложения будем считать элементы множества {“.”, ”?”, ”!”}. Назовем (синтаксическим) предложением S множество слов {w1,W2,...,wN},

Интеллектуальные технологии на транспорте. 2015. № 4

40

Intellectual Technologies on Transport. 2015. No 4

синтаксически связанных друг с другом (находящихся в одном естественно-языковом предложении, заканчивающемся символом конца предложения).

Пусть имеется текст - множество синтаксически связанных упорядоченных слов, являющихся идентификаторами w е {W} с {ю}, где w - слово; W - множество слов в тексте, ю - множество допустимых слов в языке. Допустимое множество слов в языке ю определяется словарями и является каркасом онтологии. В ряде задач допускается динамическое расширение множества ю неологизмами, а также различными внеязыковыми идентификаторами.

Текст сегментируется на семантически близкие компоненты.

Для каждого слова нормализуется морфологическая форма с использованием функции m морфологического анализа - получается каноническая форма слова, т. е. словоизменительные формы слова сводятся к исходной (для существительных - именительный падеж, единственное число; для прилагательных - именительный падеж, единственное число, мужской род; для глаголов - инфинитив и т. д.): m(w) = b, w е {W}, где {W} - множество словоформ одного слова; b - нормальная (каноническая) форма слова. Свойства функции нормализации:

m(b) = b;

Vw(w £ {W}) ^ m(w) = b,b £ {W}.

В ряде работ нормализация морфологической формы называется лемматизацией [22].

Для каждого слова в нормальной форме строится рейтинговое распределение %w, которое используется в задачах визуализации, поиска и реферирования текстов.

Для слов строятся отношения Ri и R2 по следующему правилу:

(wl, w2) е R1,

если w1, w2 - последовательные слова в предложении.

Vwi е S & Vw2 е S ^ (wi, w2) е R2.

В терминах [22] отношение R1 определяет словосочетания w2 - последовательности, состоящие ровно из к слов, между которыми отсутствуют стоп-знаки предложения или текста.

Для отношений R1 и R2 строятся рейтинговые распределения ^ и ^R2 связей элементов.

Отношение R1 используется для определения сложных терминов, состоящих из нескольких последовательных слов.

Если ^ri (wi, w2) > Si, то слова wi и w2 считаются единым термином и для него повторяется вся обработка, при которой слова w^, w2, расположенные последовательно, рассматриваются как одно слово w\+г-

Если ^R2(wi, w2) > S2, то слова м\ и w2 считаются семантически связанными. Полученное семантическое окружение (элемент ассоциативной онтологии) можно представить в виде множества V2

^R2(wi, w2) >S2 ^ (wi, w2) е V2,

где Si, S2 - значения порогов визуализации. Множество V2 может быть визуализировано в виде графа, ребрами которого являются элементы (w^ w2) е V2 . Параметр S2 может

динамически изменяться для управления размером семантического окружения. Одним из примеров применения управления семантическим окружением может быть интерактивное изучение предметной области пользователем.

Экспериментально показано, что эффективность восприятия человеком информации ухудшается при одновременной визуализации более 20 объектов, поэтому в предлагаемом подходе визуализируются первые 20 элементов множества V2, упорядоченных по убыванию частоты ^R2 их использования (по такой схеме: не более 5 элементов первого уровня иерархии, каждый из которых содержит не более 3 связанных с ним элементов второго уровня иерархии). Возможна также фильтрация по принадлежности элементов V2 к тематическим областям.

Тематические области

Объединение ассоциативных связей по всем доступным источникам (антологии) образует Eg (ассоциативную онтологию).

Et с Eg .

Объединение ассоциативных семантических окружений текстов по единой тематике дает тематическую область Et :

U Ei = Et ,

i

где Е} - ассоциативное окружение к тексту Ti (рис. i).

Реферирование

В задачах интернет-мониторинга, а также для предоставления кратких аннотаций документов при поиске используется метод автоматического реферирования текстов, основанный на сформированном для текста семантическом окружении.

Идея реферирования основана на построении текста реферата путем выбора предложений исходного текста, имеющих рейтинг выше порогового значения.

Пусть s е T, где s - предложения, являющиеся элементами множества предложений текста T. В этом случае рефератом текста назовем множество F, если F с T, |F| < |T|. Рефератом на каждом шаге s = i, 2,..., n является множество FS, которое формируется из предложений s исходного текста T по правилам s е FS, если р(s) > S, где p(s) - рейтинг предложения. Значение n определяется условием |Fn| = 0.

Для определения рейтинга предложения используется отношение R2, определяющее синтаксическую связь к между двумя словами предложения. Рейтингом предложения счита-

Интеллектуальные технологии на транспорте. 2015. № 4

41

Intellectual Technologies on Transport. 2015. No 4

ется максимальный рейтинг элементов множества Ks с R2, входящих в предложение s, рассчитываемый по формуле

p(s) = max ILk I, s e L к,

keKs

где Lk - множество предложений текста T, содержащих синтаксическую связь к между двумя словами.

Алгоритм ассоциативного поиска текстов

Формально процесс ассоциативного поиска по текстам можно определить как выборку множества документов по поисковой фразе, удовлетворяющих условию наличия семантических связей в документе между всеми словами поисковой фразы.

Поисковая фраза представляет из себя множество слов, полученных из естественно-языкового запроса путем приведения всех слов в нормальную (каноническую) форму и удаления стоп-слов. Для поисковой фразы формируют ассоциативное окружение Eq с EG аналогично формированию ассоциативного окружения для текста, считая всю поисковую фразу синтаксическим предложением.

Для слов Wj текстового запроса Q:

Vwj e Q& VW2 e Q ^ (wj, W2) e Eq.

При операции поиска Er = Eq П Eg по запросу Q возможны следующие случаи:

• |Er| = |Eq| - существуют документы, содержащие все связи запроса;

• |Er| < \Eq\ - не существует документа в антологии, имеющего все связи запроса, онтология неполная или запрос некорректен;

• \Er\ = 0 - по запросу ничего не найдено (в онтологии нет связей, удовлетворяющих поисковому запросу).

Результатом выполнения запроса является множество документов {T}, Ет, П Eq ф0, которое преобразуется в упорядоченный список (SERP) путем применения функции ранжирования.

Поиск документов, отвечающих поисковой фразе, производится путем выбора документов, удовлетворяющих условию наличия всех связей между словами, имевшимися в поисковой фразе (рис. 2).

Рис. 2. Иллюстрация принципа ассоциативного поиска на основе поиска подграфа в графе

Заключение

Описанный в статье подход и предложенные на его основе методы обработки текстов на естественном языке успешно

решают целый круг задач, связанных с автоматизированной обработкой текстов, таких как выделение признаков текста для построения поисковых индексов, автоматическое реферирование научных и технических документов, отнесение текста к предметной области (локализация положения в ассоциативной онтологии), поиск в коллекции документов и другие.

На основе описанного подхода могут быть построены поисковые и справочные системы с использованием ассоциативно-онтологического поиска информации [8, 9, 24-26].

В этих системах может быть реализован автоматический отбор фактологических и справочных данных с одновременным игнорированием коммерческих и рекламных предложений, а также различных видов поискового спама.

Подход дает возможность реализовать подсистему тематической локализации области поиска (по областям знания и сферам деятельности) путем работы в соответствующей антологии. Имеется возможность поиска кластеров однотемных документов с выделением вероятного первоисточника.

Принцип работы такой системы - поиск информационного окружения какого-либо процесса, явления или персоны. Здесь под информационным окружением понимаются те ассоциации, которые могут возникать у человека в текущий момент под влиянием внешнего окружения. Система может решать задачу поиска документов и фактов при недостатке начальных данных. Как правило, в таких случаях известно лишь одно или несколько ключевых слов и ничего более, а недостающие ключевые слова добавляются постепенно при помощи их итеративного выбора из ассоциативного окружения.

Литература

1. Александров В. В. Тенденции развития информационных систем. Базы данных, базы знаний, онтологические, логистические, семиологические / В. В. Александров, Н. А. Андреева, С. В. Кулешов // Современные проблемы социально-экономического развития информационных технологий : сб. тр. междунар. конф., Баку, 2004. - Баку, 2004. -С. 40-51.

2. Александров В. В. Семиологический подход построения информационно-аналитических систем / В. В. Александров, Н. А. Андреева, С. В. Кулешов // Системные проблемы надежности, качества, информационных и электронных технологий (Инноватика-2004) : материалы Междунар. конф. и Рос. науч. школы, Сочи, 2004. - М., 2004. -С. 3-16.

3. Александров В. В. Семиологический подход и информационно-аналитические системы / В. В. Александров, С. В. Кулешов, Р. М. Юсупов // Инфокоммуникационные и вычислительные технологии в науке, технике и образовании : докл. и тез. междунар. науч. конф., Ташкент, 2004. -Ташкент, 2004. - С. 13-23.

4. Александров В. В. Визуальный динамический глоссарий - VISGLOSS / В. В. Александров, Н. А. Андреева, С. В. Кулешов // Системные проблемы надежности, качества, информационных технологий (Инноватика-2005) : материалы Х междунар. конф. и Рос. науч. школы, Сочи, 2005. - М., 2005. - С. 4-8.

Интеллектуальные технологии на транспорте. 2015. № 4

42

Intellectual Technologies on Transport. 2015. No 4

5. Александров В. В. Семиологические информационные системы - аналитическое самореферирование / В. В. Александров, С. В. Кулешов // Системные проблемы надежности, качества, информационных технологий (Инноватика-2005) : материалы Х междунар. конф. и Рос. науч. школы, Сочи, 2005. - М., 2005. - С. 9-14.

6. Эко У Отсутствующая структура. Введение в семиологию / У Эко. - СПб. : Петрополис, 1998. - 432 с.

7. Александров В. В. Системное моделирование. Методы построения информационно-логистических систем : учеб. пособие / В. В. Александров, Н. А. Андреева, С. В. Кулешов. - СПб. : Изд-во Политехн. ун-та, 2006. - 95 с.

8. Александрова В. В. VisualWorld.ru когнитивная технология представления знаний / В. В. Александрова, Н. А. Андреева, С. В. Кулешов // Будущее сильной России - в высоких технологиях : тр. Вторых Всерос. науч. чтений, СПб., 2008. - СПб. : Логос, 2008. - С. 28-32.

9. Andreeva N. A. VisualWorld.ru - the internet-educational resource / N. Andreeva, P. Kokorin, S. Kuleshov // Proc. Distributed Intel. Syst. and Technol. Workshop, St. Petersburg, 2008. - St. Petersburg, 2008. - Pp. 163-168.

10. Alexandrov V V The Visual Glossary as New Information Technology for Science Education / V. V Alexandrov, S. V. Kuleshov, N.A. Semushkina // Education and Information Systems, Technologies and Applications (EISTA) : proc. 6th Int. Conf., Orlando, Florida, USA, 2008. - Orlando, Florida, USA, 2008.

11. Александров В. В. Интернет-обучение и поиск информации. Поиграем в ассоциации! / В. В. Александров, С. В. Кулешов // Будущее сильной России - в высоких технологиях : сб. трудов Всерос. чтений, СПб., 2007. - СПб., 2007. - С. 29-33.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

12. Александров В. В. Аналитический мониторинг INTERNET-контента. Инфологический подход / В. В. Александров, С. В. Кулешов // Системные проблемы надежности, качества, математического моделирования, информационных и электронных технологий в инновационных проектах (Инноватика-2007) : материалы Междунар. конф. и Рос. науч. школы, Сочи, 2007. - М. : Энергоатомиздат, 2007. - С. 80-83.

13. Александров В. В. Концепция построения информационно-логистических систем / В. В. Александров, С. В. Кулешов, П. П. Кокорин // Системные проблемы надежности, качества, математического моделирования, информационных и электронных технологий в инновационных проектах (Инноватика-2008) : материалы Междунар. конф. и Рос. науч. школы, Сочи, 2008. - М. : Энергоатомиздат, 2008. -С. 21-23.

14. Кокорин П. П. Инфологический подход к разработке систем «обучение через развлечение» (edutainment) / П. П. Кокорин, Р А. Колесников, Н. А. Андреева, К. А. Фролов, Ш. А. Боумедин, С. В. Кулешов // Информ.-измерительные и управляющие системы. - 2009. - Т. 7, № 11. - С. 42-48.

15. Кокорин П. П. Инфологическая система аналитического мониторинга научно-технических фондов библиотек // Информ.-измерительные и управляющие системы. -2009. - Т. 7, № 4. - С. 11-16.

16. Кулешов С. В. Аппаратная реализация СУБД в инфо-логических системах / С. В. Кулешов, П. П. Кокорин // Тр. СПИИРАН. - 2010. - Вып. 14. - С. 244-250.

17. Александров В. В. Аналитический мониторинг Internet-контента. Инфологический подход / В. В. Александров, С. В. Кулешов // Качество. Инновации. Образование. - 2008. -№ 3. - С. 68-70.

18. Smirnov A. V. Intelligent Manufacturing Cover image Agent-based support of mass customization for corporate knowledge management. / A. V. Smirnov, M. Pashkin, N. Chilov, T. Levashovа // Eng. Appl. Artificial Intel. - 2003. - Vol. 16, is. 4. - P. 349-364.

19. Zenuni X. State of the Art of Semantic Web for Healthcare / X. Zenuni, B. Raufi, F. Ismaili, J. Ajdari // Procedia - Soc. Behav. Sci. - 2015. - Vol. 195. - P. 1990-1998.

20. Оробинская Е. А. Метод автоматического построения онтологии предметной области на основе анализа лингвистических характеристик текстового корпуса / Е. А. Оробин-ская // Интернет и современное общество (IMS-2012) : тр. XV Всерос. объединенной конф., СПб., 2012. - СПб., 2012. -С. 209-212.

21. Поляков А. О. Построение моделей профессионального знания на основе использования лингвистического подхода / А. О. Поляков // Интеллектуализация автоматизации проектирования : сб. тр. СПИИРАН. - СПб. : Изд-во СПбГТУ, 1994. - С. 16-37.

22. Филиппович Ю. Н. Семантика информационных технологий : опыты словарно-тезаурусного описания / Ю. Н. Филиппович, А. В. Прохоров; предисл. А. И. Новикова. - М. : Изд-во МГУП, 2002. - 368 с.

23. Бектаев К. Б. Математические методы в языкознании. Ч. 2. Математическая статистика и моделирование текста / К. Б. Бектаев, Р. Г. Пиотровский. - Алма-Ата, 1974. -336 с.

24. Кулешов С. В. Аналитический мониторинг интернет ресурсов с целью выявления потенциально опасного содержания / С. В. Кулешов // Перспективные системы и задачи управления : материалы IV науч.-практич. конф., Таганрог, 2008. - Таганрог, 2009. - С. 255.

25. Михайлов С. Н. Методика инфологического анализа семантического содержания обращений пациентов для организации электронной записи / С. Н. Михайлов, О. И. Ма-лашенко, А. А. Зайцева // Тр. СПИИРАН. - 2015. - Вып. 42. -C. 140-154.

26. Зайцева А. А. Метод оценки качества текстов в задачах аналитического мониторинга информационных ресурсов / А. А. Зайцева, С. В. Кулешов, С. Н. Михайлов // Тр. СПИИРАН. - 2014. - Вып. 6 (37). - С. 144-155.

Интеллектуальные технологии на транспорте. 2015. № 4

43

Intellectual Technologies on Transport. 2015. No 4

Associative-Ontological Approach to Natural Language Texts Processing

Kuleshov S. V., Zaytseva A.A.

SPIIRAS

St.Petersburg, Russia [email protected]

Abstract. The paper considers the generalization of natural language texts processing methods based on the associative-ontology data representation forming. It is shown that the proposed methods of natural language text processing are suitable for the tasks of text attributes extraction for search indexes creation, automated scientific and technical texts annotation, determining texts subject area, search through the text collections.

Keywords: infological approach, ontology, semiological approach, texts processing, semantics, visualization.

References

1. Alexandrov V. V., Andreeva N.A., Kuleshov S. V. Trends in the Development of Information Systems. Databases, Knowledge Bases, Ontological, Logistic, Semiological [Tendentsii razvitiia informatsionnykh sistem. Bazy dannykh, bazy znanii, ontologicheskie, logisticheskie, semiologicheskie]. Proc. “Modern problems of socio-economic development of information technology ". Baku, 2004. Pp. 40-51.

2. Alexandrov V. V., Andreeva N.A., Kuleshov S. V. Semiological Approach of Building Information-analytical Systems [Semiologicheskii podkhod postroeniia informatsionno-analit-icheskikh sistem]. Proc. “Systemproblems of reliability, quality of information and electronic technologies". Sochi, 2004. Pp. 3-16.

3. Alexandrov V. V., Kuleshov S. V., Yusupov R. M. Semiological Approach and Information and Analytical Systems [Semiologicheskii podkhod i informatsionno analiticheskie sistemy]. Proc. “Infocommunication and computing technologies in Science, Engineering and Education". Tashkent, 2004. Pp.13-23.

4. Alexandrov V. V., Andreeva N.A., Kuleshov S. V. Visual Dynamic Glossary - VISGLOSS [Vizual'nyi dinamicheskii glos-sarii - VISGLOSS]. Proc. “Systemproblems of reliability, quality of information and electronic technologies". Sochi, 2005. Pp. 4-8.

5. Alexandrov V. V., Kuleshov S. V. Semiological Information Systems - Analytical Self-annotation [Semiologicheskie infor-matsionnye sistemy - analiticheskoe samoreferirovanie]. Proc. “System problems of reliability, quality of information and electronic technologies". Sochi, 2005. Pp.9-14.

6. Eko U. Otsutstvuiushchaia struktura. Vvedenie v semi-ologiiu [Lack of Structure. Introduction to Semiology]. St. Petersburg, Petropolis, 1998. 432 p.

7. Alexandrov V. V., Andreeva N. A., Kuleshov S. V. Sistem-noe modelirovanie. Metody postroeniia informatsionno-logis-ticheskikh system: uchebnoeposobiye [System Modeling. Methods of Construction Information and Logistics Systems: study guide], St. Petersburg, Publ. “Politechnika”, 2006. 95 p.

8. Alexandrova V. V., Andreeva N. A., Kuleshov S. V. Visu-alWorld.ru Cognitive Knowledge Representation Technology

Markov V. S.

SPbAC RAS St.Petersburg, Russia [email protected]

[VisualWorld.ru kognitivnaia tekhnologiia predstavleniia znanii].

Trudy “Vtorye Vserossiiskie nauchnye chteniia Budushchee sil'noi Rossii - v vysokikh tekhnologiiakh" [Proc. “SecondAll-Russian Scientific Readings Future of a Strong Russia is in HiTech"]. St. Petersburg, 2008. Pp. 28-32.

9. Andreeva N.A., Kokorin P. P, Kuleshov S. V. VisualWorld. ru - the Internet-Educational Resource. Proc. “Distributed Intel. Syst. and Technol. Workshop". St. Petersburg, 2008. Pp. 163-168.

10. Alexandrov V. V. Kuleshov S. V., Semushkina N.A. The Visual Glossary as New Information Technology for Science Education. Proc. “Education and Information Systems, Technologies and Applications (EISTA)". Orlando, Florida, USA, 2008.

11. Alexandrov V. V., Kuleshov S. V. Internet-Training and Information Search. Let's Play in the Associations! [Internet-obuchenie i poisk informatsii. Poigraem v assotsiatsii!] Trudy “Vserossiiskie nauchnye chteniia Budushchee sil'noi Rossii -v vysokikh tekhnologiiakh" [Proc. “Russian Scientific Readings Future of a Strong Russia is in Hi-Tech"]. St. Petersburg, 2007. Pp. 29-33.

12. Alexandrov V. V., Kuleshov S. V. Analytical Monitoring of Internet Content. Infological Approach [Analiticheskii monitoring INTERNET kontenta. Infologicheskii podkhod]. Proc. “System problems of reliability, quality of information and electronic technologies". Sochi, 2007. Pp. 80-83.

13. Alexandrov V. V., Kuleshov S. V., Kokorin P. P. The Concept of Building of Information and Logistics Systems. [Kontseptsiia postroeniia informatsionno-logisticheskikh sistem]. Proc. “System problems of reliability, quality of information and electronic technologies". Sochi, 2008. Pp. 21-23.

14. Kokorin P. P, Kolesnikov R. A., Andreeva N. A., Frolov K.A., Sh. Boumedyen, Kuleshov S. V. The Infological Approach to Develop Edutainment Systems [Infologicheskii podkhod k razrabotke sistem “obuchenie cherez razvlechenie” (edutainment)]. Informatsionno-izmeritelnye i upravlyayushchia sistemy [Information-measuring and Control Systems], 2009, no. 11 (7), pp. 42-48.

15. Kokorin P. P. Infological System for Analytical monitoring of Scientific and Technical Literature in Electronic Libraries [Infologicheskaia sistema analiticheskogo monitoringa nauchno-tekhnicheskikh fondov bibliotek]. Informatsionno-izmeritelnye i upravlyayushchia sistemy [Information-measuring and Control Systems], 2009, no. 4 (7), pp. 11-16.

16. Kuleshov S. V., Kokorin P. P. Hardware Implementation of the DBMS for Infological Systems [Apparatnaia realizatsiia SUBD v infologicheskikh sistemakh]. Trudy SPIIRAN[SPIIRAS Proceedings], 2010, no. 14, pp. 244-250.

17. Alexandrov V. V., Kuleshov S. V. Analytical Monitoring of Internet Content. Infological Approach [Analiticheskii moni-

Интеллектуальные технологии на транспорте. 2015. № 4

44

Intellectual Technologies on Transport. 2015. No 4

toring Internet kontenta. Infologicheskii podkhod]. Kachestvo. Innovatsii. Obrazovanie [Quality. Innovations. Education], 2008, no. 3, pp. 68-70.

18. Smirnov A. V., Pashkin M., Chilov N., Levashovа T. Intelligent Manufacturing Cover image Agent-based support of mass customization for corporate knowledge management. Eng. Appl. Artificial Intel., 2003, Vol. 16, Is. 4, pp. 349-364.

19. Zenuni X., Raufi B., Ismaili F., Ajdari J. State of the Art of Semantic Web for Healthcare. Procedia - Soc. Behav. Sci., 2015, vol. 195, pp. 1990-1998.

20. Orobinskaya E. A. Automatic Method Of Domain Ontology Construction Based on Characteristics of Corpora POS-Anal-ysis [Metod avtomaticheskogo postroeniia ontologii predmetnoi oblasti na osnove analiza lingvisticheskikh kharakteristik teksto-vogo korpusa]. Trudy “XV Ob’edinennaia rossiiskaia konferen-tsiia Internet i sovremennoe obshchestvo” [Proc. “XV United Russian conf. IMS-2012”]. St.Petersburg, 2012, pp. 209-212

21. Polyakov A. O. Building of Models of Professional Knowledge through the Use of Linguistic Approach [Postroe-nie modelei professional’nogo znaniia na osnove ispol’zovaniia lingvisticheskogo podkhoda]. Intellektualizatsiia avtomatizatsii proektirovaniia: sbornik trudov SPIIRAN[Intellectualization of design automation: a collection of papers of SPIIRAS]. St. Petersburg, Publ. of SPbGTU, 1994. Pp. 16-37.

22. Philippovich Yu. N., Prokhorov A. V Semantika informat-sionnykh tekhnologii: opyty slovarno-tezaurusnogo opisaniia; pre-dislovie A. I. Novikova [The Semantics of Information Technology: Experiments of Dictionary-Thesaurus Description; a foreword of A. I. Novikov]. Moscow, Publ of MGUP, 2002. 368 p.

23. Bektaev K. B., Piotrovsky R. G. Matematicheskie me-tody v iazykoznanii. Ch. 2. Matematicheskaia statistika i mod-elirovanie teksta [Mathematical Methods in Linguistics. Part 2. Mathematical Statistics and Modeling of the Text.]. Alma-Ata, 1974. 336 p.

24. Kuleshov S. V. Analytical Monitoring of Internet Resources in Order to Detect Potentially Dangerous Content [Analiticheskii monitoring internet resursov s tsel'iu vyiavleni-ia potentsial'no opasnogo soderzhaniia]. Trudy “Perspektivnye sistemy i zadachi upravleniia” [Proc. “Prospective systems and control problems”]. Taganrog, 2009. P. 255.

25. Mikhailov S. N., Malashenko O. I., Zaytseva A. A. The Method for the Infology Analysis of Patients Complaints Semantic Content in Order to Organize the Electronic Appointments. Trudy SPIIRAN [SPIIRAS Proc.], 2015, Is. 42, pp. 140-154.

26. Zaytseva A. A., Kuleshov S. V., Mikhailov S. N. The Method for the Text Quality Estimation in the Task of Analytical Monitoring of Information Resources. Trudy SPIIRAN [SPIIRAS Proc.], 2014, Is. 37, pp. 144-155.

Интеллектуальные технологии на транспорте. 2015. № 4

45

i Надоели баннеры? Вы всегда можете отключить рекламу.