Научная статья на тему 'Разработка механизма преобразования запросов на естественном языке в информационной системе'

Разработка механизма преобразования запросов на естественном языке в информационной системе Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
360
61
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ДИАЛОГ / ЗАПРОС / ЕСТЕСТВЕННЫЙ ЯЗЫК / ТЕСТОВАЯ СИСТЕМА / МОРСКИЕ СПЕЦИАЛЬНОСТИ / КОМПЕТЕНЦИИ / ОБУЧЕНИЕ / ЛЕКСИЧЕСКИЙ АНАЛИЗ / СИНТАКСИЧЕСКИЙ АНАЛИЗ / DIALOG / QUERY / NATURAL LANGUAGE / TEST SYSTEM / MARITIME SPECIALTIES / COMPETENCIES / EDUCATION / LEXICAL ANALYSIS / SYNTACTIC ANALYSIS

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Барышникова Надежда Юрьевна

Современные достижения в области информационных технологий проявляются в создании и развитии интеллектуальных информационных систем, обеспечивающих хранение и изменение необходимых пользователю данных, а также их получение по требованию. В статье описан метод реализации формального механизма преобразования запроса к данным на проблемно-ориентированном подмножестве естественного языка в информационной системе. За основу взята система электронного тестирования для подготовки морских специалистов. Разработан алгоритм функционирования механизма, позволяющий существенно сократить и упростить процесс формирования произвольных отчетов с целью анализа и определения структуры организации, приоритетных должностей и т. д. для дальнейшего решения кадрового вопроса. Алгоритм реализован на неком формальном подмножестве естественного языка, которое ограничено двумя классами предложений: простые вопросительные и побудительные. Рассмотрен подробный пример выполнения запроса на этапах лексического и синтаксического анализа с последующей трансляцией на язык запросов к информационной системе и предоставлением конечного результата пользователю.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

At the user level, modern advances in information technology are manifested in the creation and development of the intelligent information systems for storing and change the necessary user data, as well as receive them on demand. Describes a method for implementing a formal mechanism for the conversion request to the data on problem-oriented subset of natural language processing in information system. It based on the testing system for the preparation of marine professionals. The algorithm of functioning of the mechanism, which allows significantly devide out and oversimplify the process of forming arbitrary reports to analyse and define the structure of the Organization, priority posts, etc. for further address the staffing issue. Algorithm is implemented on some formal natural language subset, which limited by two classes of proposals: a simple interrogative and motive. Considered a detailed example of query execution on the stages of the lexical and syntactic analysis with subsequent translation into the language of the query to the information system and providing the final result to the user.

Текст научной работы на тему «Разработка механизма преобразования запросов на естественном языке в информационной системе»

SLOZ (178) 9 «эЛшча1

МЕСТНИК

Г0СУДАРСТ6ЕН1-ЮГ0 УНИВЕРСИТЕТА

^МОРСКОГО И РЕЧНОГО ФЛОТА ИМЕНИ АДМИРЛЯАС. О. МАКАРОвА

6. Cormen, Thomas H., Charles E. Leiserson, Ronald L. Rivest, Clifford Stein. Algoritmy: postroenie i analiz. - 2-e izd. Per. s angl. M.: Izdatelskij dom «Vilijams», 2010.

7. Levitin, A. V. Algoritmy: vvedenie v razrabotku i analiz. M.: Izdatelskij dom «Viljams», 2006.

8. Russell, Jesse, and Ronald Cohn. Algoritm Dejkstry. Izd-vo VSD, 2012.

9. Ohorzin, V. A. Optimizacija jekonomicheskih sistem. M.: Finansy i statistika, 2005.

10. Romanovsky, I. V. Diskretnyj analiz. 4-e izd., ispr. i dop. SPb.: Nevskij Dialekt, BHV-Peterburg, 2008.

11. D’Ambrosio, C., A. Lodi, S. Wiese, and C. Bragalli. “Mathematical programming techniques in water network optimization.” European Journal of Operational Research 243.3 (2015): 774-788. DOI:10.1016/J. EJOR.2014.12.039.

12. Reich, Daniel. “A linear programming approach for linear programs with probabilistic constraints.” European Journal of Operational Research 230.3 (2013): 487-494. D0I:10.1016/J.EJ0R.2013.04.049.

13. Sokolov, A. V., and O. I. Karasev. “Razrabotka tehnologicheskih dorozhnyh kart.” Rossijskie nanotehnologii 4.3-4 (2009): 16-17.

14. Ore, O. Teorija grafov. Izdatelstvo: Librokom, 2009.

15. Bojarinceva, T. I., and A. A. Mastihina. Teorija grafov: metodicheskie ukazanija k vypolneniju domashnego zadanijapo kursu «Diskretnaja matematika». M.: MGTU im. N. Je. Baumana, 2014.

________ИНФОРМАЦИЯ ОБ АВТОРАХ

Чертков Александр Александрович — кандидат технических наук, доцент.

ФГБОУ ВО «ГУМРФ имени адмирала С. О. Макарова».

chertkov51@mail.ru

Вардомская Анна Александровна — аспирант. Научный руководитель:

Барышников Сергей Олегович —

доктор технических наук, профессор, ректор

ФГБОУ ВО «ГУМРФ имени

адмирала С. О. Макарова»

kaf_osnipr@gumrf.ru

Дмитриев Александр Александрович — аспирант. Научный руководитель:

Сахаров Владимир Васильевич — доктор технических наук, профессор.

ФГБОУ ВО «ГУМРФ имени адмирала С. О. Макарова» kaf_osnipr@gumrf.ru

INFORMATION ABOUT THE AUTHORS

Chertkov Alexandr Alexandrovich —

PhD, associate professor.

Admiral Makarov State University of Maritime and Inland Shipping

chertkov51@mail.ru

Vardomskaya Anna Alexandrovna — postgraduate. Supervisor:

Baryshnikov Sergej Olegovich —

Dr. of Technical science, professor, rector Admiral Makarov State University of Maritime and Inland Shipping

kaf_osnipr@gumrf.ru

Dmitriev Alexandr Alexandrovich — postgraduate. Supervisor:

Saharov Vladimir Vasilievich —

Dr. of Technical science, professor Admiral Makarov State University of Maritime and Inland Shipping

kaf_osnipr@gumrf.ru

Статья поступила в редакцию 7 октября 2015.

УДК 681.3.015

Н. Ю. Барышникова

РАЗРАБОТКА МЕХАНИЗМА ПРЕОБРАЗОВАНИЯ ЗАПРОСОВ НА ЕСТЕСТВЕННОМ ЯЗЫКЕ В ИНФОРМАЦИОННОЙ СИСТЕМЕ

Современные достижения в области информационных технологий проявляются в создании и развитии интеллектуальных информационных систем, обеспечивающих хранение и изменение необходимых пользователю данных, а также их получение по требованию. В статье описан метод реализации формального механизма преобразования запроса к данным на проблемно-ориентированном подмножестве естественного языка в информационной системе. За основу взята система электронного тестирования для подготовки морских специалистов. Разработан алгоритм функционирования механизма, позво-

BECTHL

ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА

МОРСКОГО И РЕЧНОГО ФЛОТА ИМЕН И АДМИРАЛА С, О. МАКАРОВА,

ляющий существенно сократить и упростить процесс формирования произвольных отчетов с целью анализа и определения структуры организации, приоритетных должностей и т. д. для дальнейшего решения кадрового вопроса. Алгоритм реализован на неком формальном подмножестве естественного языка, которое ограничено двумя классами предложений: простые вопросительные и побудительные. Рассмотрен подробный пример выполнения запроса на этапах лексического и синтаксического анализа с последующей трансляцией на язык запросов к информационной системе и предоставлением конечного результата пользователю.

Ключевые слова: диалог, запрос, естественный язык, тестовая система, морские специальности, компетенции, обучение, лексический анализ, синтаксический анализ.

С целью организации подготовки морских специалистов [1], [2] на кафедре вычислительных систем и информатики успешно разработана и внедрена в эксплуатацию распределенная информационная система электронного тестирования для оценки соответствия профессиональным компетенциям [3], [4], реализованная на платформе «1С: Предприятие 8» на основе адаптированной типовой конфигурации «1С: Электронное обучение. Экзаменатор» [5].

Для определения результатов [6] прохождения тестов и факторов, их обусловливающих, большое внимание при создании программного продукта было отведено статистическому анализу данных. Здесь прослеживается прямая зависимость от предусмотренного разработчиком набора отчетов информационной системы, создаваемых на основе итоговых результатов тестирований пользователей. Полученная информация позволяет руководителям и разработчикам в дальнейшем вносить соответствующие корректировки в процесс тестирования. Например, информационная система [7], [8] позволяет анализировать качество тестов на основании целого ряда параметров: количество и качество верных и неверных ответов на вопросы, затраченное на ответы время и т. д. Это дает возможность получать обратную связь об уровне подготовки тестируемых, сложности теста, характерных ошибках при выполнении теста, что важно для дальнейшего совершенствования учебных материалов и тестов. Также проанализировав конечные результаты, можно определить приоритетные для организации должности. Стоит отметить, что с возрастанием числа участников тестирования, растет и точность получаемых статистических выводов.

Однако часто встречается ситуация, когда информации, полученной из стандартных отчетов, содержащихся в программном продукте, недостаточно, или требуется получить более детальную расшифровку результатов. Обычно для решения задач такого рода необходимо прибегнуть к использованию средств программирования, требующих от пользователя достаточно высокой квалификации, четкого понимания структуры и наполнения базы данных, ее динамически изменяющейся структуры и объема. В соответствии с этим активно создаются и развиваются интеллектуальные информационные системы, обеспечивающие хранение и преобразование необходимых пользователю данных, а также их получение по требованию. Однако средств, которые в полной мере предоставляли бы возможность исполнять запросы пользователя, сформулированные на естественном языке (ЕЯ), до сих пор нет. В полной мере такими средствами нельзя считать и специализированные языки запросов (например, 1CQ, SQL, MDX), поскольку они требуют достаточно высокой квалификации.

В настоящей работе приведен разработанный формальный [9] - [11] механизм интеллектуального доступа в информационной системе посредством организации диалога и последующего анализа запросов на ЕЯ. Создание интуитивно-понятного анализатора позволяет значительно увеличить эффективность работы пользователя. Стоит отметить, что ЕЯ выбран благодаря достоинствам, которыми он обладает с точки зрения обычного пользователя:

- ЕЯ не требует специальной подготовки в освоении пользователем;

- языковые конструкции, в том числе в их проблемно-ориентированном ограниченном виде, просты и понятны всем пользователям информационной системы;

Введение

Выпуск 6 (34) 2015.

SLOZ (178) 9 «эЛшча1

- компоненты структуры информационной системы описываются терминами ЕЯ как во внутреннем, так и во внешнем представлении.

Постановка задачи

Постановку задачи в общем виде можно сформулировать следующим образом: разработать формальный механизм преобразования запроса к данным на проблемно-ориентированном подмножестве ЕЯ в язык запросов к информационной системе. Далее этот запрос должен быть выполнен информационной системой и возвращен результат или сообщение об ошибке с осмысленными пояснениями причин ее возникновения.

Организация диалога в рамках информационной системы на ЕЯ

Разработанный формальный механизм учитывает ограниченный функционал информационной системы, определяемый объектом автоматизации, т. е. системой электронного тестирования для подготовки морских специалистов. Взаимодействие осуществляется между человеком [12], в роли которого может выступать как работник или претендент на должность, так и организатор тестирования, и информационной системой. Главной задачей механизма является преобразование запросов на проблемно-ориентированном подмножестве ЕЯ в язык запросов к базе данных с целью получения необходимой выборки.

В целом алгоритм функционирования разработанного формального механизма основан на следующих этапах [13]:

- поддержка интеллектуального ввода пользователем запроса на ЕЯ на основе заполненных словарей с возможностью задания параметров;

- выполнение лексического анализа запроса;

- выполнение синтаксического анализа запроса;

- автоматическая генерация текста запроса на язык запросов 1CQ (язык запросов среды «1С: Предприятие 8)»;

- выполнение запроса информационной системой, вывод конечных результатов пользователю или сообщение об ошибке.

На основе разработанного алгоритма детально рассмотрим пример его работы по анализу простейшего запроса на ЕЯ «Показать результаты теста участников на должность капитан».

Работа механизма начинается с ввода запроса на ЕЯ и, при необходимости, задания параметров. Был реализован диалог, предполагающий ввод некоторого произвольного текста в специальные поля формы. В большинстве случаев это приводит к возникновению ошибок со стороны пользователя. На этот случай механизм оснащен интеллектуальной составляющей. Осуществляется анализ входного запроса и решение целого ряда задач, связанных с поиском в нем информации определенной структуры, последующей проверкой данных, поступивших от пользователя, и их возможной модификацией. Также с целью сокращения возникновения заведомо очевидных ошибок используются некоторые ограничения, относящиеся к проблемно-ориентированному подмножеству ЕЯ, что позволяет упростить работу по разбору предложения на каждом последующем этапе анализа. На основании этого вся совокупность входных запросов была ограничена двумя классами предложений [14]: простые вопросительные предложения («Каков...?») и побудительные предложения («Показать.»). При вводе запроса на ЕЯ пользователь пошагово набирает слова, при этом информационная система, на основе заполненных ранее словарей, ограничивает круг предлагаемых вариантов в зависимости от предыдущего введенного слова и предоставляет интеллектуальную подсказку. В результате получаем структуру фразы вида

С С С С С С С ,

М ^2 ^3 ^4 ^5 ^6 ^7’

(1)

где Ся — слова входящего запроса на ЕЯ.

Разбор исходного запроса на ЕЯ всегда начинается с этапа лексического анализа, представляющего собой процесс определения слов и дальнейшего заполнения на их основе таблицы лексем, где каждой лексеме в соответствие ставится набор определенных характеристик, таких как

часть речи, род, число и т. д. На основе внесенных в информационную систему наборов правил осуществляется разбор входной конструкции. В результате формируется системная таблица лексем следующего вида

Системная таблица лексем

Л, Х,

Л2 Х2

Л3 Х3

Л4 Х4

Л5 Х5

Л6 Х6

Л7 Х7

Здесь Ля — лексема, составляющая входящий запрос; Хя — характеристика, соответствующая лексеме.

Выходная информация, полученная на этапе лексического анализа, передается для дальнейшей обработки на этап синтаксического анализа, основной задачей которого является сопоставление линейной последовательности лексем с формальной входной грамматикой языка. В результате получаем разобранную синтаксическую структуру предложения.

Представим вариант формальной грамматики G, на основе которой выполняется простейший синтаксический анализ:

<предложение>::=<побудительное>.|<вопросительное>?

<побудительное>::=показать<существительное><существительное><существительное>

<обстоятельство><параметр>|

найти<существительное><существительное><существительное><обстоятельство>

<параметр>|

вывести<существительное><существительное><существительное><обстоятельство>

<параметр>|

отобразить<существительное><существительное><существительное><обстоятельство>

<параметр>

<вопросительное>::=каковы<существительное><существительное><существительное>

<обстоятельство><параметр>|

какие<существительное><существительное><существительное><обстоятельство>

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

<параметр>

<обстоятельство>::=на<существительное>

<существительное>::=результаты|участников|теста|должность

<параметр>::=капитан

Синтаксическое дерево [15], полученное после выполнения текущего этапа работы механизма, используется как источник данных для следующего этапа, где требуется произвести генерацию кода, т. е. автоматическое создание программного кода на языке 1CQ — стандартный язык запросов платформы «1С: Предприятие 8». Одной из возможных форм внутреннего представления программы служат триады — многоадресный код с неявно именуемым результатом. Они позволяют преобразовать собственную последовательность в последовательность команд результирующей программы. Запрос «Показать результаты теста участников на должность капитан» в записи с использованием триад принимает следующий вид.

1. Задание параметра (параметр, капитан).

2. Задание существительного (существительное, должность).

3. Задание определения (л2, л1).

Выпуск 6 (34) 2015.

SLOZ (178) 9 «эЛшча1

4. Задание предлога (предлог, на).

5. Задание существительного (существительное, участников).

6. Задание существительного (существительное, теста).

7. Задание существительного (Л6, л5).

8. Задание существительного (существительное, результаты).

9. Задание существительного (Л8, Л7).

10. Задание дополнения (Л4, лз).

11. Задание дополнения (Л9, Л10).

12. Задание глагола (глагол, показать).

13. Задание сказуемого (сказуемое, Л12).

14. Задание предложения (Л13, лц).

На завершающем этапе работы формального механизма с помощью триад производится автоматическая генерация кода на языке 1CQ в специально разработанном модуле. Фактически получается, что это программа, создающая программный запрос. Генератор получает на входе информацию о структуре, данных и параметрах предметной области и шаблоны, по которым будет выполняться генерация, а на выходе выводит готовый программный код. В конце работы организуется предоставление результатов пользователю или сообщение об ошибке.

Организация разбора запросов на ЕЯ со сложными связями

Ранее рассмотренный пример является достаточно простым. Больший интерес представляет задача разбора запроса на ЕЯ с выборкой информации из различных таблиц со сложными связями (например, один ко многим или многие ко многим) [16]. Пусть пользователь информационной системы вводит запрос на ЕЯ «Выбрать всех участников тестирований». В соответствии с реализованным алгоритмом функционирования формального механизма игнорируется незначащая лексема «всех».

Часто корневой вершиной дерева будет являться лексема, указывающая на необходимость осуществления выборки (например, вывести, показать, найти). Для упрощения работы лексемы заранее описаны в словаре. Исходя из этого дальнейшие действия по разбору запроса на ЕЯ будут производиться только для вершин потомков. При первом проходе после лексического анализа на этапе синтаксического анализа осуществляется поиск грамматической основы «участник» в названиях таблиц и их полей в базе данных для ограничения круга выборки. В результате будет найдена таблица «УчастникиТестирований», хранящаяся в информационной системе в виде регистра сведений. Так как больше никаких вершин в синтаксическом дереве нет и никаких особых условий выборки в запросе указано не было, то автоматически генерируется запрос на языке 1CQ.

Рассмотрим более сложный запрос «Выбрать всех участников теста на должность капитан». Информационная система, как и в предыдущем случае, удаляет избыточную информацию, а именно, лексемы «всех» и «теста». В результате получается линейное синтаксическое дерево. В этом случае до вершины «участников» система повторяет действия из предыдущего примера, а затем производится анализ для последующих дочерних вершин, которые уточняют требуемую выборку информации посредством фильтрации по виду теста. Поскольку в запросе на ЕЯ нет уточнения относительно периода запрашиваемых данных, то по умолчанию система организует выборку участников тестирования на должность капитана в текущем году.

Этот запрос также можно считать относительно простым. Представим запрос с неоднозначной связью таблиц. До прохождения тестирования пользователь регистрируется в информационной системе электронного тестирования. При этом его личные данные и характеристики выбранного теста попадают в таблицу (регистр сведений) «УчастникиТестирований». По окончании прохождения теста вся информация о результатах попадает в другую таблицу (регистр сведений) — «ПрохождениеТестирований». Обе эти таблицы имеют связь один ко многим и хранят ссылку на пользователя и тест, которые в свою очередь ссылаются на записи в таблице пользователей (Справочник.Пользователи) и тестов (Справочник.Тесты). Пользователь вводит

запрос на ЕЯ «Выбрать всех участников тестирования на должность капитан и их среднюю продолжительность тестирования в секундах за ноябрь 2014 года», который относится к совокупности взаимосвязанных таблиц, описанных ранее. В результате информационная система составляет следующее синтаксическое дерево.

Сложное синтаксическое дерево

На основании синтаксического дерева составляется временный список объектов для лексемы «выбрать». В данном случае это лексемы: «участников» и «продолжительность». Затем происходит перебор всех таблиц в информационной системе в поисках одновременного вхождения этих лексем и их синонимов. В таблице «ПрохождениеТестирований» нет участников как таковых, но она является внешним ключом к таблице «Пользователи», которая содержит нужную информацию. Таким образом, механизм обнаруживает вхождение лексемы «участник». Результатом этого будет выбор полей и записей, удовлетворяющих запросу. После обхода всех остальных таблиц информационная система установит, что это единственный возможный вариант, при этом не требуется дополнительная обработка запроса на ЕЯ. Затем происходит объединение лексем «секундах» и «продолжительность» на единую лексему «продолжительность в секундах» в связи с совпадением семантики [17] подчинения данного набора лексем со словарной семантикой сущности [18] - [20]. В завершении работы анализа происходит добавление условия выборки данных «за ноябрь 2014 года». Сложность заключается в определении того, к чему собственно указанная дата относится. Так в синтаксическом дереве дата относится к продолжительности тестирования, а в таблице «УчастникиТестирований» поля даты нет. Информационная система начинает просматривать связанные таблицы, имеющие ключевое поле с типом «Дата». В результате организуется связь с таблицей «ПрохождениеТестирований», в которой поле дата присутствует. При проведении дальнейшего анализа информационной системой больше не будет выявлено никаких дат.

На этапе ввода запроса на ЕЯ пользователю требуется задать параметры запроса для данного случая в значения «01.11.2014» и «30.11.2014» соответственно, иначе появится сообщение об ошибке. Ввиду отсутствия дополнительных условий и альтернативных вариантов запроса происходит его выполнение и вывод результата пользователю. Также информационная система обладает возможностью конвертации запроса на язык SQL [21], [22].

Выводы

1. На основе реализации механизма разработано формальное описание проблемно-ориентированного подмножества ЕЯ.

2. Разработан алгоритм функционирования механизма.

3. Организована возможность конвертации запроса с языка 1CQ на язык SQL.

4. Корректность работы и эффективность предложенного механизма подтверждена на рассмотренных в статье примерах.

Выпуск 6 (34) 2015.

SLOZ (178) 9 «эЛшча

ВВЕСТИ И К

ГОСУДАРСТ6ЕН1-ЮГО УНИВЕРСИТЕТА

..МОРСКОГО И РЕЧНОГО ФЛОТА ИМЕНИ АДМИРАЛАС. О. МАКАРОвА

В качестве основной особенности реализованного механизма следует отметить, что интеллектуальным доступом в информационной системе может воспользоваться любой пользователь. При этом не требуется обладать высокой квалификацией в области программирования. Информационная система выполнит все действия по преобразованию и предоставлению данных самостоятельно. Реализованный простой и удобный интерфейс также позволяет пользователю существенно сократить и упростить процесс формирования произвольных отчетов.

Стоит отметить, что механизм универсален и может быть внедрен в любую информационную систему, а не только использоваться в сфере подготовки кадров по морским специальностям. Для этого перед началом использования требуется заполнить словари в соответствии с выбранной тематикой предметной области.

СПИСОК ЛИТЕРАТУРЫ

1. Тарануха С. Н. Информатизация в инновационных образовательных процессах / С. Н. Тарануха,

С. С. Соколов // Журнал университета водных коммуникаций. — 2010. — № 1. — С. 171-175.

2. Фирсов Ю. Г. Инновационные методики в учебном процессе при подготовке гидрографов / Ю. Г. Фирсов // Вестник Государственного университета морского и речного флота имени адмирала С. О. Макарова. — 2015. — № 1 (29). — С. 123-129.

3. Барышникова Н. Ю. Распределенная тестовая система оценки соответствия профессиональных компетенций работников морских специальностей / Н. Ю. Барышникова, Л. Н. Тындыкарь // IT: ВЧЕРА, СЕГОДНЯ, ЗАВТРА: материалы III науч.-исслед. конф. студентов и аспирантов факультета информационных технологий, 19 декабря 2014 г. — СПб.: Изд-во ГУМРФ им. адм. С. О. Макарова, 2015. — С. 18-20.

4. Крупенина Н. В. Организация распределенной системы подготовки проведения электронного тестирования для оценки соответствия профессиональных компетенций работников морских специальностей / Н. В. Крупенина, Н. Ю. Барышникова, Л. Н. Тындыкарь // Вестник Государственного университета морского и речного флота имени адмирала С. О. Макарова. — 2015. — № 3 (31). — С. 216-228.

5. Описание прикладного решения «1С: Электронное обучение. Экзаменатор» [Электронный ресурс]. — Режим доступа: http://www.v8.1c.ru/elo/exam (дата обращения: 20.02.2015).

6. Григорян М. Г. Информационные резервы сбалансированной системы показателей, используемых для оценки деятельности транспортных предприятий / М. Г. Григорян // Вестник Государственного университета морского и речного флота имени адмирала С. О. Макарова. — 2013. — № 1. — С. 146-154.

7. Егоров А. Н. Система построения и тестирования терминов предметной области естественного языка / А. Н. Егоров, Н. В. Крупенина // Материалы XIV Санкт-Петербургской междунар. конф. «Региональная информатика (РИ-2014)», Санкт-Петербург, 29-31 октября 2014 г. — СПб.: СПОИСУ, 2014. — С. 329-330.

8. Зацман И. М. Построение системы терминов информационно-компьютерной науки: проблемноориентированный подход / И. М. Зацман // Матефизика. — 2013. — № 4 (10). — С. 115-148.

9. ТимофееваМ. К. Естественные и формальные языки: дис. ... д-р филол. наук: 10.02.19 / М. К. Тимофеева. — Новосибирск, 2005. — 323 с.

10. Кан Д. А. Способ формализации связей в тексте при обработке естественно-языковых конструкций / Д. А. Кан, И. С. Лебедев // Вестник Санкт-Петербургского университета. Серия 10: Прикладная математика. Информатика. Процессы управления. — 2008. — № 2. — С. 56-61.

11. Барковский С. С. Подход к формализации семантической структуры текста в системах документооборота / С. С. Барковский, П. В. Желтов, А. М. Лукашов // Вестник КГТУ им. А. Н. Туполева. — 2010. — № 2. — С 96-100.

12. Барышникова Н. Ю. Организация диалога пользователя в системе автоматизации образовательного процесса на языке, близком к естественному / Н. Ю. Барышникова. // Новые информационные технологии в образовании: сб. науч. тр. XVI междунар. науч.-практ. конф. «Новые информационные технологии в образовании» (Применение технологий «1С» для формирования инновационной среды образования и бизнеса), 3-4 февраля 2015 г., ч. 1. — М.: ООО «1С-Паблишинг», 2015. — С. 386-389.

13. Волкова И. А. Введение в компьютерную лингвистику. Практические аспекты создания лингвистических процессоров / И. А. Волкова. — М.: Изд-во МГУ, 2006. — 43 с.

14. Организация диалога удаленного пользователя с подсистемой балльно-рейтингового учета обучения студентов / Н. Ю. Барышникова, А. Н. Егоров, Н. В. Крупенина, Л. Н. Тындыкарь // Новые информационные технологии в образовании: сб. науч. тр. XIV междунар. науч.-практ. конф. «Применение технологий «1С» для повышения эффективности деятельности организаций образования», 28-29 января 2014 г., часть 1. — М.: ООО «1С-Паблишинг», 2014. — С. 331-334.

ВЕСТНИКА

ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА

МОРСКОГО И РЕЧНОГО ФЛОТА ИМЕН И АДМИРАЛА С, О. МАКАРОВА,

15. Боярский К. К. Язык правил для построения синтаксического дерева / К. К. Боярский, Е. А. Каневский // Труды XIV Всероссийской объединенной конференции «Интернет и современное общество», Санкт-Петербург, 12-14 октября 2011 г. — СПб.: ООО «МультиПроджектСистемСервис», 2011. — С. 223-237.

16. Кропотова Л. В. Многозначность в ествественных языках: способы выявления / Л. В. Кропотова // Вестник Пятигорского государственного лингвистического университета. — 2010. — № 1. — С. 151-153.

17. Мозговой М. В. Семантический анализатор и задача информационного поиска / М. В. Мозговой // Вестник Санкт-Петербургского университета. Серия 10: Прикладная математика. Информатика. Процессы управления. — 2005. — № 3-4. — С 54-59.

18. Журавлев А. Е. Организация диалога с информационной системой оперативного учета судопропуска в шлюзах / А. Е. Журавлев // Журнал университета водных коммуникаций. — 2012. — № 3. — С. 133-140.

19. Журавлев А. Е. Механизм семантического анализатора запросов к базам данных информационных систем / А. Е. Журавлев // Вестник Санкт-Петербургского университета. Серия 10: Прикладная математика. Информатика. Процессы управления. — 2012. — № 4. — C. 92-101.

20. Журавлев А. Е. Диалог с информационной системой оперативного учета судопропуска в шлюзованной системе на усложненных запросах подмножества естественного языка / А. Е. Журавлев // Журнал университета водных коммуникаций. — 2012. — № 4. — С. 114a-123.

21. Смирнов И. В. Перевод запросов, сформулированных на естественном языке, на язык SQL / И. В. Смирнов, Ю. Л. Лустгартен // Вестник Костромского государственного технологического университета. — 2006. — № 13. — С 96-100.

22. Ердесов С. Ж. Способы трансляции выборки с естественного языка на язык SQL / С. Ж. Ердесов // Научная перспектива. — 2014. — № 4. — С. 215.

DEVELOPMENT OF A MECHANISM FOR TRANSFORMING NATURAL LANGUAGE QUERY IN THE INFORMATION SYSTEM

At the user level, modern advances in information technology are manifested in the creation and development of the intelligent information systems for storing and change the necessary user data, as well as receive them on demand. Describes a method for implementing a formal mechanism for the conversion request to the data on problem-oriented subset of natural language processing in information system. It based on the testing system for the preparation of marine professionals. The algorithm offunctioning of the mechanism, which allows significantly devide out and oversimplify the process of forming arbitrary reports to analyse and define the structure of the Organization, priority posts, etc. for further address the staffing issue. Algorithm is implemented on some formal natural language subset, which limited by two classes of proposals: a simple interrogative and motive. Considered a detailed example of query execution on the stages of the lexical and syntactic analysis with subsequent translation into the language of the query to the information system and providing the final result to the user.

Keywords: dialog, query, natural language, test system, maritime specialties, competencies, education, lexical analysis, syntactic analysis.

REFERENCES

1. Taranukha, S. N., and S. S. Sokolov. “Infofmatization in innovative educational processes.” Zhurnal universiteta vodnykh kommunikatsiy 1 (2010): 171-175.

2. Firsov, Ju. G. “Hydrographic innovative education methodology.” Vestnik Gosudarstvennogo universiteta morskogo i rechnogo flota imeni admirala S.O. Makarova 1(29) (2015): 123-129.

3. Baryshnikova, N. Ju., and L. N. Tyndykar. “Distributed test system for conformity assessment of professional competencies by employees of maritime specialties.” IT: VCHERA, SEGODNYA, ZAVTRA: materialy III nauchno-issledovatelskoy konferentsii studentov i aspirantov fakulteta informatsionnykh tekhnologiy, 19 dekabrya 2014 g. SPb.: Izd-vo GUMRF imeni admirala S.O Makarova, 2015: 18-20.

4. Krupenina, N. V., N. Ju. Baryshnikova, and L. N. Tyndykar. “Organization of a distributed system by electronuc testing for conformity assessment of professional competencies by employees of maritime specialties.” Vestnik Gosudarstvennogo universiteta morskogo i rechnogo flota imeni admirala S.O. Makarova 3(31) (2015): 216-228.

5. Opisaniye prikladnogo resheniya “1C: Elektronnoye obucheniye. Ekzamenator”. Web. 20 February 2015 <http://www.v8.1c.ru/elo/exam>.

Выпуск 6 (34) 2015.

SLOZ (178) 9 «эЛшча1

6. Grigoryan, M. G. “The balanced scorecard information reserves for evaluation of transport enterprises activity.” Vestnik Gosudarstvennogo universiteta morskogo i rechnogo flota imeni admirala S.O. Makarova 1 (2013): 146-154.

7. Egorov, A. N., and N. V. Krupenina. “Sistema postroyeniya i testirovaniya terminov predmetnoy oblasti yestestvennogo yazyka.” Materialy XIV Sankt-Peterburgskoy mezhdunarodnoy konferentsii “Regionalnaya informatika (RI-2014)”, Sankt-Peterburg, 29-31 oktyabrya 2014g. SPb.: SPOISU, 2014: 329-330.

8. Zatsman, I. M. “Postroyeniye sistemy terminov informatsionno-kompyuternoy nauki: problemno-oriyentirovannyy podkhod.” Metafizika 4(10) (2005): 115-148.

9. Timofeeva, M. K. Yestestvennyye i formalnyye yazyki: Abstract of Dr. (Phil.) dissertation. Novosibirsk, 2005.

10. Kan, D. A., and I. S. Lebedev. “Method of formalizing semantical links between objects in a natural language text.” Vestnik of Saint-Petersburg University. Series 10. Applied Mathematics. Computer Science. Control Processes 2 (2008): 56-61.

11. Barkovskii, S. S., P. V. Zheltov, and A. M. Lukashov. “On one approach to formalization of model for semantic structure of texts in systems of documents circulation.” VestnikKGTUim. A.N. Tupoleva 2 (2010): 96-100.

12. Baryshnikova, N. Ju. “The organization a users dialogue in the automation system of the educational process in a language close to the natural.” Novyye informatsionnyye tekhnologii v obrazovanii: Sbornik nauchnykh trudov VII mezhdunarodnoy nauchno-prakticheskoy konferentsii “Novyye informatsionnyye tekhnologii v obrazovanii” (Primeneniye tekhnologiy “1C” dlya formirovaniya innovatsionnoy sredy obrazovaniya i biznesa), 3-4 fevralya 2015g., chast 1. M.: OOO “1C-Publishing”, 2015: 386-389.

13. Volkova, I. A. Vvedeniye vkompyuternuyu lingvistiku. Prakticheskiye aspekty sozdaniya lingvisticheskikh protsessorov. M.: MGU, 2006.

14. Baryshnikova, N. Ju., A. N. Egorov, N. V. Krupenina, and L. N. Tyndykar. “The organization of a dialog of the remote access users with a subsystem ball-rating accounting of the training of students.” Novyye informatsionnyye tekhnologii v obrazovanii: Sbornik nauchnykh trudov VII mezhdunarodnoy nauchno-prakticheskoy konferentsii “Primeneniye tekhnologiy “1C” dlya povysheniya effektivnosti deyatelnosti organizatsiy obrazovaniya”, 2829 yanvarya 2014g., chast 1. M.: OOO “1C-Publishing”, 2014: 331-334.

15. Boyarskiy, K. K., and E. A. Kanevskiy. “Yazyk pravil dlya postroyeniya sintaksicheskogo dereva.” Trudy XII Vserossiyskoy obyedinennoy konferentsii “Internet i sovremennoye obshchestvo”, Sankt-Peterburg, 1214 oktyabrya 2011 g. SPb.: OOO “MultiProdzhektSistemServis”, 2011: 223-237.

16. Kropotova, L. V. “The phenomenon of polysemy in the natural language: ways of revealing.” Pyatigorsk State Linguistic University Bulletin 1 (2010): 151-153.

17. Mozgovoy, M. V. “Semantical analyzer and the problem of text retrieval.” Vestnik of Saint-Petersburg University. Series 10. Applied Mathematics. Computer Science. Control Processes 3-4 (2005): 54-59.

18. Zhuravlev, A. E. “Dilogue organization with information system of operational registration of locking.” Zhurnal universiteta vodnykh kommunikatsiy 3 (2012): 133-140.

19. Zhuravlev, A. E. “Queries semantic analyzer to information systems databases technology.” Vestnik of Saint-Petersburg University. Series 10. Applied Mathematics. Computer Science. Control Processes 4 (2012): 92-101.

20. Zhuravlev, A. E. “Dialogue with gateway locking operational registration information system by complicated queries of natural language subset.” Zhurnal universiteta vodnykh kommunikatsiy 4 (2012): 114a-123.

21. Smirnov, I. V., and Ju. L. Lustgarten. “Perevod zaprosov, sformulirovannykh na yestestvennom yazyke, na yazyk SQL.” Vestnik Kostromskogo gosudarstvennogo tekhnologicheskogo universiteta 13 (2006): 96-100.

22. Erdesov, S. Zh. “Sposoby translyatsii vyborki s yestestvennogo yazyka na yazyk SQL.” Nauchnaya perspektiva 4 (2014): 215.

ИНФОРМАЦИЯ ОБ АВТОРЕ

INFORMATION ABOUT THE AUTHOR

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Барышникова Надежда Юрьевна — аспирант, старший преподаватель. Научный руководитель:

Крупенина Наталия Викторовна — кандидат технических наук, доцент. ФГБОУ ВО «ГУМРФ имени адмирала С.О. Макарова» BaryshnikovaHU@gumrf. ru

Baryshnikova Nadezhda Yurievna — Postgraduate, Senior lecturer.

Supervisor:

Krupenina Nataliya Viktorovna — PhD, associate professor. BaryshnikovaHU@gumrf.ru Admiral Makarov State University of Maritime and Island Shipping

Статья поступила в редакцию 21 июля 2015 г.

i Надоели баннеры? Вы всегда можете отключить рекламу.