Научная статья на тему 'Программная реализация общей модели словоизменения имен прилагательных русского языка'

Программная реализация общей модели словоизменения имен прилагательных русского языка Текст научной статьи по специальности «Языкознание и литературоведение»

CC BY
191
61
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по языкознанию и литературоведению, автор научной работы — Каменева Ирина Витальевна, Афанасьев Анатолий Сергеевич

Рассматривается работа разработанного приложения AdjNet, основанная на общей модели словоизменения прилагательных русского языка, на примерах решения задач синтеза, анализа и нормализации словоформ, а также анализируется произношение полных непритяжательных имен прилагательных, представленных в звуковой форме.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по языкознанию и литературоведению , автор научной работы — Каменева Ирина Витальевна, Афанасьев Анатолий Сергеевич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

The software implementation of general model inflection of Russian language adjectives

In the article reviewed the performance of AdjNet application based on a common model of Russian inflection of adjectives. It is decide the problems of synthesis, analysis and normalization of word forms, and also analyze the pronunciation of full adjectives in sound form.

Текст научной работы на тему «Программная реализация общей модели словоизменения имен прилагательных русского языка»

Литература: 1. Бондаренком. Ф., Хаханов В.И., Литвинова Е.И. Структура логического ассоциативного мультипроцессора // Автоматика и телемеханика. 2012. № 10. С. 71-92. 2. Хаханов В.И., Литвинова Е.И., Чумаченко С.В., Гузь О.А. Логический ассоциативный вычислитель // Электронное моделирование. 2011. № 1(33). С. 73-89. 3. Hahanov V., Wajeb Gharibi, LitvinovaE., Chumachenko S. Information analysis infrastructure for diagnosis // Information an international interdisciplinary journal. 2011. Japan. Vol. 14, № 7. Р. 2419-2433. 4. НП 306.2.141-2008. Общие положения безопасности атомных станций. К: ГКЯРУ, 2008. 42 с. 5. Protecting against common cause failures in Digital I&C Systems of Nuclear Power Plants: Nuclear Energy Series / International Atomic Energy Agency. Vienna: IAEA, 2009. No. NP-T-1.5. 65 p. 6. Ястребенецкий М.А. Информационные и управляющие системы АЭС Украины: результаты и проблемы / М.А. Ястребенецкий // Проблемы обеспечения безопасности информационных и управляющих систем АЭС:. сб. науч. тр. Одесса: «Астропринт», 2010. С. 9-19. 7. Modern Instrumentation and Control for Nuclear Power Plants: Technical Reports Series / International Atomic Energy Agency. -Vienna: IAEA, 1999. No. 387. 629 p. 8. Application of the Single Failure Criterion: Safety Series / International Atomic Energy Agency. Vienna: IAEA, 1990. No. 50-P-1. 134 p. 9. Герасименко К.Е. Методы непрерывного контроля и диагностирования оборудования управ-

ляющих систем безопасности энергоблоков АЭС по функции защит / К.Е. Герасименко // Радіоелектронні і комп’ютерні системи. 2010. №3 (44). С. 152-156. 10. Герасименко К.Е. Использование непрерывных функций в элементах оборудования защит АЭС для диагностирования неисправностей типа «несрабатывание по требованию» / К. Е. Герасименко // Радіоелектронні і комп’ ютерні системи. 2011. №1 (49). С. 29-33.

Поступила в редколлегию 14.10.2012

Рецензент: д-р техн. наук, проф. Литвинова Е.И.

Хаханов Владимир Иванович, декан факультета КИУ ХНУРЭ, д-р техн. наук, профессор кафедры АПВТ ХНУ-РЭ. Научные интересы: техническая диагностика цифровых систем, сетей и программных продуктов. Увлечения: баскетбол, футбол, горные лыжи. Адрес: Украина, 61166, Харьков, пр. Ленина, 14, тел. 70-21-326. E-mail: hahanov@kture. kharkov. ua.

Г ерасименко Константин Евгеньевич, заведующий отделом информационно-управляющих систем ЧАО «СНПО “Импульс”». Научные интересы: техническая диагностика цифровых систем управления объектами с повышенными требованиями к безопасности и надежности. Адрес: Украина, 93405, Северодонецк, пл. Победы 2, тел. 60194. E-mail: gerasymenko.k.e@yandex.ua.

УДК 519.7

ПРОГРАММНАЯ РЕАЛИЗАЦИЯ ОБЩЕЙ МОДЕЛИ СЛОВОИЗМЕНЕНИЯ ИМЕН ПРИЛАГАТЕЛЬНЫХ РУССКОГО ЯЗЫКА

КАМЕНЕВА И.В., АФАНАСЬЕВ А.С.___________

Рассматривается работа разработанного приложения AdjNet, основанная на общей модели словоизменения прилагательных русского языка, на примерах решения задач синтеза, анализа и нормализации словоформ, а также анализируется произношение полных непритяжательных имен прилагательных, представленных в звуковой форме.

Введение

На протяжении многих лет предпринимались попытки автоматизации процесса выявления слов из текста и их классификации, были разработаны модели существительных, глаголов, прилагательных [1-4]. Полная автоматизация процесса корректировки, анализирования и нормализации естественно-языкового текста не была продемонстрирована ни в одной из работ с частями речи в полной мере. Школой М.Ф. Бондаренко и Ю.П. Шабанова-Кушнаренко «Бионика интеллекта» уже разработаны модель полных непритжа-тельных имен прилагательных [1], модель полных непритяжательных имен прилагательных, представленная звуковой формой [4]. Разработанная нами модель кратких имен прилагательных [5] помогла приблизиться к построению общей полной модели словоизменения прилагательных русского языка [6].

На основании трех указанных выше моделей реализовано программное приложение AdjNet. Оно позволяет автоматизировать процесс работы эксперта в задачах синтеза, анализа и нормализации текста с именами прилагательными.

Приложение AdjN et основ ано на модели реляционной сети логической мозгоподобной структуры [7]. В основе определения понятия мозгоподобной структуры лежит понятие отношения. Школой разработана алгебраическая система предикатов для формульного представления отношений и действий над ними [8]. Данная система делится на алгебру имен предикатов и модель предикатов. Схемная реализация формул, описывающих алгебро-логические структуры, приводит к логическим сетям - функциональным и реляционным [9, 10]. Программа AdjNet представляет собой приложение, которое позволяет моделировать процесс склонения и словоизменения прилагательных русского языка на основании полной модели склонения непритяжательных имен прилагательных, полной модели склонения непритяжательных имен прилагательных, представленных в звуковой форме, и модели кратких имен прилагательных.

Подробная структура программного приложения представлена на рис. 1.

AdjNet имеетудобный интерактивный интерфейс, при работе с которым пользователь будет получать исчерпывающую информацию об общем словоизменении имен прилагательных русского языка. Работа программы изображена на диаграмме вариантов использования (Use case) (рис. 2).

52

РИ, 2012, № 3

Удаление основ А

Gass 4 Form

* Fields

* Methods

/ л ShortPritag А Gass

«Word

+- Fields

" Methods

0 Analising

б BuitdWord

в DefrteLastLert...

в DetermineP

0 Gethfo

а GetP

0 GetZK

0 SetP

0 SetY

SetYK

4> SetZK

б SetZOK

0 V ShortPriljg j

Главное окно

Gass ■* Form

® Fields *■ Methods •*' Nested Types

. Основными задачами, которые решает данное прило-

Добавление основ Л жение, ЯВЛЯЮТСЯ:

Сам .

+ F°m - синтез словоформы;

з Field; л Methods

Word *

Class

4 Fields

^Methods

© GetSone

0 GetPos

© GetSignW

0 GetSignXZ

© GetWord

© SetBone

© SetPcs

© SetSignXl

© SetSignXZ

© Set Word

)

longPrilag ■

Class « Word

fields

“ Methods [ б Analysing

І б ButldWord

Ф DefinitronYl б DefinitionZ б DefinitionZO ® DefinitionZI б DtfinitionZ2 Ф DefinitionZ3 О DeiinitionZL О DefinitionZP j б Deter fTuneQ

б DeternineR б Getlnfo І б GetQ

б GetR О GetS б GetZ 0 GetZL О GetZP б LongPriJag ® Normalising б SerQ ® SetR б Sets б SetS*grX3 б SetS<gnX4 б SetSigrXS б SetZL б SetZP

l

Рис. 1. Диаграмма классов

- анализ словоформы; нормализация словоформы;

- проверка устной речи.

Поиск и выбор прилагательных из текста осуществляется методом сравнения существующих основ имен прилагательных со словами в предложении. Существующие основы имен прилагательных хранятся в текстовом файле, основы можно добавлять, что делает программу расширяемой, а также просматривать и удалять основы слов из репозитория.

Выявленные программой прилагательные выводятся в список, который отображен в главном окне программы, а так же отображается в окне синтеза, анализа и нормализации, что делает интерфейс более интерактивным. Классификация прилагательных на краткие и полные выполняется методом сравнения выявленного прилагательного со списком всех существующих окончаний полных прилагательных русского языка. Если окончание прилагательного присутствует в списке, то оно является полным, если нет - кратким, что выполнено в соответствии с моделью, базирующейся на алгебре конечных предикатов.

Рассмотрим пример решения задачи синтеза словоформы.

Задача синтеза заключается в определении словоформы в соответствии с окружающим контекстом слова. Суть задачи заключается в преобразовании ошибочно “введенных слов в корректные словоформы, в соответствии с контекстом предложения, и заменой их.

Рис.2. Use case диаграмма AdjNet

Остановимся подробнее на решенных задачах с помощью программного приложения.

Для настройки признаков (рода, числа, падежа, признака одушевленности, употребляемости, ударности и признака смягчения) в окне «Синтез» существуют списки для их выбора. После выбора необходимых признаков AdjNet изменяет прилагательное в соответствии с предъявленными экспертом требованиями и предлагает вставить его обратно в текст.

Выполним синтез предложения, которое введено неверно: «хорошая указчик дороже десяти работников», для полного непритяжательного имени прилагательного. Благодаря настройкам эксперта прилагательное можно привести к необходимому правильному виду употребляемости в предложении.

Приведем пример синтеза данного слова:

- род - М;

- число - Ед.;

- падеж - В;

- признак одушевленности - О;

- признак употребляемости - С.

Получаем слово «хороший».

РИ, 2012, № 3

53

Далее программа позволяет вставить корректное слово обратно в исходный текст - «хороший указчик дороже десяти работников».

Также программа осуществляет синтез слов кратких имен прилагательных в предложении. С ее помощью можно синтезировать слова без сопровождаемого контекста как для полных, так и для кратких имен прилагательных.

Для наглядного примера выполним синтез для слова «свеж» модели кратких имен прилагательных русского языка, введем такие признаки:

- род - *;

- число - Мн.;

- ударная буква основы - е;

- ударение - на окончание и.

Получаем слово «свежи». В примере и со словом «хороший», и со словом «свеж» мы наблюдаем, что программа AdjNet корректно выполняет словоизменение по указанным экспертом признакам и определяет ударность. В данном слове присутствует двойное ударение. Приложение определяет, что ударение падает как на основу, так и на окончание и имеет два варианта правильного употребления слова, т.е. выявляет двойное ударение.

Рассмотрим пример решения задачи анализа словоформы. Она заключается в определении грамматических признаков словоформы в соответствии с окружающим контекстом формы слова. Суть задачи состоит в выведении корректно расклассифицированных признаков словоформы.

Введем предложение: «Ребята играли на зеленой лужайке - она была ухожена». Программа выделила 2 прилагательных: «зеленой» и «ухожена», выполним их анализ.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

В окне анализа из списка выделим необходимое прилагательное «зеленой» и проанализируем его. В результате получаем, что слово «зеленой» имеет:

- полное прилагательное - зеленой;

- основа слова - зелен;

- номер влияния контекста - 9;

- род - Ж;

- число - Ед.;

- падеж - П;

- последняя буква основы слова - н;

- окончание - ой;

- левая часть окончания - о;

- правая часть окончания - й;

- первая буква окончания - о;

- вторая буква окончания - й;

- третья буква окончания - *.

Анализ слова «ухожена» показал:

- краткое прилагательное - ухожена;

- основа слова - ухожен;

- род - Ж;

- число - Ед;

- номер ячейки таблицы - 2;

- окончание - а;

- ударная буква основы - о.

Программа AdjNet правильно проанализировала два слова для полного и краткого имени прилагательного, что подтверждает правильность и корректность ее работы, а также то, что программа выполняет одну из основных своих задач - анализ слов в представленном тексте.

Рассмотрим пример решения задачи нормализации словоформы. Задача нормализации заключается в определении слова, соответствующего словоформе. Суть задачи состоит в отыскании словарных форм словоформ.

Введем предложение «Глубока была река, а солнце своими теплыми лучами ее прогревало и ярким светом освещало близлежащую зеленую лужайку». Программа выделила 5 прилагательных: «глубока», «теплыми», «ярким», «близлежащую» и прилагательное «зеленую». Для выполнения задачи нормализации словоформы в окне «нормализация» из списка выделяем необходимое прилагательное - «глубока» и запускаем нормализацию. Результат нормализации -«глубок», для «теплыми» - «теплый». Для прилагательного «ярким» - «яркий», для прилагательного «близлежащую» - «близлежащий», для прилагательного «зеленую» результатом нормализации словоформы будет слово «зеленый».

Наконец, рассмотрим работу задачи склонения полных непритяжательных имен прилагательных русского языка, представленных звуковой формой. Переключим программу в режим устной речи, в окне синтеза или анализа, в зависимости от того, какая из задач решается, установим переключатель «Устная речь». Введем предложение «Я увидела радостного человека в окне». Программа определила одно прилагательное полной модели склонения непритяжательных имен прилагательных, которая доопределяется правильным произношением (транскрипцией) слов и характеризуется полной моделью склонения прилагательных русского языка в звуковой форме.

Таким образом, выполнив анализ слова «радостного» для полной модели склонения непритяжательных имен прилагательных, которое определяется признаками:

- полное прилагательное - радостного;

- основа слова - радостн;

- номер влияния контекста - 2;

54

РИ, 2012, № 3

- род - М;

- число - Ед.;

- падеж - Р;

- последняя буква основы слова - н;

- окончание - ой;

- левая часть окончания - о;

- правая часть окончания - го;

- первая буква окончания - о;

- вторая буква окончания - г;

- третья буква окончания - о,

можем увидеть наглядное представление правильного произношения (транскрипции) слова, переключив модель на «Устная речь». Получаем:

- полное прилагательное - радостного;

- основа слова - радостн;

- номер влияния контекста - 2;

- род - М;

- число - Ед.;

- падеж - Р;

- последняя буква основы слова - н;

- окончание - ой;

- левая часть окончания - о;

- правая часть окончания - во;

- первая буква окончания - о;

- вторая буква окончания - в;

- третья буква окончания - о.

Это также решено с использованием общей модели словоизменения русского языка на основании алгебры конечных предикатов.

Выводы

Научная новизна: представлено практическое применение программного приложения для задач: анализа, синтеза и нормализации.

Практическая значимость: программа работает быстро и эффективно, что помогает корректно выводить результат, ожидаемый экспертом.

Перспективы исследования. В дальнейшем планируется разработать модель кратких имен прилагательных, представленных звуковой формой, что позволит

расширить возможности процесса словоизменения модели.

Литература: 1. Мельникова, Р.В. Алгебраические модели морфологии и их применение в логических сетях. Дис. ... канд. техн. наук. Х.: ХНУРЭ, 2005. 152 с. 2. Лещинский, В. А. Модели бинарных логических сетей и их применение в искусственном интеллекте. Дис. ... канд. техн. наук. Х.: ХНУРЭ, 2006. 157 с. 3. Дударь, З.В. Математические модели флективной обработки словоформ и их использование в системах автоматической обработки текста русского языка. Дис. ... канд. техн. наук. Х.: ХИРЭ, 1984. 215 с. 4. Русакова Н.Е. Моделирование мозгоподобных структур и их применение в искусственном интеллекте Дис. ... канд. техн. наук. Х.: ХНУРЭ, 2012. 157 с. 5. Каменєва І.В. Побудова реляційної мережі коротких прикметників російської мови /І.В. Каменєва, А.С. Афанасьєв // Вісник Київського національного університету технологій та дизайну: Київ. 2012. № 5. C. 195-202. 6. КаменеваИ.В. Общая модель словоизменения имен прилагательных русского языка / И. В Каменева, А. С. Афанасьев // АСУ и приборы автоматики. 2012. С. 3-8. 7. Бондаренко, М.Ф. Мозгоподобные структуры / М.Ф. Бондаренко, Ю.П. Шабанов-Кушнаренко // Справочное пособие. Том первый / Под ред. И.В. Сергиенко. К.: Наук. думка, 2011.460 с. 8. Бондаренко, М. Ф. Алгебра предикатов и предикатных операций / М.Ф. Бондаренко, З.В. Дударь, Н.Т. Процай, В.В. Черка-шин, В.А. Чикина, Ю.П. Шабанов-Кушнаренко // Радиоэлектроника и информатика. 2000. № 4. С. 15-23. 9. Бондаренко М. Ф. О реляционных сетях / М. Ф. Бондаренко, И. А. Лещинская, Н. П. Кругликова, Н. Е. Русакова, Ю. П. Шабанов-Кушнаренко // Бионика интеллекта. 2010. № 3. С. 8-13. 10. Бондаренко М. Ф. О булевых реляционных сетях / М. Ф. Бондаренко, И. В. Каменева, И. А. Лещинская, Н. Е. Русакова, Ю. П. Шабанов-Кушнаренко, И. Ю. Шубин // Бионика интеллекта. 2011.

Поступила в редколлегию 12.10.2012 Рецензент: д-р техн. наук, проф. Четвериков Г.Г.

Каменева Ирина Витальевна, аспирантка кафедры ПИ ХНУРЭ. Научные интересы: искусственный интеллект, интеллектуальная обработка данных. Увлечения: изучение иностранных языков. Адрес: Украина, 61166, Харьков, пр. Ленина, 14, тел. 702-16-46, Е -

mail: irina.kamenieva@gmail.com.

Афанасьев Анатолий Сергеевич, студент кафедры ПИ ХНУРЭ. Научные интересы: искусственный интеллект, программирование на языках C++, C#. Увлечения: кулинария. Адрес: Украина, 61166, Харьков, пр. Ленина, 14, тел. 702-16-46. Е-mail: tolya.afanasev@gmail.com.

РИ, 2012, № 3

55

i Надоели баннеры? Вы всегда можете отключить рекламу.