Научная статья на тему 'Нормативно-правові документи як об’єкт зняття граматичної омонімії шляхом автоматичної обробки текстів'

Нормативно-правові документи як об’єкт зняття граматичної омонімії шляхом автоматичної обробки текстів Текст научной статьи по специальности «Языкознание и литературоведение»

CC BY
52
6
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
нормативно-правові документи / граматична омонімія / лексико-граматичні фільтри / статистичні методи / словоформа / граматичне значення / нормативно-правовые документы / грамматическая омонимия / лексико- грамматические фильтры / статистические методы / словоформа / грамматическое значение

Аннотация научной статьи по языкознанию и литературоведению, автор научной работы — Карнаух Анна Владимировна

Дослідження присвячено вивченню особливостей зняття граматичної неоднозначності словоформ на матеріалі текстів нормативно-правових актів. З огляду на специфіку мови юридичних документів, створено лексико-граматичні фільтри, що сприяють зростанню кількісних показників усунення омонімії статистичними методами. Здійснено аналіз якісно-кількісних характеристик отриманих даних. Встановлено, що поява більшості омонімічних одиниць зумовлена їх різною функціональною належністю.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Нормативно-правовые документы как объект снятия грамматической омонимии путем автоматической обработки текстов

Исследование посвящено изучению особенностей снятия грамматической неоднозначности словоформ на материале текстов нормативно-правовых актов. С учетом специфики языка юридических документов созданы лексико-грамматические фильтры, которые способствуют росту количественных показателей устранения омонимии статистическими методами. Проанализированы качественноколичественные характеристики полученных данных. Установлено, что появление большинства омонимичных единиц обусловлено их разной функциональной принадлежностью.

Текст научной работы на тему «Нормативно-правові документи як об’єкт зняття граматичної омонімії шляхом автоматичної обробки текстів»

Ученые записки Таврического национального университета имени В. И. Вернадского Серия «Филология. Социальные коммуникации». Том 25 (64). № 4, ч. 2. 2012 г. С. 415-422.

УДК 81'276.6.34:373.423:81-139

НОРМАТИВНО-ПРАВОВ1 ДОКУМЕНТИ ЯК ОБ'СКТ ЗНЯТТЯ ГРАМАТИЧНО! ОМОН1МП ШЛЯХОМ АВТОМАТИЧНО! ОБРОБКИ ТЕКСТ1В

Карнаух Г. В.

УкраУнський мовночнформа^йний фонд НАН УкраУни, м. КиУв

Дослщження присвячено вивченню особливостей зняття граматично! неодно-значност словоформ на матерiалi текстiв нормативно-правових акпв. З огляду на специфiку мови юридичних документiв, створено лексико-граматичнi фшьтри, що сприяють зростанню кiлькiсних показниюв усунення омошми статистичними методами. Здшснено аналiз якiсно-кiлькiсних характеристик отриманих даних. Встанов-лено, що поява бшьшосп омонiмiчних одиниць зумовлена !х рiзною функцюналь-ною належнiстю.

Ключовi слова: нормативно-правовi документи, граматична омонiмiя, лекси-ко-граматичнi фiльтри, статистичш методи, словоформа, граматичне значення.

Постановка проблеми. Найновiшi лiнгвiстичнi дослiдження часто охоплюють предметне поле декiлькох наукових дисциплiн або здiйснюються в рамках рiзних парадигм [2; 4; 6; 11-14; 18; 20; 21]. З огляду на це останшм часом чггко окреслився системно-функцюнальний пiдхiд довивчення мови, який дозволяе здiйснювати все-бiчний аналiз усiх параметрiв дослщжуваного об'екта [1; 6; 10; 11; 17; 18; 20]. Саме у межах цього тдходу варто розглядати комушкативнуфункщю мови. При цьому детальне вивчення дiевих механiзмiв, правил та особливостей комушкацп дозволяе розробити ушфшоваш норми, моделi спiлкування в певних сферах соцiального жит-тя[11; 13, с. 70, 73]. Це актуально не лише для лшгвютики, а й для юбернетики, ш-форматики, оскшьки побудова унiверсального коду для адекватного сприйняття i надання потрiбно! шформаци е важливою складовою сучасних технологш створен-ня мов машинного програмування, пошукових систем, а також систем автоматичного опрацювання мови (переклад, автокорекщя та iн.) [6; 11; 18; 20].

Протесуттевою перешкодою при автоматичнш обробцi текстiв е явище неодно-значностi1 словоформ, зокрема - граматично! омошми [2; 3; 6; 8-10; 18]. Одним iз шляхiв вирiшення цiе! проблеми е створення лiнгвiстичного процесор2, принцип ди якого базуеться на застосуваннi статистичних методiв3 [2-4; 8; 9]. Крiм того, резуль-тати машинно! обробки дослщжуваного об'екта суттево залежать вщ його особли-

'Неоднозначшсть або ж багатозначшсть трактуеться як родове поняття, що поеднуе полюемта та омо-шмта [7, с. 93].

2Сукупшсть штучних моделей природно! мови, алгоримв i програм, що описують будову та функцю-нування цих моделей, та техшчш засоби, яш реатзують цю модель [12, с. 10].

3Так1 програмш засоби створено в Украшському мовно-шформацшному фонд1 НАН Украши (УМ1Ф НАНУ). Вони дозволяють вивчати мову на вах li р1внях та виршувати цшу низку завдань (здшснюва-ти автоматичне зняття омошми, анатз статистичних параметр1в текстiв, автоматичний синтаксичний анатз, створювати частотш словники, поршнювати тексти за р1зними параметрами) [9].

востей: функцюнального стилю, граматичних характеристик, орфографiчного та пунктуацшного оформлення тексту.

Основним завданням цього дослщження е вивчення поведiнки лшгвютичного процесора при зняттi граматично! омошми статистичними методами в текстах нор-мативно-правових документiв з метою створення додаткових програмних функцiй, покликаних збшьшити кiлькiсть правильно iдентифiкованих словоформ1.

Анатз даних, отриманих внаслiдок застосування зазначено! програми на мате-рiалi тексту законодавчого акту2, показав, що поява значно! кiлькостi омонiмiчних одиниць зумовлена !х рiзною функцiональною належнютю. Це пояснюеться тим, що Граматичний словник укра!нсько! мови3, який надае iнформацiю про частиномовну належнiсть i граматичне значення кожно! словоформи тексту4(завдяки застосуван-ню алгоритму лематизаци), майже повнютю репрезентуе лексику укра!нсько! мови, а також ус можливi комбшаци символiв у межах слiв, вщповщно - i всi допустимi граматичною системою словоформи, серед яких i рiдковживанi [9].

Тому, враховуючи специфiку мови законодавчих документiв, виникае потреба видалення певних лем чи граматичних значень, тобто створення лексико-граматичних фiльтрiв, формування яких грунтуеться на детальному вивченнi особ-ливостей мови зазначених текстiв.

I. Колесшкова i Ю. Прадiд визначають такi ознаки офiцiйно-дiлового стилю: офщшшсть, конкретнiсть змiсту; чiткiсть, стислiсть, лопчна послiдовнiсть, одноз-начнiсть формулювань; несуперечшсть аргументаци; усталенiсть та одноманiтнiсть форми докумеипв; канцелярська лексика, вiдсутнiсть емоцшно! образностi, станда-ртнi звороти (клше); безособовi та наказовi форми; вщсутшсть iндивiдуальних ав-торських рис; монолопчна (рiдше дiалогiчна) форма тексту [5, с. 55].

Автори науково! пращ «Мова закону», наголошуючи, що законодавчий текст не описуе подш, факпв, наукових понять, почуттiв i переживань людей, не характери-зуе ставлення до певних ошб, явищ дшсносп, а владно приписуе суб'ектам права певну модель поведшки, формулюе вимоги, загальнообов'язковi норми [21, с. 18], видшяють такi мовнi особливостi нормативно-правових акпв:

1. Офiцiйний характер, документальшсть мовного вираження думки законодавця.

2. Яснють i простота мови нормативно-правових акпв.

3. Максимальна точнiсть мови законодавства (досягнення найбiльшо! вiдповiдностi мiж щеею, думкою законодавця й утшенням цiе! думки в законодавчiй формул^.

3.1. Вимоги до термiнологi!:

3.1.1. Застосування термшв iз чiтко окресленим змютом.

'Словоформи, яю при попереднш обробщ отримали неправильний наб1р граматичних значень або за-лишилися невдентифшзваними.

2Досл1дження проводилося на матер1ал1 тексту Закону Украши «Про Кабшет Мшстрш Украши» [Про Кабшет Мшстрш Укра!ни. Закон ввд 07.10.2010 № 2591-У1 / [Верховна Рада Укра!ни]. - Режим доступу : http://zakon3.rada.gov.ua/laws/show/2591-17].

3Веб-сервгс розподшено! програмно! лексикограф1чно! системи «Граматичний словник украшсько! мови», створений науковим колективом УМТФу НАНУ, забезпечуе морфолопчний анал1з словоформ - один з основних еташв процесу зняття граматично! омошми шляхом автоматично! обробки текстш [17].

4Якщо словоформа е омошм1чною, вона отримуе так званий наб1р граматичних характеристик (грама-тичш параметри всх можливих значень анал1зовано! одинищ) [2, с. 27-28; 8, с. 518].

416

НОРМАТИВНО-ПРАВОВ1ДОКУМЕНТИ ЯК ОБ'СКТ ЗНЯТТЯ ГРАМАТИЧНОÏ ОМОН1МНШЛЯХОМ АВТОМАТИЧНОÏ ОБРОБКИ ТЕКСТ1В

3.1.2. Використання ^в та висловiв, зазвичай, у бшьш вузькому чи спеща-льному значенш, порiвняно з тим, яке вони мають у лiтературнiй mobî.

3.1.3. Уживання слiв i виразiв у ïx прямому i первинному значенш.

3.1.4. Вщмова вiд багатозначних термшв.

3.1.5. Gднiсть термiнологiï, що застосовусться в усьому законодавствi чи у великому його роздш.

3.2. Вимоги до стилю викладу:

3.2.1. Лопчна послiдовнiсть i стрункiсть висловлення думки законодавця, ïï смислова завершенiсть.

3.2.2. Одномаштнють способiв викладу однотипних формулювань (хоча з точки зору шформативност вони можуть бути зовсiм рiзними).

4. Економнiсть використання в текстах нормативних актiв мовних засобiв.

5. Лопчна зв'язнють i послiдовнiсть викладу (адже мовi законодавства властива ращональшсть, однозначнiсть змiсту, вмотивованiсть висновкiв).

6. Експресивна нейтральнють нормативного тексту.

7. Безособовий, нешдивщуальний характер стилю законодавчих положень (у цьому планi мова законодавства кардинально вiдрiзняeться вiд мови xудожньоï л> тератури й науки (особливо гумаштарно1), де дозволяеться вираження авторського ставлення до викладеного матерiалу) [20].

Враховуючи зазначенi вище особливост законодавчо1' мови, до фiльтру можна ввести таю леми та граматичш значення: вигуки (а - уживаеться для вираження здо-гаду, здивування i т. iн.); частки з ремаркою тдсил. (i - уживаеться для шдкреслен-ня, видшення значення слова, перед яким стшть); ус леми з ремаркою розм., дiал. (eida - звютка, чутка, повщомлення); рiдковживанi або неxарактернi для мови законодавства слова (банка - скляна, металева i т. ш. посудина переважно цитндрично1' форми; шдвищення морського дна, мiлина в морц дошка, яка надае шлюпцi або чо-вну поперечно!' мiцностi й одночасно служить сидшням для веслярiв), серед яких i словоформи, що е власними назвами (Або - назва мюта у Фiнляндiï); кличний вiдмi-нок однини i множини для iменникiв чоловiчого, ж1ночого, середнього роду (adMi-мстрацп - кличний вщмшок, множина); особовi форми наказового способу (плати - вщшкодовувати вартють одержаного або використаного), форми 1-оï особи для дiеслiв (вищим - видавати уривчастi, рiзкi, пронизливi звуки). Детальний опис одиниць, якi ввшшли до фiльтру, подано в таблищ 1.

Застосування зазначеного програмного засобу на практищ дало такi результати: iз загальноï кiлькостi словоформ (10595) у Тексп 1 - 2745 неомонiмiчниx одиниць, а

в Тексп 2 - 3821 (отже, 1076 одиниць унаслщок використання фiльтру перейшли в розряд однозначних). Крiм того, у Тексп 2 промарковано на 187 словоформ бшьше, нiж у Тексп 2 (7355 i 7186 одиниць вщповщно). Таким чином, рiзниця в кшькосп правильно iдентифiкованиx словоформ мiж аналiзованими текстами становить 1263 одинищ (11,92 % вщ загальноï кiлькостi) (див. табл. 2).

'У Текста 2 при знятт1 граматичноï неоднозначност1 словоформ застосовано лексико-граматичний фшьтр, у Текст1 1 зазначена програмна функцiя не застосовувалась.

417

Список ушкальних словоформ, що ввшшли до лексико-граматичного фшьтру _Таблиця 1

№ Ушкальна Граматична характеристика словофор ми Примггки

з/п словофо- лема граматичне значения код

рма (числовий)

1. а а вигук 72,0

а частка 74,0 спонук.

2. або Аба 1менник жшочого роду, кличний в1д-мiиок, однина 5,7 власна назва (мю-то в Угорщиш)

Або iмеииик називний вщмшок 13,1 власна назва

середнього родовий вщмшок 13,2 (друга назва

роду, одни- давальний ввдмшок 13,3 м. Турку, Фш-

на знахщний вщмшок 13,4 ляндiя)

орудний вщмшок 13,5

мюцевий ввдмшок 13,6

кличний вщмшок 13,7

або частка 74,0 розм.

3. але але вигук 72,2

але частка 74,3 рiдко (з вщпнком сумшву)

4. банками банка iменник жшочого роду, орудний в1дмь нок, множина 5,12 мшина, лавка в човш

5. без без iмеииик чоловiчого роду, знахiдний вщмшок, однина 8,4 дiал. бузок

6. бере бере iменник називний ввдмшок, однина 5,1 назва групи сто-

ж1ночого родовий ввдмшок, однина 5,2 лових сорт1в гру-

роду давальний вiдмiнок, однина 5,3 ш1, плоди яких

знахвдний вiдмiнок, однина 5,4 мають видовжену

орудний вiдмiнок, однина 5,5 форму та сокови-

мюцевий вiдмiнок, однина 5,6 тий м'якуш.

кличний ввдмшок, однина 5,7

називний вiдмiнок, множина 5,8

родовий ввдмшок, множина 5,9

давальний вщмшок, множина 5,10

знахвдний вщтнок, множина 5,11

орудний вщмшок, множина 5,12

мюцевий вщмшок, множина 5,13

кличний ввдмшок, множина 5,14

бер iменник чоловiчого роду, кличний ввд-мшок, однина 8,7 одиниця дози рентгешвського

випромшювання

Бер iменник чоловiчого роду, кличний в1д-мiнок, однина 33,7 власна назва (прь звище)

7. веде веда iменник жшочого роду, кличний в1дмь 5,7 пам'ятка лггера-

нок, однина тури (шд.)

вед iменник чоловiчого роду, кличний ввд-мiнок, однина 8,7 представник на-родносл

418

НОРМАТИВНО-ПРАВОВ1ДОКУМЕНТИ ЯК ОБ'СКТ ЗНЯТТЯ ГРАМАТИЧНО! ОМОН1М1! ШЛЯХОМ АВТОМАТИЧНО! ОБРОБКИ ТЕКСТ1В

8. вищу вища-ти д1еслово недоконаного виду, теперш-нш час, перша особа, однина 36,11

9. вад вща 1менник ж1ночого роду, родовий в1дмь нок, множина 5,9 дiал. зв1стка, по-ввдомлення

10. всш ваяти д1еслово доконаного виду, наказовий спос1б, друга особа, однина 35,2

11. для дляти д1еслово недоконаного виду, теперш-нш час, третя особа, однина 36,15

12. до до 1менник жшочого роду називний вщмшок, однина 13,1 нота

родовий вщмшок, однина 13,2

давальний ввдмшок, однина 13,3

знахщний вщмшок, однина 13,4

орудний вщмшок, однина 13,5

м1сцевий ввдмшок, однина 13,6

кличний вщмшок, однина 13,7

називний вщмшок, множина 13,8

родовий вщмшок, множина 13,9

давальний вщмшок, множина 13,10

знахщний вщмшок, множина 13,11

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

орудний вщмшок, множина 13,12

м1сцевий ввдмшок, множина 13,13

кличний вщмшок, множина 13,14

13. за за присл1вник 71,4 на пвдтримку

за частка 74,5

14. мет1 мет 1менник чолов1чого роду, м1сцевий вщмшок, однина 8,6 дiал. момент

15. на на вигук 72,6

на частка 74,3 розм.

16. освгги освь тити д1еслово доконаного виду, наказовий спос1б, друга особа, однина 35,2

17. переговори пере-гово-рити д1еслово доконаного виду, наказовий спос1б, друга особа, однина 35,2

18. перед перед 1менник чолов1чо-го роду називний вщмшок, однина 8,1

знахщний вщмшок, однина 8,4

19. тд тд 1менник чолов1чо-го роду називний вщмшок, однина 8,1 западина; нижня горизонтальна по-верхня; мсце для спжка; горище

знахщний вщмшок, однина 8,4

20. тдстав падс-тавити д1еслово доконаного виду, наказовий спос1б, друга особа, однина 35,2

21. тсля шсля присл1вник 71,8

22. плати плати-ти д1еслово недоконаного виду, наказовий спос1б, друга особа, однина 36,2

419

23. постанови постанови-ти д1еслово доконаного виду, наказовий споаб, друга особа, однина 35,2

24. розм1р розмь ряти д1еслово доконаного виду, наказовий споаб, друга особа, однина 35,2

25. стану стати д1еслово доконаного виду, майбутнш час, перша особа, однина 35,5

26. так така 1менник жшочого роду, родовий в1дмь нок, множина 5,9 грошова одиниця Бангладеш

так присл1вник 71,2

так частка 74,3

27. тих тихну-ти д1еслово недоконаного виду, минулий час, чолов1чий рщ, однина 36,19

28. у у вигук 72,19

29. чи чи частка 74,19 пит.

30. чи! чий 1менник чолов1чо-го роду мюцевий в1дм1нок, однина 8,6

називний вщмшок, множина 8,8

знахгдний в1дм1нок, множина 8,11

кличний в!дм1нок, множина 8,14

31. що що частка 74,8 розм.

32. як як частка 74,8 експрес.-пiдсил.

як 1менник чолов1чого роду, ютота, нази-вний вщмшок, однина 7,1 велика жуйна рогата тварина

33. яка як 1менник чолов1чого роду, ютота родовий в1дм1нок, однина 7,2 велика жуйна рогата тварина

знахщний в1дм1нок, однина 7,4

якати д1еслово недоконаного виду, теперш-н1й час, третя особа, однина 36,15

Загальна характеристика Текстов 1 i 2

_Таблиця 2

№ Без застосування 1з застосуванням

ф1льтру фшьтру

% %

1. Загальна шльшсть словоформ 10595 10595

2. Юльшсть ушкальних словоформ 1872 17,69 1872 17,69

3. Загальна шльшсть маркованих словоформ 7186 67,82 7355 69,42

4. Юльшсть ушкальних маркованих словоформ 1230 11,60 1234 11,65

5. Юльшсть неомошм1чних словоформ 2745 25,91 3821 36,06

6. Юльшсть омон1м1чних словоформ 7850 74,09 6774 63,94

Для зручносп роботи з текстом, в якому здшснюеться зняття граматично! не-однозначностi словоформ статистичними методами, пропонований лiнгвiстичний процесор надае можливiсть формувати iндивiдуальний лексико-граматичний фшьтр для кожного окремого аналiзованого об'екта. Однак, спираючись на лiнгвiстичний матерiал, можна констатувати, що до фшьтру, створеного в межах цього дослщжен-ня, входить група омонiмiчних словоформ, яка буде завжди вилучатися iз загально-

420

НОРМАТИВНО-ПРАВОВ1ДОКУМЕНТИ ЯК ОБ'СКТ ЗНЯТТЯ ГРАМАТИЧНО! ОМОН1М1! ШЛЯХОМ АВТОМАТИЧНО! ОБРОБКИ ТЕКСТ1В

го реестру омонiмiв при автоматичнш обробщ текспв нормативно-правових актiв. Тому доцшьним вважаемо створення словника омонiмiчних словоформ, якi е одноз-начними в межах юридичних документiв.

Висновки. Отже, основне завдання законодавчо! мови (владно приписувати суб'ектам права певну поведiнку, формулювати вимоги, загальнообов'язковi норми) диктуе певш правила та особливост оформлення нормативно-правових документiв на вшх рiвнях мови. Це у свою чергу дозволяе розробити певш програмш засоби автоматичного опрацювання текстiв зазначеного виду, зокрема, створити лексико-граматичш фiльтри, що сприятимуть збiльшенню кшькост правильно щентифшо-ваних неоднозначних словоформ. Оскшьки результати апробаци зазначеного про-грамного засобу демонструють динамiку зростання позитивних змiн (збiльшення кiлькостi правильно щентифшованих словоформ, зменшення - щентифшованих неправильно), актуальним залишаеться поповнення списку словника омонiмiчних словоформ, що стають однозначними в контекстi юридично! мови, для створеного фiльтру, а також формування нових функцiй цього типу.

Список л^ератури

1. Афанасьева О. С. Лексико-семаншчш дев1аци у текстах нормативно-правових акпв / О. С. Афанасьева // Вгсник Прикарпатського ушверситету. Фшолопя (Мовознавство). - Випуск ХХ1 -XXII. - 1вано-Франкшськ : Прикарпат. нац. ун-т 1м. В. Стефаника, 2009. - С. 77-80.

2. Карнаух Г. В. Велика [ мала лггери як заиб розр1знення иеоднозиачиих словоформ при автоматичнш дизамб1гуаци / Г. В. Карнаух // Проблеми граматики [ лексикологи украшсько! мови. - Вип. 8. -К. : НПУ 1м. М. П. Драгоманова, 2011. - С. 26-36.

3. Карнаух Г. В. Деяю аспекти зняття граматично! иеоднозиачиостi словоформ у текстах худож-нього стилю (на матер1ат прозових та поетичних творш) / Г. В. Карнаух // Фшолопчш студи. Науко-вий вюник Кривор1зького державного педагопчного уиiверситету. - Випуск 6. - Кривий Р1г : КДПУ, 2011. - С. 585-592.

4. Карнаух Г. В. До питання про зняття граматично! иеодиозиачиостi словоформ у системах автоматично! обробки текстiв (на матер1ат прозового твору) / Г. В. Карнаух // Украшське мовознавство. М1жшдомчий науковий зб1рник. - Випуск 41/1. - К. : КНУ 1м. Т. Шевченка. - С. 106-110.

5. Колесшкова I. С. Украшське дшове мовлення : [навч. поабник] / I. С. Колесшкова, Ю. Ф. Прадщ ; [за ред. Ю. Ф. Прадща]. - С1мферополь : ВД «АРЬАЛ», 2009. - 210 с.

6. Корпусна лшгвгстика / В. А. Широков, О. В. Бугаков, Т. О. Грязнухша та ш. ; [тд ред. В. А. Широкова]. - К. : Дов1ра, 2005. - 407 с.

7. Кочерган М. П. Слово [ контекст (лексична сполучувашсть [ значення слова) : [монографш] / Михайло Петрович Кочерган. - Л. : Вид-во при Львгв. держ. ун-та видавничого об'еднання «Вища школа», 1980. - 182 с.

8. Крыгин М. Снятие грамматической омонимии в тексте с помощью статистических методов / М. Крыгин, В. Шкурко, О. Афанасьева // Прикладна лшгвгстика та лшгвютичш технологи : MegaLing-2009. - К. : Дов1ра, 2009. - 527 с.

9. Крыгин М. Текст на естественном языке как объект статистического анализа / М. Ю. Крыгин// Бюшка штелекту : [наук.-техн. журнал]. - 2000. - № 1 (72). - С. 75-82.

10. Любченко Т. П. Лексикограф1чш системи граматичного типу та !х застосування в засобах автоматичного опрацювання мови : дис. на здобуття наукового ступеня кандидата техн. наук : спец. 05.13.01 - К., 2011. - 294 с.

11. Мшьченко О. С. Семантичш дев1аци в нормативно-правових текстах : дис. на здобуття науко-вого ступеня кандидата фiлол. наук : спец. 10.02.01 «украшська мова» / О. С. Мiльчеико. - К., 2011. -178 с.

12. Пиотровский Р. Г. Инженерная лингвистика и теория языка : [монография] / Раймунд Генри-хович Пиотровский. - Л. : Наука. Ленингр. отд-ние 1979. - 111 с.

421

13. Токарська А. С. Комунжативна природа права i правова професшна д1яльшсть / А. С. Токарська // На терен юридично! i фшолопчно! науки : [зб. наук. праць, присвячений 50^ччю вiд дня народження i 25^ччю наук.-пед. дiяльностi професора Прадiда Ю. Ф.]. - Сiмферополь : Ель ньо, 2006. - С. 69-73.

14. Чулшда Л. I. Аспекти використання лiнгвiстичних знань в юриспруденцй / Л. I. Чулiнда // На тереш юридично! i фшолопчно! науки : [зб. наук. праць, присвячений 50^ччю вiд дня народження i 25-рiччю наук.-пед. дiяльностi професора Прадща Ю. Ф.]. - ймферополь : Елгньо, 2006. - С. 89-93.

15. Чулшда Л. I. Особливосп тексту нормативно-правового акта / Л. I. Чулшда // Науковий вюник Нацюнально! академп внутрiшнiх справ Укра!ни. - 2003. - № 2. - С. 82-89.

16. Чулшда Л. I. Текст нормативно-правового акта: загальш тдходи до аналiзу / Л. I. Чулшда // Науковий вюник Нацюнально! академп внутршшх справ Укра!ни. - 2002. - № 3. - С. 120-126.

17. Шевченко И. В. Электронный грамматический словарь украинского языка / И. В. Шевченко, А. Г. Рабулец, В. А. Широков // Труды Международной конференции «MegaLing-2005. Прикладная лингвистика в поиске новых путей», 27 июня - 2 июля 2005 г. - Меганом, 2005. - С. 124-129.

18. Шипшвська О. О. Структурно-семантичш та функцюнальш характеристики тжчастиномовно! морфолопчно! омошмп сучасно! укра!нсько! мови: дис. на здобуття наукового ступеня кандидата фь лол. наук : спец. 10.02.01 «украшська мова» / О. О. Шипнгвська. - К., 2007. - 238 с.

19. Шипнгвська О. О. Функцюнування мiжчастиномовних морфолопчних омошмгв в укра!нських текстах / О. О. Шипшвська // Мовознавство. - 2005. - № 6 (233). - С. 70-80.

20. Широков В. А. Феноменолопя лексикографiчних систем : [монографiя] / Володимир Анатоль йович Широков. - К. : Наук. думка, 2004. - 327 с.

21. Язык закона / [под. ред. А. С. Пиголкина]. - М. : Юрид. лит., 1990. - 192 с.

Карнаух А. В. Нормативно-правовые документы как объект снятия грамматической омонимии путем автоматической обработки текстов / А. В. Карнаух // Ученые записки Таврического национального университета имени В. И. Вернадского. Серия «Филология. Социальные коммуникации». -2012. - Т. 25 (64), № 4, ч. 2. - С. 415-422.

Исследование посвящено изучению особенностей снятия грамматической неоднозначности словоформ на материале текстов нормативно-правовых актов. С учетом специфики языка юридических документов созданы лексико-грамматические фильтры, которые способствуют росту количественных показателей устранения омонимии статистическими методами. Проанализированы качественно-количественные характеристики полученных данных. Установлено, что появление большинства омонимичных единиц обусловлено их разной функциональной принадлежностью.

Ключевые слова нормативно-правовые документы, грамматическая омонимия, лексико-грамматические фильтры, статистические методы, словоформа, грамматическое значение.

Karnaukh G. The legal documents as an object of elimination of grammatical of grammatical ho-monymy by automatic text processing / G. Karnaukh // Scientific Notes of Taurida V. I. Vernadsky National University. - Series: Philology. Social communications. - 2012. - Vol. 25 (64), No 4, part 2. - P. 415-422.

This research describes the investigation of particulars for elimination of grammatical ambiguity of word-forms on the basis of legal acts. Considering the specificity of language of judicial documents it was developed lexical and grammatical filters which increase the growth of quantitative indicators for elimination of grammatical ambiguity by means of statistical methods. The qualitative and quantitative characteristics of data obtained were analyzed. It was found that the appearance of majority of homonyms is caused by its different functional belonging.

Keywords: legal documents, grammatical ambiguity, lexical and grammatical filters, statistical methods, word-form, grammatical meaning.

Поступила в редакцию 14.10.2012

422

i Надоели баннеры? Вы всегда можете отключить рекламу.