Научная статья на тему 'Интерпретационная модель смысла текстового фрагмента'

Интерпретационная модель смысла текстового фрагмента Текст научной статьи по специальности «Языкознание и литературоведение»

CC BY
303
60
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ФУНКЦИОНАЛ СМЫСЛОВЫРАЗИТЕЛЬНОСТИ / ТЕКСТОВЫЙ ФРАГМЕНТ / КОНТЕКСТ / ОПЕРАЦИЯ КОНТЕКСТНОГО УТОЧНЕНИЯ СМЫСЛА / КОНТЕКСТНАЯ СВЯЗКА / MEANING EXPRESSION FUNCTIONAL / TEXT SELECTION / CONTEXT / CONTEXT-SENSITIVE MEANING COMPUTATION / CONTEXT LINK

Аннотация научной статьи по языкознанию и литературоведению, автор научной работы — Вишняков Ренат Юрьевич, Вишняков Юрий Муссович

В связи с ростом объемов электронных документов и повышением требований к качеству и точности их обработки, например, в таких областях как информационный поиск, кластеризация, классификация и др. в работе обосновывается необходимость разработки формальных методов представления семантики текстов и ее учете в обработке. С этой целью для связанных фрагментов текстов определяются такие формальные понятия как функционал смысловыразительности, контекст, контекстная связка. Вводится операция контекстного уточнения смысла и раскрывается ее физический смысл. Рассматриваются свойства и особенностей операции контекстного уточнения смысла, а также исследуются основные смысловые особенности и соотношения в контекстной связке. Особенности введенных понятий иллюстрируются конкретными текстовыми примерами.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

INTERPRETATIVE MODEL OF TEXT SELECTION MEANING

The paper shows the need to develop formal methods for text semantics representation and its treatment in processing. In connection with the growth of documents amount and the increasing demands for quality and accuracy of their processing, for example in areas such as information retrieval, clustering, classification, and others. To this end, defined the procedure of the text fragments meaning representation tools for the related text fragments, context, context-sensitive link. We introduce the operation context clarify the meaning and reveals its physical meaning. We consider the properties and characteristics of the operation clarify the meaning of the context, and explores the basic semantic features and relations in the context bundle. Features introduced concepts are illustrated with specific examples of text. Conceptions of text selection meaning expression functional, context, context-sensitive meaning computation and context link are defined in the project. Features and properties of context-sensitive meaning computation are considered as well as main semantic correlations based on context link are elaborated.

Текст научной работы на тему «Интерпретационная модель смысла текстового фрагмента»

4. СаакА.Э. Полиномиальные алгоритмы диспетчеризации на основе квадратичной типизации массивов заявок пользователей // Труды VI Международной конференции «Параллельные вычисления и задачи управления» РАСО’ 2012. - М.: Институт проблем управления им. В.А. Трапезникова Ран, 2012. - C. 341-347.

5. СаакА.Э. Полиномиальная диспетчеризация круговым типом массива заявок пользователей // Материалы 2-й Всероссийской научно- технической конференции «Суперкомпью-терные технологии (СКТ-2012)». - Ростов-на-Дону: Изд-во ЮФУ, 2о12. - С. 169-173.

6. СаакА.Э. Полиномиальные алгоритмы диспетчеризации массивов заявок гиперболического типа // Информационные технологии. - 2Q13. - № 3. - С. 33-3б.

7. Саак А.Э. Центрально- кольцевой алгоритм диспетчеризации массивами заявок гиперболического типа // Известия ЮФУ. Технические науки. - 2Q12. - № 8 (133). - С. 214-222.

S. Саак А.Э. Полиномиальные алгоритмы диспетчеризации массивов заявок параболического типа // Информационные технологии. - 2Q13. - № 5. - С. 25-29.

9. Korf R. Optimal rectangle packing: Initial results. In Proceedings of the thirteenth international conference on automated planning and scheduling (ICAPS 2QQ3). Trento, Italy, June 9-13, 2QQ3. - P. 2S7-295.

1Q. Korf R. Optimal rectangle packing: New results. In Proceedings of the fourteenth international conference on automated planning and scheduling (ICAPS 2QQ4). Whistler, British Columbia, Canada, June 3-7, 2QQ4. - P. 142-149.

11. Korf R. Huang E. New Improvements in Optimal Rectangle Packing. In Proceedings of the 21st International Joint Conference on Artificial Intelligence (IJCAI 2QQ9) Pasadena, California, USA, July 11-17, 2QQ9. - P. 511-51б.

12. Korf R. Moffitt M. Pollack M. Optimal rectangle packing // Annals of Operations Research. - 2Q1Q. -Vol. 179, № 1. -P. 2б1-295.

13. Korf R., Huang E. Optimal rectangle packing: an absolute placement approach // Journal of Artificial Intelligence Research. - 2Q12. - Vol. 4б. - P. 47-S7.

Статью рекомендовал к опубликованию д.т.н., профессор В.П. Карелин.

Саак Андрей Эрнестович - Федеральное государственное автономное образовательное учреждение высшего профессионального образования «Южный федеральный университет»; e-mail: [email protected]; 347928, г. Таганрог, пер. Некрасовский, 44; тел., факс: 88634393373; кафедра государственного и муниципального управления; зав. кафедрой.

Saak Andrey Ernestovich - Federal State-Owned Educational Establishment of Higher Vocational Education «Southern Federal University»; e-mail: [email protected]; 44, Nekrasovskiy, Taganrog, 34792S, Russia; phone, fax: +78б34393373; the department of state and municipal administration; head the department.

УДК 004.912

Р.Ю. Вишняков, Ю.М. Вишняков

ИНТЕРПРЕТАЦИОННАЯ МОДЕЛЬ СМЫСЛА ТЕКСТОВОГО

ФРАГМЕНТА

В связи с ростом объемов электронных документов и повышением требований к качеству и точности их обработки, например, в таких областях как информационный поиск, кластеризация, классификация и др. в работе обосновывается необходимость разработки формальных методов представления семантики текстов и ее учете в обработке. С этой целью для связанных фрагментов текстов определяются такие формальные понятия как функционал смысловыразительности, контекст, контекстная связка. Вводится операция контекстного уточнения смысла и раскрывается ее физический смысл. Рассматриваются свойства и особенностей операции контекстного уточнения смысла, а также исследуются основные смысловые особенности и соотношения в контекстной связке. Особенности введенных понятий иллюстрируются конкретными текстовыми примерами.

Функционал смысловыразительности; текстовый фрагмент; контекст; операция контекстного уточнения смысла; контекстная связка.

R.Yu. Vishnyakov, Yu.M. Vishnyakov INTERPRETATIVE MODEL OF TEXT SELECTION MEANING

The paper shows the need to develop formal methods for text semantics representation and its treatment in processing. In connection with the growth of documents amount and the increasing demands for quality and accuracy of their processing, for example in areas such as information retrieval, clustering, classification, and others. To this end, defined the procedure of the text fragments meaning representation tools for the related text fragments, context, context-sensitive link. We introduce the operation context clarify the meaning and reveals its physical meaning. We consider the properties and characteristics of the operation clarify the meaning of the context, and explores the basic semantic features and relations in the context bundle. Features introduced concepts are illustrated with specific examples of text.

Conceptions of text selection meaning expression functional, context, context-sensitive meaning computation and context link are defined in the project. Features and properties of context-sensitive meaning computation are considered as well as main semantic correlations based on context link are elaborated.

Meaning expression functional; text selection; context; context-sensitive meaning computation; context link.

Постановка задачи. Сегодня в частотной парадигме моделирования семантики (частотная релевантность) точность и качество обработки текстовой информации подошли к своему естественному пределу, что уже явно наблюдается в таких областях как информационный поиск, кластеризация, индексация документов и др. Дальнейшее улучшение данных характеристик, по-видимому, связано с переходом на другие формальные модели моделирования семантики, которые бы учитывали не только частотные характеристики лексических единиц, но и, прежде всего, их отношения и связи. В виду сложности и неоднозначности естественных языков, наверное, универсальных методов интерпретации семантики найдено не будет, однако для частных областей это вероятно вполне реально. Поэтому сегодня в компьютерной обработке текстов возрастающее внимание уделяется разработке формальных способов интерпретации семантики. Необходимость решения данной проблемы связана с широким использованием информационных технологий, увеличением объемов информации и как следствие с повышением требований пользователей к качеству обработки.

Предлагаемая работа освещает частью развиваемого нами подхода применительно к обработке текстов научно-технического стиля и является логическим продолжением идей и результатов работы [2].

Метод решения. Рассматривая естественный язык, следует обратить внимание на тот факт, что лексический состав языка представляет собой конечное и достаточно ограниченное множество слов, которые являются многозначными или полисемичными. В данном случае многозначность отражает тот факт, что за словами скрывается множество смыслов, но при употреблении в предложениях эта многозначность слов правильным образом сужается, что позволяет синтетически выразить смысл всего предложения в целом. Если бы естественный язык был устроен так, что каждому новому смыслу давал бы новое название, он разрастался бы неимоверно.

Введем понятие функционала смысловыразительности. Пусть L - некоторый язык и в нем существует последовательность а слов x,X,--,X, представляющая собой некоторое осмысленное выражение (словосочетание, предложение), т.е. а = xx ■■■X. Пусть S(x ) - множество смыслов (семантических значений) слова

X, тогда смысл (семантическое значение) выражения а определим в общем случае в виде функционала следующего вида:

Б(а) = Ф(8(Х! ),8(х2).....Б(хп)); (2)

Б (а) с 8(Х;),

где xi - главное слово фрагмента текста а.

Данный функционал вычленяет из множества смысловых значений слов их определенные семантические значения и на их множестве строит смысловое значение всего выражения х в целом, которое является в общем случае частью смыслового значения главного слова выражения.

Теперь сконструируем формальные правила вычисления функционала смы-словыразительности. Пусть задан некоторый фрагмент текста a=x1x2... xn. Выделим в нем такие слова xi и xj, что слово xi является главным, а слово Xj прямо от него зависимым. Тогда можно считать, что во фрагменте текста а смысл 5(х;) слова xi уточняется смыслом 5(х;) слова Xj, а данное обстоятельство представить в виде записи следующего вида:

)= ^ (х; : х/ ). (3)

Здесь можно говорить, что смысл 5 (х;) является контекстом для смысла 5 (х;) , или, иначе говоря, слово Xj есть контекст для слова xi.

В этой записи стрелка указывает направление зависимости слов, которое задается конфигурацией фрагмента текста непосредственно.

Поскольку всегда контекст сужает смысл главного слова, то для выражения (2) с учетом (1) всегда справедливо соотношение:

5 (х^Гх*) с 5(Х().(4)

Введем для выражения (2) операцию контекстного уточнения смысла и обозначим ее как П. Тогда выражение (2) с учетом данной операции представляется следующим образом:

5 (х; : х/) = 5 (Х;)ПХ (х;-) . (5)

Рассмотрим свойства операции контекстного уточнения смысла П.

Свойство 1. Поскольку в осмысленных текстах связь слов всегда однонаправленная, то для операции контекстного уточнения смыслов П всегда справед-

ливо соотношение:

5 (х) П 5 (у) Ф 5 (у) П 5 (х), (6)

или, иначе говоря, операция контекстного уточнения смысла является несимметричной. Данное обстоятельство непосредственно вытекает из соотношения (3), поскольку при изменении мест операндов речь всегда идет о контекстном уточнении разных множеств смыслов.

Свойство 2. Если два слова x и у в некотором фрагменте текста не связаны

прямой зависимостью, то результат операции контекстного уточнения смысла

представляет собой пустое множество (аксиома), т.е.:

5 (х) П 5 (у) = 0. (6)

Свойство 3. Для операции контекстного уточнения смысла всегда справедливо соотношение:

5 (х)п5 (х) = 5(х). (7)

Справедливость данного соотношения очевидна.

Определение 1. Если в связанном фрагменте текста имеется некоторое главное слово v и его контекстные слова x1, x2,..., xn, то контекстной связкой слова v будем называть запись вида:

V! {*!, Х2, ..., х„} . (8)

Теперь рассмотрим выполнение операции контекстного уточнения смыслов, для чего вначале рассмотрим случай k=2, а потом распространим его результаты на случай произвольного k.

Случай 1. Пусть v, у и z некоторые слова фрагмента текста а, причем слово v является главным словом, а у и z его прямо зависимыми словами, т.е. k=2. Тогда используя (4) для слов v, у и z фрагмента текста а можно записать следующее выражение:

S(v. {у, z}) = S(v,y) П5 ( v, z). (8)

Важно подчеркнуть уместность использования в выражении (9) операции пересечения П. Действительно, поскольку контекст уточняет всегда смысл главного слова v, то операция П проводится на подмножествах одного и того же множества смыслов главного слова v.

Учитывая данное обстоятельство, распространим соотношение (9) на случай произвольного числа k контекстных слов.

Случай 2. Пусть задан некоторый фрагмент текста и в нем имеется главное слово v, образующее контекстную связку вида v: {хх, х2,..., xfc}. Тогда из (9) для данного случая следует справедливость следующего выражения:

S(v: {х,Х2,...,xfc}) = S(v,xi) ПS(vTx^) П .П5 ( v,xfc). (9)

Соотношению (10) можно придать следующий обобщенный вид:

5 (х: {хх,Х2, ..., xfc}) = П f=i 5 (vTx^). (10)

При вычислении смыслового значения главного слова порядок учета контекстов зависимых слов не существенен, что непосредственно следует из симметричности операции пересечения множеств П.

В частном случае, когда контекстное множество слов является одноэлементным (k=1) или пустым (k=0), то соотношение (10) сводится к видам:

S(v: {х}) = S(и: х); (11)

5 (v: 0) = S(v). (12)

Проиллюстрируем введенные понятия на примере следующего текстового фрагмента:

«международное признание образовательных программ российских вузов».

Действительно, в этом фрагменте текста для контекстной связки (признание: {международное, программ}) выражение (10) для контекстного уточнения смысла слова признание имеет вид:

S(признание: {международное, программ} )

= S(п р и з н ан и е , м еждун ар о д н о е) П5 (п р и з н ан и е , пр о гр ам м) =

(п р и з н ан и е П м еждун ар одн о е ) П ( пр и з н а н и е П пр о гр ам м) .

контекстное уточнение смысла контекстное уточнение смысла

Таким образом, в работе определены понятия контекста, операции контекстного уточнения смысла, контекстной связки. Рассмотрена операция контекстного уточнения смысла, которая определяется на множестве смысловых значений главного слова контекстной связки, и показано, что данная операция является несимметричной. Также рассмотрены свойства и особенностей операции контекстного уточнения смысла и построено обобщенное выражение для вычисления функционала смысловыразительности контекстной связки. Теоретические построения проиллюстрированы примером.

БИБЛИОГРАФИЧЕСКИЙ СПИСОК

1. Тестелец Я.Г. Введение в общий синтаксис: Учебное пособие. - М.: Изд-во Российского гуманитарного университета, 2001. - 830 с.

2. Вишняков Ю.М., Вишняков Р.Ю. Проблемы семантического информационного поиска // Труды международных научно-технических конференций «Интеллектуальные системы» (AIS’06) и «Интеллектуальные САПР» (CAD-2006). Научное издание в 3-х томах. Т. 2. - М.: Физматлит, 2006. - C. 308-314.

3. Вишняков Р.Ю. Контекстное уточнение смысла слов в связанном текстовом фрагменте. // Сборник трудов Всероссийской научной школы-семинар молодых ученых, аспирантов и студентов «Семантическая интерпретация и интеллектуальная обработка текстов, их приложения в информационном поиске, хранении и обработке документов в электронных архивах и библиотеках». - Таганрог: Изд-во ТТИ ЮФУ, 2012. - C. 112-116.

Статью рекомендовал к опубликованию д.т.н., профессор В.П. Карелин.

Вишняков Ренат Юрьевич - Федеральное государственное автономное образовательное учреждение высшего профессионального образования «Южный федеральный университет»; e-mail: [email protected]; 347928, г. Таганрог, пер. Некрасовский, 44; тел.: +78634314485; кафедра системного анализа и телекоммуникаций; ассистент.

Вишняков Юрий Муссович - e-mail: [email protected]; факультет автоматики и вычислительной техники; декан.

Vishnyakov Renat Yur’evich - Federal State-Owned Autonomy Educational Establishment of Higher Vocational Education “Southern Federal University”; e-mail: [email protected]; 44, Nekrasovskiy, Taganrog, 347928, Russia; phone: +78634314485; the department of system analysis and telecommunication; assistant.

Vishnyakov Yurij Mussovich - e-mail: [email protected]; the college of automation and computer engineering; dean.

УДК 004.732.056(075.8)

А.Е. Васильев, О.П. Третьяков

ГРАФОВАЯ МОДЕЛЬ КОНТРОЛЯ И АНАЛИЗА СОСТОЯНИЯ ЗАЩИТЫ

ИНФОРМАЦИИ*

Рассматривается многоуровневая графовая модель для контроля и анализа состояния защиты информации. Для решения задачи, контроль предлагается проводить по точкам контроля, которые представляют собой возможные существующие недостатки по проверяемому направлению и имеют между собой определенную взаимосвязь и при выявлении уязвимости защиты информации, позволит быстро определить направления ее распространения.

* Работа выполнена при финансовой поддержке РФФИ (проект № 12-01-00474). 156

i Надоели баннеры? Вы всегда можете отключить рекламу.