Научная статья на тему '«Вычислительное» представление смысла текстовых фрагментов на основе обратной польской записи'

«Вычислительное» представление смысла текстовых фрагментов на основе обратной польской записи Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
408
50
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
КОНТЕКСТ / КОНТЕКСТНАЯ СВЯЗКА / ОПЕРАЦИЯ КОНТЕКСТНОГО УТОЧНЕНИЯ СМЫСЛА / ДЕРЕВО КОНТЕКСТНОЙ СВЯЗКИ / ОБРАТНАЯ ПОЛЬСКАЯ ЗАПИСЬ / CONTEXT / CONTEXT LINK / CONTEXT-SENSITIVE MEANING COMPUTATION / CONTEXT LINK TREE / REVERSE POLISH NOTATION

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Вишняков Ренат Юрьевич, Вишняков Юрий Муссович

Предлагаемая работа развивает интерпретационную модель представления смыслов предложений текстов научно-технического стиля и посвящена конструированию «вычислительного» представления функционала смысловыразительности текстовых фрагментов на основе идей обратной польской записи. В работе разрабатывается процедура представления функционала смысловыразительности текстового фрагмента в нотации обратной польской записи, формулируются правила ее получения и вычисления. Определяются понятия операции контекстного уточнения смысла, контекстной связки, дерева контекстной связки и конструируются их представление в нотации обратной польской записи. Рассматриваются свойства и особенности операции контекстного уточнения смысла и исследуются особенности контекстной связки. Все рассмотренные понятия и соотношения разбираются и иллюстрируются на конкретных примерах.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

“CALCULATING” REPRESENTATION OF THE TEXT SELECTION MEANING BASED ON THE REVERSE POLISH NOTATION

The paper shows build up of meanings representation interpretive model of the scientific and technical texts and concentrates on constructing text fragments meaning representation tools development. The procedure of the text fragments meaning representation tools based on the reverse polish notation is developed as well as rules of its calculation is stated in the project. Conceptions of context-sensitive meaning computation, context link, context link tree are defined. Their representation based on the reverse polish notation is designed. Features and properties of context-sensitive meaning computation are considered. Context link peculiarities are carried out. All the above terms are illustrated with specific examples.

Текст научной работы на тему ««Вычислительное» представление смысла текстовых фрагментов на основе обратной польской записи»

5. Cong J., Fang J., Xie M. and Zhang Y. MARS-A multilevel full-chip gridless routing system // IEEE Trans Comput.-Aided Design Integr. Syst. - 2005. - Vol. 24, № 3. - P. 382-394.

6. Лебедев Б.К., Лебедев В.Б. Поисковые процедуры канальной трассировки, базирующиеся на моделировании адаптивного поведения роя частиц в пространстве решений с неупорядоченным лингвистическим шкалированием // Известия ЮФУ. Технические науки. - 2009. - № 12 (101). - С. 15-22.

7. DorigoM. and Stutzle T. Ant Colony Optimization. MIT Press, Cambridge, MA, 2004.

8. Walter Banks, Gordon Hayward. Fuzzy logic in embedded microcomputers and control systems. Published by Byte Craft Limited, Waterloo Ontario Canada, 2001.

9. Курейчик В.М. Особенности построения систем поддержки принятия решений // Известия ЮФУ. Технические науки. - 2012. - № 7 (132). - С. 92-98.

10. Чернышев Ю.О., Венцов Н.Н., Крупенин А.В., Щербаков А.В., Мухтаров С А. Адаптивная оптимизация запросов в современных системах управления базами данных. Монография. Краснодар: ФВАС, 2011.

11. Курейчик В.М., Кажаров А.А. Использование роевого интеллекта в решении NP-трудных задач // Известия ЮФУ. Технические науки. - 2010. - № 7 (120). - С. 30-36.

Статью рекомендовал к опубликованию д.т.н., профессор Б.К. Лебедев.

Чернышев Юрий Олегович - Донской государственный технический университет; e-mail: [email protected]; 344000, г. Ростов-на-Дону, пл. Гагарина, 1; тел.: 88632738582, кафедра автоматизации производственных процессов; профессор.

Венцов Николай Николаевич - e-mail: [email protected]; кафедра информационных технологий; доцент.

Мухтаров Сергей Артурович - Филиал Военной академии связи (г. Краснодар); e-mail: [email protected]; 350035, г. Краснодар, ул. Красина, 4; соискатель.

Chernyshev Yury Olegovich - Don State Technical University; e-mail: [email protected]; 1, Gagarin Square, Rostov-on-Don, 344000, Russia; phone: +78632738582; the department of automation of productions; professor.

Vencov Nikolay Nikolaevich - e-mail: [email protected]; the department of information technologies; associate professor.

Mukhtarov Sergey Arturovich - Branch of Military academy of communication (Krasnodar); e-mail: [email protected]; 4, Krasina street, Krasnodar, 350035, Russia; competitor.

УДК 004.912

Р.Ю. Вишняков, Ю.М. Вишняков

«ВЫЧИСЛИТЕЛЬНОЕ» ПРЕДСТАВЛЕНИЕ СМЫСЛА ТЕКСТОВЫХ ФРАГМЕНТОВ НА ОСНОВЕ ОБРАТНОЙ ПОЛЬСКОЙ ЗАПИСИ

Предлагаемая работа развивает интерпретационную модель представления смыслов предложений текстов научно-технического стиля и посвящена конструированию «вычислительного» представления функционала смысловыразительности текстовых фрагментов на основе идей обратной польской записи. В работе разрабатывается процедура представления функционала смысловыразительности текстового фрагмента в нотации обратной польской записи, формулируются правила ее получения и вычисления. Определяются понятия операции контекстного уточнения смысла, контекстной связки, дерева контекстной связки и конструируются их представление в нотации обратной польской записи. Рассматриваются свойства и особенности операции контекстного уточнения смысла и исследуются особенности контекстной связки. Все рассмотренные понятия и соотношения разбираются и иллюстрируются на конкретных примерах.

Контекст; контекстная связка; операция контекстного уточнения смысла; дерево контекстной связки; обратная польская запись.

R.Yu. Vishnyakov, Yu.M. Vishnyakov

“CALCULATING” REPRESENTATION OF THE TEXT SELECTION MEANING BASED ON THE REVERSE POLISH NOTATION

The paper shows build up of meanings representation interpretive model of the scientific and technical texts and concentrates on constructing text fragments meaning representation tools development.

The procedure of the text fragments meaning representation tools based on the reverse polish notation is developed as well as rules of its calculation is stated in the project. Conceptions of context-sensitive meaning computation, context link, context link tree are defined. Their representation based on the reverse polish notation is designed. Features and properties of context-sensitive meaning computation are considered. Context link peculiarities are carried out. All the above terms are illustrated with specific examples.

Context; context link; context-sensitive meaning computation; context link tree; reverse polish notation.

Постановка задачи. Повышенный интерес к выделению семантической составляющей текстов сформирован сегодняшней практикой информационных технологий и связан с возросшими запросами пользователей к качеству обработки текстовой информации. Это связано с тем, что используемые на практике подходы основаны на частотной парадигме релевантности, наверное, уже достигли предела своих возможностей и не могут удовлетворить возрастающие запросы пользователей. Предлагаемая работа развивает интерпретационную модель представления смыслов предложений текстов научно-технического стиля [2, 3] и посвящена конструированию «вычислительного» представления функционала смысловырази-тельности текстовых фрагментов на основе идей обратной польской записи.

Метод решения. Обратная польская запись (нотация) арифметических выражений была предложена польским математиком Я. Лукасевичем и получила широкое распространение в методах трансляции языков программирования в связи со способом ее вычисления на основе автомата с магазинной памятью, предложенного голландским ученым Дейкстрой [1]. В нотации обратной польской записи (ОПЗ) символ операции всегда завершает список ее операндов. Поэтому, если в традиционном представлении задана некоторая k-нарная операция Ф(хх,x2,..., xk), то нотация ОПЗ этой операции имеет вид:

*1 ,х 2 , ■ ■ ■ ,хк Ф . (1)

к операндов операция

Для указания k-арности операции (границы действия операции в линейной записи выражения) перед символом операции явно проставляют счетчик числа операндов k, после чего ОПЗ выражения (1 ) принимает вид:

*1 , *2 , ■ ■ ■ , *к к Ф . (2)

" к операндов ' ошраНДОв операция

Отличительной особенностью ОПЗ является линейный порядок ее вычисления слева направо за один проход, а отсюда и отсутствие в нотации скобок. По этой причине применительно к ОПЗ часто добавляют слово «бесскобочная» запись.

Теперь обсудим следующие понятия [2-4]:

1. Функционал смысловыразительности некоторого осмысленного текстового фрагмента й- x2...xn представляется следующим образом:

S(«) = Ф(S (xi) , S(Х2) ,..., S(хп) ) ; (3)

S(«) с S(Xj),

где х,X,■■■,х„слова текстового фрагмента а, представляющего собой некоторое осмысленное выражение (словосочетание, предложение), xi - главное слово фрагмента текста а, ^(х ) - множество смыслов (семантических значений) слова х ■, ^(а) - смысл (семантическое значение) текстового фрагмента а,

Ф(Б (хГ) , Б (хг) ,..., Б (хп) ) - функционал смысловыразительности.

Данный функционал вычленяет из множества смысловых значений слов их определенные семантические значения и на их множестве строит смысловое значение всего выражения а , которое в общем случае является частью смыслового значения главного слова выражения.

2. Если в некотором фрагменте текста имеются такие слова х и у, что х -главное слово, у - зависимое слово, то операция контекстного уточнения смысла П определяется следующим образом:

Б (ХТу) = Б (х) П Б (у), (1)

Б (ХТу) с Б (х) ,

здесь: Б (х) и Б (у) смысловые значения слов х и у соответственно, П - операция контекстного уточнения смысла, Б (ХТу) - результат операции контекстного уточнения смысла.

3. Контекстная связка. Если в некотором фрагменте текста V есть некоторое слово и хГ, хг, ... , хп прямо от него зависимые слова, то контекстной связкой для слова V назовем запись вида V: {хГ, хг, ... ,хп}. Смысловое значение данной контекстной связки определяется следующим образом:

Б(^{Х1(Х2,... ,Хп} ) = Б(уТТХГ) П Б(уТХ2) П ...П Б(^хЛ) , (5)

где Б (V, хГ) = Б (V) П Б (х1 ) ; Б (V, х Г) = Б (V) П Б (х2) ;...; Б (V, хп ) = Б (V) П Б (х1 ) .

Поскольку операция контекстного уточнения смысла (4) не является симметричной [3], то при ее конструировании в нотации ОПЗ необходимо сохранить логику линейного следования операндов и их вычисления. С учетом данного обстоятельства в нотации обратной польской записи операция контекстного уточнения смысла запишется следующим образом:

Б (у) Б (V) П. (6)

Следует отметить, что направление стрелки над операцией контекстного уточнения смысла в нотации обратной польской записи меняет направление, что соответствует логике выполнения операции.

Нотация обратной польской записи контекстной связки V: {хГ,х2, ... ,хп} , определяемой выражением (5) с учетом (6), соответственно примет вид:

Б(V: {Хг,Хг, ... ,Хп} ) = Б(уГхТ) Б(уТхТ) ... Б(уТХП) п П, (7)

где

Б (уТхТ) = Б (хг)Б (V) П; Б (уТхТ) = Б (хг)Б (V) П; ...; Б (уТхП) = Б (Хп) Б(V) П. (8)

Подставляя (8) в (7), получим следующее выражение в нотации обратной польской записи для вычисления смыслового значения контекстной связки:

Б (V: {Хг,Хг, ... ,Хп}) = Б (хг ) Б (V) П ^ (хг) Б (V) П ... Б (хп ) Б (у) П п П. (9)

12 п к=п

В выражении (9) горизонтальными фигурными скобками выделены операции контекстного уточнения смысла, результаты которых представляют операнды операции пересечения П. Фигурной скобкой также отмечен счетчик числа операндов операции пересечения. Как это нетрудно заметить, в сконструированном выражении (9) основные свойства и особенности нотации обратной польской записи контекстной связки сохранены.

Сконструируем процедуры построения обратной польской записи контекстного смыслоуточнения для фрагментов текстов. Заметим, что построение обратной польской записи арифметических выражений осуществляется путем обход дерева арифметического выражения слева направо [1], в результате чего формируется строка обратной польской записи. Однако данное правило обхода для нашего случая напрямую не применимо уже хотя бы потому, что дерево зависимостей фрагмента текста в виду наличия операции контекстного уточнения смысла не подобно дереву арифметических выражений. Для сохранения общей логики обхода дерева [1] модифицируем данное понятие применительно к вычислению функционала смысловыразительности фрагментов текстов. Для этого в дереве зависимостей фрагмента текста дуги пометим символами операций контекстного смыслоуточне-ния П, а узлы - операциями пересечения П.

Теперь сконструируем обход дерева контекстной связки для построения ее обратной польской записи.

Алгоритм 1.

1. Обход выполняем слева направо, начиная с самого левого контекстного

узла;

2. Для каждого контекстного узла строим обратную польскую запись операции контекстного уточнения смысла (6), которая определяется дугой зависимости и главным словом.

3. После обхода всех контекстных узлов в строку-результат записываем операцию пересечения со значением счетчика операндов, равным числу контекстных узлов.

4. Результатом обхода дерева контекстной связки является ее обратная польская запись.

Например, модифицированное дерево контекстной связки у: {х, у, г} и его обход показаны на рис. 1.

Рис. 1. Модифицированное дерево контекстной связкиv:{x, у ^}

В результате обхода дерева (см. рис. 1) будет сформирована обратная польская запись контекстной связки у: (х, у, г} вида:

ОПЗ: 5 (у:(х, у, г}) = 5 (х) 5 (у) П5 (у) 5 (у) П 5 (г)5 (у) П 3 П. (10)

4---.----" "--.---" 4---.---" к =3

12 3

Для построения обратной польской записи смыслового значения S(a) всего фрагмента текста а сконструируем следующий алгоритм:

Алгоритм:

1. Выполнить слева направо последовательный обход узлов дерева фрагмента а, начиная с самого левого нижнего узла.

2. Для каждого рассматриваемого узла построить ОПЗ его контекстной связки, после чего перейти к следующему узлу.

Справедливость сконструированного алгоритма рассмотрим на следующем примере фрагмента текста а:

«м еждун ар о д н о е п р и з нан и е о б р аз о в ател ь н ых п р о гра м м р о с си й с ких вузо в»

а Ь С й е /

Закодируем латинскими буквами слова данного фрагмента текста. С учетом кодировки дерево зависимостей фрагмента текста показано на рис. 2

Рис. 2. Дерево зависимостей фрагмента текста

В результате сконструированного обхода дерева (см. рис. 2) получим ОПЗ функционала смысловыразительности S(a) фрагмента текста а вида:

5 (а) = Оф S (р П о (с) Б^)П о ф S (О П 5(Д) П 2 П S(b) П 2 П, (11)

1 2 3____________п ^=2 к =2

о__________________С____________,

о_______________5_______________,

о_____________________________6________________________,

7

в которой горизонтальными фигурными скобками выделены конкретные операции уточнения смысла и пересечения с их операндами, выполняемые на каждом шаге вычисления, а номер шага вычисления указан непосредственно под фигурной скобкой.

Введем условно массив временных переменных R={r1, г2,..., гп}, в которых будем сохранять промежуточные результаты вычисления операций. Тогда пошаговое вычисление обратной польской записи (11) функционала смысловырази-тельности с запоминанием промежуточных результатов во временных переменных представлено в табл. 1.

Таблица 1

Вычисление ОПЗ функционала смысловыразительности с использованием

временных переменных

№ пп Текущая конфигурация ОПЗ Выполняемая операция

1 О ^) Б (Ь) П S (е) S ^) П S ф S (0 П S(d) П 2 П 5(Ь) П 2 П г1 = S ^) S (Ь) П

2 г1 О (е) Б ^) П S (e) S (0 П S(d) П 2 П 5(Ь) П 2 П Г2 = S (е) S (d) П

3 г1 г2 О (e) S (0 П S(d) П 2 П 5(Ь) П 2 П Г3 = S ф S (0 П

Окончание табл. 1

№ пп Текущая конфигурация ОПЗ Выполняемая операция

4 riг2 гз S(d) П 2 П 5(b) П 2 П 74 = 73S(d) П

5 71 г2 г42 П S(b) П 2 П 75 = 72 74 2 П

6 r1 r5 S (b) П 2 П *6 = ?sS(b) П

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

7 717*6 2 П Ту = 71 Гб2 П

Процесс завершен, результат представлен в г7

Здесь выполняемая на каждом шаге операция выделена горизонтальной фигурной скобкой. Из примера нетрудно увидеть, что все характерные особенности и свойства обратной польской записи (отсутствие скобок и линейность процесса вычисления) при ее вычислении сохраняются.

Заключение. В работе рассмотрено «вычислительное» представление функционала смысловыразительности текстовых фрагментов в обратной польской записи, для чего в данной нотации сконструированы операция контекстного уточнения смысла и процедура вычисления смысла контекстной связки. Для контекстной связки предложена конструкция модифицированного дерева зависимостей, сконструирована процедура его обхода, результатом которой является ОПЗ функционала смысловыразительности текстового фрагмента. Показано, что основные особенности обратной польской записи в нотации обратной польской записи функционала смысловыразительности (однопроходной линейный порядок вычисления и отсутствие скобок) полностью сохранены.

БИБЛИОГРАФИЧЕСКИЙ СПИСОК

1. ЛебедевВ.Н. Введение в системы программирования. - М.: Статистика, 1975. - 312 с.

2. Вишняков Ю.М., Вишняков Р.Ю. Проблемы семантического информационного поиска // Труды международных научно-технических конференций «Интеллектуальные системы» (AIS’06) и «Интеллектуальные САПР» (CAD-2006). Научное издание в 3-х томах. Т. 2. - М.: Физматлит, 2006. - C. 308-314.

3. Вишняков Р.Ю. Контекстное уточнение смысла слов в связанном текстовом фрагменте // Сборник трудов VI Всероссийской научной школы-семинар молодых ученых, аспирантов и студентов «Семантическая интерпретация и интеллектуальная обработка текстов, их приложения в информационном поиске, хранении и обработке документов в электронных архивах и библиотеках». - Таганрог: Изд-во ТТИ ЮФУ, 2012. - С. 112-116.

4. Вишняков Р.Ю. Использование нотации обратной польской записи для контекстного уточнения смыслов фрагментов текстов // Сборник трудов Всероссийской научной школы-семинар молодых ученых, аспирантов и студентов «Семантическая интерпретация и интеллектуальная обработка текстов, их приложения в информационном поиске, хранении и обработке документов в электронных архивах и библиотеках». - Таганрог: Изд-во ТТИ ЮФУ, 2012. - С. 106-112.

Статью рекомендовал к опубликованию д.т.н., профессор В.П. Карелин.

Вишняков Ренат Юрьевич - Федеральное государственное автономное образовательное учреждение высшего профессионального образования «Южный федеральный университет»; e-mail: [email protected]; 347928, г. Таганрог, пер. Некрасовский, 44; тел.: +78634314485; кафедра системного анализа и телекоммуникаций; ассистент.

Вишняков Юрий Муссович - e-mail: [email protected]; факультет автоматики и вычислительной техники; декан.

l46

Vishnyakov Renat Yur’evich - Federal State-Owned Autonomy Educational Establishment of Higher Vocational Education “Southern Federal University”; e-mail: [email protected]; 44, Nekrasovskiy, Taganrog, 347928, Russia; phone: +78634314485; the department of system analysis and telecommunication; assistant.

Vishnyakov Yurij Mussovich - e-mail: [email protected]; the college of automation and computer engineering; dean.

УДК 004.272.43

А.Э. Саак

УГЛОВОЙ АЛГОРИТМ ДИСПЕТЧЕРИЗАЦИИ МАССИВАМИ ЗАЯВОК

КРУГОВОГО ТИПА

Рассматривается круговой тип массива заявок пользователей на компьютерное обслуживание в Grid-системах, многопроцессорных вычислительных системах. Предлагается и исследуется угловой полиномиальный алгоритм назначения заявок кругового квадратичного типа. Проведено сравнение с оптимальным алгоритмом распределения вычислительных ресурсов на примере массивов натуральных ресурсных квадратов. Оценено качество алгоритма по эвристической мере на тех же массивах требований. Даются рекомендации о возможности использования углового полиномиального алгоритма в диспетчере как МВС, так и центра Grid-технологий.

Grid-система; многопроцессорная вычислительная система; диспетчирование; круговой квадратичный тип массива требований пользователей; угловой полиномиальный алгоритм.

A.E. Saak

AN ANGULAR ALGORITHM FOR SCHEDULING BY SETS OF CIRCULAR-TYPE USER TASKS

A circular-type task queue waiting for service in Grid systems or multiprocessor computer systems is considered. An angular polynomial algorithm for circular-type quadratic tasks assigning are proposed and considered. The results are compared with the optimal algorithm of computer resources scheduling in which sets of natural resource squares are taken as an example. Quality of the algorithm is estimated by an heuristic measure on the same sets of user tasks. Recommendations on possible use of the angular polynomial algorithm in a control system of a multiprocessor computer system or Grid system are given.

Grid system; multiprocessor computer system; scheduling; circular and quadratic type of set of user tasks; angular polynomial algorithm.

Введение. Классификация массивов заявок пользователей на круговой, гиперболический и параболический квадратичные типы [1] была дополнена работами с алгоритмами диспетчеризации, адаптированными под соответствующий вид требований. Так, в [2-5] рассматривались алгоритмы для кругового, в [2, 6, 7] -для гиперболического, в [2, 8] - для параболического типов. Качество алгоритмов оценивается эвристической мерой [6]. В настоящей статье предлагается и исследуется угловой алгоритм назначения на обслуживание заявок кругового квадратичного типа и приводится сравнение с оптимальным алгоритмом.

Полиномиальный угловой алгоритм. При представлении заявки пользователя для обслуживания диспетчером центра Grid-технологий или операционной системы МВС ресурсным прямоугольником [(я(^),b(j))] горизонтальное и вертикальное измерения, соответственно, принимаются равными числу единиц ресурса времени a(j) и процессоров b(j), требуемому для обработки j -й заявки.

i Надоели баннеры? Вы всегда можете отключить рекламу.