Научная статья на тему 'Построение матрицы лексических связей в информационно-поисковых системах'

Построение матрицы лексических связей в информационно-поисковых системах Текст научной статьи по специальности «Математика»

CC BY
125
25
i Надоели баннеры? Вы всегда можете отключить рекламу.
i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Построение матрицы лексических связей в информационно-поисковых системах»

Известия ТРТУ

Специальный выпуск

УДК 681.3.06

Э.М. Котов

ПОСТРОЕНИЕ МАТРИЦЫ ЛЕКСИЧЕСКИХ СВЯЗЕЙ В ИНФОРМАЦИОННО-ПОИСКОВЫХ СИСТЕМАХ

Принимая во внимание наличие связей, существующих между различными предложениями текста документа на естественном языке, которые устанавливаются набором лексем документа, возможно рассматривать текст как ориентированный граф или иерархическую сеть, в которой помимо частоты встречаемости лексемы, важность приобретают и такие критерии, как положение лексемы в иерархии, длина ассоциативных цепочек порожденных некоторой лексемой. Отметим, что согласно [1], частотой лексемы будем называть число ее повторений в различ-, . Подмножество повторяющихся лексем составляет лексическое множество связи текста. Произведя исключение из рассмотрения лексем, принадлежащих подмно-, , -.

Пусть Ь = {/1,..., // ,..., N }- множество лексем,

0 = {^1,..., wг■,..., WN/} - множество частот соответствующих лексем. При условии, что все уникальные лексемы из рассмотрения исключены, то

wi > 1, V/ < N 1,

где Ы/ -общее число лексе м связи в тексте.

Если предложениям текста /7* поставить в соответствие множество входящих в них лексем, то:

к = |1, / е Пк

[0, /■ € Пк

и предложениям документа Гк соответствует вектор:

а тексту соответствует матрица лексических связей:

' & . .. & . сі л .. &

(&)= .. & . ок .. &

& . .. ^ . 6Ыр

БИБЛИОГРАФИЧЕСКИЙ СПИСОК

1. Чанышев ОТ. Ассоциативная модель естественноязыкового текста. Вестник Омского университета. Вып. 2. Омский государственный университет, 1997,С.17-20.

&

i Надоели баннеры? Вы всегда можете отключить рекламу.