УДК 621.37
Г.Н. Никитина, соискатель (4872)35-02-19, [email protected] (Россия, Тула. ТулГУ)
ПОИСКОВЫЕ ИНФОРМАЦИОННЫЕ СИСТЕМЫ С ИЕРАРХИЧЕСКОЙ СТРУКТУРОЙ
Рассмотрены вопросы применения граф-схем, описывающих механизмы поиска с иерархической структурой, представляющие собой математическое подобие. Определена количественная оценка величины нахождения параметра, характеризующего связь в реальном объекте.
Ключевые слова: механизм поиска, поисковая система, вершины графа, плотность распределения, транзитивные связи, матрица смежности.
Структурно-параметрические модели используются в теории надежности достаточно широко [1, 2], при этом поисковые системы и методы поиска с точки зрения проектирования могут иметь сетевую структуру. Для подобных структур характерным является то, что их объекты с общих позиций могут быть разделены на два класса: терминальные (конечные документы (объекты)) и транзитные (связи между документами (например, ссылки)).
Для математического описания механизма поиска удобно применять аппарат теории графов. Множество вершин графа моделирует терминальные объекты, множество ребер моделирует транзитные объекты. Математически граф определяется кортежем:
G = (A, Z),
где A = {й?1(а),...,an(a)} - конечное множество вершин, моделирующее
терминальные объекты; Z - конечное множество пар вершин, образующее множество ребер и моделирующее транзитивные объекты.
Пары, образующие множество Z, могут быть неупорядоченными множествами, т.е.
Z = { {a1(a), a1(a)},..., {ai(a), aj(a)}, -., {an(a), an(a)} } , а могут представлять собой кортежи, т.е.
Z = {(a1(a), a1(a)),..., (ai(a), aj(a)), - ., (an(a), an(a))} .
В первом случае ребра описывают связи между терминальными объектами с ненаправленным действием, например контекст поиска на другие объекты. В подавляющем числе случаев моделирования транзитивных связей между объектами являются направленными.
При практическом описании структуры системы граф может быть описан матрицей смежности, номера строк и столбцов которой совпадают с номерами вершин:
О
Х1(а),1(а) ••• Х1(а ),/(а) ••• Х1(а ),п(а)
Х у (а),1(а) ••• Х у (а),/(а) ••• Х у (а ),п(а)
Х У (а),/(а )
Хп(а),1(а) ••• Хп(а),/(а) ••• Хп(а ),п(а)
элементы матрицы принимают два значения:
1, если (ау(а), а/(а)) е ^,
О, если (ау(а),а/(а))£ ^•
Иерархия представлена следующими уровнями:
0 - уровень самой поисковой системы, на котором граф должен представлять собой математическое подобие структуры, состоящей из взаимодействующих;
1 - уровень поисковой системы, на котором графы должны представлять собой математическое подобие соответствующих структур, необходимых для поиска;
2, 3, 4 и т д^ - уровень взаимодействующих объектов, представляемый графами, описывающими внутренние взаимосвязи между объектами
Очевидно, что возможно и дальнейшее иерархическое деление, но в контексте задачи поиска такое деление не имеет смысла^
Графы-схемы, описывающие механизм поиска, будут иметь по сравнению с классическими схемами теории графов свою специфику, отражающую тот факт, что один и тот же объект может быть представлен в разных структурах^
Графы каждого уровня являются взвешенными Под весом дуги
п
г -х (п\ ■( -/ам понимается количественная оценка величины нахо-
У[z,У(О),У(n-1),•••,У(0)]
п
ждения параметра ^ у 2 у (О) у (п-1) у (0)], характеризующего связь в реальном объекте, математическим аналогом которой является рассматриваемая дуга^
В случае континуальной величины оценкой параметра может быть шюлюстъ распределения /”1Мо ),у („-!),•,у (0)](?п;[2, у (О ),,(„-1),-,,(0)])> для которой справедливы следующие ограничения:
, у (О),. у (п-1),-,, у (0)](^ п[ % , у (О), у (п-1),-, у (0)]) Ф
1у[ г у(ОX у(пу (0)](^ у[ ) (О), у («у (0)]) “
Ф 0, если £д
г,у (О),у (п-1), ,у (0)]
°, еачч £",, у (О), у (п-!),-, у (0)] С
с,
I 'л2, у (О), у (п-1),..,, у (0)](£ п[ г, у (О), у (п-1),..., у (0)]^ "[г, у (О), у (п-1),-, у (0)] = 1’
О
где с - область ненулевых значений плотности распределения
{п
•'Л 2,у (О),у (п -1),•••, у (0)Г
В случае дискретной величины плотность распределения
/у[ % у (О) у (п-1) у (0)] представляет собой сумму взвешенных ^-функций Дирака:
/п =
/у[2 ,у (О),у (n-1),•••,j(0)]
I
= XР,Л2,у(О),](п-1),„„у(0)]^(Сдгу(О), у(у-1),..,у(0)] - ^"яzj(О),у(п-1),..,у(0)])> /=1
где р/ у[ 2 у (О) у (п-1) у (0)] - вероятности появления значений
п
у[ 2 у (О) у (п-1) у (0)] измеряемой величины, для которых справедливо равенство
I
1 = х Р1, у[ 2, у (О), у(n-1),•••, у (0)],
/=1
8(£ п[2 , у (О), у ("-1),.,у (0)]1у[ гу (О),у (n-1),..•, у (0)]) - 5-фУнкция Дирака, для которой справедливы ограничения:
8(Х "[г, у (О), у(п-1),.., у (0)] - zn,j[z,j (О), у (п-1),.., у (0)]) =
¥ прмС "[г , у (О ), у (п-1),., у (0)] = у[ г, у (О), у (п-1),.., у(0)],
0 При£ Л 2, у (О), у (п-1),..,у (0)] Ф ^ у[ 2, у (О), у (п-1),..,у (0)]’
18(£ "[Г, у (О), у (п-1),..., у (0)]п Л 2 , у (О), у (п-1),-,./(0)]>ВД "[Г, у (О), у (п-1),..., у (0)] = 1
с
Область с параметра £"[ 2 у (О) у (п-1) у (0)] может быть разбита на
две непересекающиеся подобласти с = d и е такие, что d п е = 0. При этом подобласть d соответствует работоспособному состоянию связи, а подобласть е соответствует отказу. Таким образом, вероятность нарушения свя-
п
зи, определяемой параметром £ у[
'[2,у (О ),у (n-1),•••,j (0)]:
п
ру[ 2,у (О),у (п-1),-, у (0)]
1 /у[2,у(О\у(n-1), •••, у(0)](£у[2,у(О\у(n-1),• •,у(0)])й^у[2,у(О),у(n-1),• • •,у(0)]
d
Вероятность отсутствия нарушения связи
q%,i(G ),j (n-1),..., j (0)] =
_ 1 fj[ z,j (G),j (n^X..., j (0)](z Л z,j (G Xj (nЧ),.., j (0)])dz j[ Z ,j (G), j (H-1),...J(0)].
e
Очевидно, что если с = d u e и d n e = 0, то
n , n _ 1
pj[z,j(G),j(n-1),...,j(0)] + qj[z,j(G),j(n-1),...,j(0)] _1
В том случае, если важен факт связи, то параметр ZЛZ j(G) j(n-1) j(0)] может быть оценен следующим образом:
1, если связь имеет место,
0, если связь отсутствует.
При этом вес дуги может быть определен вероятностью наличия
или отсутствия связи, 0 £ p(Zn[z j(g) j(n-1) j(0)]) £ 1 что определяет нахождение объекта.
При решении задачи проектирования поисковых систем следует учитывать все многообразие факторов, воздействующих на информационную систему, а также прогнозировать нахождение объектов.
Список литературы
1. Барлоу Р., Прошан Ф. Статистическая теория надежности и испытания на безотказность. М.: Наука, 1984. 328 с.
2. Райншке К., Ушаков И. А. Оценка надежности систем с использованием графов. М.: Радио и связь, 1988. 209 с.
G. Nikitina
Search information systems with a hierarchical structure
The problems of graph-schemes that describe the search engines with a hierarchical structure representing a mathematical similarity are considered, The quantitative assessment of the value of finding a parameter characterizing the relationship in the real object is offered.
Key words: search engine, search engine, top graph, the distribution density of transitive relation, adjacency matrix.
Получено 28.12.10 г.
j[ z,j (G),j (n-1),...,j (0)]