Научная статья на тему 'Расчет времени поиска информации о местоположении подвижного абонента в базе данных'

Расчет времени поиска информации о местоположении подвижного абонента в базе данных Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
272
27
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ПОИСК ПОДВИЖНЫХ АБОНЕНТОВ / БАЗА ДАННЫХ О МЕСТОПОЛОЖЕНИИ / БЫСТРЫЙ ПОИСК / SEARCH OF MOBILE SUBSCRIBERS / LOCATION DATABASE / QUICK SEARCH

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Козинец Артур Валерьевич

В статье приведено решение задачи определение времени поиска информации о местоположении подвижного абонента. Выведены формулы для расчета среднего значения времени поиска информации о местоположении подвижного абонента в базе данных и среднеквадратического отклонения времени поиска информации о местоположении подвижного абонента в базе данных. Отмечено, что квадрат коэффициента вариации времени поиска записи в базе данных не зависит от числа записей в базе данных.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

The mobile subscriber location information in the database search time calculation

The article presents the solution of the problem of determining the time of the search the location information of the movable subscriber. The formulas for calculating the average values of search time location information of the movable subscriber in the database and standard deviation of search time location information of the movable subscriber in the database. It is noted that the square of the coefficient of variation of the time search record in the database depends on the number of records in the database.

Текст научной работы на тему «Расчет времени поиска информации о местоположении подвижного абонента в базе данных»

[email protected]

Электронный научный журнал «Век качества» ISSN 2500-1841 http: //www .agequal.ru 2015, № 3 http://www.agequal.ru/pdf/2015/AGE QUALITY 3 2015.pdf Ссылка для цитирования этой статьи:

Козинец А.В. Расчет времени поиска информации о местоположении подвижного абонента в базе данных // Электронный научный журнал «Век качества». 2015. №3. С. 85-100. Режим доступа: http://www.agequal.ru/pdf/2015/315007.pdf (доступ свободный). Загл. с экрана. Яз. рус., англ.

УДК 004 + 654

Расчет времени поиска информации о местоположении подвижного

абонента в базе данных.

Козинец Артур Валерьевич

заведующий лабораториями кафедры информационных систем Московский технический университет связи и информатики 125993, Москва, ул. Народного Ополчения, 32, каб.407

ко2\не1н @т1и. €¡2. ги

Аннотация. В статье приведено решение задачи определение времени поиска информации о местоположении подвижного абонента. Выведены формулы для расчета среднего значения времени поиска информации о местоположении подвижного абонента в базе данных и среднеквадратического отклонения времени поиска информации о местоположении подвижного абонента в базе данных. Отмечено, что квадрат коэффициента вариации времени поиска записи в базе данных не зависит от числа записей в базе данных.

Ключевые слова: поиск подвижных абонентов; база данных о местоположении; быстрый поиск.

Одним из элементов системы поиска подвижных абонентов является база данных о местоположении абонентов [1, 2, 3, 4]. В данной статье будет определено распределение плотности вероятности времени поиска записи в базе данных. Распределение плотности вероятности времени обслуживания в данном обслуживающем устройстве, и его зависимость от размера базы данных.

[email protected]

Время поиска необходимой информации о подвижном абоненте в базе данных о местоположении абонентов зависит от размера базы данных, способа ее организации, метода поиска и времени доступа к элементу базы данных. Размер базы данных определяется числом абонентов в системе, количеством и структурой зон обслуживания в системе и распределением абонентов по зонам. Эти параметры являются исходными данными при проектировании системы. Время доступа к элементу базы данных определяется быстродействием запоминающего устройства. Изменение этого параметра однозначно связано с изменением стоимости запоминающего устройства и, как следствие, стоимости системы в целом. Два других параметра в значительной степени влияют на время поиска, поэтому выбор оптимальных методов хранения и поиска данных на стадии проектирования системы может значительно улучшить временные характеристики при незначительном изменении стоимостных характеристик.

Рассмотрим возможные варианты методов построения базы данных о местоположении подвижных абонентов и методов поиска записей в базе данных. Процедура поиска записи, соответствующей вызываемому абоненту, зависит от способа хранения данных. Рассмотрим возможные варианты методов хранения и поиска данных.

При организации базы данных о местоположении подвижных абонентов в виде несортированного массива возможен только один метод поиска -последовательный перебор элементов массива [5]. Максимальное время поиска соответствует времени перебора всех элементов массива и определяется формулой [6]:

T = t* N, где

max 1 ' ^

тах 1

(1)

^ах - максимальное время поиска абонента, ^ - время доступа к одной записи базы данных, N число записей в базе данных.

В случае построения базы данных о местоположении подвижных абонентов в виде сортированного массива, кроме метода последовательного перебора, время поиска по которому определено выше, возможен так называемый метод быстрого поиска [5]. Суть данного метода сводится к рекуррентному делению исходного сортируемого массива на два равных по количеству элементов массива (с точностью до одного элемента). На следующем шаге поиск производится в том подмассиве, к которому может принадлежать искомый элемент. Максимальное время нахождения необходимого элемента массива для данного метода поиска определяется по следующей формуле [6]:

Тах = ¿1 * ^2 ( N 1) . (2)

Альтернативой организации базы данных в виде массива являются списочные структуры [5, 7]. В простейшем случае это линейный список. При использовании этого метода для построения базы данных о местоположении подвижных абонентов возможен только метод последовательного перебора всех элементов. Максимальное время поиска необходимой записи для данного метода поиска определено выше, его можно найти по формуле [6]:

Тах = ¿1* N. (3)

Совпадение формул для расчета максимального времени поиска записи в базе данных при ее построении в виде несортированного массива (формула 1) и в виде линейного списка (формула 3) объясняется тем, что используется последовательный перебор всех элементов, так как при этих методах построения базы данных отсутствует какая-либо информация о взаимном расположении записей.

Сбалансированное двоичное дерево является разновидностью списочных структур. Длинна всех ветвей сбалансированного двоичного дерева одинакова [7], а число элементов определяется формулой:

[email protected]

N= 2L -1, где

(4)

N число элементов; ь- длинна ветви. Максимальное время поиска необходимого элемента зависит от длины ветви дерева, следовательно его можно найти по формуле:

Совпадение формул для расчета максимального времени поиска записи в базе данных при ее построении в виде сортированного массива (формула 2) и в виде сбалансированного двоичного дерева (формула 5) объясняется тем, что используются варианты быстрого метода поиска, различия в которых вызваны особенностями организации базы данных (массив или список). Отличие в максимальном времени поиска для быстрого метода поиска от последовательного перебора вызвана использованием в быстром методе поиска информации о взаимном расположении записей, что приводит уменьшению максимального времени поиска.

Необходимо особо подчеркнуть, что формула 5 определяет максимальное время поиска элемента в сбалансированном двоичном дереве, число элементов которого определяется формулой 4. Если же реальное число элементов в базе данных о местоположении подвижных абонентов не удовлетворяет условию из формулы 4, то мы сможем получить только квазисбалансированное двоичное дерево, у которого разница между максимальной и минимальной длиной ветви не превышает единицы. Максимальное время поиска необходимой записи в этом случае равно максимальному времени поиска в сбалансированном двоичном дереве, определяемом по формуле 5.

Результаты, полученные в ходе рассмотрения возможных вариантов построения базы данных и методов поиска информации о местоположении подвижных абонентов сведены в таблицу 1.

Анализ возможных вариантов методов построения базы данных и методов поиска позволяет сделать вывод о том, что минимальное значение

Tmax = t * l0g2 ( N+ 1) .

(5)

максимального времени поиска информации о местоположении подвижного абонента обеспечивается двумя вариантами:

- при построении базы данных в виде сортированного массива и использовании быстрого метода поиска;

- при построении базы данных в виде квазисбалансированного двоичного дерева.

Таблица 1.

Методы организации базы и поиска данных. Максимальное время поиска.

Несортированный массив. Tax = t *N

Сортированный массив, быстрый поиск. Tax = t * l0g2 ( N+ 1)

Линейный список. Tax = ti * N

Квазисбалансированное двоичное дерево. Tax = t * l0g2 ( N+ 1)

Методы организации базы данных в виде несортированного массива и линейного списка не позволяют получить минимальное значение максимального времени поиска записи, поэтому из дальнейшего рассмотрения следует исключить эти методы построения базы данных, а всю внимание сконцентрировать на двух оставшихся: сортированный массив с быстрым методом поиска и квазисбалансированное двоичное дерево.

При выборе метода построения базы данных о местоположении подвижного абонента следует учесть, что кроме времени поиска абонента второй важной характеристикой является время обновления базы данных. Это вызвано тем, что абонент, являясь мобильным, может изменять свое местоположение (перемещаться из одной зоны обслуживания в другую). Изменение

местоположения подвижного абонента должно сопровождаться адекватным изменением содержания базы данных.

В случае перемещения любого подвижного абонента из одной зоны обслуживания (¡-1)-го уровня в другую в пределах ¡-й зоны, либо в случае если абонент, зарегистрированный в данной зоне, покидает ее в базе данных этой зоны необходимо изменить уже существующую запись. В этом случае время обновления в основном определяется временем поиска той записи, которую необходимо изменить. У обоих вариантов это время одинаково.

В случае если абонент, зарегистрированный в другой зоне ¡ -го уровня перемещается в данную зону, то к базе данных о местоположении подвижных абонентов необходимо добавить новую запись. Однако в случае построения базы данных в виде сортированного массива необходимо отсортировать полученный массив, что требует определенного времени, которое растет в квадратической зависимости от числа записей в базе данных [8], в отличие от этого, время балансировки двоичного дерева после добавления нового элемента пропорционально произведению числа записей на логарифм двоичный от числа записей [6].

Таким образом, минимальное время поиска информации о местоположении подвижного абонента при одновременном обеспечении минимального времени обновления базы данных обеспечивает метод организации базы данных в виде квазисбалансированного двоичного дерева. Отсюда можно сделать следующий вывод: базу данных о местоположении подвижных абонентов целесообразно строить в виде квазисбалансированного двоичного дерева.

Определим распределение плотности вероятности времени поиска информации о местоположении подвижного абонента при построении базы данных в виде квазисбалансированного двоичного дерева.

Вероятность того, что на к-м шаге мы найдем искомую запись при условии что на (к-1)-м шаге мы ее не нашли равна:

wk) = pk\qk-1 =

(L-(k-1))

где

(6)

#к-1 = 1 - рк-1; к- номер шага; ь- длинна ветви. Семейство условных функций распределения плотности вероятности времени поиска записи в базе данных о местоположении подвижных абонентов при различном числе абонентов представлено на Рис. 1 .

w(k)

0,7

0,6

0,5

0,4

0,3

0,2

0,1

-Число записей N=1024 -х-N=32768

■N=1048576

0 S

k

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23

Рис. 1. Семейство условных функций распределения плотности вероятности времени поиска записи в базе данных о местоположении подвижных абонентов при различном числе записей в базе данных.

Разработано автором.

Проводя анализ семейства функций распределения, представленных на Рис. 1, можно сделать следующий важное вывод: при изменении числа записей в базе данных о местоположении подвижных абонентов изменение условной функции распределения плотности вероятности времени поиска записи заключается в смещении вдоль оси времени, при этом форма функции распределения в области больших значений числа записей (более 1000), а это условие выполняется для большинства действительных ситуаций, остается практически неизменной.

Таким образом, можно предположить, что при увеличении числа записей в базе данных о местоположении подвижных абонентов, начиная с некоторого значения, условная дисперсия времени поиска необходимой записи перестает зависеть от общего числа записей в базе данных и ее можно считать постоянной.

Для подтверждения этого предположения была рассчитана условная дисперсия времени поиска по условным функциям распределения плотности вероятности времени поиска необходимой записи в базе данных при различных значениях числа записей и получена зависимость условной дисперсии времени поиска необходимой записи от общего числа записей в базе данных. Результаты расчета сведены в таблицу 2.

Таблица 2.

Число записей M/t Маппр/ t Ошибка D/t2 Dannp./ tt Ошибка

16 3,267 3 8,16% 0,862 2 131,96%

32 4,161 4 3,88% 1,168 2 71,30%

64 5,095 5 1,87% 1,420 2 40,89%

128 6,055 6 0,91% 1,611 2 24,14%

256 7,031 7 0,45% 1,748 2 14,41%

512 8,018 8 0,22% 1,841 2 8,63%

1024 9,010 9 0,11% 1,902 2 5,14%

2048 10,005 10 0,05% 1,941 2 3,05%

4096 11,003 11 0,03% 1,965 2 1,79%

8192 12,002 12 0,01% 1,979 2 1,04%

16384 13,001 13 0,01% 1,988 2 0,60%

32768 14,000 14 0,00% 1,993 2 0,34%

65536 15,000 15 0,00% 1,996 2 0,20%

131072 16,000 16 0,00% 1,998 2 0,11%

262144 17,000 17 0,00% 1,999 2 0,06%

524288 18,000 18 0,00% 1,999 2 0,03%

1048576 19,000 19 0,00% 2,000 2 0,02%

2097152 20,000 20 0,00% 2,000 2 0,01%

Кроме зависимости условной дисперсии от общего числа записей в базе данных, в таблице 2. также представлены результаты расчета условного математического ожидания времени поиска записи при различном числе записей в базе данных.

В результате анализа зависимости условной дисперсии времени поиска записи в базе данных от числа записей, представленной в таблице 2, можно сделать следующий вывод: условная дисперсия времени поиска необходимой записи от общего числа записей в базе данных при больших значениях числа записей (больше 1000) может быть аппроксимирована постоянной величиной с точностью, достаточной для практических задач:

П[п] = 2 , где (7)

^ - время доступа к одной записи базы данных.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Результаты расчета аппроксимирующей функции и относительной ошибки аппроксимации сведены в таблицу 2. В частности, при числе записей равном 1000 ошибка составит чуть больше 5%, а при 10000 - менее 1%. Графики зависимости условной дисперсии времени поиска необходимой записи от общего числа записей в базе данных и аппроксимирующей функции представлены на Рис. 2.

Анализ зависимости условного математического ожидания времени поиска записи от общего числа записей в базе данных, представленной в таблице

2, позволяет сделать следующий вывод: условное математическое ожидание времени поиска необходимой записи при больших значениях числа записей (больше 100) может быть с достаточной для практических задач точностью определено по следующей формуле:

М[п] = к (1св2 И-1). (8)

Результаты расчета аппроксимирующей функции и относительной ошибки аппроксимации сведены в таблицу 2. При использовании такой аппроксимации уже при числе записей равном 100 ошибка составит менее 1%.

D/ti

2,500 2,400 2,300 2,200 2,100 2,000 1,900 1,800 1,700 1,600 1,500 1,400 1,300 1,200 1,100 1,000 0,900 0,800 0,700 0,600 0,500 0,400 0,300 0,200 0,100 0,000

ю

00

—ь. W сп —ь. Ю СЛ —ь. ю 00 —ь. W СП —ь. ю СЛ —ь.

СП ю СЛ —i. 0 о о —i. ю СЛ СП ю 0

00 (35 ю ю CD CD W СЛ —i. 1

00 (35 Ю 00 СП 00 W СП о ю 4 4 ю 00 00 00 СЛ СП

N

Рис. 2. Зависимость условной дисперсии времени поиска записи от общего числа записей в базе данных о местоположении подвижных абонентов. Разработано автором.

Графики зависимости условного математического ожидания времени поиска записи от общего числа записей в базе данных и аппроксимирующей функции представлены на Рис. 3.

Теперь определим безусловную функцию распределения плотности вероятности времени поиска необходимой записи в базе данных о местоположении подвижного абонента, а также безусловные математическое ожидание, дисперсию и квадрат коэффициента вариации времени поиска.

МНг 20,000

18,000

16,000

14,000

12,000

10,000

8,000

6,000

4,000

2,000

0,000

M - - - M аппр.

/V / /У

* 1 У * *

ю

оэго-^госл—^ооо—^

ООСОЮЮ-^СОСОСО^СЛ

со со со со со W со со

—^ ОЭ ОЭ —^ ГО СГ1 —^

со ю ел w со ю о

м ^ ^

о ^ со со

^ й (Л

со со -ч СП

N

Рис. 3. Зависимость математического ожидания времени поиска записи от общего числа записей в базе данных о местоположении подвижных

абонентов. Разработано автором.

Вероятность #к-1 того, что на (£-1)-м и предыдущих шагах мы не нашли искомую запись равна:

где (9)

к- номер шага, Ь- длинна ветви.

Безусловная вероятность рк того, что на к-м шаге мы найдем искомую запись равна:

Рк = Щ * Як-1 = (рк\Як-1 )* Як-1 = (Ь-(1к-1)) * Ь-Ь-1)) = Уг (10)

Подставив в формулу (10) значение длинны ветви Ь из формулы (4) получим следующий результат:

р=¡дат где (11)

И- число записей в базе данных.

Длительность одного шага поиска равна времени доступа к одной записи базы данных. Переходя от дискретного времени, измеряемого числом шагов, к непрерывному, получаем функцию распределения плотности вероятности

времени поиска необходимой записи в базе данных о местоположении подвижного абонента имеет вид:

pt) =

1 , 0 < t< t * log2 (N+1)

t * log2 (N+1)

1 , где (12)

0 , 0 > t> t * log2 (N+1)

г1 - время доступа к одной записи базы данных, Ы- число записей в базе данных. Математическое ожидание времени поиска необходимой записи в базе данных или среднее время поиска информации о местоположении подвижного абонента равно:

г И0Ё2ГЫ+1) ** г* 1СВ2 (Ы+1)

ср { г * 10Ё2 (Ы+1) 2 • у }

Дисперсия времени поиска необходимой записи в базе данных равна:

J =

^¡i N+Y t* log2 (N + 1)>|2 dt (t* log2 (N+1))2 (14)

J0 l 2 I t * log2 (N +1) 12 • ( )

Среднеквадратическое отклонение времени поиска необходимой записи в базе данных равно:

= ^ = г * 10Ё2 Ы+1). (15)

п * п 2л/3

Таким образом, среднеквадратическое отклонение времени поиска записи в базе данных в 73 раз меньше среднего значения. Следовательно, квадрат коэффициента вариации времени поиска необходимой записи в базе данных не зависит от числа записей в базе данных и равен:

^ =^2/ _(t * log2 (N+1))2 /f t * log2 (N+1f2

t2 ~ 12

I = (16)

В итоге мы определили среднее время поиска информации о местоположении подвижного абонента в базе данных (формула 13) и среднеквадратическое отклонение (формула 15).

Литература.

1. 3GPP TS 23.003 «Numbering, addressing and identification (Release 14) (version 14.1.0)». Valbonne, 2016.

2. CCITT. (Blue Book) Recommendation Series Q.1000. «Mobile Subscriber Search Order». Geneva, 1988.

3. Бонч-Бруевич А.М., Козинец А.В Выбор метода организации базы данных о местоположении подвижных абонентов», Деп. науч. раб. в ЦНТИ "Информсвязь", 1998г.

4. Пикчур Б.Д. «Логическая структура баз данных интеллектуальной сети», доклад на научно-практической конференции профессорско-преподавательского состава / М.: МТУСИ, 1997г.

5. Мартин Дж. Организация баз данных в вычислительных системах. / М.: Мир, 1980.

6. Кнут Д.; Искусство программирования. Т. 1: Основные алгоритмы. — 3-е изд. / М.: Вильямс, 2006. — 682 с.

7. Гарсиа-Молина Гектор, Ульман Дж., Уидом Дж. Системы баз данных. Полный курс / М.: Издательский дом "Вильямс", 2003. — 1088 с.

8. Кнут Д.; Искусство программирования. Т. 3: Сортировка и поиск. — 3-е изд. / М.: Вильямс, 2006. — 682 с.

9. Воронцов Ю.А. О влиянии формы распределения вероятностей на показатели производительности систем и сетей массового обслуживания. / Тезисы докладов XVII-й Международной школы-семинара по вычислительным сетям. - М.: ВИНИТИ, 1992. - с. 140-144.

10.Будущее сети мобильной связи 5G // Век качества. 2015. №2. С. 22-25

[email protected]

The mobile subscriber location information in the database search time

calculation

Kozinets Arthur Valerievich

Head of laboratories of the Department of information systems Moscow Technical University of Communications and Informatics #32, Narodnogo Opolcheniya street, Moscow, 123993, Russain Federation

kozinets@mtuci2. ru

Abstract. The article presents the solution of the problem of determining the time of the search the location information of the movable subscriber. The formulas for calculating the average values of search time location information of the movable subscriber in the database and standard deviation of search time location information of the movable subscriber in the database. It is noted that the square of the coefficient of variation of the time search record in the database depends on the number of records in the database.

Key words: search of mobile subscribers; location database; quick search.

1. 3GPP TS 23.003 «Numbering, addressing and identification (Release 14) (version 14.1.0)». Valbonne, 2016.

2. CCITT. (Blue Book) Recommendation Series Q.1000. «Mobile Subscriber Search Order». Geneva, 1988.

3. Bonch-Bruevich A.M., Kozinets A.V Vybor metoda organizatsii bazy dannykh o mestopolozhenii podvizhnykh abonentov», Dep. nauch. rab. v TsNTI "Informsvyaz'", 1998g.

4. Pikchur B.D. «Logicheskaya struktura baz dannykh intellektual'noy seti», doklad na nauchno-prakticheskoy konferentsii professorsko-prepodavatel'skogo sostava / M.: MTUSI, 1997g.

REFERENCES

5. Martin Dzh. Organizatsiya baz dannykh v vychislitel'nykh sistemakh. / M.: Mir, 1980.

6. Knut D.; Iskusstvo programmirovaniya. T. 1: Osnovnye algoritmy. — 3-e izd. / M.: Vil'yams, 2006. — 682 s.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

7. Garsia-Molina Gektor, Ul'man Dzh., Uidom Dzh. Sistemy baz dannykh. Polnyy kurs / M.: Izdatel'skiy dom "Vil'yams", 2003. — 1088 s.

8. Knut D.; Iskusstvo programmirovaniya. T. 3: Sortirovka i poisk. — 3-e izd. / M.: Vil'yams, 2006. — 682 s.

9. Vorontsov Yu.A. O vliyanii formy raspredeleniya veroyatnostey na pokazateli proizvoditel'nosti sistem i setey massovogo obsluzhivaniya. / Tezisy dokladov XVII-y Mezhdunarodnoy shkoly-seminara po vychislitel'nym setyam. - M.: VINITI, 1992. - s. 140-144.

10.Budushchee seti mobil'noy svyazi 5G // Vek kachestva. 2015. №2. S. 22-25

i Надоели баннеры? Вы всегда можете отключить рекламу.