2006
НАУЧНЫЙ ВЕСТНИК МГТУ ГА серия Прикладная математика. Информатика
№ 105
УДК 629.735.015:681.3
ОЦЕНКИ ВЕРОЯТНОСТЕЙ ПОТЕРЬ ЗАЯВОК В АВИАЦИОННЫХ СИСТЕМАХ С УЧЕТОМ СВЯЗНОСТИ ВЫЧИСЛИТЕЛЬНЫХ ЗАДАЧ
С.И. БАБАЕВА, Л.Е. РУДЕЛЬСОН
Исследована модель совместной обработки заявок на вычислительные работы в автоматизированной системе управления воздушным движением с учетом их корреляции по управлению и данным. Получены оценки для вероятностей потерь заявок, и для конкретных соотношений параметров обслуживания выделены области их изменения, в которых применение компьютерной сети становится предпочтительнее, чем одной вычислительной машины эквивалентной производительности.
1. Введение
Организация совместной работы компьютеров приводит к потерям производительности на сетевое взаимодействие, которые можно оценить статистически, используя последовательности значений корреляции выполняемых программных функций по общим данным и отношениям предшествования. Параметр Qi введен в [1] для учета связей по управлению и данным и назван корреляцией между записями. Понятие определяется как некоторая вероятность Qi (г = 1,.. .,и) обслуживания очередной записи г-м свободным компьютером при условии, что любые (г - 1) других компьютеров системы заняты. Это интегральная характеристика состояния, указывающая, с какой вероятностью смогут, начиная с текущего момента, быть занятыми г компьютеров системы, причем в силу стационарности входного потока этот момент инвариантен относительно сдвига по оси времени. Для наглядности используем следующую аналогию. Комплекс программ (КП) обработки радиолокационной информации (РЛИ) автоматизированной системы (АС) УВД периодически, с темпом обзора антенны радиолокационной станции (РЛС), решает следующие задачи обработки РЛИ:
• сбор и обработка сообщений первичной и вторичной радиолокации;
• вычислительные процессы обнаружения, захвата, сопровождения ВС;
• организация фазы ассоциации, фильтрации и экстраполяции траекторий;
• первичная, вторичная и третичная обработка РЛИ;
• обработка данных радиопеленгаторов;
• радиолокационное сопровождение в сложной информационной обстановке (пропуски целей, ложные отметки, помехи, маневрирующие объекты);
• анализ качества прокладки траекторий.
На каждом обзоре должен выполняться весь список задач, однако они связаны отношениями предшествования. Фаза экстраполяции не может начаться раньше фильтрации и ассоциации, которые, в свою очередь, должны дождаться результатов обработки координатных измерений, выполняемых после окончания сбора сообщений. Помимо функциональных связей данные коррелированны между собой вследствие их общего использования взаимодействующими КП обработки планов полетов, докладов подсистемы автоматического зависимого наблюдения, функций ввода диспетчерского персонала. Другими словами, обязательные для исполнения процессы не могут начаться на свободном (незанятом) компьютере сети до тех пор, пока не создадутся необходимые условия. Количественно такие потери номинальной производительности сети учитываются показателем Qi.
В [2] получены количественные оценки объема г компьютерной памяти, необходимой для устойчивой работы вычислительной системы, использующей ИО:
) г (=
> - 1п
1п р
■I а,
г =1
где символ ) (, охватывающий в левой части обозначение объема г необходимой памяти, означает ближайшее большее неотрицательное целое, а все обозначения в правой части соответствуют параметрам системы:
Р - допустимая вероятность переполнения ИО, определяемая замыслом системы; р = 1//1 - загрузка системы, равная отношению интенсивности 1 потока записей (сообщений) о ВС и об изменении состояния элементов структуры воздушного пространства (ВП) к параметру ц их обслуживания;
п - количество компьютеров вычислительной сети центра УВД.
В данной статье исследуются области изменения перечисленных параметров модели, в которых применение компьютерной сети становится предпочтительнее, чем одной вычислительной машины эквивалентной производительности.
2. Модель без учета корреляции заявок
Для исследования тенденции изменения объема файла, необходимого для сопровождения г записей, в зависимости от количества п компьютеров сети введем функцию вп относительного выигрыша, доставляемого обслуживанием заявок на п-канальной системе в сравнении с одноканальной. На первом шаге рассмотрения ограничимся п = 2. При этом вероятность потери записи вследствие недостаточного объема г файла для одного канала (п =1) составляет [3]:
или Ь2 =
1 -р
= Р
г+3 1 02 •
рг+1 (1 - р) 2рг+2 (1 -р) а Р
Р = ——п , а для п = 2: р = . Тогда Д, = —
1 1 -рг+2 2 1 + р- 2р 2 р 1 + р- 2рг
где Р02 есть вероятность простоя двухканальной системы; вообще, относительный выигрыш
совпадает по значению с вероятностью простоя: рп = Р0п.
В предельном случае при г ^ го (неограниченный объем файла) функция относительно выигрыша не зависит от числа каналов системы: вг^® = (1 - р) / (1 + р). Другими словами, для правильно рассчитанной по загрузке (А < ^, р < 1) системы безразлично число обслуживающих аппаратов, так как все записи находят место в файле. При р ^ 1 выигрыш вг^л отсутствует вообще. Со снижением загрузки наблюдается прирост значения вп, достигающий максимума при р ^ 0, однако он носит чисто символический характер, объясняемый упрощениями анализируемой модели. Фактически утверждается, что с ростом п больше заявок одновременно обслуживаются в системе, т. е. больше записей разнесены по локальным базам данных (БД) сети и меньший (относительно одноканальной системы) объем файла с общим доступом занят очередью на удаление.
Графики зависимостей р2 = Хр) для некоторых значений г представлены на рис. 1. Недостатки модели проявляются здесь наиболее наглядно. Для вычислительной сети с распределенной БД, не имеющей файла с общим доступом, в противоположном предельном случае при г = 0 даже в условиях полной загрузки выигрыш составляет двадцать процентов (в2 = 2). Дальнейшее наращивание количества п каналов еще выше поднимает минимум рп для вычислительной сети без общего файла доступа. Однако использование даже небольшого общего файла (г = 5) резко снижает символический эффект вычислительной сети относительно одного канала, а при г >= 10 преимущества параллельной обработки по рассматриваемому критерию практически исчерпываются.
Рис. 1. График зависимости относительного выигрыша в от загрузки системы р:
Условные обозначения: г = 0; г = 5;
------- г = 10; ...... г ^ да
Анализ семейства кривых в2 = Лр) позволяет обойти недостатки упрощенной модели. Увеличение количества п каналов системы интерпретируется в ней как тривиальное приращение числа мест для ожидания. Считается, что записи распространяются по локальным файлам распределенной БД вычислительной сети, и доступ к информации соседа возможен лишь как запрос данных, реализуемый через отдельную заявку. Для формализации модели файла с общим доступом достаточно стабилизировать в ней общее число п + г мест в системе. Тогда увеличение п будет компенсироваться равным ему сокращением объема г файла. В результате отношение ап+Г вероятности Рг(п потери записи в п - канальной системе с объемом г файла общего доступа к вероятности Р+п-/1 потери заявки в эквивалентной по пропускной способности и количеству размещаемых записей одноканальной системе составит:
пП-1
n Пп+Г (1 Пп+Г+1 ^
п) U^\\p V-р )
Я, (П -1)!
a =
^ 1Л_I
п+r Я1') п nk-1 (п - k) пп-1
pn+r-1 Vі п \п К) pk - п r+r+1
k=0 k! (n — 1)!
где (an+r есть аналог при фиксированном значении суммы n + r).
Нетрудно видеть, что во всем диапазоне изменения загрузки системы 0 <= р <= 1 при любых n > 1 отношение an+r > 1 и возрастает с увеличением n (n + r = Const). Это значит, что потери записей в системе, содержащей n каналов и общий буферный накопитель (БН) объемом на r заявок, выше чем в одноканальной системе с БН длиной r + n + 1. В поставленной задаче величина Р задается априорно в качестве ограничительного параметра. Следовательно, для удовлетворения условий допустимого уровня потери записей объем файла общего доступа в многоканальной системе необходимо резервировать более вместительным, чем в одноканальной системе. Широко известна и обратная задача: при заданных значениях интенсивности входного потока X, параметра обслуживания ^, количества приборов n и мест ожидания r определить вероятность Р потери заявки, также решенная полученными формулами.
3. Модель с учетом корреляции
Для сопоставления многоканальных систем при различных Qi необходимо нормировать их
п
суммарным значением: ^ Qi. На первом шаге рассмотрения ограничимся сравнением СМО с
;=1
11 Отметки поступления заявок
1111 I 1111 II I____________________________Bez1
Рис. 2. Типовые ситуации нерегулярности потока
одним и двумя приборами (компьютерами), в дальнейшем это ограничение будет снято. Напомним, что нерегулярность входного потока проявляется в наличии периодов спада и возрастания текущих значений частоты поступления заявок (рис. 2). График, изображенный на рис. 3, дает представление о соотношении соответствующих величин вероятностей P потери заявки для предельного случая r = 0 отсутствия файла общего доступа, т.е. при распределенной базе БД сети. В гипотетической ситуации, соответствующей области малых загрузок (р <= 0.3), в которой БД вычислительных систем обычно не эксплуатируются, использование двух каналов дает выигрыш даже при полном запрете приема на обслуживание заявки вторым прибором, если работает первый (Q2 = 0). Сказывается малая занятость системы в среднем. Вследствие нерегулярности входного потока типична следующая ситуация. «Сгущения» моментов поступлений расположены на оси времени таким образом, что использование второго канала в качестве БН полезнее для системы, пусть даже и вдвое менее производительной, чем один быстродействующий канал, не успевающий «захватить» (вследствие отсутствия буфера) очередную заявку и простаивающий затем в периоды относительного «разрежения» входного потока. С увеличением загрузки при Q2 = 0 потери в двухканальной системе резко возрастают и при р ^ 1 достигают максимума, значительно превосходя соответствующий показатель для одноканальной системы. Вероятность потери записи для случая Q2 = 1 всегда ниже, чем при использовании одного прибора. Напомним, что функция относительного выигрыша в2 даже при р ^ 1 достигает величины 0,2. Кривая, соединяющая наивысшие значения Рс для предельных случаев Q2 = 0 и Q2 = 1, есть годограф функции Рс = f (Q2) при стремлении значения загрузки системы р к единице р ^ 1.
Совместное решение уравнений кривых Р и Рс позволяет получить набор критических значений Q2, при которых использование двух каналов становится эффективнее, чем одного. При отсутствии в системе файла общего доступа (г = 0) и полной загрузки (р ^ 1) таким значением является QKp = 0,74. С уменьшением загруженности системы связанность записей, при которой два прибора все еще предпочтительнее, может достигать более высоких значений, например, при р = 0,9 показатель Q2 = 0,66. Преимущества «многоканальности» весьма условны, так как введение даже небольшого по объему БН, выступающего в модели в качестве изменчивого файла общего доступа, без которого БД становится менее эффективной, сводит их к минимуму, что наглядно демонстрирует график, представленный на рис. 3.
Для системы, насчитывающей r = 10 мест для ожидания и выполняющей свои функции при загрузке р ^ 1, критическое значение корреляции между записями, при котором двухканальная система предпочтительнее, становится равным QKp = 0,98.
Рис. 3. Сравнительные оценки для вероятностей потерь заявок в системах с одним и с двумя каналами при отсутствии буферного накопителя (г = 0)
0 0,2 0,4 0,6 0,8 1 1,2 1,4 1,6 1,8 (1+02)-р
Рис. 4. Сравнительные оценки для вероятностей потерь заявок в системах с одним и с двумя каналами при объеме буферного накопителя г = 10
Последнее не означает, что вычислительная сеть всегда менее эффективна, чем один компьютер эквивалентной производительности. Во-первых, сопоставительный анализ осуществляется по критерию вероятности потери записи, легко управляемому варьированием объема файла [4]. По многим другим, в том числе по трудно управляемым показателям, таким как надежность, стоимость, гибкость и пропускная способность интерфейса с периферийными устройствами, одноканальный комплекс может оказаться неприемлемым. В этом случае даже при необходимости расширять область данных предпочтение разработчика будет отдано вычислительной сети. Во-вторых, как показывают результаты статистического анализа алгоритмов управления и обработки информации, процент столкновения запросов программ в файлах общего дос-
тупа невелик.
Для получения сравнительных оценок эффективности в системах различной конфигурации с учетом корреляции между записями рассмотрим отношение ас вероятности Рс потери заявки в многоканальной системе к вероятности Р потери заявки в системе с одним каналом. Оно вводится аналогично показателю ап+г относительного выигрыша, исследованному выше в модели обслуживания без учета корреляции заявок, и наследует характер соотношения параметров. Отметим, что при анализе связности заявок по данным или по управлению аналогом п при зна-
п к
чащих Qi служит Т Qi = 1 + Q2 +... + Qn , аналогом к - Т Qi , аналогом значения к! -
П Т Qi , а загрузка системы при занятости каналов р
1=1 і=1
мТ ^
і=1
л
п-1
а
р
с
р
Т а
V і=1 У
п-1 I
П 2^
I=1 і=1
■ р
-1 ■(! -рг+п+1)
Т
к=0
' п \
Т Qг
ч І =1 У
к -1
п-1
к I
р
I =1 І =1
^ п \
Т Qi
V І=1 У
п-1 I
П ТQ,
I =1 І =1
Лп-1 (л ЛГ+п+1
Р (1 -Р
В зависимости от значений вероятностей ^¡}, количества п каналов СМО, загрузки р и объема г БН отношение ас пробегает всю правую полуось, начиная от единицы.
2=1
2=1
4. Заключение
Организация совместной работы компьютеров в АС УВД приводит к потерям производительности на взаимодействие [5], которые можно оценить статистически, используя последовательности значений ^¡} корреляции выполняемых программных функций по общим данным и отношениям предшествования. Финальные вероятности переходов процесса по разветвляющимся дугам исходного графа могут с достаточной статистической достоверностью определяться априорно, исходя из заданных характеристик проекта. В такой постановке задача расчета последовательности вероятностей Qi становится методически столь же реальной, как вычисление значений 1 и ¡1- Эти величины характеризуются известным распределением моментов наступления событий, интенсивностью их потоков, подтвержденными опытом эксплуатации. Исследованные в статье модели образования и удаления записей в БД вычислительных систем позволяют наметить оценки эффективности, основанные на вероятностях потери заявок на обслуживание. Полученные результаты помогают понять физическую природу образования очередей. Однако в силу ряда упрощений, без которых трудно было бы дать направление анализа, их можно рекомендовать лишь для ориентировочных расчетов объемов изменчивых файлов записей. Для более полного учета факторов, влияющих на вычислительный процесс, необходимо рассмотреть модели с неоднородным входным потоком записей [6].
ЛИТЕРАТУРА
1. Гальков М.А., Рудельсон Л.Е., Тверитнев М.М. Имитационная модель использования воздушного пространства // Известия Академии Наук, Теория и системы управления, № 4, 2003.
2. Бабаева С.И. Оценка объема памяти, необходимого для информационного образа полетной информации // Научный Вестник МГТУ ГА, серия Информатика. Прикладная математика, № 92, 2004.
3. Вентцель Е.С., Овчаров Л.А. Прикладные задачи теории вероятностей. - М.: Радио и связь, 1983.
4. Саати Т.Л. Теория массового обслуживания и ее применение. - М.: Наука, 1984.
5. Анодина Т. Г., Кузнецов А.А., Маркович Е.Д. Автоматизация управления воздушным движением. - М.: Транспорт, 1992.
6. Бочаров П. П., Печинкин А.В. Теория массового обслуживания: Учебник. - М.: Изд-во РУДН, 1995.
THE EVALUATION OF CORRELATION AMONG COMPUTATIONAL TASKS OF AVIATION
SYSTEMS
Babaeva S.I., Rudel’son L.Ye.
The article puts forward a principle to calculate data and management correlation probabilities among computational algorithms of various traffic control centers, to evaluate the indicators of capacity, readiness, reliability and systemic integrity. Commonly used schemes are based on the toolkit of the set and graph theories, and require significant implementation resources. Hereby the authors propose an alternative description of the complex program as a composition of Boolean functions, which allows minimizing the computational complexity of the task at hand.
Сведения об авторах
Бабаева Светлана Игоревна, окончила МГТУ ГА (2003), аспирантка МГТУ ГА, автор 12 научных работ, область научных интересов - программное обеспечение планирования полетов воздушных судов.
Рудельсон Лев Ефимович, 1944 г. р., окончил МЭИ (1968), доктор технических наук, профессор МГТУ ГА, автор более 110 научных работ, область научных интересов - программное обеспечение автоматизированных систем организации воздушного движения.