2006
НАУЧНЫЙ ВЕСТНИК МГТУГА серия Эксплуатация воздушного транспорта и ремонт авиационной техники.
Безопасность полетов
№ 99
УДК 629.735.015:681.3
ВЛИЯНИЕ КОРРЕЛЯЦИИ ПОЛЕТНЫХ ДАННЫХ НА ПОКАЗАТЕЛИ КАЧЕСТВА ИХ ОБРАБОТКИ
С.И. БАБАЕВА
Статья представлена доктором технических наук Рудельсоном Л.Е.
Записи о планах полетов и отождествленных с ними измеренными параметрами движущихся воздушных судов связаны отношениями предшествования и общими атрибутами. В процессе планирования и непосредственного управления воздушным движением они подвергаются корректировкам. Одновременные обращения к записям от взаимодействующих комплексов программ ведут к конфликтам, простоям системы и, как следствие, к снижению производительности. Для учета связей по управлению и данным введено понятие корреляции между записями и получены формулы для расчета необходимого объема памяти, гарантирующего заданный уровень вероятности потери данных.
1. Введение
Автоматизация процесса управления воздушным движением (УВД) предполагает наличие развитой базы данных (БД) [1]. Здесь содержится разнородная информация. Это измерения наземных радиолокаторов, бортового оборудования, спутниковой навигации, которые постоянно обновляются, сравниваются с планами полетов, запрашиваются для расчета других полетных данных. Наряду с регулярным потоком измерений, который требуется зафиксировать в БД, в систему поступает информация о манипуляциях диспетчера, которая в отличие от радиолокационных измерений оценивается потоком случайных событий. Измеренные данные сосуществуют в БД с постоянной информацией, например, техническими характеристиками воздушных судов, каталогом маршрутов и т. п. Зафиксированные данные непрерывно используются, большинство таблиц БД обновляются. Процесс обновления происходит за счет регулярного поступления новых данных, которые немедленно должны быть обработаны и зафиксированы в соответствующем разделе. Параллельно с этими процессами БД должна удовлетворять поступающим заявкам, как в предоставлении неизменной информации, так и обновленных данных. Аппаратно взаимодействие БД с источниками измерений и диспетчерским персоналом реализовано с помощью сети электронных вычислительных машин (ЭВМ), каждая из которых имеет доступ к БД. Эта аппаратная схема вписывается в ограничения модели системы массового обслуживания (СМО), насчитывающей, в общем случае, п одинаковых каналов (обслуживающих аппаратов). Входной поток - простейший с интенсивностью поступления заявок-записей в систему, равной X. Время обслуживания - экспоненциальное с показателем ^. Любой из п каналов (любая ЭВМ сети, имеющая доступ к файлам базы данных) может обслужить (удалить) любую заявку (запись). Обслуживание частично состоит в удалении; это диктует регулярный поток данных большого объема, которые непременно нужно фиксировать и которые постоянно запрашиваются различными комплексами программ. Пришедшие вновь данные вытесняют самые «старые» строки, так как количество мест для записей ограничено. Каждая заявка, поступая в систему, принимается к обслуживанию одним из свободных каналов. Если все каналы заняты, то заявка ожидает обслуживания в общем буферном накопителе (БН) объемом г мест для ожидания. Заявка, поступившая в систему и заставшая занятыми все п каналов и г мест для ожидания, получает отказ в обслуживании и теряется.
2. Постановка задачи
Расчетные формулы, устанавливающие зависимость количества г мест для ожидания в функции известных X, ^, п и наперед заданной допустимой вероятности Р потери заявки без учета корреляции, получены в [2]. Однако в исследованных моделях не рассмотрен обсуждаемый здесь факт связности записей по управлению и данным. На рис. 1 представлен пример вычислительной сети, обслуживающей поток заявок. Заявки поступают последовательно и распределяются по ЭВМ. Все машины имеют одинаковые права доступа к БД и, следовательно, могут обслужить любую заявку. Подробнее ход обслуживания заявок представлен в таблице. Нетрудно проследить, что результаты обработки заявки №2 составляют исходную информацию для обработки заявки №3. Из колонки «Время поступления заявки / Время выполнения» видно, что ЭВМ №2 успевает выполнить операцию «Б + Н» до поступления заявки №3, следовательно, результат «М» будет получен без задержки. Противоположная ситуация - с заявкой №5, выполнение которой задержится, так как ЭВМ №4 не успеет получить результат «Т», который является исходной информацией для получения результата «2».
Ї0 < її < Ї2 < Ї3 < Ї4 < Ї5
-1---1--1---1--1-►
III II
І І І І 1 т
Рис. 1. Пример сети ЭВМ, обслуживающей поток заявок
Таблица
№ заявки Операция Время поступления заявки, ч м с / Время выполнения, с Результат Отметка о выполнении заявки
1 А + В 10.13.10 / 3 С Выполнена сразу
2 Б + Н 10.13.11 / 2 8 Выполнена сразу
3 8 + N 10.13.14 / 4 м Выполнена сразу
4 К + Р 10.13.18 / 6 Т Выполнена сразу
5 Т + V 10.13.19 / 2 ъ Задержка по корреляции
В реальных БД нередко возникают ситуации, при которых незаконченность обслуживания одной записи запрещает обращение к другой, ожидающей очереди в БН. Например, обновление информации, при котором новые значения атрибутов фиксируются в файле только после удаления старых. В других случаях такие запреты вызываются иными видами корреляции записей по управлению и информации, осуществляемой либо посредством отношений предшествования, либо на общем поле памяти, когда записи размещены в одной секции файла, и для работы с ними разные каналы обращаются одновременно к одному физическому носителю.
В качестве примера активизации нескольких вычислительных работ, одновременно обращающихся к одной записи БД, воспользуемся ситуацией в системе резервирования билетов на авиалиниях. Параллельная (одновременная) обработка нескольких запросов на один рейс может привести к тому, что нескольким пассажирам достанется одно место в салоне.
3. Учет корреляции между записями
Для учета столкновений запросов каналов обслуживания в общей памяти, т. е. связей записей по управлению, а также для учета различий физического быстродействия разных ЭВМ сети, обрабатывающих информацию файла общего доступа, рассмотрим следующую модель. Введем понятие корреляции между заявками как вероятности Qi (г = 1, п) разрешения обслуживания очередной заявки г - м свободным каналом при условии, что любые (г - 1) приборов системы заняты. При этом индекс г не является зафиксированным номером конкретной ЭВМ (узлом сети), но означает своего рода формальную грань, количественный раздел между работающими и простаивающими каналами обслуживания. Это наглядно поясняет рис. 1, номера заявок на нем не обязательно совпадают с номерами обслуживающих эти заявки ЭВМ. Если в системе насчитывается п приборов, то г = 1, ..., п - это увеличенное на единицу число занятых среди них в текущий момент времени. Понятно, что величина г ничего не говорит ни о распределении заявок по ЭВМ, ни о занятости каждой из них. Это интегральная характеристика текущего состояния системы, статистически указывающая, могут ли, начиная с данного момента времени, быть занятыми г ее каналов, причем в силу стационарности входного потока момент этот инвариантен относительно сдвига по оси времени.
Статистический анализ процесса управления БД предоставляет достоверные сведения о распределении вероятностей столкновений запросов к файлу общего доступа. Предположим в связи с этим, что в системе, содержащей п каналов, всегда известен набор условных вероятностей Qi = ^¡, Q2, причем очевидно, что Q¡ = 1. Оценим объем изменчивого файла запи-
сей, необходимый для удовлетворения заданной величины допустимой вероятности Рс потери заявки с учетом корреляции по управлению и данным.
Рассмотрим двухканальную СМО [3] с БН объемом г. Пусть на ее вход поступает простейший поток заявок интенсивностью X. Обслуживание экспоненциальное с параметром ^. На рис. 2 представлен граф переходов и состояний такой системы, из которого нетрудно установить, что набор условных вероятностей Qi = {1, Q2}, загрузка р = X/(1+Q2) • ц, а нормировочное
условие равенства единице суммы вероятностей всех состоянии выглядит так:
1 +(1 + 02 )*Г+(і + 02 )*Г2 +(1 + 02 )*
к=0
корреляции. Вероятность Р0с простоя системы отсюда равна: Рос =
= 1, где индекс «с» указывает на учет
1 -р
1 + 02 *р-(1 + 02 )*р
вероятность Рс потери записи: Рс = (1 + 02 ) * РГ+2 * Рос = , (|.+ 02 )<Р>, Д(1\ Рр+3 ,0 £ 02 £ 1.
1 + 02 *Р-(1 + 02 )*Р
В предельных случаях соблюдается переход Рс в Р:
р"+2-(1 -Р)
Р™ =
1-Р 2рг+2 -(1 -р)
1 + р- 2р
г+3 , если 02 = 0,
р)
г+3 , если 02 = 1.
При Q2 = 1 формула для Рс совпадает с Р2. Для случая Q2 = 0 имеет место увеличение на единицу показателей степени при р, что отражает факт использования второго канала в качестве дополнения к БН. Это естественно в условиях полного запрета его работы при занятости первого. Отметим, что в силу эквивалентности пропускных способностей сравниваемых СМО параметр обслуживания ^ для каждого прибора двухканальной системы вдвое меньше, чем для одноканальной. Следовательно, вдвое меньшей становится загрузка, с которой такая СМО при Q2 = 0 может справиться.
X
Ц(1+02)
X
Ц(1+02)
X
Ц(1+02)
X
X
Ц(1+02) Ц(1+02) Ц(1+02)
Ц(1+02)
Рис. 2. Граф переходов и состояний системы, содержащей 2 канала и файл объемом г,
с учетом корреляции между записями
а
С помощью изображенного на рис. 3 графа переходов и состояний распространим полученный результат на общий случай и-канальной СМО. Отметим, что в такой системе аналогом
п
при значащих Qi служит Т ^ = 1+^ , аналогом к - Т Qi , аналогом к! - П Тв, , а
,=1 2=1 ы ,=1
загрузка системы при занятости каналов г = 1 . Связь вероятности любого к-го состояния
^ к
тТ в
,=1
системы с вероятностью ее простоя приобретает вид:
Та
кс к-1 /
П
X
р1=1
К1+02)
X X
тТ в тТ в
X
X
X
тТ в тТ в тТ в тТ й-
,=1
X
X
X
X
к
к-1
2=1
1=1 ,=1
И
2=1
2=1
2=1
2=1
п п п п
тТ в тТ в тТ в тТ в
2=1 2=1 2=1 2=1
Рис. 3. Граф переходов и состояний системы, содержащей п каналов и файл объемом г,
с учетом корреляции между записями
п+г
Из нормировочного условия ТРр = 1, (Р}С = Ркс, ] — п; Р}С =Рпср, ]>п):
]=0
1 -Р
Т
Т в*
Т в* I - Т в,
2=1 ) 2=1
к I
П "Ев,
Т в.
2=1
п-1 I
п т&,
При полном отсутствии корреляции, когда все {в} = 1, 2=1,..., п, Рос = Р0. Вероятность потери заявки в исследуемой модели:
т&.
п-1 I рг+п •(1 -р)
П Тв,
р =-
Т
Т в.
Тв. I - Тв,
2=1 ) 2=1 к I
П Тв,
Тв,
2=1
г-1 I
П Тв,
пк V 2=1 ) ~г+п+1
р п-1 1 р
Тогда объем изменчивого файла, необходимый для удовлетворения заданному пороговому значению вероятности Рс потери записи, равен:
1п
) г (=-
РТ
Т в.
Т в. I - Т в,
2=1 к ~
П Тв,
•р
- 1п
Т в.
2=1_________
п-1 I
П Тв,
•(1 -р+р •р)
1п р
- Т в.
Символ ) ( означает ближайшее неотрицательное большее целое вычисленной величины. Требование неотрицательности выдвигается вследствие того, что при больших значениях допустимой вероятности Р потери записи или при малых загрузках системы р соотношение параметров системы может оказаться таким, что заданный порог Р удовлетворяется даже в абстрактном случае отрицательного количества г мест для ожидания, что физически бессмысленно. При в. = {0,1} соблюдаются предельные переходы полученных выражений, учитывающих корреляцию, в известные из теории очередей формулы. С помощью сравнительных оценок эффективности вычислительных сетей, содержащих п ЭВМ (при равенстве суммарных производительностей), для конкретных соотношений их параметров (р, X, ц, Qi), могут быть определены области изменения в,, в которых сеть становится предпочтительнее одной ЭВМ.
Заключение
к-1
п-1
п
2=1
к=0
1=1 2=1
1=1 2=1
п-1
1=1 2=1
к-1
п-1
к
п
п
2=1
к=0
1=1 2=1
/=1 2=1
к-1
п-1
к
п
2=1
к=0
1=1 2=1
1=1 2=1
2=1
Любое программное изделие еще на этапе проектирования принято представлять графом, вершины которого соответствуют выполняемым функциям, а дуги - допустимым переходам между ними. Прослеживается аналогия со структурными схемами технических систем разного уровня сложности и обобщения, наглядно демонстрирующими логику их работы. В данном изложении важно то обстоятельство, что финальные вероятности переходов процесса по разветвляющимся дугам исходного графа могут с достаточной статистической достоверностью
определяться априорно, исходя из заданных характеристик проекта. В такой постановке задача расчета последовательности вероятностей ^ становится методически столь же реальной, как вычисление значений 1 и ¡1- Эти величины характеризуются известным распределением моментов наступления событий, интенсивностью их потоков, подтвержденными опытом эксплуатации. Затруднения вызывает лишь громоздкость вычисления вероятностей прохождения процесса по десяткам тысяч возможных путей на графе сложной программы.
ЛИТЕРАТУРА
1. Анодина Т. Г., Кузнецов А. А., Маркович Е.Д. Автоматизация управления воздушным движением. - М.: Транспорт, 1992.
2. Бабаева С.И. Оценка объема памяти, необходимого для информационного образа полетной информации. // Научный вестник МГТУ ГА, сер. Информатика. Прикладная математика, 2005, вып. 92.
3. Саати Т.Л. Теория массового обслуживания и ее применение. - М.: Наука, 1984.
INFLUENCE OF FLIGHT DATA CORRELATION ON THE QUALITY PARAMETERS OF DATA PROCESSING
Babaeva S.I.
Flight plan records and associated measured parameters of aircraft movements are linked by common pre-history and attributes. In the process of planning and direct air traffic control they are subject to changes. Concurrent requests to records from application software tools may lead to potential conflicts, system downtime and, consequently, reduced performance. In order to take account of management and data interdependencies several formulae have been developed for calculation of required hardware memory that would make it possible to maintain the set level of data loss probability.
Сведения об авторе
Бабаева Светлана Игоревна, окончила МГТУ ГА (2003), аспирантка кафедры ВМКСС МГТУ ГА, автор 11 научных работ, область научных интересов - программное обеспечение планирования полетов воздушных судов.