2005
НАУЧНЫЙ ВЕСТНИК МГТУ ГА серия Информатика. Прикладная математика
№ 92(10)
УДК 629.735.015:681.3
ИНСТРУМЕНТАЛЬНОЕ СРЕДСТВО ПЛАНИРОВАНИЯ ДЕЯТЕЛЬНОСТИ АВИАПРЕДПРИЯТИЯ
В.А. РЕБРОВ
Статья представлена доктором технических наук, профессором Рудельсоном Л.Е.
Для многих факторов деятельности авиапредприятия не существует аппарата, который бы адекватно описывал их действие. Обычно такие влияния оцениваются с помощью вероятностно-статистического моделирования. Недостаток многих моделей - жесткие ограничения на однородность исходных данных. В статье рассмотрено программное средство, позволяющее быстро и удобно анализировать многомерные данные на однородность.
В гражданской авиации, как и в других отраслях, часто возникает необходимость оценки деятельности предприятий, прогнозирования развития, выбора рентабельных проектов и т.д. Наиболее подходящим способом решения этих сложных задач является метод экспертных оценок. Ситуацию анализируют по ряду показателей несколько квалифицированных специалистов
- экспертов, выставляя для каждого показателя свою оценку. Как результат, получаем несколько решений, для каждого из которых высказано несколько мнений, состоящих из нескольких оценок [1].
Для того чтобы облегчить принятие ответственным лицом окончательного решения, следует либо снизить размерность вектора оценок, либо уменьшить количество векторов до одно-го-двух. В первом случае необходимо для каждого показателя определить коэффициент его влияния на итоговые оценки, что обычно является крайне сложной задачей. При этом нельзя сразу находить среднее значение. Если мнения экспертов разделились на две или более групп, то среднее значение окажется между этими группами и, тем самым, не будет отражать мнение ни одной из них, т. е. будет в корне неверным. Нужно прежде разделить мнения экспертов на группы и находить средние значения отдельно в каждой группе. Кроме того, подобное разделение позволит найти экспертов, которые не разобрались в сути вопроса (или учли то, о чем забыли другие), и заранее исключить их мнения из дальнейшего рассмотрения (либо пересмотреть оценки других). Разделить многомерные оценки на группы можно, если спроецировать их на плоскость (или на прямую). Метод главных компонент позволяет сделать это, причем с минимальными потерями структурного расположения векторов оценок друг относительно друга. Собственно, это и есть его графическая интерпретация - найти плоскость, на которую можно было бы спроецировать точки с минимальными потерями информативности.
Будем различать два класса ситуаций, в которых требуется принять решение. В первом классе решение принимает одно лицо или коллектив единомышленников. Задача здесь заключается в том, чтобы установить цель выбора, агрегировать цели, если их несколько, и выработать концепцию рационального решения в более сложных случаях. Во втором классе ситуаций необходимо обеспечить согласование интересов различных лиц, принимающих решения (ЛИР), или преодолеть противоречия и добиться компромисса нескольких конфликтующих сторон. Рассмотрим вначале класс задач с одним ЛИР, готовым не только производить выбор, но и нести ответственность за его последствия. В этом классе задач рассмотрим три типа ситуаций:
1. ЛИР четко формулирует цель выбора, и эта цель единственна.
2. Иеред ЛИР стоят несколько целей, и он способен сравнивать любую пару целей и указывать, достижение какой из них предпочтительней.
3. Полезность выбора не может быть определена сравнением пар объектов; результат зависит от контекста выбора - от того, с какими альтернативами придется еще сравнивать рассматриваемые варианты решений.
Пример ситуаций типа (3): требуется выбрать типичный («оригинальный») вариант из заданного множества альтернатив или отделить «рациональные», с точки зрения ЛИР, варианты от «нерациональных». Выбор требует целостного представления допустимого множества альтернатив. Приведенные типы ситуаций характеризуются соответственно целью, предпочтением и интересом ЛПР. Все эти три понятия формализуются [2].
Таким образом, задача разбиения всей совокупности экспертов на группы сводится к задаче разбиения неоднородной выборки на однородные подвыборки. Исходные статистические данные называются однородными, если все они зарегистрированы при одних и тех же сопутствующих условиях, т.е. при одних и тех же воздействующих сторонних факторах. В зависимости от исходных данных различают два общих способа решения проблемы неоднородности:
• воздействующие качественные сопутствующие факторы наблюдаемы в ходе сбора исходных статистических данных, а объем последних позволяет разбить всю имеющуюся выборку на однородные подвыборки таких объемов, которые обеспечивают возможность статистически надежного анализа отдельно по каждой подвыборке. Построение и анализ модели производится отдельно по каждой такой однородной выборке;
• если качественные переменные не наблюдаемы или их значения своевременно не зарегистрированы при сборе исходных статистических данных, то в этом случае нет принципиальной возможности разбить имеющиеся исходных статистически данные на однородные порции, ориентируясь при этом на значения этих качественных переменных. В этих случаях сначала исходные данные методом кластерного анализа распределяют в ^-мерном пространстве, где р -количество измеряемых показателей, используемых в модели, с целью получения однородных кластеров, а затем, как и в первом случае, строят и анализируют искомую модель отдельно по наблюдениям каждого такого кластера.
Так как эксперт учитывает некоторые факторы неосознанно, интуитивно, то для селекции экспертов на группы необходимо использовать методы кластерного анализа. Существует достаточное разнообразие методов алгоритмического разбиения исходной выборки, распределенной в ^-мерном пространстве, на однородные кластеры. Они требуют:
- либо непосредственного вмешательства исследователя в процесс разбиения на кластеры, например, кластеризация методом перебора фиксированных расстояний от центров сфер требует указания радиуса сферы и визуального контроля качества разбиения;
- либо чтобы данные удовлетворяли определенным условиям, например, кластеризация интегральным методом геометризации информационного поля требует, чтобы все характеристики объекта можно было естественным образом разделить на пары составляющих: точные и приближенные, числовые и логические и т. д.;
- либо какой-либо дополнительной информации, например, требуется указание критерия оптимального разбиения, из возможных вариантов разбиения выбирается лучший вариант по этому критерию.
При этом ни один из методов не дает гарантированный результат. Вследствие этого, независимо от выбранного алгоритма разбиения, необходимо предоставить возможность руководителю контролировать результат разбиения. Для этого нужно представить результат таким образом, чтобы руководитель мог сразу оценить качество разбиения экспертов на группы. В результате, мы опять возвращаемся к проблеме наглядного представления многомерных оценок, то есть снижению их размерности до двух, что позволит представлять оценки точкой на плоскости (рис. 1).
Если представить ^-мерную оценку эксперта точкой в ^-мерном пространстве, то, другими словами, нам необходимо спроецировать эту точку на плоскость. При этом возникает проблема такого расположения плоскости проекции, чтобы по возможности была сохранена информация о расположении всех оценок друг относительно друга, о возникновении сгустков и разрежений, что позволит видеть, как группируются мнения экспертов. Данную проблему можно решить с помощью известного алгоритма многомерного статистического анализа - метода главных компонент.
СХЕМА РЕШЕНИЯ ЗАДАЧИ: Технологические операции:
Сбор исходных данных
Объекты Показ 1 Показ 2
об1 ¿и ¿12
об2 ¿21 ¿22
Проецирование многомерных данных на двумерную плоскость с минимальными потерями информации о структуре совокупности с помощью метода главных компонент
1
Подготовить данные для метода главных компонент - найти ковариационную матрицу
1
Найти собственные числа и матрицу собственных векторов ковариационной матрицы
I
Вычисление главных компонент
I
Вывод промежуточных результатов
Ф
Преобразование найденных первых двух главных компонент в экранные координаты.
Отображение структуры исходных данных на экране монитора
Ручное разбиение всей совокупности данных на группы
! * \ ' • • Ї • / \ • / ГК 2 к і * * ; ГК 1 ' • /
; • 1
Вывод сведений по каждой группе
- на экран
- на печать
- в текстовый файл
Группа 1 : состав - об1, об3, об10
Средние значения показателей:
Показ 1= ... Показ 2=...
Типовой объект группы - об3
Группа 1 : состав - об2 .
Рис. 1. Технологическая схема анализа многомерных данных на однородность
Во многих задачах обработки многомерных наблюдений исследователя интересуют, прежде всего, те признаки, которые обнаруживают наибольшую изменчивость при переходе от одного объекта к другому. Кроме того, не обязательно для описания состояния объекта использовать какие-то исходные, непосредственно замеренные на нем показатели. Их можно заменить производными от измерений ряда параметров показателями. При этом теряется какая-то доля информации, огрубляются получающиеся при агрегировании классы. Именно эти принципиальные установки заложены в сущность того линейного преобразования системы исходных показателей в систему новых параметров, которые называют главными компонентами.
Первой главной компонентой исследуемой системы показателей называется такая нор-мировано-центрированная линейная комбинация этих показателей, которая среди прочих нор-мировано-центрированных комбинаций переменных обладает наибольшей дисперсией.
Аналогично, к-й главной компонентой исследуемой системы показателей называется такая нормировано-центрированная линейная комбинация этих показателей, которая не коррелированна с к - 1 предыдущими главными компонентами и обладает наибольшей дисперсией среди всех прочих нормировано-центрированных и некоррелированных с предыдущими к - 1 главными компонентами линейных комбинаций переменных.
Таким образом, наибольшая доля информации о различии исследуемых многомерных оценок будет содержаться в первых двух главных компонентах. Как следствие, отбрасывание всех оставшихся главных компонент не приведет к значительным потерям информации. Первые две главные компоненты дадут нам необходимые координаты на плоскости.
Главные компоненты обладают свойством наименьшего искажения геометрической структуры множества исходных р-мерных наблюдений при их проектировании в пространство р’ первых главных компонент. Представим исходные наблюдения в виде точек в пространстве размерности р. Тогда среди всех подпространств заданной размерности р' (р' < р), полученных
из исследуемого пространства с помощью линейного преобразования исходных координат х(1,
(р) ! ху, в пространстве, натянутом на первыер главных компонент, менее всего искажаются:
- сумма квадратов расстояний между всевозможными парами рассматриваемых точек-наблюдений;
- расстояния от рассматриваемых точек-наблюдений до их общего «центра тяжести»;
- углы между прямыми, соединяющими всевозможные пары точек-наблюдений с их общим «центром тяжести».
Благодаря этому свойству, метод главных компонент оптимален для проецирования исходных многомерных оценок на двумерную плоскость с максимальным сохранением информации о положении оценок друг относительно друга.
Основную сложность при нахождении главных компонент представляет задача нахождения собственных чисел и собственных векторов симметричной матрицы. Собственные значения - это такие значения, которые при вычитании из главной диагонали матрицы обращают ее определитель в ноль. Наиболее очевидным способом поиска собственных значений является нахождение характеристического полинома и вычисление его корней. Однако при реализации этого метода возникают следующие трудности.
Во-первых, вычисление определителя действительной матрицы довольно трудоемкая задача. Если же требуется найти характеристический полином, то сложность этой задачи возрастает многократно. При нахождении характеристического полинома матрицы размером 10х10 приходится умножать друг на друга полиномы, количество коэффициентов которых исчисляется сотнями. Одна такая операция отбирает несколько секунд машинного времени. Эта проблема решается использованием специальных методов нахождения характеристического полинома, например, метода Леверрье.
Во-вторых, итерационные алгоритмы нахождения корней линейного уравнения довольно чувствительны к погрешностям, возникающим в процессе вычисления. Для того чтобы найти кратные корни уравнения, которые довольно часто встречаются при решении задач на собственные числа, необходимо понижать степень исходного уравнения, исключая найденные корни
из дальнейшего рассмотрения. Так как корни ищутся с не очень высокой точностью, это увеличивает погрешность вычислений, что в совокупности с погрешностью нахождения коэффициентов уравнений и высоким порядком самого уравнения приводит к потере малых корней или нахождению их с очень высокой погрешностью. Подобное решение задачи малоприемлемо, и необходимо использовать специальные алгоритмы.
Современные алгоритмы нахождения собственных чисел используют преобразования подобия. Главная стратегия заключается в том, что матрица приводится к диагональной форме посредством цепочки преобразований подобия, при этом на диагонали будут расположены искомые собственные значения. Оптимальная стратегия сведения матрицы к диагональной форме заключается в первоначальной редукции матрицы за конечное число шагов к возможно более простой форме. Для симметричной матрицы такой формой считается трехдиагональная. Это позволяет значительно снизить трудоемкость следующего этапа, на котором матрица за неопределенное число шагов и сводится к диагональной форме.
Первый этап осуществляется с помощью метода отражений, также называемого алгоритмом Хаусхолдера. Второй - с помощью ОЬ- (или QR-)алгоритма с неявными сдвигами. Комбинация этих двух алгоритмов считается оптимальной.
В реализованном программном продукте объекты представляются в виде точек на графике рис. 2. Абсциссой является первая, ординатой - вторая главная компонента. По степени равномерности расположения точек можно оценить неоднородность исходной совокупности. Если навести курсор мыши на точку, то будет показано имя объекта, который эта точка отображает, и, если объект принадлежит какой-то группе, названия группы.
Рис. 2. Графическое представление выборки
В этом же окне производится дробление всей совокупности объектов на более однородные группы. Выделение группы производится многоугольником. Вершины многоугольника указываются нажатием левой кнопки мыши на графике, при этом вершина отобразится как небольшой синий квадрат. Вершины соединяются пунктирными отрезками. Указав несколько вершин, необходимо нажатием левой кнопки мыши на последнюю вершину завершить выделение. Также это можно сделать, нажав на клавишу Enter. У завершенного многоугольника отображаются только стороны, но не вершины. Все объекты, оказавшиеся внутри многоугольника, считаются принадлежащими одной группе. При выделении нужно учитывать, что стороны многоугольника не могут пересекаться. Отменить постановку вершины можно правой кнопкой мыши. Двойной щелчок правой кнопки или клавиша Esc удаляет весь многоугольник. Когда начинается выделение следующей группы объектов, старый завершенный многоугольник больше не отображается. Если будет выделен один или несколько объектов, уже принадлежащих какой-то группе, будет выдан запрос: присоединять ли эти объекты к выделяемой группе.
Название выделяемой в данный момент группы отображается в раскрывающемся списке в левом нижнем углу. Каждой новой группе автоматически присваивается имя «Группа N», где N - постоянно возрастающее число. Если необходимо, это название можно изменить. Сделать это нужно до выделения. После выделения группа будет создана, и ее название изменить нельзя (можно удалить группу и заново выделить с новым названием). Каждый раз добавление выделяемых вершин происходит в группу, имя которой отображено в списке. Если необходимо добавить вершины в ранее выделенную группу, то следует раскрыть список, выбрать нужную группу и произвести выделение добавляемых вершин.
Не принадлежащие ни одной группе объекты отображаются темно-серыми точками. Объекты, определенные в группу, отображаются точками с темной каймой и выделяются определенным цветом. Цвет, которым будут отличаться объекты данной группы, указан в квадрате внизу окна. Этот цвет выбирается автоматически из небольшого набора, но в случае необходимости (например, при большом числе групп) его можно определить вручную, нажав на кнопку «Цвет». В этом случае будет вызван стандартный диалог Windows, в котором можно выбрать любой необходимый цвет. Цвет у уже созданной группы изменить нельзя.
Чтобы удалить группу, нужно выбрать уже существующую группу из списка и нажать кнопку «Удалить группу». Все объекты, принадлежавшие группе, становятся свободными.
Если нажать на точку, отображающую объект, правой кнопкой мыши, то будет выдано контекстное меню. В верхней части меню отображается название объекта (это важно, если несколько объектов расположены близко друг от друга). С помощью меню можно добавить объект в текущую группу, удалить объект из группы, которой он принадлежит, при этом он становится свободным, или же скрыть его. В последнем случае объект больше не отображается на графике. После скрытия объекта график заново масштабируется. Обычно требуется скрыть явно ошибочные объекты, чтобы исключить их из дальнейшего рассмотрения.
Если количество объектов, входящих в какую-то группу, становится равным нулю, то эта группа удаляется автоматически, а пользователю выдается соответствующее сообщение.
Выводимый на экран график можно распечатать, для этого следует нажать на кнопку «Печать». Если объекты в группы еще не выделены, то выдается предупреждение. При печати используется стандартный диалог Windows, в котором можно настроить параметры принтера, после чего следует в нем нажать «ОК», и график распечатается. Печать желательно производить на цветном принтере, чтобы было проще различить группы. В центре каждой группы на распечатанном графике будет отображаться ее название. Выделяющий многоугольник не печатается.
Разработанный программный инструмент обеспечивает подход к задаче выбора на основе экспертных оценок с исследованием групповых структур в пространстве ответов. Он позволяет накапливать обоснованные результаты, обладающие свойством высокой надежности, и может использоваться не только для оценки деятельности и планирования инвестиций в предприятиях гражданской авиации.
ЛИТЕРАТУРА
1. Кучинская Н.В., Борисов Я.И., Шныров В.Г. Экспертные оценки для решения задач в гражданской авиации. // Научный Вестник МГТУ ГА, серия Информатика. Прикладная математика, № 77, 2004.
2. Юдин Д.Б. Выбор и компромисс. // Известия Академии Наук. Теория и системы управления, № 3, 2004.
PLANNING INSTRUMENT FOR AVIATION ENTERPRISE ACTIVITY
Rebrov V.A.
There is no way to describe all factors of air enterprises activity, which would describe their functioning adequately. As a rule, the influence of these factors is estimated using stochastic and statistic modeling. The drawback of some models is strict initial data uniformity limitation. Software that allows analyzing data uniformity quite fast and comfortably is described in this article.
Сведения об авторе
Ребров Виталий Анатольевич, 1982 г.р., окончил МГТУ ГА (2004), аспирант кафедры ВМКСС, автор 2 научных работ, область научных интересов - программное обеспечение планирования полетов воздушных судов.