Научная статья на тему 'Определение перспективных характеристик самолетов с помощью кластерного анализа'

Определение перспективных характеристик самолетов с помощью кластерного анализа Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
279
90
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
проектирование самолета / авиаперевозка / кластер / кластерный анализ / анализ данных / airplane design / airline operations / cluster / cluster analysis / data analysis

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — В.А. Вестяк, А.В. Малашкин, А.А. Малашкин

Проектирование новых типов легкомоторных самолетов требует обоснования предполагаемой пассажировме-стимости и грузоподъемности. В фундаментальных трудах излагаются основные подходы, задачи и методы их ре-шения, связанные с общим проектированием самолетов различного назначения, а также вопросы проектирования отдельных частей самолета. В настоящей статье уделено внимание именно автоматизации решения проектной зада-чи: разработан и программно реализован эффективный алгоритм модифицированного кластерного анализа данных пассажирских авиаперевозок. На основе имеющихся в литературе данных кратко обосновывается необходимость проектирования отечественного самолета пассажировместимостью до 19 человек. При проектировании борта, харак-теризующего конкретную авиаперевозку, учитывались следующие параметры: дальность перелета, количество пас-сажиров и вес коммерческого груза. В случае использования классических подходов кластерного анализа (K-means или K-medians с конечным количеством кластеров) в каждом кластере будут находиться авиаперевозки, превышающие возможности самолета, с характеристиками, соответствующими характеристикам кластера. Каждая перевозка представляет собой точку в трехмерном пространстве, оси которого имеют разную размерность (км, коли-чество пассажиров, кг), поэтому возникает проблема измерения расстояния в таком пространстве, так как подобрать эффективную метрику в нем не представляется возможным. В связи с этим использован не упомянутый классиче-ский подход, а оригинальный метод перехода от трехмерного к одномерному пространству для кластерного анализа. Предложен и обоснован критерий остановки алгоритма. Обработаны реальные данные о 1 017 конкретных авиапере-возках. Полученные результаты могут быть использованы проектировщиками самолетов и инженерами, занимаю-щимися разработкой облика самолета.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

ESTIMATION OF ADVANCED CHARACTERISTICS OF AIROPLANES USING CLUSTER ANALYSIS

The development of new types of light airplanes requires justification for passenger and weight-lifting capacities. The fundamental works [2] describe crucial problems of aircraft development for various purposes and methods of their solutions. The problems also concern the issues of general design of airplanes’ particular parts. The article pays attention to finding a solution for automation of the design objective: the effective algorithm of modified cluster data analysis for passenger air travel was developed and software-implemented. In short, based on the literature review, the authors explain the necessity of designing a local airplane with passenger capacity up to nineteen people. The development of an airplane for a specific airline operation takes into account the following parameters: transit range, the amount of passengers and weight of commercial cargo. In case of using cluster analysis classic approaches (K-means or K-medians with a finite number of clusters), in each cluster there will be airline operations exceeding aircraft capabilities with cluster specifications. Moreover, each airline operation represents a point in a three-dimensional space, each axis has a different dimension (kilometres, the amount of passengers, kilograms). Therefore, the problem of measuring the distance in this kind of a dimension arises: it is impossible to select the effective metric in such a dimension. That's why instead of the above-mentioned classic approach the authors used the original method of changing from three-dimensional to one-dimensional space for cluster analysis. It allows using a general Euclidean metric. The criteria of stopping the algorithm is offered and justified. The actual data of 1017 airline operations was processed. The acquired results can be used by aircraft designers and engineers working on aircraft concepts.

Текст научной работы на тему «Определение перспективных характеристик самолетов с помощью кластерного анализа»

Программные продукты и системы /Software & Systems

№ 3 (111), 2015

УДК 303.732.4 Дата подачи статьи: 15.04.15

DOI: 10.15827/0236-235X.111.093-096

ОПРЕДЕЛЕНИЕ ПЕРСПЕКТИВНЫХ ХАРАКТЕРИСТИК САМОЛЕТОВ С ПОМОЩЬЮ КЛАСТЕРНОГО АНАЛИЗА

В.А. Вестяк, к.ф.-м.н., зав. кафедрой, v.avestyak@mail.ru (Московский авиационный институт (национальный исследовательский университет), Волоколамское ш., 4, г. Москва, 125993, Россия);

А.В. Малашкин, к.ф.-м..н., доцент, malashkin_a_v@mail.ru (Московский институт электроники и математики Национального исследовательского университета Высшей школы экономики, ул. Таллинская, 34, г. Москва, 123458, Россия);

А.А. Малашкин, ведущий инженер-программист, malashkin.andrey@mail.ru (Радиотехнические и информационные системы, ул. 8 Марта, 10, стр. 1, г. Москва, 127083, Россия)

Проектирование новых типов легкомоторных самолетов требует обоснования предполагаемой пассажировместимости и грузоподъемности. В фундаментальных трудах излагаются основные подходы, задачи и методы их решения, связанные с общим проектированием самолетов различного назначения, а также вопросы проектирования отдельных частей самолета. В настоящей статье уделено внимание именно автоматизации решения проектной задачи: разработан и программно реализован эффективный алгоритм модифицированного кластерного анализа данных пассажирских авиаперевозок. На основе имеющихся в литературе данных кратко обосновывается необходимость проектирования отечественного самолета пассажировместимостью до 19 человек. При проектировании борта, характеризующего конкретную авиаперевозку, учитывались следующие параметры: дальность перелета, количество пассажиров и вес коммерческого груза. В случае использования классических подходов кластерного анализа (K-means или K-medians с конечным количеством кластеров) в каждом кластере будут находиться авиаперевозки, превышающие возможности самолета, с характеристиками, соответствующими характеристикам кластера. Каждая перевозка представляет собой точку в трехмерном пространстве, оси которого имеют разную размерность (км, количество пассажиров, кг), поэтому возникает проблема измерения расстояния в таком пространстве, так как подобрать эффективную метрику в нем не представляется возможным. В связи с этим использован не упомянутый классический подход, а оригинальный метод перехода от трехмерного к одномерному пространству для кластерного анализа. Предложен и обоснован критерий остановки алгоритма. Обработаны реальные данные о 1 017 конкретных авиаперевозках. Полученные результаты могут быть использованы проектировщиками самолетов и инженерами, занимающимися разработкой облика самолета.

Ключевые слова: проектирование самолета, авиаперевозка, кластер, кластерный анализ, анализ данных.

В общем объеме внутренних авиаперевозок России легкомоторная авиация занимает важное место, поскольку более 60 % территории недоступно другим видам транспорта, кроме воздушного [1]. Однако в силу нерентабельности местных перевозок, несмотря на частичное субсидирование, происходит их постоянное и системное сворачивание. Следует отметить, что значительная часть парка региональной и местной авиации, состоящая в основном из самолетов постройки еще СССР (Ан-2, Ан-28) и ЧССР (Л-410), имеет значительный возраст и требует либо замены, либо глубокой модернизации. Старение авиапарка - одна из причин слишком больших эксплуатационных расходов (горючее, ремонт). Подобные ограничения приводят к необходимости разработки новых типов самолетов местной авиации исключительно на базе отечественных технологий в рамках импортозамещения. В частности, с использованием фундаментальной работы [2], в которой изложены основные принципы проектирования самолетов и указаны методики, позволяющие уточнить и оптимизировать параметры, полученные в процессе общего проектирования. В монографии [3] изложены и способы формирования облика самолета с

точки зрения моментно-инерционного фактора, что полезно при детальном и более подробном подходе к созданию проекта.

Следует отметить, что даже наиболее продвинутые и перспективные проекты СМ-92, Ан-2СМ, V-100, Аккорд-201, Ла-8, «Рысачок», Бе-32КМ реализованы в лучшем случае единичным производством. Покупка иностранных самолетов типа Л-410 стала невыгодной. И это при том, что потребность в самолетах вместимостью до 19 пассажиров оценивается минимально в 600 машин до 2020 года [4]. К сожалению, в последнее время возможности международной кооперации в области использования зарубежных технологий существенно уменьшились. Подобные ограничения приводят к необходимости разработки новых типов самолетов местной авиации исключительно на базе отечественных технологий в рамках импортозамещения.

При проектировании новых самолетов легкомоторной авиации необходимо иметь представление об условиях их эксплуатации. Каким образом анализировать данные об уже осуществленных перевозках и/или прогнозируемые планы перевозок в будущем?

93

Программные продукты и системы /Software & Systems

№ 3 (111), 2015

В числе параметров, характеризующих конкретную авиаперевозку, будем учитывать дальность перелета, количество пассажиров и вес коммерческого груза. Остальные параметры, такие как длина разбега, крейсерская скорость и высота полета, не влияют на потребительские свойства авиаперевозки и должны варьироваться при разработке самолета для прогнозируемого плана перевозок. Учтенные параметры для уже осуществленных перевозок, безусловно, зависят от характеристик существующих самолетов (например, более частое повторение максимального груза и максимального количества пассажиров), поэтому для более точного прогноза желательно иметь данные об отказах в продаже билетов и перевозке груза, но получить эти данные от перевозчиков не удалось, так как они не хранят такую информацию. Наилучшими исходными данными для перспективных типов самолетов являются экспертные оценки будущих перевозок.

Обрабатывая массив исходных данных о перевозках, мы хотим получить несколько характерных типов перевозок, для каждой из которых будет проектироваться свой тип самолета. Для группировки перевозок применим основные идеи кластерного анализа [5, 6].

Удобство применения кластерного анализа методами K-means или K-medians с заданием конечного количества кластеров, равного количеству проектируемых типов самолетов (предположительно, 2-3 типа), очевидно. Однако этот подход неприемлем, так как в каждом кластере будут авиаперевозки, превышающие возможности самолета с характеристиками, соответствующими характеристикам кластера. Исходя из особенностей задачи, необходимо выбрать метрику, соответствующую смыслу задачи.

Так как учтены три параметра, каждая авиаперевозка представляет собой точку в трехмерном пространстве: дальность, пассажиры, груз. Возникает проблема измерения расстояния между точками. Если груз и пассажиров можно учесть одной размерностью (кг), приняв по нормативам, что 1 пассажир = 100 кг, то дальность требует обоснованного коэффициента. Исходя из характеристик самолета Л-410 [7] было принято, что величина 1 кг условно равна 2 км. Очевидно, что при проектировании нового типа самолета эта пропорция обязана быть другой, исходя из прогноза проектировщиков. Также возможно решение задачи оптимизации типа самолета при варьировании этой пропорции. В этом уже одномерном пространстве будем использовать евклидову метрику [8].

Предлагается модернизировать кластерный метод и не использовать для вычисления координат кластеров среднее взвешенное или медианное значение. Кластер будем описывать характеристиками, соответствующими характеристике перевозки с максимальной метрикой. Это означает, что

спроектированный самолет с характеристиками, соответствующими кластеру, может выполнять все перевозки, входящие в кластер.

В качестве примера работы метода были использованы данные о 1 017 реальных перевозках, предоставленных авиакомпаниями.

На рисунках показаны полученные кластеры в направлении уменьшения их количества от 10 до 2 и доля во всех перевозках двух и трех самых больших кластеров. На рисунке 1 показано состояние расчета при оставшихся 10 кластерах, 4 из них самые большие, что не соответствует смыслу задачи (проектируемых типов самолетов может быть не более 3), а если выбрать 3 из них, то 25 % перевозок не входят в эти три кластера.

Тип диаграммы: |Кластеры

Рис. 1. Осталось 10 кластеров: 2 самых больших кластера включают 61 % перевозок, а 3 кластера - 75 %

Fig. 1. 10 clusters are left: the 2 biggest clusters include 61 % of transfers, and 3 clusters - 75 %

В качестве критерия остановки кластеризации предлагается использовать долю перевозок, выполняемых прогнозируемым количеством разных типов самолетов. Например, если эту долю взять 90 %, то процесс остановится при 9 кластерах,

1

Тип диаграммы: |Кластеры J

Рис. 2. Осталось 3 кластера: 2 самых больших кластера включают 99 % перевозок Fig. 2. 3 clusters are left: the 2 biggest clusters include 99 % of transfers

94

Программные продукты и системы /Software & Systems

№ 3 (111), 2015

3 из которых соответствуют 90 % перевозок, а 6 кластеров - 10 % (см. http://www.swsys.ru/up-loaded/image/2015-3/2015-3-dop/8.jpg). Перевозки, не попавшие в кластеры, соответствующие проектируемым самолетам, должны занимать небольшую долю и могут быть выполнены полностью или частично, но не самым эффективным образом. Так, при оставшихся 8 и 6 кластерах количество перевозок для проектируемого количества типов самолетов увеличилось незначительно (см. http://www.swsys.ru/uploaded/image/2015-3/2015-3-

dop/9.jpg, http://www.swsys.ru/uploaded/image/

2015-3/2015-3-dop/10.jpg).

Очевидно, что критерий остановки кластеризации по количеству кластеров, например, для 3 типов самолетов (рис. 2), приводит к явно неверному результату: третий тип самолета предназначен для 1 % перевозок. Даже оставшиеся два кластера не меняют смысла решения по сравнению с рисунком 2 (см. http://www.swsys.ru/uploaded/image/ 2015-3/2015-3 -dop/11 .jpg).

На рисунке 3 приведен алгоритм кластеризации, где выбираются i и j кластеры, находящиеся на минимальном расстоянии друг от друга. Затем один из кластеров присоединяется к другому по критерию, указанному выше, то есть самолет, соответствующий объединенному кластеру, может выполнять все перевозки из обоих кластеров.

Таким образом, предложен эффективный и достаточно общий алгоритм обработки массива данных авиаперевозок с целью определения характеристик перспективных типов самолетов. Для этого был предложен вариант кластерного анализа и указан критерий окончания алгоритма. Критерием остановки выбрано условие выполнимости заданной доли перевозок (в примере 90 %) необходимым количеством типов самолетов (обычно 2-3). Алгоритм реализован [9, 10] на языке C++ в среде Qt.

Литература

1. Ицкович Б. Гражданская авиация - состояние, проблемы, решения // CONNECT! Мир связи. 2007, март. URL: http://www.connect.ru/article.asp?id=7595 (дата обращения:

15.03.2015) .

2. Егер С.М., Мишин В.Ф., Лисейцев Н.К. Проектирование самолетов. М.: Машиностроение, 1983. 616 с.

3. Куприков М.Ю., Долгов О.С. Моментно-инер-ционный фактор в формировании облика самолета. М.: Изд-во МАИ, 2008. 179 с.

4. Аралов Г. Когда региональная авиация встанет на крыло? // Aviation EXplorer. 2012. 19 сентября. URL: http://www.aex.ru/docs/2/2012/9/19/1634 (дата обращения:

15.03.2015) .

5. Мандель И.Д. Кластерный анализ. М.: Финансы и статистика, 1988. 176 с.

6. Бериков В.С., Лбов Г.С. Современные тенденции в кластерном анализе // Информационно-телекоммуникационные системы: Всеросс. конкурс. отбор обзор.-аналит. статей по приоритет. направл. 2008. URL: http://www. ict.edu.ru/ft/005638/62315e1-st02.pdf (дата обращения:

12.01.2015) .

7. Charakteristika letounu L 410. URL: http://www.let.cz/ clanek 272 charakteristika-letounu-l-410.html (дата обращения: 02.02.2015).

8. Вестяк А.В., Вестяк В.А., Тарлаковский Д.В. Алгебра и аналитическая геометрия. М.: Изд-во МАИ, 2007. Т. 2. 544 с.

9. Шлее М. Qt 4.8. Профессиональное программирование на C++. СПб: БХВ-Петербург, 2012. 912 с.

10. Гамма Э., Хелм Р., Джонсон Р., Влиссидес Д. Приемы объектно-ориентированного проектирования. Паттерны проектирования. СПб: Питер, 2015. 268 с.

95

Программные продукты и системы /Software & Systems

№ 3 (111), 2015

DOI: 10.15827/0236-235X. 111.093-096 Received 15.04.15

ESTIMATION OF ADVANCED CHARACTERISTICS OF AIROPLANES USING CLUSTER ANALYSIS

Vestyak V.A., Ph.D. (Physics and Mathematics), Head of Chair, v.a.vestyak@mail.ru (Moscow Aviation Institute (National Research University),

Volokolamskoe Highway 4, Moscow, 125993, Russian Federation);

Malashkin A.V., Ph.D. (Physics and Mathematics), Assosiate Professor, malashkina_v@mail.ru

(Moscow Institute of Electronics and Mathematics (National Research University, Higher School of Economics), Tallinskaya St. 34, Moscow, 123458, Russian Federation);

Malashkin A.A., Leading Engineer-Programmer, malashkin.andrey@mail.ru (Radio-Technical and Information Systems, 8 Marta St. 10/1, Moscow, 127083, Russian Federation)

Abstract. The development of new types of light airplanes requires justification for passenger and weight-lifting capacities. The fundamental works [2] describe crucial problems of aircraft development for various purposes and methods of their solutions. The problems also concern the issues of general design of airplanes’ particular parts. The article pays attention to finding a solution for automation of the design objective: the effective algorithm of modified cluster data analysis for passenger air travel was developed and software-implemented. In short, based on the literature review, the authors explain the necessity of designing a local airplane with passenger capacity up to nineteen people. The development of an airplane for a specific airline operation takes into account the following parameters: transit range, the amount of passengers and weight of commercial cargo. In case of using cluster analysis classic approaches (K-means or K-medians with a finite number of clusters), in each cluster there will be airline operations exceeding aircraft capabilities with cluster specifications. Moreover, each airline operation represents a point in a threedimensional space, each axis has a different dimension (kilometres, the amount of passengers, kilograms). Therefore, the problem of measuring the distance in this kind of a dimension arises: it is impossible to select the effective metric in such a dimension. That's why instead of the above-mentioned classic approach the authors used the original method of changing from three-dimensional to one-dimensional space for cluster analysis. It allows using a general Euclidean metric. The criteria of stopping the algorithm is offered and justified.

The actual data of 1017 airline operations was processed. The acquired results can be used by aircraft designers and engineers working on aircraft concepts.

Keywords: airplane design, airline operations, cluster, cluster analysis, data analysis.

References

1. Itskovich B. Civil aviation - the state, problems, solutions. CONNECT! Mir svyazi [CONNECT! The world of connection]. 2007, March. Available at: http://www.connect.ru/article.asp?id=7595 (accessed March 15, 2015).

2. Eger S.M., Mishin V.F., Liseitsev N.K. Proektirovanie samoletov [Design of Planes]. Moscow, Mashinostroenie Publ., 1983, 616 p.

3. Kuprikov M.Yu., Dolgov O.S. Momentno-inertsionny faktor v formirovanii oblika samoleta [Moment and Inertial Factor in Shape Formation of the Plane]. Moscow, MAI Publ., 2008, 179 p.

4. Aralov G. When will regional aviation stand on its wing? Aviation EXplorer. 2012. Available at: http://www.aex.ru/docs/2/2012/9/19/1634 (accessed March 15, 2015).

5. Mandel I.D. Klasterny analiz [Cluster Analysis]. Moscow, Finansy and statistika Publ., 1988.

6. Berikov V.S., Lbov G.S. Current Tendencies in Cluster Analysis. Informatsionno-telekommunikatsionnye sistemy: Vseross. konkurs. otbor obzor.-analit. statey po prioritet. napravl. [All-Russian National Competitive Selection of Analytical Articles and Reviews on the Focus Area of “Information and Telecommunication Systems”]. 2008. Available at: http://www.ict.edu.ru/ft/005638/62315e1-st02.pdf (accessed January 12, 2015).

7. Characteristics of the Let L 410. Available at: http://www.let.cz/clanek_272_charakteristika-letounu-l-410.html (accessed February 2, 2015).

8. Vestyak A.V., Vestyak V.A., Tarlakovskiy D.V. Algebra i analiticheskaya geometriya [Algebra and Analytical Geometry]. Moscow, MAI Publ., 2007, vol. 2, 544 p.

9. Shlee M. Qt 4.8. Professionalnoe programmirovanie na C++ [Professional Programming in C++]. St. Petersburg, BKhV-Petersburg Publ., 2012.

10. Gamma E., Helm R., Johnson R., Vlissides D. Design Patterns. Elements of Reusable Object-Oriented Software. St. Petersburg, Piter Publ., 2015.

96

i Надоели баннеры? Вы всегда можете отключить рекламу.