Научная статья на тему 'Визуальное представление многомерных данных с использованием компьютерных моделей'

Визуальное представление многомерных данных с использованием компьютерных моделей Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
553
31
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
МНОГОМЕРНЫЕ ДАННЫЕ / МЕТОДЫ ВИЗУАЛИЗАЦИИ / СНИЖЕНИЕ РАЗМЕРНОСТИ / МНОГОМЕРНОЕ ПРЕДСТАВЛЕНИЕ ИНФОРМАЦИИ / MULTI-DIMENSIONAL DATA / IMAGING METHODS / DIMENSION REDUCTION / MULTI-DIMENSIONAL REPRESENTATION OF THE INFORMATION

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Погорелый Е. С.

Приведено краткое описание методов представления различного рода информации, в том числе и аэрокосмической, и данных большой размерности, способов снижения размерности данных и методов, позволяющих человеку воспринимать подобные данные.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

VISUAL REPRESENTATION OF MULTI-DIMENTIONAL DATA BY USING COMPUTER MODELS

This article reviews methods of representation of different kinds of information, including the aerospace, and high-dimensional data, ways to reduce the dimensionality of data and methods enabling a person to perceive such data.

Текст научной работы на тему «Визуальное представление многомерных данных с использованием компьютерных моделей»

References

1. Abenova Zh. Open source-technology: engineering support tools in the aerospace industry. Eurasian Union of Scientists (EUS), № 6(27), part 2, 2016, pp. 9-10.

2. Service Github - Repository for open source developments from NASA [Electronic resource]. URL: https://github.com/nasa (accessed: 15.09.2016).

3. National Aeronautic and Space Administration [Electronic resource]. URL: http://www.nasa.gov/ (accessed: 15.09.2016).

4. Kireenko S. G., Grinshpon I. Je. Jelementy teorii mnozhestv (ucheb. pos.). Tomsk, 2003. p. 42.

5. Gol'chevskij Ju. V., Severin P. A. Bezopasnoe web-programmirovanie: bezopasnost' CMS : ucheb. posobie. Syktyvkar : Izd-vo Syktyvkar. gos. universiteta, 2013, p. 68.

© Петров М. Н., Абенова Ж. С., Набиев Н. К., 2016

УДК 004.62

ВИЗУАЛЬНОЕ ПРЕДСТАВЛЕНИЕ МНОГОМЕРНЫХ ДАННЫХ С ИСПОЛЬЗОВАНИЕМ КОМПЬЮТЕРНЫХ МОДЕЛЕЙ

Е. С. Погорелый

Сибирский федеральный университет Российская Федерация, 660074, г. Красноярск, ул. Киренского, 26 E-mail: [email protected]

Приведено краткое описание методов представления различного рода информации, в том числе и аэрокосмической, и данных большой размерности, способов снижения размерности данных и методов, позволяющих человеку воспринимать подобные данные.

Ключевые слова: многомерные данные, методы визуализации, снижение размерности, многомерное представление информации.

VISUAL REPRESENTATION OF MULTI-DIMENTIONAL DATA BY USING COMPUTER MODELS

E. S. Pogorelyi

Siberian Federal University 26, Kirenskogo Str., Krasnoyarsk, 660074, Russian Federation E-mail: [email protected]

This article reviews methods of representation of different kinds of information, including the aerospace, and high-dimensional data, ways to reduce the dimensionality of data and methods enabling a person to perceive such data.

Keywords: multi-dimensional data, imaging methods, dimension reduction, multi-dimensional representation of the information.

Принятие решений является одной из сложных и ответственных составляющих человеческой деятельности. Многообразие целей, сложность задач, ограничения и неопределенность при обработке и представлении аэрокосмической информации требуют компьютерной поддержки процесса принятия решений. В настоящее время разработка компьютерных систем поддержки принятия решений (КСППР) представляет собой одно из интенсивно развивающихся направлений создания информационных систем [1]. В рамках поддержки решений используются различные технологии, среди которых следует указать на визуально-интерактивное моделирование (ВИМ), представляющее собой метод, который предполагает использование динамического дис-

плея, в котором пользователь может изменять параметры модели во время обычной работы и анализировать их последствия [2; 3]. Важным преимуществом ВИМ является то, что при использовании визуального отображения у пользователей имеется возможность следить за развитием событий, когда они происходили, что необходимо для выявления потенциальных ошибок [3].

Одной из проблем ВИМ является визуализация данных - задача, с которой сталкивается в своей работе любой исследователь. К задаче визуализации данных сводится проблема представления в наглядной форме каких-либо данных. Традиционные инструменты в этой области - графики и диаграммы -плохо справляются с задачей визуализации, когда

<Тешетневс^ие чтения. 2016

возникает необходимость изобразить более трех взаимосвязанных величин, т. е. наглядно визуализировать многомерные данные (МД) [1—2]. Существуют различные способы представления МД, одними из которых являются нечеткие методы представления данных. Одной из основных причин возникновения идеи нечеткого множества является так называемый принцип несовместимости, который заключается в том, что с увеличением размеров и сложности системы существенно усложняется ее моделирование с помощью известных математических выражений. Существенно возрастает число переменных и параметров, измерение и определение которых сильно затрудняется, а создание адекватной модели становится практически невозможным. Лотфи А. Заде предложил лингвистическую модель, которая использует не традиционные математические выражения, а слова, отражающие качество. Применение данного метода не обеспечивает такую же точность, какой обладают регулярные математические модели, но позволяет создать качественное описание системы [2].

В зависимости от количества используемых измерений методы визуализации принято разделять на представление данных либо до 3-х, либо в 4-х и более измерениях.

К первой группе методов относятся хорошо известные способы отображения информации, которые доступны для восприятия человеческим воображением. Практически любой современный инструмент DataMining включает способы визуального представления из этой группы. Следует заметить, что наиболее естественно человеческий глаз воспринимает двухмерные представления информации.

При использовании двух- и трехмерного представления информации пользователь имеет возможность увидеть закономерности набора данных, а именно, его кластерную структуру и распределение объектов на классы (например, на диаграмме рассеивания), топологические особенности, наличие трендов, информацию о взаимном расположении данных в наборе, существование других зависимостей, присущих исследуемому набору данных.

Если набор данных имеет более трех измерений, то возможны такие варианты [5]:

- использование многомерных методов представления информации;

- снижение размерности до одно-, двух- или трехмерного представления.

Существуют различные способы снижения размерности, один из них - факторный анализ. Для снижения размерности и одновременного визуального представления информации на двумерной карте используются самоорганизующиеся карты Кохонена [5].

Представления информации в четырехмерном и более измерениях недоступны для человеческого восприятия. Однако разработаны специальные методы для возможности отображения и восприятия человеком такой информации.

Наиболее известными способами многомерного представления информации являются параллельные координаты, «лица Чернова» и лепестковые диаграммы.

Также существует такой способ визуального представления МД, как гистограмма, которая является функцией, приближающей плотность вероятности некоторого распределения, построенной на основе выборки из него. Данный метод представления данных применяется для сравнения значений в течение некоторого периода или же соотношения величин. Следует отметить, что гистограммы подходят в основном для визуализации данных на начальном этапе статистической обработки и при увеличении числа значений снижается наглядность представления [1; 3]. Таким образом, гистограмма, как правило, подходит для малых выборок, независимо от их асимптотических свойств [2]. Однако David W. Scott говорит о том, что гистограммы могут предоставить массу информации для больших наборов данных, даже хорошо известных [5]. Данное утверждение лучше работает в случае использования многомерных гистограмм, которые непосредственно отображают распределение многомерных векторов, рассматриваемых как их плотности вероятностей, а также с гистограммами второго порядка, где каждый столбец является гистограммой.

Визуализировать данные, в том числе и многомерные, позволяют компьютерные модели, которые, в свою очередь, являются компьютерными программами, работающими на отдельном компьютере или множестве взаимодействующих компьютеров (вычислительных узлов), реализующими представление объекта, системы или понятия в форме, отличной от реальной, но приближенной к алгоритмическому описанию, включающей и набор данных, характеризующих свойства системы и динамику их изменения со временем.

Одну и ту же информацию можно представить при помощи различных средств. Для того чтобы средство визуализации могло выполнять свое основное назначение - представлять информацию в простом и доступном для человеческого восприятия виде - необходимо придерживаться законов соответствия выбранного решения содержанию отображаемой информации и ее функциональному назначению [4]. Иными словами, нужно сделать так, чтобы при взгляде на визуальное представление информации можно было сразу выявить закономерности в исходных данных и принимать на их основе решения [3]. Однако следует заметить, что в случаях визуализации данных большой размерности, большинство способов представления данных теряют в наглядности, лаконичности и своей пригодности для эффективного использования пропорционально увеличению размерности данных.

Библиографические ссылки

1. Попова О. А. Технология извлечения и визуализации знаний на основе численного вероятностного анализа неопределенных данных // Информатизация и связь. 2013. № 2. С.63-66.

2. Uglev V. A., Popova O. A., Dobronets B .S. The accuracy calculation control of reliability indices for equipment responsible appointment // International

Siberian Conference on Control and Communications, SIBCON-2015. 2015. С. 7147248.

3. Dobronets B., Popova O. Numerical probabilistic approach for data nonparametric analysis // Applied methods of statistical analysis. Nonparametric approach : Proceedings of the international workshop. 2015. С. 376384.

4. Popova O. A. Optimization problems with random data // Журнал Сибирского федерального университета. Сер. «Математика и физика». 2013. Т. 6. № 4. С. 506-515.

5. Scott D. W. Multivariate density estimation: theory, practice and visualization / Rice University. Houston, Texas, 1993.

References

1. Popova O. A. Tekhnologiya izvlecheniya i vizualizatsii znanii na osnove chislennogo veroyat-

nostnogo analiza neopredelennykh dannykh // Informatizatsiya i svyaz'. 2013. .№ 2. S. 63-66.

2. Uglev V. A., Popova O. A., Dobronets B .S. The accuracy calculation control of reliability indices for equipment responsible appointment // International Siberian Conference on Control and Communications, SIBCON-2015. Proceedings 2015. С. 7147248.

3. Dobronets B., Popova O. Numerical probabilistic approach for data nonparametric analysis // Applied methods of statistical analysis. Nonparametric approach. Proceedings of the international workshop. 2015. С. 376-384.

4. Popova O. A. Optimization problems with random data // Zhurnal Sibirskogo federal'nogo universiteta. Seriya: Matematika i fizika. 2013. T. 6. № 4. S. 506-515.

5. Scott D. W. Multivariate density estimation: theory, practice and visualization / Rice University, Houston, Texas, 1993.

© Погорелый Е. С., 2016

УДК 004.45

ПРОГРАММНАЯ АРХИТЕКТУРА АВТОНОМНОЙ РОБОТИЗИРОВАННОЙ ПЛАТФОРМЫ ДЛЯ ОБУЧЕНИЯ СТУДЕНТОВ

А. В. Саяпин*, А. Г. Зотин

Сибирский государственный аэрокосмический университет имени академика М. Ф. Решетнева Российская Федерация, 660037, г. Красноярск, просп. им. газ. «Красноярский рабочий», 31

E-mail: [email protected]

Студенты аэрокосмических университетов встречаются с трудностями в процессе изучения таких дисциплин, как «Системы нечеткой логики» и «Нейронные сети» в связи с их малой практической направленностью. Для устранения этого была разработана роботизированная платформа, программное обеспечение которой взаимодействует, используя протокол mqtt.

Ключевые слова: робот, обучение студентов, автономная платформа, программная архитектура, протокол mqtt, нечеткая логика.

PROGRAM SYSTEM ARCHITECTURE FOR AUTONOMOUS ROBOTIC PLATFORM

FOR EDUCATIONAL PURPOSES

А. V. Sajapin*, A. G. Zotin

Reshetnev Siberian State Aerospace University 31, Krasnoyarsky Rabochy Av., Krasnoyarsk, 660037, Russian Federation E-mail: *[email protected]

The students of aerospace universities face difficulties dealing with fuzzy logic systems and neural networks due to lack of practice. To make the disciplines more practical the robotic platform was developed. Its software includes a set of programs that interoperate using mqtt protocol.

Keywords: robot, education, autonomous platform, program architecture, mqtt protocol, fuzzy logic control.

Введение. В последнее время все более широкое распространение получают автономные системы, предназначенные для разведки местности, взятия образцов и т. п., при этом они находят применение не только на земле, но и в космосе [1]. В связи с этим

повышается спрос на специалистов, которые могли бы разрабатывать подобные системы. При разработке таких систем от специалиста требуются знания и навыки в различных областях, в том числе и в области микроконтроллерных систем. Для обучения студентов

i Надоели баннеры? Вы всегда можете отключить рекламу.