Научная статья на тему 'Снижение размерности данных нейросетевым подходом с использованием метода визуализации t-SNE'

Снижение размерности данных нейросетевым подходом с использованием метода визуализации t-SNE Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
396
40
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
T-SNE / СНИЖЕНИЕ РАЗМЕРНОСТИ / ВИЗУАЛИЗАЦИЯ / НЕЙРОННЫЕ СЕТИ / DIMENSIONALITY REDUCTION / VISUALIZATION / NEURAL NETWORKS

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Становов В.В., Семенкин Е.С., Шкраба А.

Предлагается новый подход к снижению размерности посредством применения метода визуализации t-SNE и нейронной сети. Полученные результаты подтверждают эффективность метода для многомерных проблем, которые часто возникают в аэрокосмической области.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

DATA DIMENSIONALITY REDUCTION WITH NEURAL NETWORK APPROACH USING T-SNE VISUALISATION METHOD

In this paper a new approach to dimensionality reduction using a visualization method t-SNE and a neural network is proposed. The received results confirm the effectiveness of the method for multidimensional problems, which often appear in aerospace industry.

Текст научной работы на тему «Снижение размерности данных нейросетевым подходом с использованием метода визуализации t-SNE»

В результате расчетов был получен алгоритм расчета вихревых пульсаций давления в гасителях колебаний. По результатам нестационарного расчета получены акустические характеристики вихревого течения. В результате моделирования было установлено, что разработанная методика позволяет получить адекватные результаты при расчете вихревых течений в гасителе колебаний.

Библиографические ссылки

1. Lighthill M. J. On sound generated aerodynamically. I. General theory. Proc. Roy. Soc. London. 1952. A211. P. 564-587.

2. Lighthill M. J. On sound generated aerodynamically. II. Turbulence as a source of sound. Proc. Roy. Soc. London. 1954. A222. P. 1-32.

3. Зарембо Л. К., Красильников В. А. Введение в нелинейную акустику. М. : Наука, 1966. 520 c.

4. Смольяков А. В. Шум турбулентных потоков. СПб. : ЦНИИ им. акад. А. Н. Крылова, 2005. 312 с.

5. Смольяков А. В. Интенсивность акустического излучения турбулентного пограничного слоя на пластине // Акустический журнал. 1973. Т. 19. № 2. С. 251-256.

6. Смольяков А. В. Спектр квадрупольного излучения плоского турбулентного пограничного слоя // Акустический журнал. 1973. Т. 19, № 3. С. 420-425.

References

1. Lighthill M. J. On sound generated aerodynamically. I. General theory. Proc. Roy. Soc. London : A211, 1952. P. 564-587.

2. Lighthill M. J. On sound generated aerodynamically. II. Turbulence as a source of sound. Proc. Roy. Soc. London : A222, 1954. P. 1-32.

3. Zarembo L. K., Krasil'nikov V. A. Vvedenie v nelineynuyu akustiku [Introduction to nonlinear acoustics]. Moscow, Nauka Publ., 1966, 520 p.

4. Smol'yakov A. V. Shum turbulentnykh potokov [Noise turbulence]. St. Petersburg : Krylov Shipbuilding Research Institute Publ., 2005. 312 p. (In Russ.)

5. Smol'yakov A. V. Intensivnost' akusticheskogo izlucheniya turbulentnogo pogranichnogo sloya na plastine [The intensity of the acoustic emission of the turbulent boundary layer on the wafer]. Journal of Acoustics, 1973. Vol. 19, № 2. P. 251-256.

6. Smol'yakov A. V. Spektr kvadrupol'nogo izlucheniya ploskogo turbulentnogo pogranichnogo sloya [The range of quadrupole radiation plane turbulent boundary layer]. Journal of Acoustics, 1973. Vol. 19, № 3. P. 420-425.

© Романов К. А., Кондрашов С. В., Макарьянц Г. М., 2016

УДК 519.87

СНИЖЕНИЕ РАЗМЕРНОСТИ ДАННЫХ НЕЙРОСЕТЕВЫМ ПОДХОДОМ С ИСПОЛЬЗОВАНИЕМ МЕТОДА ВИЗУАЛИЗАЦИИ T-SNE

В. В. Становов1*, Е. С. Семенкин1, А. Шкраба2

'Сибирский государственный аэрокосмический университет имени академика М. Ф. Решетнева Российская Федерация, 660037, г. Красноярск, просп. им. газ. «Красноярский рабочий», 31

2Мариборский университет, факультет организационных наук Словения, 4000, г. Крань, Кидричева цеста, 55а E-mail: vladimirstanovov@yandex.ru

Предлагается новый подход к снижению размерности посредством применения метода визуализации t-SNE и нейронной сети. Полученные результаты подтверждают эффективность метода для многомерных проблем, которые часто возникают в аэрокосмической области.

Ключевые слова: t-SNE, снижение размерности, визуализация, нейронные сети.

DATA DIMENSIONALITY REDUCTION WITH NEURAL NETWORK APPROACH USING T-SNE VISUALISATION METHOD

V. V. Stanovov1*, E. S. Semenkin1, A. Skraba2

:Reshetnev Siberian State Aerospace University 31, Krasnoyarsky Rabochy Av., Krasnoyarsk, 660037, Russian Federation ^University of Maribor, Faculty of Organizational Sciences 55a, Kidriceva cesta, Kranj, 4000, Slovenia E-mail: vladimirstanovov@yandex.ru

In this paper a new approach to dimensionality reduction using a visualization method t-SNE and a neural network is proposed. The received results confirm the effectiveness of the method for multidimensional problems, which often appear in aerospace industry.

Keywords: t-SNE, dimensionality reduction, visualization, neural networks.

<Тешетневс^ие чтения. 2016

На сегодняшний день разработано множество методов снижения размерности и предобработки имеющихся данных. Среди них можно выделить методы, отбирающие информативные признаки, т. е. производящие feature selection, и методы, формирующие новые признаки из уже имеющихся. К последним можно отнести, к примеру, широко известный метод главных компонент, а среди методов отбора признаков - методы последовательного включения и исключения признаков. В последнее время популярными становятся нейросетевые подходы к автоматическому формированию информативных признаков, с последующим использованием полученных признаков для классификации, аппроксимации либо других задач. Среди методов выбора информативных признаков существует ряд разработок с использованием эволюционных алгоритмов [1-3].

Помимо методов снижения размерности, которые создают правило, по которому исходные данные отображаются в пространство новых переменных, также существуют методы визуализации данных, которые позволяют лишь изобразить точки в двумерной плоскости с сохранением структуры. Одним из популярных методов визуализации является метод t-SNE, представленный в [3; 4]. Несмотря на то, что данный метод нашел широкое применение и может эффективно визуализировать многомерные структуры с сотнями и тысячами переменных, он является лишь методом визуализации и не предоставляет функции отображения в новое пространство переменных.

Одним из способов создания такого отображения может служить обучение нейронной сети, входами которой служат переменные задачи, а выходами - пере-

менные, созданные визуализацией ^ЫЕ. Для выяснения возможности применения подобного подхода была использована база данных рукописных текстов МККТ [5], которая широко используется в качестве тестовой задачи для методов машинного обучения.

Тестирование производилось следующим образом: сначала на обучающей выборке из 60000 измерений строилась визуализация данных с помощью ^ЫЕ с двумя переменными - выходами, затем на изначальных 784 входах базы данных и 2 выходах ^ЫЕ обучалась нейросеть с 200 нейронами на скрытом слое. Далее нейронная сеть, реализующая отображение в новое пространство двух переменных, использовалась, чтобы визуализировать тестовую выборку из 10000 измерений. Результаты визуализации представлены на рисунке. Номера классов в ходе эксперимента использовались только для раскраски.

По полученным результатам можно заключить, что, несмотря на то, что нейросеть восстановила существенно более размытое изображение, она позволила сохранить структуру кластеров и их взаимное расположение как на обучающей, так и на тестовой выборке. Полученные отображения возможно в дальнейшем использовать для автоматизированного проектирования причино-следственных моделей, так как это поможет развить интуицию пользователя при изучении модели реального процесса [6]. Таким образом, предложенный подход может быть использован не только для визуализации уже имеющихся данных, но также и для быстрого отображения новых данных в пространство меньшей размерности, что является важным достижением во множестве задач аэрокосмической отрасли.

Визуализация данных ^ЫЕ; выученная нейросетью модель на обучающей выборке и отображение, полученное нейросетью на тестовой выборке

References

1. Venkatadri M., Srinivasa Rao K. A multiobjective genetic algorithm for feature selection in data mining, International Journal of Computer Science and Information Technologies. 2010. Vol. 1, No. 5, pp. 443-448.

2. Brester C., Kauhanen J., Tuomainen T. P., Semenkin E., Kolehmainen M. Comparison of two-criterion evolutionary filtering techniques in cardiovascular predictive modelling. Proceedings of the 13th International Conference on Informatics in Control, Automation and Robotics (ICINCO'2016), Lisbon, Portugal, 2016. Vol. 1. P. 140-145.

3. L. J. P. van der Maaten, G. E. Hinton, Visualizing High-Dimensional Data Using t-SNE. Journal of Machine Learning Research, 9 Nov, pp. 2579-2605, 2008.

4. L. J. P. van der Maaten, Accelerating t-SNE using Tree-Based Algorithms. Journal of Machine Learning Research, 2014. 15 Oct, pp. 3221-3245.

5. LeCun Y., Bottou L., Bengio Y., Haffner P. Gradient-based learning applied to document recognition. Proceedings of the IEEE, 86, 1998. Pp. 2278-2324.

6. Semenkin E., Stanovov V., Fuzzy rule bases automated design with self-configuring evolutionary algorithm, ICINCO 2014 - Proceedings of the 11th International Conference on Informatics in Control, Automation and Robotics 11. 2014. C. 318-323.

© Становов В. В., Семенкин Е. С., Шкраба А., 2016

УДК 004.94

ПРОГРАММНО-МАТЕМАТИЧЕСКОЕ ОБЕСПЕЧЕНИЕ ДЛЯ УПРАВЛЕНИЯ КОМПЛЕКСОМ АВТОМАТИЗИРОВАННОГО КОНТРОЛЯ КРУПНОГАБАРИТНЫХ ОБЕЧАЕК

С ВАФЕЛЬНЫМ ФОНОМ

Е. А. Субботина

Южно-Российский государственный политехнический университет (НПИ) имени М. И. Платова Российская Федерация, 346428, Ростовская обл., г. Новочеркасск, ул. Просвещения, 132

E-mail: Katy504@yandex.ru

Рассматриваются основные задачи, которые должно решать программное обеспечение для управления комплексом автоматизированного контроля крупногабаритных обечаек с вафельным фоном. Данные конструкции используются в качестве топливных баков, панелей и отсеков космических аппаратов.

Ключевые слова: контроль геометрии, станки с ЧПУ, вафельный фон.

SOFTWARE OF THE AUTOMATED CONTROL OF THE GEOMETRIC DIMENSIONS

OF LARGE WAFER SHELLS

E. A. Subbotina

Platov South-Russian State Polytechnic University (NPI) 132, Prosveschenia Str., Novocherkassk, Rostov Region, 346428, Russian Federation

E-mail: Katy504@yandex.ru

Large wafer shells would be fuel tanks, compartments and panels of spacecraft. Developed system monitors their geometrical characteristics and thickness.

Keywords: measurement, CNC machine, wafer shells.

Применение вафельных обечаек в цилиндрических и конических топливных баках, отсеках и панелях космических аппаратов позволяет уменьшить массу конструкции по сравнению с гладкой в 1,5-2 раза. Характеристики данных изделий существенно зависят от способа и точности их изготовления [1].

Для контроля качества производства данных обечаек необходимо иметь возможность контроля их геометрических размеров.

Количество ячеек вафельного фона в обечайке зависит от их размеров и размера самой обечайки,

так, например, при размере ячеек 32*32 на цилиндрической обечайке диаметром 5,5 м и высотой 2 м количество ячеек достигает примерно 30 000. Так как количество ячеек довольно большое, то контроль их геометрии непосредственно человеком довольно труден, следовательно, необходимо двигаться в сторону автоматизации данного процесса. Автоматизация процесса измерения крупногабаритных обечаек повысит бы производительность и увеличит повторяемость и технологичность процедуры проведения измерений.

i Надоели баннеры? Вы всегда можете отключить рекламу.