Научная статья на тему 'Проблемы очистки данных в пространствах большой размерности'

Проблемы очистки данных в пространствах большой размерности Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
63
20
i Надоели баннеры? Вы всегда можете отключить рекламу.
i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Проблемы очистки данных в пространствах большой размерности»

152

Секция 10

Список литературы

1. N. G. Zagoruiko, I.A. Borisova, V. V Dyubanov, О. А. Kutnenko. Methods of recognition based on the function of rival similarity // Pattern Recognition and Image Analysis. 2008. Vol. 18, № 1. P. 1-6.

2. Garey, M. and Johnson, D. Computers and Intractability: A Guide to the Theory of NP-Completeness. Freeman, New York, 1979.

Проблемы очистки данных в пространствах большой размерности

И. А. Борисова, О. А. Кутненко Институт математики им. С. Л. Соболева Email: biamia@mail.ru DOI: 10.24411/9999-017A-2020-10264

В анализе данных большая размерность задачи является фактором, накладывающим ряд ограничений на методы, пригодные для ее решения. С одной стороны, в число описывающих характеристик могут попадать нерелевантные, что приводит к усложнению поиска скрытых в этих данных закономерностей. С другой, многие метрические методы анализа данных в пространствах больших размерностей не работают. Помимо этого, часть алгоритмов имеет высокую трудоемкость, и их использование напрямую для задач большой размерности вызывает технические сложности.

В работе предлагается метод снятия части ограничений, накладываемых большой размерностью на задачу цензурирования (очистки) данных [1]. Для этого используется технология снижения размерности за счет выбора наиболее информативных признаков, основанная на использовании ансамблей. В результате исходная задача распадается на серию параллельно решаемых подзадач малой размерности. При этом цензурирование может осуществляться как в каждой подзадаче отдельно, так и после агрегирования результатов в общее решение, содержащее информацию как о признаках, наиболее релевантных для исходной задачи, так и об объектах, признанных выбросами. Предлагаемый подход использует функцию конкурентного сходства [2].

Работа выполнена при поддержке программы фундаментальных научных исследований СО РАН, проект № 0314-2019-0015.

Список литературы

1. Aggarwal C. C. Outlier analysis // Data Mining. Springer International Publishing. 2015. P. 237-263.

2. N. G. Zagoruiko, I.A. Borisova, V. V Dyubanov, О. A. Kutnenko. Methods of recognition based on the function of rival similarity // Pattern Recognition and Image Andysis. 2008. Vol. 18. № 1. P. 1-6.

Разработка системы распознавания жестового языка

Д. Г. Еникеев, С. А. Мустафина

Стерлитамакский филиал Башкирского государственного университета Email: cooldeepband@gmail.com DOI: 10.24411/9999-017A-2020-10265

В работе представлен обзор существующих методов распознавания жестовых языков. Исследованы аппаратные возможности сбора данных жестового языка: сенсорные перчатки, различные виды камер и специализированные видеоустройства. В качестве инструмента записи информации был выбран инфракрасный датчик движения рук Leap Motion [1], произведен обзор программного обеспечения и возможностей прибора. Создана архитектура нейронной сети распознавания дактильного жестового языка.

Работа выполнена при финансовой поддержке Российского фонда фундаментальных исследований и Правительства Республики Башкортостан (код проекта 17-47-020068).

Список литературы

1. Сайт датчика движения Leap Motion Controller. [Электрон. ресурс]. URL: https://developer.leapmotion.com/ (дата обращения: 20.01.2020).

i Надоели баннеры? Вы всегда можете отключить рекламу.