Научная статья на тему 'ПРОГРАММНАЯ РЕАЛИЗАЦИЯ МНОГОПОТОЧНЫХ ВЫЧИСЛЕНИЙ ПЛОТНОСТЕЙ ВЕРОЯТНОСТИ В НЕПАРАМЕТРИЧЕСКОМ АЛГОРИТМЕ АВТОМАТИЧЕСКОЙ КЛАССИФИКАЦИИ ДАННЫХ ДИСТАНЦИОННОГО ЗОНДИРОВАНИЯ'

ПРОГРАММНАЯ РЕАЛИЗАЦИЯ МНОГОПОТОЧНЫХ ВЫЧИСЛЕНИЙ ПЛОТНОСТЕЙ ВЕРОЯТНОСТИ В НЕПАРАМЕТРИЧЕСКОМ АЛГОРИТМЕ АВТОМАТИЧЕСКОЙ КЛАССИФИКАЦИИ ДАННЫХ ДИСТАНЦИОННОГО ЗОНДИРОВАНИЯ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
39
9
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
МНОГОПОТОЧНЫЕ ВЫЧИСЛЕНИЯ / АВТОМАТИЧЕСКАЯ КЛАССИФИКАЦИЯ / БОЛЬШИЕ ВЫБОРКИ / ДИСКРЕТИЗАЦИЯ ОБЛАСТИ ЗНАЧЕНИЙ МНОГОМЕРНЫХ СЛУЧАЙНЫХ ВЕЛИЧИН / ДАННЫЕ ДИСТАНЦИОННОГО ЗОНДИРОВАНИЯ / MULTITHREADED CALCULATIONS / AUTOMATIC CLASSIFICATION / BIG DATA / DISCRETIZATION OF VALUE AREA MULTIDIMENSIONAL RANDOM VARIABLES / REMOTE SENSING DATA

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Тубольцев Виталий Павлович, Авдеенок Валерий Леонидович

Ассматривается программная реализация многопоточных вычислений плотностей вероятности автоматической классификации данных дистанционного зондирования. Для обнаружения классов используются непараметрический алгоритм, основанный на дискретизации и анализе области значений многомерных случайных величин.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Тубольцев Виталий Павлович, Авдеенок Валерий Леонидович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «ПРОГРАММНАЯ РЕАЛИЗАЦИЯ МНОГОПОТОЧНЫХ ВЫЧИСЛЕНИЙ ПЛОТНОСТЕЙ ВЕРОЯТНОСТИ В НЕПАРАМЕТРИЧЕСКОМ АЛГОРИТМЕ АВТОМАТИЧЕСКОЙ КЛАССИФИКАЦИИ ДАННЫХ ДИСТАНЦИОННОГО ЗОНДИРОВАНИЯ»

ТЕХНИЧЕСКИЕ НАУКИ

ПРОГРАММНАЯ РЕАЛИЗАЦИЯ МНОГОПОТОЧНЫХ ВЫЧИСЛЕНИЙ ПЛОТНОСТЕЙ ВЕРОЯТНОСТИ В НЕПАРАМЕТРИЧЕСКОМ АЛГОРИТМЕ АВТОМАТИЧЕСКОЙ КЛАССИФИКАЦИИ ДАННЫХ ДИСТАНЦИОННОГО ЗОНДИРОВАНИЯ

Тубольцев Виталий Павлович,

студент 4 курса Научно-образовательного центра «Институт космических исследований и высоких технологий» ФГБОУ ВО «Сибирский государственный университет науки и технологий

имени академика М.Ф. Решетнева, Красноярск Авдеенок Валерий Леонидович, студент 4 курса Научно-образовательного центра «Институт космических исследований и высоких технологий» ФГБОУ ВО «Сибирский государственный университет науки и технологий

имени академика М.Ф. Решетнева, Красноярск

Аннотация. ассматривается программная реализация многопоточных вычислений плотностей вероятности автоматической классификации данных дистанционного зондирования. Для обнаружения классов используются непараметрический алгоритм, основанный на дискретизации и анализе области значений многомерных случайных величин.

Abstract. The article consider realization of multithreaded calculations of probability densities in automatic classification remote sense data. For the detection of classes used nonparametric algorithms based on discretization and analysis of value area multidimensional random variables.

Ключевые слова: многопоточные вычисления, автоматическая классификация, большие выборки, дискретизация области значений многомерных случайных величин, данные дистанционного зондирования.

Keywords: multithreaded calculations, automatic classification, big data, discretization of value area multidimensional random variables, remote sensing data.

Эффективное использование природных ресурсов требует развития информационных средств за их контролем. Наиболее совершенными средствами исследования природных ресурсов являются методы дистанционного зондирования (ДЗ) с привлечением аэрокосмических аппаратов. Поэтому разработка информационных средств комплексного анализа данных дистанционного зондирования, а также максимальное использование доступных вычислительных ресурсов является основой создания геоинформационных систем, обеспечивающих оперативность получения требуемой информации и поддержку в принятии управленческих решений. Их применение позволяет значительно повысить точность и оперативность решения задач принятия решений [1, 2].

В данной работе рассматривается программная реализация многопоточных вычислений плотностей вероятности непараметрического алгоритма автоматической классификации, ориентированная на обнаружение компактных групп наблюдений, соответствующих одномодальным фрагментам плотности вероятности случайных величин.

Многопоточные вычисления. Из основного потока (главной функции в которой выполняется программа) возможен запуск дополнительных (рабочих) потоков, которые будут выполняться параллельно с основным и другими потоками. Потоки, в отличии от процесса, не могут иметь собственных ресурсов, т.е. все запущенные потоки выполняются в одном и том же адресном пространстве своего процесса. Если в программе запускаются дополнительные потоки параллельно основному потоку, то приложение является многопоточным. Тут же возникает вопрос об эффективности использования многопоточных приложений над однопоточными.

Данным дистанционного зондирования характерны большие объемы информации. Современные системы съемки природных компонентов Земли обладают высоким пространственным и спектральным разрешением, что вызывает определенные трудности при использовании алгоритмов автоматической классификации.

При синтезе непараметрического алгоритма классификации данных дистанционного зондирования, основанного на сжатии данных, был реализован не только процесс сжатия объема исходной информации, но и организовано многопоточное вычисление принадлежности наблюдения тому или иному сектору исследуемого пространства признаков. При выполнении, алгоритм самостоятельно определяет то

количество свободных для вычисления потоков, которыми располагает, в свою очередь, центральный процессор компьютера.

Для работы многопоточной обработки данных была использована встроенная в язык C++ библиотека «thread» из которой был использован класс «std::thread».

Сравнительные тесты для проверки эффективности многопоточных вычислений выполнялись на компьютере с процессором Intel® Core™ i5-6200U CPU@2,4 GHz (2 ядра, 4 потока). Однопоточная и многопоточная версии программы были написаны на высокоуровневом языке C++ в среде разработки Microsoft Visual Studio 2019. Количество потоков в многопоточной версии равно 4.

Результаты применения.

9000 Е000 | 7000

а 6000

0

1 5000

U

| 4000

® 3000 г

J-2000 1000 о

0 200000 400000 600000 800000 1000000 1200000

Количество интервалов. шт

Рисунок 1 - График зависимости времени вычислений, в секундах от количества секторов.

1 - однопоточное вычисление. 2 - многопоточное вычисление.

2.1 2

1.9

■ХЭ

s i-s 11 -1 1.6 1.5

0 200000 400000 600000 800000 1000000 1200000 Количество интервалов. шт

Рисунок 2 - График зависимости относительной эффективности работы многопоточной версий программы к однопоточной от количества секторов.

На рисунке 1 видно, что многопоточный вариант программы имеет двукратное преимущество по времени выполнения вычислений, по сравнению с однопоточным вариантом. С ростом количества интервалов увеличивается эффективность многопоточного варианта относительно однопоточного, что иллюстрируют графики на рисунке 2.

Исследование выполнено при финансовой поддержке гранта РФФИ № 18-01-00251.

Список литературы:

1. Цыпкин Я. З. Основы теории обучающихся систем. М.: Наука, 1970. 251 с.

2. Васильев В. И., Эш С. Н. Особенности алгоритмов самообучения и кластеризации // Управляющие системы и машины. 2011. №3. С. 3-9

3. Лапко А. В., Лапко В. А., Хлопов А. Н. Непараметрический алгоритм автоматической классификации статистических данных // Изв. вузов. Приборостроение. 2011. Т.54, №4. С. 72-78.

4. Лапко А. В., Лапко В. А. Непараметрический алгоритм автоматической классификации в условиях статистических данных большого объема // Информатика и системы управления. 2018. Т. 57, №3. С. 59 -70.

5. Лапко А.В., Лапко В.А. Непараметрический алгоритм автоматической классификации многомерных случайных величин в условиях больших выборок // Решетневские чтения. 2018. Т. 1. № 22. С. 367-368.

6. Кадомский А. А., Захаров В. А. Эффективность многопоточных приложений // Научный журнал. 2016. № 7 (8). С. 26-28.

© Тубольцев В.П., Авдеенок В.Л., 2020

i Надоели баннеры? Вы всегда можете отключить рекламу.