Научная статья на тему 'Об использовании метода приближения облака точек квадратичными поверхностями в многомерном пространстве'

Об использовании метода приближения облака точек квадратичными поверхностями в многомерном пространстве Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
482
49
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ВИЗУАЛИЗАЦИЯ МНОГОМЕРНЫХ ДАННЫХ / МЕТОД ГЛАВНЫХ КОМПОНЕНТ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Сумин Д. А., Бондарев А. Е., Волобой А. Г.

В статье рассматривается приближенный метод анализа многомерных объёмов данных в задачах вычислительной газовой динамики. Предлагается развитие подхода, основанного на методе главных компонент, с целью улучшения качества решения и расширения класса решаемых задач. Предлагаемый метод предполагает отображение многомерного объёма данных в пространство главных компонент, аппроксимацию отображения поверхностями второго порядка и обратный переход к исходным координатам.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Об использовании метода приближения облака точек квадратичными поверхностями в многомерном пространстве»

Об использовании метода приближения облака точек квадратичными поверхностями в многомерном пространстве_

Об использовании метода приближения облака точек квадратичными поверхностями в многомерном пространстве

Сумин Д. А., Бондарев А. Е, Волобой А. Г.

Институт прикладной математики им. М.В. Келдыша РАН da. sumin(a),gmail. com, bond&keldysh. ru, voloboy(cp,gin. keldysh. ru Аннотация. В статье рассматривается приближенный метод анализа многомерных объёмов данных в задачах вычислительной газовой динамики. Предлагается развитие подхода, основанного на методе главных компонент, с целью улучшения качества решения и расширения класса решаемых задач. Предлагаемый метод предполагает отображение многомерного объёма данных в пространство главных компонент, аппроксимацию отображения поверхностями второго порядка и обратный переход к исходным координатам.

Ключевые слова: визуализация многомерных данных, метод главных компонент

1 Введение

На сегодняшний день большую актуальность имеют задачи обработки, анализа и визуализации многомерных данных. Необходимость работы с многомерными данными встаёт во многих областях. В частности, в [Bondarev et al., 2013; Бондарев и др., 2011] рассматриваются вопросы применения Data Analysis к многомерным решениям нестационарных задач вычислительной физики.

В статье [Бондарев и др., 2014] авторы предлагают применить метод главных компонент (РСА) для анализа многомерных данных в задачах вычислительной газовой динамики. Отличительной особенностью предложенного авторами подхода является следующее: тогда как в большинстве задач Data Analysis входные многомерные данные разбиваются на кластеры с целью дальнейшей классификации новых объектов, в рассматриваемой авторами задаче вычислительной газовой динамики стояла цель изучить зависимость вида хп = являющуюся набором многомерных данных и полученную в результате обработки экспериментальных данных.

Рассматриваемая в статье [Бондарев и др., 2014] задача может быть рассмотрена достаточно широко с прикладной точки зрения. Во многих практических задачах встаёт необходимость рассмотреть состояние системы в зависимости от некоторых «настроек», параметров составляющих её частей. В случае большого количества параметров оказывается невозможным применение классических методов визуализации данных с целью последующей оценки влияния каждого параметра на результирующую систему. Другой проблемой может

оказаться большая сложность проведения каждого эксперимента; тогда перебрать значительное количество всевозможных значений каждого из параметров системы оказывается достаточно сложной задачей. В этой ситуации было бы разумно попробовать использовать математический аппарат для интерполяции результатов экспериментов.

Метод главных компонент является одним из основных методов уменьшить размерность данных, потеряв при этом минимальное количество информации. Реализации метода главных компонент подробно описаны в [ОогЬап е! а1., 2007]. Применение метода главных компонент в визуализации данных описано в [Зиновьев, 2000]. Метод широко применяется при решении практических задач, в том числе, в экономике, эконометрике, биоинформатике, обработке изображений, сжатии данных.

2 Описание базового подхода

Авторы предложили понизить размерность исходного набора многомерных данных вида хп = F(;ri^..,^;ríi¡_1) с использованием метода главных компонент. Таким образом был произведен переход из «-мерного пространства (для задач вычислительной газовой динамики та не превышает 6) в трёхмерное пространство, для которого применимы традиционные способы анализа данных с использованием визуализации данных.

Схема базового подхода следующая:

• Вычислить три первые главные компоненты Уг, У2, У% для исходного набора данных. Каждая главная компонента есть линейная комбинация исходных переменных:

• Выразить координаты исходных точек в пространстве главных компонент:

• Аппроксимировать полученный набор точек в трёхмерном пространстве с помощью параметрически заданных плоскостей вида + Е2У2 + Е,У3 = Су.

• Произвести обратное преобразование полученной параметрической плоскости в исходное и-мерное пространство, получить уравнение вида Ег1х1 + Е'2х2 + —Ь Е'пх)Ъ = Сх.

Суть подхода заключается в том, что плоскость при таком переходе сохраняет свои свойства, и полученное в результате применения этого алгоритма выражение в исходных координатах можно рассматривать как искомую квазианалитическую зависимость.

В результате решения такой задачи появляется возможность предположить состояние системы при использовании некоторого нового

Об использовании метода приближения облака точек квадратичными поверхностями

в многомерном пространстве_

набора параметров системы, для которого не был произведен настоящий эксперимент, так как полученное решение является непрерывным.

Необходимо отметить, что в статье [Бондарев и др., 2014] предлагается находить аппроксимирующую плоскость визуально, не прибегая к автоматизации этого процесса.

3 Предлагаемый подход

Принимая во внимание актуальность задач, которые можно решать по предложенной в статье [Бондарев и др., 2014] схеме, эффективность применения метода главных компонент с последующей аппроксимацией результатов, рассмотрим вопрос о дальнейшем развитии этого подхода. Предлагаемое развитие заключается в двух аспектах:

• более точное приближение набора данных в главных компонентах поверхностями второго порядка;

• автоматизация процесса приближения.

По сути, необходимо по данному набору точек определить поверхность второго порядка, которой можно разумно приблизить данный набор точек. В такой постановке задача имеет решение, как показано в [Vaneo et al., 2008; Ruiz et al., 2013]. В этих статьях авторы решают задачу распознавания поверхностей второго порядка в облаках точек, полученных в результате трёхмерного сканирования объектов.

Специфика данных, полученных таким образом, заключается в большом количестве шума и отклонений. Возможность фильтрации шума и отклонений является актуальной и для решаемой задачи, так как очевидно, что полученный после операции понижения размерности набор данных скорее всего не является какой-то поверхностью второго порядка, но может быть ею приближен.

Первым шагом большинства алгоритмов определения уравнения поверхности второго порядка, наилучшим образом приближающей данный набор точек, является определение параметров кривизны поверхности в каждой точке исследуемого набора данных. Параметры кривизны описывают (в трёхмерном случае) отклонение поверхности от плоскости. Для определения параметров кривизны в определённой точке исходного набора данных необходимо выбрать способ выделения локальной окрестности точки; существуют следующие подходы: выбор в качестве окрестности к ближайших точек; выбор точек, находящихся на определённом расстоянии от рассматриваемой точки; глобальная триангуляция набора данных и другие (часть этих методов рассматривается в [Vaneo et al., 2008]).

Рисунок 1. Схема предлагаемого метода

Вопрос определения значений главной кривизны и главного направления для каждой точки некоторого объекта был достаточно подробно рассмотрен в статьях [Douros, Buxton, 2002; Hamann, 1993; Goldfeather et al., 2004; Krsek et al., 1998]. В работе [Hamann, 1993] рассматривается приближение триангулярного представления ближайших соседей рассматриваемой точки функцией z = f(x,y). Обобщение этой работы предложено в [Goldfeather et al., 2004]: определение приближающей функции производится для набора соседей по определённым нормалям в точках. В [Vaneo et al., 2008] авторы утверждают, что в проведённых синтетических тестах модификация алгоритма [Goldfeather et al., 2004] показала наилучшие результаты; модификация заключалась в подборе такого весового коэффициента, который обеспечивал наилучшую стабильность определения в условиях зашумленности входных данных.

После определения параметров кривизны в локальной окрестности каждой точки входного набора данных следует этап приближения набора данных поверхностью второго порядка. Одним из принятых подходов приближения является минимизация сумм абсолютных разностей (SAD):

(Pi — F)2 —> min,

где F — искомая функция второго порядка, P¡ — í-я точка рассматриваемого набора данных. В такой постановке для решения задачи минимизации необходимо перебрать бесконечное число различных функций F, поэтому существуют различные способы ограничить набор функций-кандидатов с использованием полученных на первом шаге параметров кривизны в каждой точке исходного набора точек. Часть таких методов рассмотрена в [Vaneo et al., 2008].

После нахождения искомой функции F, приближающей исходный параметрический набор данных в пространстве главных компонент поверхностью второго порядка, можно совершить обратное преобразование в пространство исходных координат. Общая схема предлагаемого подхода показана на Рисунке 1. Следует заметить, что может быть осмысленной дополнительная фильтрация данных после перехода в пространство главных компонент и до начала процедуры определения наилучшей приближающей поверхности; этот вопрос заслуживает дополнительного рассмотрения.

Об использовании метода приближения облака точек квадратичными поверхностями в многомерном пространстве_

4 Заключение

В статье предлагается дальнейшее развитие подхода к анализу многомерных данных, предложенного в работе [Бондарев и др., 2014]. Была рассмотрена общая схема подхода, предположительно обеспечивающего более качественные результаты и автоматизацию процесса решения задачи. Были рассмотрены существующие подходы к решению похожих задач, на базе которых предполагается реализовывать предлагаемое решение.

В ближайшее время планируется провести эксперименты с целью проверить практическую применимость предлагаемого подхода для решения многомерных задач вычислительной газовой динамики и, возможно, других практических задач.

Список литературы

[Bondarev et al., 2013] Bondarev A.E, Galaktionov V.A. Parametric Optimizing Analysis of Unsteady Structures and Visualization of Multidimensional Data // International Journal of Modeling, Simulation and Scientific Computing, Vol. 4, suppl. issue 1, 2013 [Douros, Buxton, 2002] Douros I., Buxton B. F.: Three-dimensional surface curvature estimation using quadric surface patches. Scanning (2002).

[Goldfeather et al., 2004] Goldfeather J., Interrante V.: A novel cubic-order algorithm for approximating principal direction vectors. ACM Transactions on Graphics 23,2004,45-63. [Gorban et al., 2007] Gorban A., Kegl В., Wunsch D., Zinovyev A. (Eds.), Principal Manifolds for Data Visualisation and Dimension Reduction, LNCSE 58, Springer, Berlin -Heidelberg - New York, 2007.

[Hamann, 1993] Hamann В.: Curvature approximation for triangulated surfaces. Geometric Modelling, Computing Suppl. 8 (1993), 139-153.

[Krsek et al., 1998] Krsek P., Luk'acs G, Martin R.: Algorithms for computing curvatures from range data. In The Mathematics of Surface VIII (1998), Information Geometers. Winchester, UK, pp. 1-16.

[Бондарев и др., 2011] Бондарев А.Е., Галактионов В.А., Чечеткин В.М. Анализ развития концепций и методов визуального представления данных в задачах вычислительной физики // Вычислительная математика и математическая физика, 2011. -Т. 51,N4.-С. 669-683.

[Бондарев и др., 2014] А. Бондарев, В. Галактионов, JI. Шапиро. Анализ и визуализация многомерных данных в задачах вычислительной газовой динамики // Труды 24-й Международной Конференции по Компьютерной Графике и Машинному Зрению ГрафиКон'2014, Ростов-на-Дону, 30 сентября - 3 октября, с. 146-149. [Зиновьев, 2000] Зиновьев А. Ю. Визуализация многомерных данных, Красноярск, Изд. КГТУ, 2000. - 180 с.

[Vanco et al., 2008] М. Vanco, В. Hamann, G Brunnett, Surface reconstruction from unorganized point data with quadrics. Computer Graphics Forum, Eurographics Association (2008).

[Ruiz et al., 2013] Oscar Ruiz, Santiago Arroyave, Diego Acosta, Fitting of Analytic Surfaces to Noisy Point Clouds. American Journal of Computational Mathematics, 2013,3,18-26.

i Надоели баннеры? Вы всегда можете отключить рекламу.