Научная статья на тему 'Визуализация медицинских данных на базе пакета NovoSpark'

Визуализация медицинских данных на базе пакета NovoSpark Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
469
111
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
МЕТОДЫ ВИЗУАЛИЗАЦИИ / МНОГОМЕРНЫЕ ДАННЫЕ / ПРЕДСТАВЛЕНИЕ ИНФОРМАЦИИ В ВИДЕ ГРАФИЧЕСКИХ ОБРАЗОВ / METHODS OF VISUALIZATION / THE MULTIVARIATE DATA / REPRESENTATION OF THE INFORMATION AS GRAPHIC IMAGES

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Шаропин Константин Александрович, Берестнева Ольга Григорьевна, Воловоденко Виталий Алексеевич, Марухина Ольга Владимировна

Мощным средством анализа информации являются интерактивные средства модификации графических представлений. В работе представлены различные подходы к визуализации результатов экспериментальных исследований. Приведены примеры решения прикладных задач с использованием NovoSpark Visualizer.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Шаропин Константин Александрович, Берестнева Ольга Григорьевна, Воловоденко Виталий Алексеевич, Марухина Ольга Владимировна

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

VISUALIZATION OF THE MEDICAL DATA ON THE BASIS OF PACKAGE NOVOSPARK

A powerful tool for analyzing information are interactive tools update graphic representations. The paper presents different approaches to visualize the results of experimental studies. Examples of solutions of applied problems using NovoSpark Visualizer

Текст научной работы на тему «Визуализация медицинских данных на базе пакета NovoSpark»

Лядов Максим Алексеевич E-mail: [email protected].

392000, г. Тамбов, ул. Мичуринская, 112 Д, кв. 206.

Тел. 89107529594. "

.

E-mail: [email protected].

392000, . , . , 36, 2, . 213.

.: 89050474067.

Frolov Sergej Vladimirovich

State-Owned Educational Establishment of Higher Vocational Education “Tambov State Technical University”.

E-mail: [email protected].

8, 103, Bazarnaya street, Tambov, 392000, Russia.

Phone: +79204817586.

Lyadov Maxim Alexeevich

E-mail: [email protected].

206, 112D, Michurinskaya street, Tambov, 392000, Russia.

Phone: +79107529594.

Farea G. Sultan

E-mail: [email protected].

Room 213, dormitory 2, 36, Nikiforovskaya street, Tambov, 392000, Russia.

Phone: +79050474067.

УДК 004.92:004.94

K.A. Шаропин, OX. Берестнева, BA. Воловоденко, O.B. Марухина

ВИЗУАЛИЗАЦИЯ МЕДИЦИНСКИХ ДАННЫХ НА БАЗЕ ПАКЕТА

NOVOSPARK*

Мощным средством анализа информации являются интерактивные средства модификации графических представлений. В работе представлены различные подходы к визуализации результатов экспериментальных исследований. Приведены примеры решения прикладных задач с использованием NovoSpark Visualizer.

; ; -

.

K.A. Sharopin, O.G. Berestneva, V.A. Volovodenko, O.V. Maruhina

VISUALIZATION OF THE MEDICAL DATA ON THE BASIS OF PACKAGE

NOVOSPARK

A powerful tool for analyzing information are interactive tools update graphic representations. The paper presents different approaches to visualize the results of experimental studies. Examples of solutions of applied problems using NovoSpark Visualizer.

Methods of visualization; the multivariate data; representation of the information as graphic images.

* Работа частично поддержана грантом РФФИ (проект № 08-06-00313а). 242

Введение. Визуализация данных - задача, с которой сталкивается в своей работе любой исследователь. К задаче визуализации данных сводится проблема представления в наглядной форме данных эксперимента или результатов теоретического исследования. Традиционные инструменты в этой области - графики и диаграммы -плохо справляются с задачей визуализации, когда возникает необходимость изобразить более трех взаимосвязанных величин. Визуализация должна быть одной из - , -аналитические процедуры принятия решений. Возможности инструментария визуализации (ИВ) определяяются областями его применения и конкретизируются совокупностями управленческих задач, решаемых с его помощью. Особенности ИВ определяются уникальностью и актуальностью концептуальной модели, на которой базируется методология и методика его построения. Возможности и особенности ИВ определяют архитектонику его программно-адгоритмического комплекса и структуру подсистемы его информационного обеспечения.

Современные компьютерные технологии используют широкий спектр методов визуализации информации. Легкость построения графиков и диаграмм с помощью ЭВМ все заметнее меняет когнитивные навыки исследователя. Современные пакеты анализа информации позволяют строить сотни типов различных графиков и диаграмм. Исследователь может одним взглядом обнаружить особенности, выявить закономерности и аномалии в больших объемах информации.

Мощным средством анализа информации являются интерактивные средства модификации графических представлений. Особенно широко графические методы используются в разведочном анализе данных, позволяя выявлять закономерности в многомерных массивах информации.

Визуализация экспериментальных данных, представленных в виде чи.

объектов обычно представлено в виде числовых таблиц. Методы визуализации такого рода информации основаны, как правило, на переходе от многомерной к двумерной системе координат (рис. 1) (метод главных компонент [1], методы структурного упорядочения [2] и др.).

Рассмотрим алгоритм формирования координат объектов в методе начального упорядочения [2].

Для оценки рассогласования структур в RL и R2 вычисляется матрица

DN (X) = Ыпк С взаимных расстояний ёпк между элементами Хп и Хк из вы-

В п-й строке такой матрицы записаны расстояния от некоторого п-го элемен-

к-го элемента. Любую п-ю строку матрицы DN(X) можно рассматривать как ре-

борки X:

та Хп до всех остальных (N-1) элементов множества {Хп Г , к-цы образован расстояниями от всех элементов множества

зультат упорядочения элементов

зультат упорядочения элементов относительно п-го элемента Хп путем

отображения этого множества на числовую ось действительных чисел Я+. Задавая на оси Я+ положение п-го элемента и принимая его за начало отсчета (точку Уп, координата которой на оси Я+ равна нулю), можно упорядочить образы

{Уп } выборки X на оси Я+ относительно и-го элемента, используя в качестве меры упорядочения расстояние от элемента Хп до всех остальных (N-1) элементов. Из точки Уп е Я+ (начало отсчета в Я+) построим перпендикулярно к оси Я+

другую числовую ось Я+, при этом к-й элемент выборки X расположим в точке

пересечения осей Я+ и , а на ось Я+ отобразим множество {Хп } , подобно

тому как это было осуществлено для оси Я+. Координаты элементов {Уп 1Г на

оси Я+ представляют собой расстояния от к-го элемента до всех остальных (N-1)

элементов и позволяют судить о группируемое™ векторов {Хп } около вектора

Хк. Эти две оси Я^ и Я+ определят некоторую псевдоплоскость (+) .

Таким образом, выбирая две любые строки (или два столбца) матрицы О^Х),

можно образовывать новые псевдопространства (+) образов {Уп Г множества

{Хп г {Хп } » (я *)2 совокупность

образов {У,} используется в качестве начального приближения для итерацион-.

0 50 100

Рис. 1. Отображение многомерных экспериментальных данных (переменных психофизиологического состояния различных групп беременных женщин) в новой

системе координат

Данный подход был использован авторами для визуализации экспериментальных данных в информационной системе оценки и мониторинга психофизиологического состояния беременных женщин [3].

Эффективность данного метода зависит от “хорошего” выбора строк матрицы Б^Х), который не должен быть совсем случаен. Выбор близких в RL элементов

Xn и Xk в качестве центров упорядочения остальных (N-1) элементов на осях Rn

и R+ нерационален, так как не дает существенно новой информации об упорядоченности выборки X, так что необходимо выбирать элементы X, относительно удаленные друг от друга. На рис. 1 представлен пример графического отображения многомерных данных, когда в качестве центров упорядочения нами выбраны «этадонный» объект (№1) (т.е. объект с наилучшими значениями переменных) и объект, имеющий «наихудшие» параметры (№124).

Визуализация многомерных экспериментальных данных на базе пакета NovoSpark Visualizer. Основной задачей визуализации данных является задача получения визуального образа, однозначно соответствующего набору данных. В пакете NovoSpark Visualizer (www.novospark.com) реализован предложенный . . , линейных конструкций: отрезок, ломаная линия, симплекс в многомерных про.

данных является вектор конечномерного пространства Rn:

A = (a0,ax,a2,...,an-1)e Rn. (1)

Для перехода от данного вектора к визуальному образу будет использоваться базис ортонормированных функций p (т)}”0. В качестве такого базиса можно использовать известные функции, в частности ортонормированные полиномы Лежандра на отрезке [0,1], множество которых мы обозначим через { (7)Г=0.

В этом случае точке с координатами A = (a0, a1, a2,..., an-1) можно поставить в соответствие функцию

n-1

Fa (т) = Z аЬ (Т). (2)

i=0

(1) (2) ,

(1) ,

Fa (Т) возможно представление в виде графика этой функции. Г рафик функции -

это структура, которая допускает визуальное представление на [0,1]. Между (1) и

(2) , . . -.

B = (b0, ^, b2 ,"^ bn -1) e Rn , (3)

то ему ставится в соответствие функция

n-1

FB (Т) = Z bl (Т). (4)

Будем считать, что функции FA (т) и FB (т) являются визуальными образами точек А и В, принадлежащих пространству Яп (рис. 2).

Если с векторами А и В связать точки их концов, а начала векторов разместить в начале координат пространства Яп , то получается взаимно-однозначная

связь между точками пространства Яп и функциями-образами FA (т) и FB (т) (рис. 3,6).

0

Р.

і і.

О

1

т

Рис 2. Визуальные образы точек А и В, принадлежащих пространству Яп

Рис. 3. Условное представление прямой Ь, проходящей через точки А и В в

пространстве Яп

Введем переменную Ъ и образуем линейное выражение

С( г) = (1 - г) А + ТВ = ((1 - г) а0 + гЬ0, (1 - г) а + гЪх,..., (1 - г) ап_х + гЪп_х). (5)

С(0) = А и С(1) = В.

Эта возможность дает право на рассмотрение функции С(г) как функции, представляющей многомерную прямую линию, проходящую через точки А и В в пространстве Яп .

Следовательно, мы можем рассматривать выражение, аналогичное (5), для представления отрезка АВ:

В

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

1_

Очевидно:

(6)

Из выражения (6) следует, что можно образовать функцию

п-1

і=0

,

{£,2"}. Это очень важно, так как дает возможность получения графика функции

FAB (£) = FAB (£, Г) , который является визуальным образом отрезка АВ (рис. 4). Таким образом, получается, что на квадрате [0,1]х[0,1] можно построить гладкую поверхность по формуле (7), которая будет однозначно соответствовать аналити-(6), .

1 Т

Рис. 4. Визуальное представление поверхности, соответствующей отрезку АВ

Таким образом, основой визуализационного подхода МоуоЗрагк является представление многомерного наблюдения в виде двумерного образа - кривой. При этом гарантируется, что близким по значениям наблюдениям А и В будут соответствовать визуально близкие образы-кривые; для сильно различающихся по значениям наблюдений их образы-кривые будут заметно отличаться.

ИоуоБратк У1шаИгет (разработка компании ИоуоБратк) - это современный ,

анализа с описательной мощью статистических методов и предоставляет наиболее полную информацию о многомерных данных. Продукт позволяет легко манипулировать загруженными наборами данных и пересчитывать модель и ее графическое , -ными. Используя этот инструмент, становится возможным автоматически классифицировать наблюдения, определять наиболее важные переменные в модели, производить кластеризацию данных, визуально сравнивать индивидуальные наблюдения и целые наборы данных, а также выполнять много других задач в работе с многомерными данными [4,5].

Заключение. Суть приведенных методов - повышение наглядности отображаемой медицинской информации. Результаты проведенных авторами экспериментальных педагогических и психофизиологических исследований позволяют , -ных направлений повышения эффективности методов анализа и представления многомерных медицинских данных.

БИБЛИОГРАФИЧЕСКИЙ СПИСОК

1. Дюк В А., Эммануэль В. Информационные т ехнологии в медико-биологических исследованиях. - СПб.: Питер, 2003. - 528 с.

2. Попечителев ЕЛ., Старцева О.Н. Аналитические исследования в медицине, биологии и экологии: Учебное пособие. - М.: Высшая школа, 2003. - 279 с.

3. Берестнева ОТ., Добрянская Р.Г., Муратова КА., Шаропин КА. Интеллектуальная система выявления групп риска среди беременных женщин // Информатика и системы управления. - 2008. - № 2 (16). - С. 22-23.

4. Ротарь ВТ., Лукьянец АЛ., Татарников ВЛ., Эйдензон Д.В. Особенности визуализации многомерных данных средствами Novospark Visualizer для бенчмаркинга теплоснаб-

//

управлении: Труды XIV Байкальской Всероссийской конференции. - Иркутск, 5-15 июля 2009. - Иркутск: ИСЭМ СО РАН, 2009. - С. 80-90.

5. . ., . ., . ., . ., . . -

// -

формационные системы и технологии (ИСТ-2010): Материалы XVI Международной научно-технической конференции. - Нижний Новгород, 23 апреля 2010. - Нижний Новгород: НГТУ, 2010.

Шаропин Константин Александрович

Национальный исследовательский Томский политехнический университет.

E-mail: [email protected].

634004, г. Томск, ул. Советская, 84/3.

Тел.: 83822426100'.

Берестнева Ольга Григорьевна

E-mail: [email protected].

Воловоденко Виталий Алексеевич E-mail: [email protected].

.: 83822420459.

Марухина Ольга Владимировна E-mail: marukhina@ tpu.ru.

Sharopin Konstantin Aleksandrovich

National Research Tomsk Polytechnic University.

E-mail: [email protected].

84/3, Sovetskaya street, Tomsk, 634004, Russia.

Phone: +73822426100.

Berestneva Olga Grigorevna

E-mail: [email protected].

Volovodenko Vitaliy Alexeevich

E-mail: [email protected].

Phone: +73822420459.

Maruhina Olga Vladimirovna

E-mail: marukhina@ tpu.ru.

i Надоели баннеры? Вы всегда можете отключить рекламу.