Научная статья на тему 'Определение важности признаков при формировании паттернов в задаче классификации'

Определение важности признаков при формировании паттернов в задаче классификации Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
63
11
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Кузьмич Р.И.

Рассматривается важность каждого признака при формировании позитивных и негативных паттернов в задаче прогнозирования осложнения инфаркта миокарда фибрилляции желудочков.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Кузьмич Р.И.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

THE DETERMINATION OF FACTORS SIGNIFICANCE WHILE CREATING THE PATTERNS IN THE CLASSIFICATION TASK

The significance of each factor on positive and negative spectrum factors creation is considered in prediction task of myocardial infarction complication ventrical fibrillation.

Текст научной работы на тему «Определение важности признаков при формировании паттернов в задаче классификации»

Решетневские чтения

Результаты исследования расширения спектра сигналов, модулированных различными типами вейвлет-функций

Тип вейвлета Ширина полосы

Хаара 310 МГц

Симлета 320 МГц

Мейера 320 МГц

Гаусса 80 МГц

Морлета 300 МГц

Шеннона 650 МГц

Комплексный Морлета 71 МГц

Койфлета 520 МГц

Дискретная аппроксимация вейвлета Мейера 363 МГц

Мексиканская шляпа 360 МГц

Комплексный Гаусса 80 МГц

Частотный В-сплайновый 230 МГц

Фрактальный 530 МГц

Проведенный анализ показал, что использование вейв-лет-функций в качестве модулирующих существенно расширяет спектр формируемого сигнала и повышает его потенциальную помехоустойчивость. Наиболее эффективными являются фрактальный вейвлет и вейвлет Шеннона.

Библиографическая ссылка

1. Болотов Н. В., Ткач Ю. В. Генерирование сигналов с фрактальными спектрами // Журнал технической физики. Т. 76. 2006. Вып. 4. С. 91-98.

A. V. Kuzovnikov, A. L. Deryabin, V. A. Shatrov, V. Y. Bazhenov JSC «Academician M. F. Reshetnev «Information Satellite Systems», Russia, Zheleznogorsk

THE ESTIMATION OF EFFICIENCY OF EXPANSION OF THE BANDWIDTH OF THE SIGNALS MODULATED BY VARIOUS TYPES OF WAVELET-FUNCTIONS

The analysis of expansion methods of a signal spectrum with use of various type of modulating functions is carried out. It is shown that at modulation of nonharmonic catenarian signal there is an essential expansion of the formed signal spectrum.

© Кузовников А. В., Дерябин А. Л., Шатров В. А., Баженов В. Ю., 2010

УДК 519.68

Р. И. Кузьмич

Сибирский государственный аэрокосмический университет имени академика М. Ф. Решетнева, Россия, Красноярск

ОПРЕДЕЛЕНИЕ ВАЖНОСТИ ПРИЗНАКОВ ПРИ ФОРМИРОВАНИИ ПАТТЕРНОВ

В ЗАДАЧЕ КЛАССИФИКАЦИИ

Рассматривается важность каждого признака при формировании позитивных и негативных паттернов в задаче прогнозирования осложнения инфаркта миокарда - фибрилляции желудочков.

Рассмотрим задачу следующего вида. Имеется выборка данных, которая состоит из двух непересекающихся множеств и п-мерных векторов. Каждый вектор соответствует некоторому наблюдению. Компоненты векторов (называемые признаками, переменными, характеристиками или атрибутами) представляют собой результаты определенных измерений, тестов.

Задача состоит в том, чтобы для некоторого нового наблюдения, являющегося также вектором п переменных, определить, к какому классу он принадлежит.

В основе предлагаемого подхода к классификации данных лежит метод, происходящий из теории комбинаторной оптимизации и называемый логическим анализом данных.

В основе рассматриваемого метода лежит понятие паттерна. Позитивным паттерном называется подкуб пространства булевых переменных Б'2, который пересекается со множеством и не имеет общих элементов со множеством Негативный паттерн задается аналогично [1].

Математические методы моделирования, управления и анализа данных.

Метод анализа данных рассмотрим на примере прогнозирования осложнения инфаркта миокарда -фибрилляции желудочков.

Для проведения испытаний использовалась выборка данных, состоящая из 70 пациентов с осложнением (позитивные объекты) и 70 пациентов без указанного осложнения (негативные объекты). Каждый пациент характеризовался 112 разнотипными признаками (бинарными, номинальными, метрическими). Пятнадцатая часть от выборки данных использовалась для контроля и в построении решающей модели не участвовала.

Проведены исследования с целью определения важности признаков при формировании позитивных и негативных паттернов в данной задаче классификации.

В результате исследований было получено расположение признаков в порядке увеличения частоты участия при формировании позитивных и негативных

Важность признаков при

паттернов. Приведем 5 самых важных признаков и 5 признаков, которые не встречаются при построении паттернов в данной задаче классификации (табл. 1, 2).

По результатам, указанным в табл. 1, 2, можно увидеть, какие признаки являются важными при формировании позитивных и негативных паттернов, какие не встречаются при формировании паттернов, какие встречаются при формировании негативных и отсутствуют при построении позитивных факторов. Необходимо проведение дальнейших исследований, которые помогут выявить, как повлияет на точность прогноза исключение признаков, не встречающихся при формировании паттернов.

Библиографическая ссылка

1. Масич И. С. Комбинаторная оптимизация в задаче классификации // Системы управления и информационные технологии. 2009. № 1, 2 (35). С. 283-288.

Таблица 1

зении позитивных паттернов

Название признака Расшифровка названия Важность, %

NA R 2 Применение наркотических анальгетиков в ОРиИТ во 2-е сутки 29,69

TIME_B_S Время, прошедшее от начала ангинозного приступа до поступления в стационар 28,13

STENOK AN Стенокардия напряжения в анамнезе 23,44

GB Наличие гипертонической болезни 23,44

ANT IM Наличие инфаркта передней стенки левого желудочка 23,44

SIM GIPER Симптоматическая гипертония 0

NR 11 Нарушения ритма в анамнезе 0

NP_05 Блокада передней ветви левой ножки пучка Гиса в анамнезе 0

D AD ORIT Диастолическое АД по данным ОРиИТ 0

B BLOK S Прием блокаторов в ОРиИТ 0

Важность признаков при построении негативных паттернов Таблица 2

Название признака Расшифровка названия Важность, %

D AD ORIT Диастолическое АД по данным ОРиИТ 65,45

AST BLOOD Содержание № в сыворотке крови 36,36

ENDOCR 01 Сахарный диабет в анамнезе 25,45

TIME_B_S Время, прошедшее от начала ангинозного приступа до поступления в стационар 21,82

LIDSN Введение лидокаина в ОРиИТ 21,82

SIM GIPER Симптоматическая гипертония 0

NR 11 Нарушения ритма в анамнезе 0

NR 02 Желудочковая экстрасистолия в анамнезе 0

FIBR TER 03 Проведение фибринолитической терапии стрептодеказой 3 млн ед 0

NA_KB Применение наркотических анальгетиков кардиобригадой 0

R. I. Kuzmich

Siberian State Aerospace University named after academician M. F. Reshetnev, Russia, Krasnoyarsk

THE DETERMINATION OF FACTORS SIGNIFICANCE WHILE CREATING THE PATTERNS IN THE CLASSIFICATION TASK

The significance of each factor on positive and negative spectrum factors creation is considered in prediction task of myocardial infarction complication - ventrical fibrillation.

© Кузьмич Р. И., 2010

i Надоели баннеры? Вы всегда можете отключить рекламу.