Научная статья на тему 'Робастное планирование эксперимента в медицинских исследованиях'

Робастное планирование эксперимента в медицинских исследованиях Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
139
27
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Г В. Табунщик, Е В. Кирсанова

В статье исследуется зависимость показателей здоровья детей от степени загрязненности района проживания. Для решения данной задачи в работе используется робастное планирование эксперимента, так как требуется исключить влияние на показатели здоровья социально-бытовых факторов. Предложен метод формирования плана эксперимента, сочитающий основные концепции робастного планирования эксперимента и таблиц сопряженности.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

У статті досліджується зваємозв’язок показників здоров’я дітей від ступеню забруднення району проживання. Для вирішення данного завдання в роботі використовується робастне планування експерименту, тому що вимогається виключити вплив на показники здоров’я соціально-битових факторів. Запропонований метод формування плану експерименту, що поєднує основні концепції робастного планування експерименту та таблиць спряженості.

Текст научной работы на тему «Робастное планирование эксперимента в медицинских исследованиях»

динамических систем в реальном и ускоренном времени, поддерживает работу на параллельных и распределенных компьютерных системах на базе опера-цион-ных платформ Windows, Linux, Unix. Библиотека может быть использована в бортовых и встроенных мультипроцессорных системах управления динамическими объектами и технологическими процессами, а также сверхоперативных системах поддержки принятия решений для управления динамическими объектами.

ПЕРЕЧЕНЬ ССЫЛОК

1. Фельдман Л. П., Дмитриева О. А. Разработка и обоснование параллельных блочных методов решения обыкновенных дифференциальных уравнений на SIMD-структурах // Науков1 прац Донецького нацюнального техшчного ушверситету. - Донецьк, 2001. - Вип. 29. -С. 70-79.

2. Пиза Н. Д., Кудерметов Р. К. Решение задачи моделирования движения космического аппарата на параллельных вычислительных системах // Высокопроизводительные параллельные вычисления на кластерных системах. Материалы IV международного научн.-прак-тич. семинара / Под ред. чл.-кор. РАН В. А. Сойфера. -Самара: «Издательство СНЦ РАН», 2004. - С. 226-232.

Надшшла 16.01.06 Шсля доробки 2.03.06

В cmammi подана 6i6niomeKa функцт для моделювання складных duHaMinHux o6'eKmie на паралельних обчислю-вальних cucmемaх. Як бaзoвi aлгoрumмu бiблiomекa вико-pucmoeye паралельт блoчнi Memodu. Для oргaнiзaцi'i o6-мiнy дaнuмu Mix пapaлeльнuмu npo^copaMu ernopucmo-вyemьcя cmaндapm MPI.

In the article the software library for the simulation of complicated dynamic objects on parallel computing systems is represented. Parallel block methods are used as base algorithms in the library. MPI standard is applied for implementation of the data exchange among the parallel processors.

УДК 519.2:681.3

Г. В. Табунщик, Е. В. Кирсанова

РОБАСТНОЕ ПЛАНИРОВАНИЕ ЭКСПЕРИМЕНТА В МЕДИЦИНСКИХ

ИССЛЕДОВАНИЯХ

В статье исследуется зависимость показателей здоровья детей от степени загрязненности района проживания. Для решения данной задачи в работе используется робастное планирование эксперимента, так как требуется исключить влияние на показатели здоровья социально-бытовых факторов. Предложен метод формирования плана эксперимента, сочитающий основные концепции ро-бастного планирования эксперимента и таблиц сопряженности.

ВВЕДЕНИЕ

Региональные экологические проблемы, сформировавшиеся в результате загрязнения окружающей среды, однозначно оказывают влияние на состояние здоровья населения, в том числе и на показатели здоровья детей. Однако оценка этого влияния представляет совсем непростую задачу. Это обусловлено тем, что часто при проведении исследований измерения выполняются с использованием номинальных и порядковых шкал. Это приводит к тому, что большинство классических методов используются в доказательной медицине довольно редко, в частности это относится и к теории планирования эксперимента (ПЭ).

Однако развитие информационных технологий стимулирует развитие таких статистических методов как ПЭ, так как снижается трудоемкость выполняемых вычислений [1]. Примером может служить робастное

© Табунщик Г. В., Кирсанова Е. В., 2006

планирование эксперимента (РПЭ) [2], которое значительно расширяет область применения классической теории ПЭ.

1 ПОСТАНОВКА ЗАДАЧИ ИССЛЕДОВАНИЯ

При изучении воздействия уровня загрязненности различных районов проживания на показатели здоровья населения перед исследователем возникла задача проверить изменяются ли показатели здоровья детей в возрасте от 7 до 10 лет в зависимости от района города. При этом требовалось, чтобы полученные результаты были устойчивы к социально-бытовым факторам.

Кроме района проживания в качестве исследуемых факторов были выбраны: возраст и пол детей. В качестве отклика решено рассматриваеть условный показатель здоровья - индекс напряженности.

На основе алгоритма нейросетевой оценки информативности признаков среди здоровьеформирующих, экологических и социально-бытовых, были определены наиболее значимые [3].

Среди значимых социально-бытовых признаков для дальнейших исследований были выбраны следующие: занимается ли ребенок спортом (1 - да, 2 - нет); средний доход на 1 члена семьи в месяц (1 - до 100 грн;

2 - от 101 до 500 грн; 3 - от 501 до 1000 грн; 4 - более 1000 грн); курит ли отец (1 - да, 2 - нет); курит ли мать (1 - да, 2 - нет); образование матери на момент родов (1 - высшее, 2 - незаконченное высшее, 3 - среднее специальное, 4 - среднее, 5 - начальное); тип семьи (1 - полная, 2 - неполная); сколько раз употребляет ребенок мясопродукты в день (1 - 5-7, 2 - 3-4, 3 - 1-2, 4 - 0).

Как видно, социально-бытовые факторы измерялись с использованием порядковых и номинальных шкал, что изначально ограничивает возможности анализа. Так как для анализа данных, измеренных в номинальных и порядковых шкалах, в основном применяются непараметрические методы, то в работе [4] был проведен анализ эффективности данных методов для исследования зависимости социально-бытовых факторов от района проживания. Поскольку полученные результаты не согласовались между собой, то для решения поставленной задачи было решено использовать РПЭ.

2 РОБАСТНОЕ ПЛАНИРОВАНИЕ

ЭКСПЕРИМЕНТА

Робастное ПЭ позволяет заложить устойчивость отклика к шумовым воздействиям при проведении эксперимента [2].

При использовании РПЭ меняется традиционная схема планирования эксперимента, так как кроме матрицы планирования для исследуемых параметров используется матрица планирования для шум-факторов.

Под исследуемым техническим объектом в РПЭ понимается объект, схематическое изображение которого представлено на рис. 1, где X - входные параметры, H - исследуемые виды шумовых воздействий, s -случайные возмущения, Y - показатель качества технического объекта.

В работе [2] предложена классификация шум-факторов в зависимости от направленности. То есть, из

множества шумовых воздействий будем рассматривать подмножество шум-факторов Ь = (Ь1; Ц, Ьз) , где Ь -шум, воздействующий на входные параметры; Ь2 -шум, воздействующий на выходную характеристику; Ьз - шум, воздействующий на исследуемый сложный технический объект в целом. В тех случаях, когда прямая направленность шумовых воздействий не известна, мы будем говорить о воздействии шумов на исследуемый технический объект в целом.

Пусть исследуемый технический объект в соответствии со стратегией робастного планирования эксперимента [2] описывается выражением:

У

fT(Xv..., Xm; Hx,..., Hp ).®T + s, (1)

где у - зависимая переменная; © - вектор неизвестных параметров; f (Х^..., Хт; И^ ..., Ир )•© =

= {Л(Х1, .••, Хт;И1, -•> ИР)>-•> ЫХ1'.--' Хт;И1, -•> ИР)} - вектор известных функций; т - количество входных параметров; р - количество контролируемых шум-факторов.

Результаты N наблюдений У1,..., уы дают с ошибками еи(и = 1, ..., N) значения

nud = n(Xu\,---> Xum';Hl\, Hl,

(2)

где Хи1 , ., Хит - значения, которые принимают соответственно переменные Х1, ., Хт в и-м эксперименте; Иц,..., Ир - значения, которые принимают соответственно в 1-м опыте переменные, соответствующие шум-факторам И^ ..., Ир .

В соответствии со стратегией робастного планирования эксперимента, кроме матрицы плана (МП) для контролируемых параметров

X11 X1m

X • • • X

n11 • * * n1m

используется МП для шум-факторов

lll'l

sr y = f(X,H)+s Y

lit . 1

Рисунок 1 - Технический объект

D

H

H11 •" H1 p

Xn21 L X

n2P

где щ, П2 - соответственно количество опытов в МП для контролируемых параметров и шум-факторов. Тогда

X

H

f1 (Xn, ..., X1 m;H11, ..., H1 p ) L fk( X11.....X1m;Hn21'.' Hn2p )

f1 (Xnt1' ■••> Xntm;H11' ■••> H1 p) •" fk(Xnt1' ■■■' Xntm;Hn21, ■••> Hn2p)

Запишем модель исследуемого технического объекта

У = X „® + 8,

(3)

где 8 - матрица неконтролируемых шум-факторов, для которых, как и ранее, будем полагать Е 81 = 0; Е 8^8у = = 0; Е82 = ст2, г,/ = 1, ..., N. Соответственно

У

у11 У\ъ

Уп,\ уп1п2

(4)

Рассмотрим способ формирования плана эксперимента для поставленной задачи.

3 ПОСТРОЕНИЕ ПЛАНА ЭКСПЕРИМЕНТА ДЛЯ ЗАВИСИМОСТИ ПОКАЗАТЕЛЕЙ ЗДОРОВЬЯ ДЕТЕЙ ОТ РАЙОНА ПРОЖИВАНИЯ

Для контролируемых факторов, приведенных в таблице 1, построим МП Dx, соответствующую ортого-111

нальной таблице ¿16 (2 3 4 ).

Таблица 1 - Контролируемые факторы

Факторы Кол-во уровней

1 Район проживания 3

2 Б2 Пол 2

3 Б3 Возраст ребенка 4

Социально-бытовые факторы, приведеные в таблице 2, будем рассматривать как внешний шум Ь2.

Таблица 2 - Шум-факторы

Факторы Кол-во уровней

1 Е1 Занимается ли ребенок спортом 2

2 Е2 Средний доход на 1 члена семьи в месяц 4

3 Е3 Курит ли отец 2

4 Е4 Курит ли мать 2

5 Е5 Образование матери на момент родов

6 Е6 Тип семьи 2

7 Е7 Сколько раз употребляет ребенок мясопродукты в день 4

Поскольку значения факторов представлены в номинальных и порядковых шкалах, то для формирования МП возможно использовать принцип таблиц сопряженности [5].

Одним из свойств таблиц сопряженности является то, что матрицы эксперимента, построенные на их основании, предствляют планы полного факторного эксперимента, в которых присутствуют все варианты сочетаний значений уровней между собой и вследсвие этого все главные эффекты и эффекты взаимодействий ортогональны между собой [6].

Для матрицы планирования Dx построим вспомага-тельные матрицы Ъ^, ] = 1, ..., р, где р - количество контролируемых шум-факторов:

21 я

-п11

~п\я

где я - количество экспертов, которые участвуют в исследовании (для каждого шум фактора, количество опрашиваемых экспертов должно совпадать); -

значение уровней исследуемых признаков, к = 1,___, я,

I = 1, _, п1.

На основании таблиц сопряженности построим ортогональную таблицу ¿32(2 4 5 ) и вспомагатель-ные матрицы Ъ и У размерности п 1 х п2, где соответственно элемент 5ц - количество наблюдений из Zj, соответствующих условиям Dx и и элемент Ууц -сумма значений индекса напряженности, для наблюдений, которым соответствуют условия эксперимента, заданные матрицами Dx и г = 1, _, п 1; I = 1, _, п2.

В результате выражение (4) примет вид:

У

у 11 /г11 ■" у1 п/21 п2 уп11 /2п11 ■" уп1 п./2пхп2

(5)

4 РЕЗУЛЬТАТЫ АНАЛИЗА РОБАСТНЫХ ЭКСПЕРИМЕНТОВ

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

В соответствии с методом анализа результатов ро-бастного эксперимента [2] выражение (5) преобразовывается с использованием выражения

д (уг)

22

У г

где ст и ц - соответственно дисперсия и математичесо-ке ожидание для г-й строки У, и получен вектор

О =

У1 Уг У п.

который использовался в качестве отклика для дальнейшего анализа. По результатам РПЭ можно сделать

2

11

Ъ

вывод, что показатели здоровья детей возраста от 7 до 10 лет, проживающих в наиболее загрязненном районе города, значительно отличаются в худшую сторону относительно показателей здровья детей, проживающих в других районах.

ВЫВОДЫ

Для исключения зависимости социально-бытовых факторов от районов проживания для анализа данных было использовано робастное планирование эксперимента. Так как большинство факторов измеряются в номинальных и порядковых шкалах, для построения плана эксперимента использовались таблицы сопряженности, что позволило получить для матрицы планирования шум-факторов ортогональную таблицу.

Использование робастного планирования эксперимента для исследования влияния загрязненности района проживания на показатели здоровья детей позволило получить результаты, устойчивые к изменению социально-бытовых факторов.

ПЕРЕЧЕНЬ ССЫЛОК

1. Тюрин Ю, Н,, Макаров А, А, Анализ данных на компьютере. - М.: ИНФРА-М, - 2003. - 544 с.

2. Табунщик Г, В, Робастное планирование эксперимента в задачах моделирования технических объектов //

Радиоэлектрошка. ¡нформатика. Управлшня. - 2004. -№ 1. - С. 90-94.

3. Кирсанова Е. В., Субботин С. А. Обобщенный метод кластер-регрессионной аппроксимации в задаче моделирования показателя здоровья детей // Радюелектрошка. 1нформатика. Управлшня. - 2004. - № 1. - С. 62-67.

4. Tabunshchik G., Kirsanova O. Nonparametric Methods Analysis for Medico-ecological research // Proceedings of the International Conference TCSET'2006. - Lviv: Publishing house of Lviv Polytechnic. - 2006. - C. 657-658.

5. Флейс Дж. Статистические методы для изучения таблиц долей и пропорций. - М.: Финансы и статистика, 1989. - 319 с.

6. Лапач С. Н., Пасечник М. Ф., Чубенко А. В. Статистические методы в фамакологии и маркетинге фармацевтического рынка. - К.: ЗАТ «Укрспецмонтажпро-ект», 1999. - 312 с.

Надшшла 12.12.05 Шсля доробки 27.01.06

У cmammi досл1джуеться зваемозв'язок показнитв здоров'я dimeü eid ступеню забруднення району прожи-вання. Для вирШення данного завдання в робоmi вико-ристовуеться робacmнe планування eкcneримeнmу, mому що вимогаеться виключити вплив на показники здоров'я сощально-битових фaкmорiв. Запропонований метод фор-мування плану експерименту, що поеднуе основт кон-цепцп робастного планування експерименту та таблиць cnряжeноcmi.

The dependence between child's health rate and district fouling factor is under the study in the article. Because of necessity to exclude the influence of social factors on health rate, robust experimental design is offered for solving this task. Method for design construction based on basic concepts of robust design and contingency tables is described by the author.

i Надоели баннеры? Вы всегда можете отключить рекламу.