Научная статья на тему 'Динамическое регрессионное моделирование уровня заболеваемости'

Динамическое регрессионное моделирование уровня заболеваемости Текст научной статьи по специальности «Математика»

CC BY
91
16
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по математике, автор научной работы — Валеев Султан Галимзянович, Сергеев Евгений Сергеевич

Рассматривается подход к построению и адаптации моделей временных рядов на основе методологии динамического регрессионного моделирования. Представлены результаты построения моделей уровней заболеваемости населения г. Ульяновска ангиной

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Динамическое регрессионное моделирование уровня заболеваемости»

рота током, когда меняется знак частоты и фазовой скорости (при

к к

>-4 =

а

1 +а

/С /С /с

1+

1

Vi

-fa

) значение плотности потока энергии

попутной КЭГДВ отрицательно, что соответствует переносу волной энергии в направлении, противоположном направлению скорости дрейфа свободных носителей заряда. Положительное значение плотности потока энергии

1

встречной КЭГДВ при (4 = 5

к 1с. 1с • k

ласти обратных волн.

1 +

Vi

+ а

) соответствует об-

Рис. 1. Зависимости плотности энергии от отношения концентраций свободных носителей в переходе:

------ а=0,1;----- Д=0,5

Рис.2. Зависимости плотности потока энергии от отношения концентраций свободных носителей в переходе: ------д=0,1,----Ф Ш- а= 0,5

Прямые и обратные КЭГДВ имеют противоположные по знаку плотности потока энергии. Изменяя соотношение концентраций свободных носителей заряда п — п - переходе и плотности тока дрейфа, величиной и знаком плотности потока энергии КЭГДВ в некоторых пределах можно управлять.

т •

Работа поддержана ФЦП «Интеграция» (код проекта А - 0066).

СПИСОК ЛИТЕРАТУРЫ

1. Браже P.A., Садулин В.В. Контактные электрогидродинамические волны свободных носителей заряда на границе раздела двух полупроводниковых слоев //Изв. вузов. Радиофизика. 1997. Т. 40. № 9. С. 1164 - 1171.

2. Браже P.A., Мефтахутдипов P.M., Шустов М.И. Электрогидродинамические неустойчивости ъп-п иp-pv - переходах с продольным током дрейфа в низкоомном слое//

Тез. докл. шк.-сем. «Актуальные проблемы физической и функциональной электроники». Ульяновск, 2000.

3. Островский Л.А., Рыбак С.А., Цимринг JI.IJLI. Волны отрицательной энергии в гидродинамике //УФН. 1986. Т. 150. Вып. 3. С. 417-437.

Брюкв Рудольф Александрович, кандидат физико-математических наук, профессор, заведующий кафедрой «Физика» Ульяновского государственного технического университета, окончил радиотехнический факультет Саратовского государственного университета. Имеет статьи в области нелинейных волновых процессов.

Мефтахутдинов Руслан Максутович, аспирант Ульяновского государственного технического университета, окончил физико-технический факультет Ульяновского государственного университета. Имеет статьи в области нелинейных волновых процессов.

Шустов Михаил Иванович, аспирант Ульяновского государственного технического университета, окончил физико-технический факультет Ульяновского государственного университета. Имеет статьи в области нелинейных волновых процессов.

УДК 658.3.012.12

С.Г. В А ЛЕЕВ, Е.С.СЕРГЕЕВ

ДИНАМИЧЕСКОЕ РЕГРЕССИОННОЕ МОДЕЛИРОВАНИЕ УРОВНЯ ЗАБОЛЕВАЕМОСТИ

■в

Рассматривается подход к построению и адаптации моделей временных рядов на основе методологии динамического регрессионного моделирования. Представлены результаты построения моделей уровней заболеваемости населения г. Ульяновска ангиной.

ВВЕДЕНИЕ

В медицинской практике такие статистические методы, как регрессион-ный анализ (РА) и анализ временных рядов (АВР), применяются достаточно широко, особенно при эмпирическом анализе инфекционной и неинфекционной патологий. Задачами статистических исследований в медицине являются: а) обнаружение различного рода взаимосвязей между характеристиками патологических процессов, морфофункциональных изменений организма в результате терапии, эмпирических процессов при инфекционных заболеваниях и т.д., являющихся проявлением закономерностей явлений; б) разработка математических моделей этих процессов, позволяющих прогнозировать значения интересующих медиков характеристик процессов. Решение описанных выше задач позволяет наметить и реализовать лечебно-

. _

профилактические мероприятия и оценить их эффективность. Поскольку содержание и эффективность намеченных мероприятий напрямую определяются разрабатываемыми математическими моделями, достижение максимальной адекватности последних является актуальной проблемой при моделировании.

Объектом исследований в данной работе является один из временных рядов наблюдений за уровнем заболеваемости городского населения. Цель исследований - повышение степени адекватности моделей ВР на основе применения эффективного РМ-подхода [1,2] и обычно используемой методики обработки ВР. В соответствии с этим ставились и решались следующие задачи:

- обоснование методологии динамического регрессионного моделирования (ДРМ);

- разработка программного обеспечения;

- анализ и моделирование ВР.

ВРЕМЕННЫЕ РЯДЫ И МЕТОД НЕСМЕЩЕННЫХ КВАДРАТОВ

л

\ * Обобщая ситуацию, сложившуюся в практике обработки ВР [3-5], можно

отметить основные причины неполной адекватности разрабатываемых динамических моделей (моделей ВР): использование для оценки адекватности «внутренних» критериев качества; применение вычислительных схем МНК без анализа соблюдения условий нормальной схемы Гаусса - Маркова и соответствующей адаптации; использование упрощенных схем обработки ВР и пр. Отметим основные этапы обработки ВР, на которых могут быть применены схемы МНК и, следовательно, справедливы высказанные замечания.

Пусть (О, Р) - вероятностное пространство, на котором задан стационарный процесс наблюдаемый в равноотстоящие моменты времени

Г(/) = /(*)+ф(0+ф(0+е(0; 0)

где ), У(г2),..., У(1М) - ряд наблюдений случайной функции £,(/), называемой временным рядом; /(*) - неслучайная (долговременная) функция тренда; ср(?) - неслучайная (сезонная) периодическая функция; ф(/) - неслучайная (долговременная, циклическая) функция; в(^) - нерегулярная компонента (случайная величина, ошибка).

Выделение регулярных компонент ряда представляет вначале аппроксимацию /(/), ф(/), ф(/) в основном алгебраическими и тригонометрическими

полиномами достаточно низкой степени; могут быть использованы и различные нелинейные по оцениваемым параметрам выражения. Так что для оценивания применяется линейный или нелинейный МНК.

После первого регулярного представления остатки К^/) чаще всего об-

ременены автокорреляцией. Поэтому на следующем этапе пытаются выделить периодические сезонные и, если окажется возможным, долговременные циклические колебания ф(г), ф(/). Если для остатков У^?) постулируется гипотеза о возможности представления периодической функцией ф(?):

У1(0 = ФЙ+е(0, ' (2)

то ср(г) записывают в виде разложения в ряд Фурье, параметры которого, являясь функциями амплитуды и фазы гармоник, определяются путем решения МНК линейных схем уравнений. На этом этапе чаще всего возникают проблемы значимости разложения, содержащего более 50% шумовых гармоник.

После элиминирования второй регулярной функции ф(/) и частично ф(/), цель анализа ВР - моделирование случайных остатков Г2(г)=е(/) моделями

авторегрессии различных порядков, авторегрессии со скользящим средним и т.д., включая использование моделей мартингальной аппроксимации [6]. Для определения различных весовых коэффициентов в разложениях здесь также применяется МНК. Основной проблемой при этом является выбор критериев качества модели и устранения автокорреляций.

Итак, на всех этапах аппроксимации аддитивных функций правой части (1) коэффициенты модели прогноза представляют собой МНК-оценки. Для обеспечения свойств . состоятельности, несмещенности и эффективности МНК - оценок необходимо применение методологии регрессионного моделирования.

• .. щ, ш ш I ж^у ■ у ■

АЛГОРИТМИЧЕСКОЕ НАПОЛНЕНИЕ ДРМ

Множество алгоритмов, обеспечивающих решение задачи разработки модели прогноза (1), должно включать в основном алгоритмы конструирования аппроксимаций, оценивания и структурной идентификации; кроме того, оно должно включать в себя процедуры формирования как критериев (мер) качества аппроксимаций, так и критериев (аналитических и графических) выполнения условий применения вычислительных процедур моделирования ВР и РА-МНК, а также предусматривать инструменты адаптации к нарушениям условий.

Кратко отметим несколько процедур, программно реализованных и примененных при обработке ВР.

К алгоритмам предварительного анализа и обработки ВР относятся:

- процедуры расчета автокорреляционной функции, в частности, критерия Дарбина-Ватсона (0\У);

- процедуры проверки стационарности ряда (постоянства среднего значения по непараметрическому критерию сдвига; постоянства дисперсии по критериям Кокрена, рассеяния, инверсий; проверки стационарности по критерию х2).

Класс аппроксимирующих функций нами уже рассматривался (линейные

и трансцендентные модели, алгебраические и тригонометрические полиномы в виде рядов Фурье, авторегрессии (АР-модели), скользящие средние, мартингальные аппроксимации).

Вычислительные схемы МНК, структурной идентификации, критерии и инструментарий адаптации подробно описаны в [1]. Здесь же представляет интерес рассмотреть фильтрации статистически значимых гармоник в разложении ряда Фурье.

Запишем ф(г) и ф(?) в виде ряда Фурье

Ф =

' 2м

Т

Ч Л

+ Ф/

У

N

О)

где обычно к = Ы/2; - оцениваемые амплитуда и фаза гармоник;

7} = А/ • / — периоды гармоник.

Для решения переходят к системе

<рМ=X

1=7

/

А^гп

\

J

соя( ф.) + ф; ^о?

N

(4)

У

после чего путем замены н>;=А;Соя ф,-, V,-= ^ ми ф,. записывают систему уравнений, нелинейную относительно новых неизвестных:

ф(',)=1

1=1

т

Г

м>1 Бгп

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

ч /

ф('2)=£

/=1

Л У

/ А 4

+ V,- СОУ

/ \\ 2л:

У

£1П

ч

л.

+ V, С08

'л 44

4тг

у

(5)

фЫ=Х

/=1

/

51П

' N 2тгЧ

Ч * У

+ V; СОЯ

ч г, >

у

Решение системы (5) можно осуществить в два этапа: на первом, принимая к = N¡2, решается обычная система с числом уравнений, равным числу

неизвестных; на втором, полагая, например, к = N/10, что обеспечивает соблюдение условия регрессионного анализа о превышении числа уравнений количества неизвестных по меньшей мере в 5 раз, выбирается к гармоник с максимальной амплитудой; формируется и решается МНК система уравнений. Использование одного из методов структурной идентификации (в простейшем случае метода пошаговой регрессии) позволяет устранить из рассматриваемого множества шумовые гармоники. Адаптация к другим условиям применения РА-МГЖ зависит от степени их нарушения.

Вестник УлГТУ 3/2001

Возвращаясь к исходным параметрам А, <р, получают окончательное представление регулярной части ф(г)

г

\

/ _ N

т

К у

где т - количество статистически значимых гармоник.

г . \\ 2Ш

(6)

ПРОГРАММНОЕ ОБЕСПЕЧЕНИЕ

Программа ДРМ позволяет:

а) создавать файлы данных, модифицировать их (редактировать данные, добавлять/убирать столбцы и строки ТЭД), сохранять на диск для последующей работы;

б) анализировать выборки:

- графически (строить графики рассеяния, зависимости);

- проводить спектральный анализ;

- проводить анализ распределений на стационарность;

в) строить регрессионные модели:

простая регрессия (16 парных зависимостей);

- множественная регрессия (метод Хаусхольдера):

I ^ т •

гармоническая модель;

авторегрессионная модель (с фиксированным порядком или с выбором его в автоматическом режиме);

модель, основанная на методах диффузионного анализа;

г) сохранять остатки для дальнейшей работы с ними.

АНАЛИЗ И ДИНАМИЧЕСКИЕ МОДЕЛИ УРОВНЯ

ЗАБОЛЕВАЕМОСТИ

Описание исходных данных. В качестве объекта исследований были взяты данные по заболеваемости населения в целом по Ульяновску ангиной (в абс. единицах на 100 тыс. жителей). Ежемесячные данные собраны Ульяновским городским центром госсанэпидемнадзора [7] за последние 16 лет.

Анализ стационарности ряда. По всем рассмотренным ранее критериям гипотеза о стационарности ряда принимается.

Выделение тренда. Из набора в 16 моделей лучшей по Я-критерию оказалась модель /(() = А + 2. Параметры модели: А = 1,3673076,

В = -0,0000223. Коэффициент корреляции /? = -0,51; среднеквадратичное отклонение (СКО) 0,41; ОЛ¥=0,9, что говорит о наличии автокорреляции.

Последующая обработка ВР выполнялась в двух направлениях: а) строилась краткосрочная модель прогноза, оптимальная (минимальная) по СКО остатков; б) формировалась модель описания с целью прогноза сезонных колебаний.

Краткосрочная модель прогноза. Построение АР-моделей по остаткам от тренда приводит к следующим результатам: выбранный порядок АР-модели - 6.

Коэффициенты модели А1: 0,5485039, А2: 0,4110646, АЗ: 0,2911025, А4\ 0,3073200, А5: 0,1772583, Аб: 0,2374270. Среднеквадратичное отклонение: 0,50256. Коэффициент ВУ/: 0,4467.

Следующим шагом становится естественная попытка улучшить модель методом мартингалытой аппроксимации для удаления оставшихся автокорреляций. Строится следующая модель: У =-А-1 - В\Х\С), где А = 1,5 = 2,

С = 0,1. Среднеквадратичное отклонение: 0,05442.

Таким образом, конечная модель заболеваемости населения Ульяновской области ангиной с использованием метода выделения авторегрессионной модели выглядит следующим образом:

УГ = 0,493 - 0,0000286 • V2 +1,5485039 • Ум + 0,4110646 • У,_2 + 0,2911 • У(_3 +

+ 0,30732 • У,_4 + ОД77258• У(_5 + 0,237427• У,_6 - 2 • | |0,1 г

*' «

Модель прогноза сезонных колебаний. Следующим шагом является попытка построения той же модели, но уже с выделением гармонического тренда. Отправной точкой служат остатки линейного тренда.

На первоначальном этапе исследуется спектр и автокорреляционная функция остатков. Выбирается модель 6-го порядка (включающая 6 основных несущих гармоник).

Гармоника Период Амплитуда Фаза

1 12 0,0526 -0,0157 *

2 38 0,1909 0,24936

3 6 -0,0314 -0,03968

4 21 0,05296 0,06533

5 8 0,12488 0,08138

6 17,5 -0,0225 -0,0312 *

Среднеквадратичное отклонение: 0,43831. Коэффициент ХУ^ остатков: 0,7795.

Мартингальная аппроксимация остатков, не снимая проблематики невыделенных частот, уменьшает СКО, доводя его до 0,27: Параметр Значение А 0,1

В 5

С ОД

Среднеквадратичное отклонение: 0,27217.

Таким образом, можно говорить о построении конечной модели в виде:

. У, =0,493-0,0000286-*2 +

\

+ 0,0526 • лг т

0,0157

V

+ 0,19097-««

/

- 0,0314 • 5?«

271/ 12

2п( ^

--0,03968 +0,0529-эти 6 )■

/

ч

/

^ + 0,249!-38 )

\

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

V

/

+ 0,1249 • мл

\

2т 8

\

+ 0,081

/

21 2тгг

+ 0,0653

+

- 0,0225 • Бт --0,0312

V

17,5

+

/

0.1

+ 0,9-7м +5-|Км|.

ЗАКЛЮЧЕНИЕ

ма I

По результатам исследования различных динамических моделей заболеваемости населения г. Ульяновска ангиной (хроническим тонзиллитом), графиков автокорреляционных функций и результатов спектрального анализа выявлена общая тенденция к снижению среднесписочной численности страдающих этой болезнью людей в настоящее время, которая может являться частью глобального периодичесхого процесса; построены гармонические модели заболеваемости, позволяющие выделить периодику заболеваемости. Кроме традиционных для анализа временных рядов периодичностей в один год, 6 месяцев, квартал, отмечены возможные периодические всплески заболеваемости с периодом в 30 и более месяцев. Это подтверждает пшотезу с

существующих глобальных периодических всплесках заболеваемости. В

• •

данном случае можно говорить о скором всплеске числа, зафиксированных случаев заболеваемости (в масштабах периодики, захватывающей несколько лет).

Результаты математического моделирования подтвердили работоспособность программного обеспечения и эффективность предлагаемой методологии.

Планируется дальнейшее расширение и развитие программной системы, применение ее для обработки данных по разным зонам города, разным возрастам населения и другим нозологиям. Для сравнения результатов, получаемых ДРМ, с результатами на основе стандартной методологии будут при-влечены современные пакеты обработки временных рядов.

л

СПИСОК ЛИТЕРАТУРЫ

1. Валеев С.Г. Регрессионное моделирование при обработке наблюдений. М.: Наука,

1991, »•шшмгш В*'* " ЬлаЖ^МД»

2. Валеев С.Г., Галиуялиы Х.Я. К вопросу применения регрессионного моделирования для анализа производительности труда // Вестник УлГТУ. 1999. №2.

3. Андерсон Т. Статистический анализ временных рядов. М.: Мир,} 976.

4. Кендалд М, Стыоарт А. Многомерный статастяческий анализ и временные ряды. М.: Наука, 1976.

5. Айвазян С.А., Мхитарян. B.C. Прикладная статистика и основы экономики. М.: Юншщ 1998.

6. Бутов A.A. Некоторые вероятностные задачи, возникающие при построении моделей // Обозрение прикладной и промышленной математики. 1997. Т.4, Вып.1. С.5-17.

7. Валеев С.Г., Никишин В.А., Чичияа Л.Н. Проблема выявления причинно-следственных связей и прогнозирования для соматической заболеааемости населения г. Ульяновска // Тез. Докл. XXXII НТК УлГТУ. Ульяновск: УлГТУ, 1999. Часть 2. С. 48-49.

9

Валеее Султан Галимзянович, доктор физико-математических нау к, профессор, заведующий кафедрой «Прикладная математика и информатика» Ульяновского государственного технического университета, окончил физический факультет Казанского государственного университета. Имеет статьи и монографию в области астрометрии и небесной механики, математической статистики и разработке информационных технологий.

Сергеев Евгений Сергеевич, аспирант Ульяновского государственного технического университета, окончил экономико-математический факультет Ульяновского государственного технического университета, . Имеет статьи в области математической статистики.

УДК 519.6

Л

В.К. ГОРБУНОВ, В.В. ПЕТРИЩЕВ

I | | * 1

МЕТОД НОРМАЛЬНОЙ СПЛАЙН-КОЛЛОКАДИИ В ВЫРОЖДЕННЫХ ЗАДАЧАХ ЛИНЕШШХ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ1

Излагается развитие метода нормальных сплайнов для решения обыкновенных дифференциальных уравнений, возможно, неразрешенных относительно производных. Дается решение проблемы канонического преобразования линейных непрерывных функционалов (ключевой для данного метода) в соболевском гильбертовом пространстве с произвольном целым индексом дифференцирования. Приводятся результаты численного решения дифференциальных уравнений.

Под вырожденными системами дифференциальных уравнений понимаются системы, не разрешаемые относительно старших производных. К ним примыкают дифференциально-алгебраические системы, а также «жесткие» системы. Такие системы появляются в математическом моделировании при учёте законов сохранения, в теории электрических цепей, ядерных реакторов, а также при желании исследователя возможно полнее описать сложное

I

1 Работа поддержана РФФИ, проект № 01-01-00731

И Вестник УлГТУ 3/2001

явление (избыточность описания приводит к функциональной зависимости и вырождению). Для решения начальных или краевых задач для таких систем обычные численные методы неприменимы или неэффективны, и это стимулирует дальнейшее развитие численных методов з области обыкновенных линейных дифференциальных уравнений [1-3]. При этом, как правило, создаются специальные методы, часто основанные на достаточно сложной алгебраической теории [1] и применимые лишь к начальным задачам [2,3], причём в случаях, когда неразрешаемость системы относительно производных (т.е. несводимость к нормальной форме) устраняется однократным дифференцированием сингулярной части системы. Такие системы называются системами «индекса 1» [1, 2]. В более сложных случаях используются вариационные методы.

В работах [4, 5, 6] был разработан вариационный метод нормальной сплайя-коллокации (нормальных сплайнов) для интегральных уравнений [4], а таюке для начальных и краевых задач линейных обыкновенных интегро-дифференциальных уравнений общего класса, в частности, неразрешенных относительно производных и на бесконечных промежутках [5, 6]. При этом.

решение считается элементом гкльбертово-собояевскогс пространства гуУ[п,

где п - размерность системы уравнений и / - индекс производной в норме. Для интегральных уравнений / > 1 и для уравнений с производными / > 2.

Метод нормальных сплайнов (НС) относится к классу методов коллока-ции, но в отличие от традиционных схем здесь базисная система функций не является априорно заданной (многочлены или полиномиальные сплайны), а строится по коэффициентам и функциям (при наличии интегральных членов) уравнения, а также в зависимости от выбора нормы пространства решений. Теоретической оснозой метода НС являются классические теоремы функционального анализа: С.Л. Соболева о вложении соболевских пространств в чебышевские [7] и Ф. Рисса о каноническом представлении (в виде скалярного произведения) линейных непрерывных функционалов в гильбертовых пространствах [8].

Б [4, 5, 6] приведены результаты реализации метода НС в пространствах уУ1п с показателем дифференцирования /= 1 и 2 для интегральных уравнений

первого рода (задачи численного дифференцирования) и для жёстких систем второго порядка- Первые результаты, демонстрирующие эффективность метода НС в вырожденных задачах, были представлены в [9]. Здесь метод был реализован для систем линейных дифференциальных уравнений первого порядка, неразрешенных относительно производных, и приведены примеры решения задач с вы р о ж д е ни ы м и матрицами при производных. В данной работе излагается вычислительная схема метода НС для систем дифференциальных уравнений произвольного порядка в У/[л при / > 2 с оптимизацией сеток.

i Надоели баннеры? Вы всегда можете отключить рекламу.