Научная статья на тему 'Прогнозирование заболеваемости: динамические модели и временные ряды'

Прогнозирование заболеваемости: динамические модели и временные ряды Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
1379
197
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
НЕЧЕТКИЕ ВРЕМЕННЫЕ РЯДЫ / ПАРАМЕТРИЧЕСКАЯ ИДЕНТИФИКАЦИЯ / PARAMETRICAL IDENTIFICATION / ПРОГНОЗ ВРЕМЕННЫХ РЯДОВ / FORECAST OF TEMPORARY RANKS / НЕЙРОНЕЧЕТКАЯ СЕТЬ / NEURO AND INDISTINCT NETWORK / ИНФЕКЦИОННЫЕ ЗАБОЛЕВАНИЯ / INFECTIOUS DISEASE / INDISTINCT TEMPORARY RANKS

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Котин Владимир Владимирович

Представлена методика прогнозирования течения инфекционных заболеваний пациентов на основе анализа данных, предоставленных кафедрой эпидемиологии и доказательной медицины Первого МГМУ им. И. М. Сеченова. Были апробированы следующие подходы: параметрическая идентификация SIR-модели, анализ временных рядов с использованием показателя Херста, адаптивные методы прогноза временных рядов с использованием методов Брауна и Хольта-Уинтерса, прогнозирование временных рядов заболеваемости с использованием искусственных нейронных сетей и тестирование нейронечеткой гибридной сети.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Прогнозирование заболеваемости: динамические модели и временные ряды»

от совокупности полупроводниковых фотосенсоров, чувствительных к разным диапазонам длин волн. Достаточным функционалом для подобного рода наблюдений обладают большинство современных цифровых видеокамер со спектрально-избирательным Байеровским фильтром. Например, в рамках своего исследования мы использовали веб-камеру потребительского уровня Logitech C270 (среднерыночная цена меньше 1000 руб.), тем не менее разработанный программный интерфейс не накладывает ограничений на использование других моделей цифровых видеокамер.

Подробное описание алгоритма работы комплекса требует большего объема сообщения, поэтому здесь мы вынуждены ограничиться описанием полученных результатов. На рис. 1 приведен пример зарегистрированного комплексом сигнала цифровой фото-плетизмограммы (изменений интенсивности света, отражаемого покровными тканями лица, отсчеты нормированы на величину выборочного среднеква-дратического отклонения). На рис. 2 приведены диаграмма кросс-корреляции и диаграмма Блэнда— Алтмана для выборки из 976 парных измерений частоты артериального пульса разработанным комплексом (тестовые измерения) и пульсоксиметром choicemmed md 300 c 318 (контрольные измерения).

Исходные коды программно-алгоритмического обеспечения, разработанного в рамках описанной работы, размещены по адресу http://sourceforge. net/projects/pulsecapture/ в режиме свободного доступа. Выражаем благодарность авторам работ [1—5], а также разработчикам свободных программных библиотек Open CV, Qt, FFTW, ALGLIB.

Литература

1. Ming-Zher Poh, Daniel J. McDuff, Rosalind W. Picard «Non-contact, automated cardiac pulse measurements using video imaging and blind source separation» // OPTICS EXPRESS. 2010. Vol. 18. N. 10. Р. 10763-10774.

2. Takano C., Ohta Y. Heart rate measurement based on a time-lapse image // Med. Eng. Phys. 2007. 29(8). P. 853-857.

3. Hao-Yu Wu, Rubinstein M., Shih E. et. al. Eulerian video magnification for revealing subtle changes in the world //ACM Transactions on Graphics (TOG) - SIGGRAPH 2012 Conference Proceedings 31 (4).

4. SahindrakarP., Haan G., Kirenko I. Improving motion robustness of contact-less Monitoring of Heart Rate using video analysis // Department of Mathematics and Computer Science of Technische Universiteit Eindhoven [in internet]: http://alexandria. tue.nl/extra1/ afstversl/wsk-i/sahindrakar2011.pdf, (2011).

5. Verkruysse W., Svaasand L. O., Nelson J. S. Remote ple-thysmographic imaging using ambient light // Opt. Express. 2008. 16(26). Р. 21434-21445.

УДК 519.+578.27+616.9

В. В. Котин, канд. физ.-мат. наук, доцент кафедры,

Московский государственный технический университет им. Н. Э. Баумана

Прогнозирование заболеваемости: динамические модели и временные ряды

Ключевые слова: нечеткие временные ряды, параметрическая идентификация, прогноз временных рядов, нейронечеткая сеть, инфекционные заболевания.

Keywords: indistinct temporary ranks, parametrical identification, forecast of temporary ranks, neuro and indistinct network, infectious disease.

Представлена методика прогнозирования течения инфекционных заболеваний пациентов на основе анализа данных, предоставленных кафедрой эпидемиологии и доказательной медицины Первого МГМУ им. И. М. Сеченова. Были апробированы следующие подходы: параметрическая идентификация SIR-модели, анализ временных рядов с использованием показателя Херста, адаптивные методы прогноза временных рядов с использованием методов Брауна и Хольта—Уинтерса, прогнозирование временных рядов заболеваемости с использованием искусственных нейронных сетей и тестирование нейронечеткой гибридной сети.

Проблемы популяционной динамики инфекционных заболеваний человека [1], традиционно актуальные и всегда занимавшие важное место в науках о жизни, в настоящее время приобретают качественно новые характеристики. Методология и аппарат количественного описания эпидемических процессов могут быть сведены к следующим направлениям: 1) динамические модели — синтез, анализ, параметрическая идентификация и верификация математических моделей, формализованных в виде систем дифференциальных уравнений [1]; 2) модели данных — статистические методы, регрессии, анализ временных рядов (ВР) [2—4]; 3) имитационные мо-

биотехносфера

| № 3(33)72014

90 80 70 60 50 40

U 30 a

И

S 20

10 0

1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010

Годы

Рис. 1 \ Исходный временной ряд инцидентности и сегменты аппроксимированных временных рядов (методы Брауна и Хольта—Уинтерса)

дели — алгоритмическое описание совокупного действия большого числа факторов заболеваемости, программная реализация и многовариантные вычислительные эксперименты (см. ссылки в работах [2—5]). В отдельный инструментальный класс выделим многофункциональные информационные системы (базы данных, базы знаний, экспертные системы), интегрирующие перечисленные выше подходы и предоставляющие пользователю новые и ранее недоступные возможности для поддержки оперативного принятия медицинских и организационных решений по противодействию эпидемиям [5].

В настоящей работе, ориентированной в первую очередь на обоснование прогнозов заболеваемости, суммированы результаты анализа данных, предоставленных кафедрой эпидемиологии и доказательной медицины Первого МГМУ им. И. М. Сеченова. Были апробированы следующие подходы: 1) параметрическая идентификация БЖ-модели [1] по вну-тригодовой заболеваемости скарлатиной детей до 14 лет в Москве (1996, 2002, 2007 гг.); 2) анализ временных рядов с использованием показателя Хер-ста (помимо инцидентности по скарлатине для детей до 14 лет в Москве в 1996—2008 гг., рассматривались данные о числе зарегистрированных больных в 1913—1999 гг. в России — скарлатина, коклюш, корь); 3) адаптивные методы прогноза временных рядов с использованием методов Брауна и Хольта— Уинтерса [2]; 4) прогнозирование временных рядов заболеваемости с использованием искусственных нейронных сетей (ИНС) [3, 4]; 5) тестирование ней-ро-нечеткой гибридной сети [4].

На рис. 1 показано сравнение исходного ВР и модельных ВР, построенных с использованием адаптивных методов Брауна и Хольта—Уинтерса по принципу скользящего прогноза (текущей экстраполяции уровней ряда на один шаг вперед). В модели Брауна обнаружены практически неприемлемые выбросы по текущей абсолютной процентной ошибке.

В целях демонстрации возможностей применения ИНС для прогноза заболеваемости предлагается использовать двухслойный персептрон. Данные для тренировки сети подготавливались с учетом априорной информации о сезонности заболеваемости скарлатиной — наличия максимумов заболеваемости в осенне-зимний период и летних спадов. Использовалась функция обучения, модифицирующая значения весов и смещений в соответствии с методом оптимизации Левенберга—Маркара и методом обратного распространения ошибки. В процедуру тренировки вводилось условие минимума средне-квадратической ошибки прогноза. Программная реализация персептрона проведена с использованием Neural Network Toolbox системы Matlab 7.11.0. В качестве обучающей выборки был взят сегмент из 108 отсчетов временного ряда. На рис. 2 иллюстрированы результаты тестирования.

Данные по заболеваемости содержат широкий спектр неопределенностей, затрудняющих использование традиционных методов прогноза временных рядов. Переход к анализу нечетких временных рядов (fuzzy time series) открывает реальную перспективу обработки и анализа как числовых,

14 12 10

/ \

щ > 1 ] \ 1 1 - . t

1 V » 1 J и ■ 1 J f я

/ V- N L я. V V Г * \ 1 ш ß

\ j Г 2 J г

м Л п * 4

2007

2008 Годы

Рис. 2

Тестирование ИНС: 1 — прогноз; 2 — контроль

№ 3(33)/2014 |

биотехносфера

так и лингвистических данных. Нечеткие методы обработки временных рядов свободны от жестких априорных предположений о свойствах прогнозируемых процессов и позволяют работать с «сырыми» данными. Нечеткие модели, как ожидается, дают возможность выявить неявные тенденции в динамике заболеваемости и имеют ряд преимуществ по сравнению с обычно используемыми методами анализа заболеваемости: 1) менее требовательны к объему выборки; 2) позволяют обрабатывать противоречивые данные; 3) допускают введение информации, ранее накопленной и системно структурированной в конкретной предметной области.

Одной из перспективных возможностей прогноза заболеваемости является использование нейроне-четкой сети. В пакете Fuzzy Logic Toolbox системы МАТЬАВ гибридные сети были реализованы в форме адаптивной системы нейронечеткого вывода ANFIS. Термы входных лингвистических переменных описываются стандартным для системы МАТЬАВ набором функций принадлежности. Нейронечеткую сеть можно рассматривать как одну из разновидностей систем нечеткого логического вывода типа Сугэно. Функции принадлежности синтезированной системы настраиваются так, чтобы минимизировать отклонения между результатами нечеткого моделирования и зарегистрированными данными по заболеваемости.

В работе [4] приведены результаты тестирования нечеткой гибридной сети для прогноза инцидентности. Система нечеткого вывода содержит пять

входных переменных с тремя термами, 243 правила нечетких продукций, одну выходную переменную. Сеть тестировалась на сегменте временного ряда заболеваемости скарлатиной (январь 2004 г. — декабрь 2009 г.).

Для проверки адекватности нечеткой модели на основе гибридной сети выполнен тестовый ретроспективный прогноз заболеваемости скарлатиной на следующий месяц (декабрь 2003 г. ^ январь 2004 г.). Оценка относительной текущей погрешности краткосрочного прогноза на месяц дала значение 9 %.

Литература

1. Андерсон Р., Мэй Р. Инфекционные болезни человека: Динамика и контроль. М.: Научный мир, 2004. 784 с.

2. Котин В. В., Ярынкина Т. А. Прогнозирование заболеваемости с использованием адаптивных и нечетких моделей // Биомедицинские технологии и радиоэлектроника. 2012. № 11. С. 13-22.

3. Дмитриев А. Н., Котин В. В. Моделирование временных рядов заболеваемости с использованием искусственных нейронных сетей // Медицинская техника. 2013. № 1. С. 35-38.

4. Дмитриев А. Н., Котин В. В. Нейронечеткие модели прогноза заболеваемости // Биомедицинские технологии и радиоэлектроника. 2013. № 10. С. 55-59.

5. Котин В. В., Чиганашкин В. В. Разработка архитектуры экспертной системы для анализа эпидемиологической ситуации // Биомедицинские технологии и радиоэлектроника. 2013. № 10. С. 48-54.

(Г л

приглашаем рекламодателей к сотрудничеству

Рекламные статьи и модули печатаются за плату согласно расценкам (в рублях, включая НДС 18 %)

черно-белые полосы цветные полосы Скидки при единовременной оплате

1 полоса А4 (180 х 250 мм) 6 000 2-я стр. обложки и каждая стр. вкладки: А4 (195 х 280) А5 (195 х 140) 12 000 8 000 2-х публикаций 10%

1/2 полосы (180 х 125 мм) 3 500 3-я стр. обложки А4 (195 х 280) А5 (195 х 140) 10 000 5 000 3-х публикаций 15%

1/4 полосы (85 х 110 мм) 2 125 4-я стр. обложки: А4 (195 х 280) А5 (195 х 140) 10 000 5 000 4-х и более 20%

1/8 полосы (85 х 50 мм) 800

^ Л

биотехносфера

| № 3(33)72014

i Надоели баннеры? Вы всегда можете отключить рекламу.