Научная статья на тему 'Программное обеспечение для построения и анализа модели жизни поколения'

Программное обеспечение для построения и анализа модели жизни поколения Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
126
23
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
МОДЕЛЬ ЖИЗНИ ПОКОЛЕНИЯ / СТАТИСТИЧЕСКИХ ДАННЫХ / ВЫБОРОЧНОЕ ИССЛЕДОВАНИЕ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Рязанцев П. П.

Для изучения здоровья населения Новгородской области представлена модель жизни поколения, основанная на статистических данных за 5 лет и данных выборочного исследования. Разработано программное обеспечение для практической реализации этой модели. Предложены варианты анализа и прогнозирования жизни поколения.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Программное обеспечение для построения и анализа модели жизни поколения»

УДК 614.39

П.П.Рязанцев

ПРОГРАММНОЕ ОБЕСПЕЧЕНИЕ ДЛЯ ПОСТРОЕНИЯ И АНАЛИЗА МОДЕЛИ ЖИЗНИ ПОКОЛЕНИЯ

Медицинский информационно-аналитический центр комитета по охране здоровья населения Новгородской области

т. (8162) 642335, 641669

The paper deals with the problem of public health in Novgorod region. A model of generation life based on the five-year statistical analysis and sampling investigation report is presented. Software has been developed for practical application of the model. Ways of analyzing and forecasting of generation life are proposed.

Ключевые слова: модель жизни поколения, статистических данных, выборочное исследование

Комплексное изучение здоровья населения является основой для разработки политики и определения приоритетов в системе охраны здоровья населения Российской Федерации. Задачу улучшения популяционного здоровья можно решать, опираясь на современные достижения профилактической медицины и большие возможности компьютерных технологий [1].

В настоящей работе представлено программное обеспечение, в котором на основе статистических данных по Новгородской области (персонифицированная база данных Новгородского научного медицинского центра СЗО РАМН) реализована задача моделирования жизни поколения. Для построения модели жизни поколения применяется метод условного поколения. В основе этого метода лежит ряд статистических показателей за короткий промежуток времени. Для получения значений ряда предполагается, что наблюдаемые демографические события произошли не у разных поколений в одно время, а в разном возрасте у одного поколения, которое и называется «условным». Иначе говоря, совокупность показателей, отразивших события одного периода у людей разного возраста, условно рассматривается исследователями как произошедшие с людьми одного поколения в разных возрастных интервалах жизни этого поколения [2].

В качестве исходных данных в модели жизни поколения используются демографические показатели с 2003 по 2007 гг. и результаты углубленных медосмотров, а именно:

— численность умерших в Новгородской области (половозрастная структура) по данным государственной статистики за пять лет;

— численность населения Новгородской области по данным регистра застрахованных за пять лет;

— заболеваемость согласно данным углубленных медосмотров по репрезентативной выборке 10 тыс. населения Новгородской области (2005 г.)

В рассматриваемой модели можно выделить следующие два этапа: моделирование численности населения по полу и возрасту в зависимости от смертности и использование в полученной модели данных заболеваемости (по выборке).

Для единства баз сравнения предполагается, что в начале жизни поколения его численность составляла 20 тыс. человек, (10 тыс. мужчин и 10 тыс. женщин). Поколение группируется по следующим возрастным категориям (полных лет): [0;0], [1;4], [5;9], [10;14], [15;19], [20;24], [25;29], [30;34], [40;44], [45;49], [50;54], [55;59], [60;64], [65;69], [70 и старше]. Численность населения для возрастных категорий рассчитывается по формуле [10000 при г = 0,

P[i] =

P[i -1] -

D[i - 'I

L[i -1]

10000 при i e (0; 15),

0 при г = 15,

где I — номер возрастной категории; Р[г] — численность прогнозируемого населения для г-й возрастной категории; £>[/] — число умерших в г-й возрастной категории; Щ] — численность населения в г-й возрастной категории.

Классификация состояний здоровья индивидов репрезентативной выборки проведена согласно справочнику МКБ-10 [3] (см. табл.). Важно отметить, что индивид одновременно может находиться в нескольких состояниях, за исключением состояний

«ЗДОРОВ» и «СМЕРТЬ».

Классификация состояний здоровья индивида (пример)

Состояние здоровья Класс

Ео «Здоров»

Ei I00- I99 Болезни системы кровообращения

E2 S00- T98 Травмы, отравления и некоторые другие последствия воздействия внешних причин

E19 H00- H59 Болезни глаза и его придаточного аппарата

E20 «Смерть»

Программное обеспечение для построения и анализа модели жизни поколения является частью программного комплекса для изучения здоровья населения. Среда разработки Borland Delphi с применением базы данных Dbase на основе механизма BDE. Исходные данные по заболеваемости выбраны из Firebird базы данных углубленных медицинских осмотров. Численность населения рассчитана из регистра застрахованных с применением базы данных ORACLE. Адаптация данных для построения модели проведена в среде Visual FoxPro.

Разработанное программное обеспечение реализует следующие функции.

1. Формирование временных рядов (модель жизни поколения), основанных на реальных данных, прогнозирование и сравнительный анализ полученных рядов в возрастно-половом аспекте.

2. Выгрузка исходных данных по численности и смертности населения.

3. Прогнозирование поведения модели при предполагаемых изменениях исходных данных численности и смертности населения.

4. Построения временных рядов заболеваемости по выбранным пользователем классам.

5. Проведение корреляционно-регрессионного статистического анализа зависимости смертности от классов заболеваемости, зависимости между сочетаниями различных классов заболеваемости.

6. Экспорт данных в шаблоны MS Excel с построением различных уравнений регрессии, определением критериев значимости, проведением корреляционного анализа, выводом графиков и диаграмм.

Рассмотрим примеры реализации функций программы.

1. Формирование временных рядов модели жизни поколения, совмещенной с заболеваемостью (рис.1).

Данная диаграмма показывает число людей находящихся в соответствующих состояниях и то, что численность исходного поколения через 35-39 лет сократится до следующих показателей: мужчин будет — 8636, а женщин — 9516. Сумма мужчин и женщин по состояниям не равна их общей численности, это объясняется тем, что каждый индивид может находиться в нескольких состояниях (иметь несколько заболеваний).

2. Прогнозирование поведение модели, при предполагаемых изменениях демографических показателей.

Рассмотрим поведение жизни мужского поколения при допущении, что смертность мужчин в возрасте 20-59 лет сократилась на 25% (рис.2).

3. Построение уравнение линейной регрессии для мужчин и женщин в зависимости от заболевания.

Рассмотрим зависимость смертности населения от сочетания заболеваний нервной системы (состояние Е8) и мочеполовой системы (состояние Е9). Для этого при помощи программы выберем фильтр состояний для предложенных классов и построим уравнение регрессии для мужчин:

4500

4000

3500

3000

2500

2000

1500

1000

500

0

4100

Г1г1нг1р1

271266 0 30 6010^ |121

Е0 Е1 Е2 Е3 Е4 Е5 Е6 Е7 Е8 Е9 Е10 Е11 Е12 Е13 Е14 Е15 Е16 Е17 Е18 Е19

■ Мужчины □Женщины

Рис.1. Распределение поколения по полу и классам состояний для возрастной категории 35-39 лет

3000

2000 2809 2269

10002009 ВЕСТНИК НОВГОРОДСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА 1 78№50 0 0

Рис.2. Прогноз жизни мужского поколения при снижении смертности на 25% в трудоспособном возрасте 20-59 лет

Р^ее) = 8168,63 +18,686tEE -0,139t¿EE +0,00015?ЕЕ,

8 9 (1066299) (23,87) 8 9 (0,102) 8 9 (0,000114 8 9

где t — возрастная категория; — число лиц в

данной возрастной категории, одновременно находящихся в состояниях Е8 и Е9; Р^е Е9) — численность

поколения в возрасте t в зависимости от наличия заболеваний классов Е8 и Е9. При этом Я2 = 0,48, стандартная ошибка оценки регрессии равна 2596,672, значимость ^ = 0,0315.

Аналогичное уравнение регрессии для женщин выглядит следующим образом:

Р^ее9) = 8439,7 + 680,87-tE8E9 -57,931-tE8E9.

(1066,299) (0,102)

Здесь Я2 = 0,8064, стандартная ошибка оценки регрессии — 100,62, значимость ^ = 0,037.

Помимо уравнений регрессии для двух факторов можно строить уравнения и для множественной регрессии.

Вывод

Разработанное программное обеспечение позволяет статистическими методами исследовать состояние здоровья реального населения, оценивать зависимость между заболеваемостью и смертностью, прогнозировать жизнь будущих поколений. Полученные разработки могут быть использованы для корректировки политики здравоохранения Новгородской области.

1. От качественной диспансеризации к государственной системе охраны и укрепления здоровья населения России // Аналитический вестник Совета Федерации ФС РФ. 2006. № 1 (289). С.58.

2. Методы реального и условного поколения — http://www.demografus.net/40.htm

3. Международная статистическая классификация болезней и проблем, связанных со здоровьем. 10-й пересмотр: В 3-х т. ВОЗ, 1995.

i Надоели баннеры? Вы всегда можете отключить рекламу.