Е. И. Воробьев, В. А. Лярский, В. А. Минченко, В. М. Прусаков, А. К. Румянцев, А. И. Татаркин
БАНК ДАННЫХ ДЛЯ КОМПЛЕКСНЫХ ГИГИЕНИЧЕСКИХ ИССЛЕДОВАНИЙ СОСТОЯНИЯ ОКРУЖАЮЩЕЙ СРЕДЫ И ЗДОРОВЬЯ НАСЕЛЕНИЯ В РАЙОНЕ КРУПНОГО ПРОМЫП1ЛЕННО-ЭНЕРГЕТИЧЕСКОГО КОМПЛЕКСА
Минздрав СССР; Институт биофизики Минздрава СССР, Москва
В проблеме совершенствования системы охраны здоровья населения и улучшения условий его жизнедеятельности важное место принадлежит теоретическим и методическим разработкам по созданию автоматизированных информационных систем (АИС), способных использовать преимущества ЭВМ и методов математического анализа, элементов системного подхода и другие достижения науки и техники.
АИС совместно с органами и объектом управления рассматриваются, в частности, как один из вариантов более совершенной системы охраны окружающей среды и здоровья населения в районах крупных промышленно-энергети-ческих комплексов. В данном случае автоматизированная система наблюдения, оценки и прогнозирования является средством информационного обеспечения органов управления достоверными данными для принятия решения по регулированию источников воздействия на окружающую среду, состояния среды и уровня здоровья населения. Отличительные особенности такой АИС: комплексность оценок прошлого, настоящего и будущего состояния источников воздействия, окружающей среды и уровня здоровья населения при выработке решений; функциональная завершенность, включающая динамическое наблюдение, оценку и прогнозирование состояния объекта управления; обладание для осуществления функции необходимым комплексом технических и программных средств (банком данных, пакетом программ и семейством моделей или имитационной моделью); организация системы на выявление и оценку широкого спектра откликов населения и прежде всего донозологических состояний индивидуума и первичных отклонений в здоровье на уровне коллективов и популяции под действием вредных факторов окружающей среды. Постоянно действующая АИС должна повысить эффективность и обоснованность принимаемых управленческих решений по оптимизации условий жизнедеятельности и охране здоровья населения от нежелательных воздействий химического загрязнения и других факторов окружающей среды в районах промышленно-энергетических комплексов [1].
Одним из важнейших элементов АИС считается банк данных [3]. Анализ особенностей формирования банков данных о состоянии окру-
жающей среды и здоровья населения [2] показал актуальность и сложность научной проблемы их создания. Принятие решения чаще требует не первичной, а вторичной обработанной информации, поэтому в составе системы должен быть пакет программ статистической обработки, связанный с банком. Это особенно касается систем, предназначенных для анализа больших объемов информации, сложных связей и стохастических зависимостей, что в полной мере относится к АИС окружающей среды и здоровья населения.
Рассмотрим один из вариантов решения задачи создания такого банка данных, разрабатываемого по специальной программе. Банк является частью создаваемого образца АИС — * основного программно-технического и организационного средства, позволяющего решать сложные задачи комплексных гигиенических исследований, осуществлять динамические наблюдения, анализ и оценку, прогнозирование состояния окружающей среды и здоровья населения в связи с воздействием выбросов промышленно-энергетического комплекса. АИС разрабатывается как органическая часть системы охраны окружающей среды и здоровья населения (схема 1, в которой полужирные линии — воздействия, светлые — информационные потоки). Она предназначается для обеспечения сбора и кодирования данных, необходимых для расчета всех показателей, характеризующих элементы объекта исследования, упорядоченного хранения ~ и организации эффективного доступа к любой ' совокупности данных, статистического и специального анализа данных, создания и совершенствования имитационной модели, адекватной реальной системе и ее натурной модели, оценки текущего состояния элементов объекта при отсутствии данных прямых наблюдений и прогнозирования будущего состояния объекта с использованием модели.
В качестве изучаемого объекта избран город с развитой промышленностью, в частности нефтехимической, и энергетикой во всем многообразии связей и взаимодействий между здоровьем населения, окружающей среды и промыш- 1 ленностыо. Под натурной моделью города нами понимается та наблюдаемая и изучаемая часть * промышленности, окружающей среды и здоро- ' вья населения, которая позволяет судить о со-
Схема I
АИС в системе охраны окружающей греды и здоровья населения
Органы управления и средства регулирования
Производство Окружающая среда Население
1
А втоматизи рованная информационная система
стоянии и характере процессов взаимодействия сложной системы производство — окружающая среда — здоровье населения во всем городе в соответствии с целями исследования.
При формировании входного информационного потока для АИС в качестве элементов объекта исследования выбраны следующие:
— для источников воздействия — ведущие источники химических, биологических выбросов и физических воздействий, источники формирования условий труда, социально-экономического развития района и социально-бытовых условий жизни рабочих и населения города;
— для окружающей среды — состояние воздушного бассейна в двух районах города, различающихся по уровню химических и других загрязнений, производственная среда на основных технологических заводах и цехах,, социально-бытовая среда групп населения, проживающих в районах города, и рабочих производственного объединения, природно-климатическая среда города;
— для здоровья населения — совокупность показателей, характеризующих состояние здоровья части населения, проживающей в различных районах города и работающей на одном из ведущих промышленных предприятий города — нефтеперерабатывающем и нефтехимическом производственном объединении. Сформированы 3 группы населения: 2 группы всех возрастов (по 20 000 человек каждая), проживающие в районах города на различном расстоянии от промышленных предприятий, и группа рабочих (около 15 000) основных заводов производственного объединения.
Номенклатура вводимых в базы данных ориентирована на получение характеристик, позволяющих определять группу здоровья индивидуума (по показателям гемодинамики и иммунитета, анамнезу); уровень физического развития детей дошкольного возраста, общей заболеваемости и заболеваемости с временной утратой трудоспособности населения и рабочих; состояние репродуктивной функции женщин (характеристики течения беременности и родов, исходов беременности и состояния новорожденных); рождаемость и смертность населения.
Общий объем поступающих в АИС данных в среднем 1300 тыс. знаков в неделю (65-Ю6 в год). Источниками данных для АИС являются действующие и архивные документы городских учреждений здравоохранения, контролирующих организаций и предприятий. Процесс сбора данных является самым трудоемким и сложным в организационном отношении этапом переработки информации в АИС. Современное состояние делопроизводства в контролирующих организациях, лечебных учреждениях и подразделениях промышленных предприятий не ориентировано на использование ЭВМ. Получение необходимых сведений для организации банка данных предусматривает ручную выкопировку и кодирование первичной информации, что составляет 57,7 % трудозатрат по вводу информации, подготовка данных на машинных носителях — 26,7%, введение баз и статистический анализ — 15,6 % от общей численности персонала.
Особенностями создаваемой АИС охраны окружающей среды и здоровья населения являются требования непрерывности процесса обновления (пополнения) информационного фонда (данных), большая трудоемкость этапа сбора и ввода данных, выполняемых преимущественно вручную, длительность накопления информации для реализации всех функций системы. Отсюда необходимость поэтапного и поэлементного создания и ввода в эксплуатацию АИС с целью достижения функциональной завершенности ее с точки зрения полноты переработки информации и решаемых задач.
В связи с этим в структуре АИС выделено 4 функционально законченных элемента: блок сбора данных, банка данных, блок анализа и оценки, блок моделирования [1].
Блок сбора данных обеспечивает сбор, кодирование информации и подготовку данных на машинных носителях. Банк данных осуществляет ввод и хранение информации в ЭВМ в формате баз данных, выдачу справочных таблиц, запись массивов на машинных носителях в формате прикладных программ для анализа информации об элементах объекта исследования. Блок анализа и оценки проводит статистическую оценку показателей, изучает качественные и количественные связи между факторами и откликами. Блок моделирования на базе матема-
С х е м а 2
Логическая структура банка и связи баз данных
тических моделей описывает состояния объекта при неполных данных и прогнозирует его параметры при заданных условиях. При функционировании всех этих блоков в законченном виде будет выполняться полный цикл переработки информации от ее выкопировки до формирования прогноза.
Разделение АИС на 4 структурные единицы основано на единстве характера переработки информации внутри каждого блока, единстве организационного, методического и технического обеспечения, возможности учета объема и качества работы при передаче результатов деятельности из одного блока в другой.'
Банк данных как элемент АИС предназначен для обеспечения следующих основных операций процесса переработки информации: перенесение данных с кодировочных бланков на машинные носители или подготовку данных, программную проверку ошибок подготовки данных, ввод данных в базы данных и хранение в формате базы, вывод таблиц по справочно-информационным запросам, формирование массивов для статистического анализа по исследовательским запросам. Под исследовательским запросом понимаются задачи определения роли источников в загрязнении окружающей среды, выявления факторов, формирующих положительные или отрицательные отклонения в здоровье населения, про-
гнозирования состояния элементов или объекта управления в целом и т. п.
Методология создания банков данных предполагает оптимизацию числа баз и их логической структуры [3]. За основной критерий при этом обычно принимается время обработки запросов, которое стремятся свести к минимуму. В процессе проектирования банка разделение данных на базы мы осуществляли с учетом обеспечения оптимального функционирования АИС в целом. Помимо требований по времени обработки запросов, руководствовались целями анализа и особенностями элементов объекта наблюдения (различия контингентов и др.), источников и путей получения информации, размещения и хранения ее на машинных носителях (удобство и т. п.).
В силу указанных причин логическая структура системы без данных (схема 2), сохраняя информационное соответствие, имеет некоторые отличия от структуры элементов изучаемого объекта. Так, сведения о населении по разделам «физическое развитие детей», «заболеваемость», «обращаемость за медицинской помощью», а также «паспортные, социально-экономические сведения о личности» объединены в одну базу по взрослому и детскому населению изучаемых районов и рабочих промышленного предприятия. В объекте исследования совокуп-
Схема 3
Схема применения программных средств на основных стадиях переработки информации АИС «Ангара»
Подготовка данных Банк данных Блок анализа
ность показателей ряда из названных групп представляют собой самостоятельные элементы. Сведения о репродуктивной функции, рождении и смерти, обращении за скорой медицинской помощью представлены отдельными базами, в которые поступают сведения обо всем населении города. При этом данные о лицах, которые накапливаются в первой из указанных баз, лишь частично пересекаются с остальными. Такое разделение структуры сведений о населении без ущерба для целостности банка данных позволяет ускорить процедуру ввода данных и упростить обращение к ним с учетом специфики решаемых задач.
Общесистемное программное обеспечение банка конструировалось нами путем создания гибридной системы управления базами данных (СУБД). Основой для этого послужили СУБД информации экономических систем (ИНЭС) и адаптивная информационная система (АИС).
Специфичность решаемой проблемы, связанной с накоплением в течение длительного времени большого объема информации, ее постоянным пополнением и изменением, большим количеством входных документов обосновывала выбор СУБД ИНЭС с древовидной структурой. Привлекала также и ее универсальность как информационной системы, выходящей за рамки только управления базами. Это особенно важно, когда структура хранимой информации не окончательно ясна. СУБД ИНЭС обеспечивает доступ к данным и их обработку как пользователем-программистом, так и не программистом. СУБД может выдавать информацию в виде таблиц как из баз данных, так и из последовательных файлов, поддерживаемых операционной
системой. Это открытая система, позволяющая добавлять и использовать в общей среде ИНЭС пакеты прикладных программ.
Однако построение инвертированных баз силами ИНЭС (как средства уменьшения времени выполнения запросов) представляется дорогостоящим и неудобным. В связи с этим в опытную эксплуатацию введена СУБД АИС как альтернативная или аддитивная компонента инвертирующей компоненте ИНЭС. При этом СУБД ИНЭС оставлены функции ввода, корректировки и агрегирования данных, так как СУБД АИС не имеет средств подготовки информации для ввода в базы.
В соответствии с технологической схемой ввода, обработки и анализа данных в АИС (схема 3, в которой ОС ЕС, ППП СОМИ-пакет прикладных программ статистической обработки медицинской информации) ввод информации в базы осуществляется средствами СУБД ИНЭС или специальными программами в тех случаях, когда данные поставляются в неформализиро-ванном виде, т. е. не обеспечивается их контроль стандартными средствами СУБД.
Состав и структура информации на кодиро-вочных бланках определяются соответственно содержанием и формой первичных документов, из которых ведется выкопнровка данных. В свою очередь совокупность кодировочных бланков полностью определяет структуру входного потока информации в банк данных. Система макетного и параграфного ввода СУБД ИНЭС предусматривают возможность ввода данных по одному или нескольким макетам в одну базу и не допускают ввода одним макетом в две или несколько баз. Это также повлияло на то, что
€
€
— п —
структура баз данных сформировалась как логическое объединение данных, содержащихся на одном или нескольких кодировочных бланках и относящихся к одному объекту, контингенту или личности. В то же время такое решение позволило предельно упростить входной поток, полностью исключить ручную сортировку и подборку документов и данных на этапе их сбора, сделать возможным выкопировку при однократном обращении к первичному документу всей необходимой для задач программы совокупности данных за любой период времени.
Первичный контроль информации при ее переносе на машинные носители осуществляется системными средствами групповой установки подготовки данных ЕС 9003. Программа контроля обеспечивает контроль данных поля и выявление недопустимых символов в поле. Программный синтаксический контроль информации по всем документам при вводе ее в базы осуществляется средствами ИНЭС. Дополнительный логический контроль по документам «Лист посещения врача», «Данные контроля атмосферы» выполняется специальными программами, а также ППП СОМИ. Косвенным средством контроля, кроме того, служит словарная система ИНЭС, которая отвергает все не включенные в словарь коды по данному показателю.
При организации баз данных соблюдался также принцип информационного обеспечения каждой из них решения определенного круга задач, связанных, как правило, с гигиенической и эпидемиологической характеристикой соответствующего элемента объекта исследования. Для этого допущено некоторое дублирование данных, необходимых для независимого решения задач, основанных на информации базы. Например, в каждой базе данных о населении сведения о личности включают год рождения и пол, в некоторых базах дублируется информация о месте работы, профессии и др.
Возможность совместного извлечения данных из разных баз по набору общих признаков обеспечена наличием в них одинаковых ключевых полей. Так, все базы включают сведения о дате получения информации (год, месяц, день). Код личности родителей указан в данных о физическом развитии детей и т. д. Межбазовые связи по дате, месту работы и жительства, коду личности показана на схеме 2.
Логическая связь между отдельными физическими базами данных осуществляется средствами СУБД (посредством языка запросов и/или с помощью специальных программ). СУБД ИНЭС обеспечивает эту возможность через рекурсивные запросы по общим ключевым полям, а СУБД АИС по любому полю, общему для группы районов и др.
Базы СУБД ИНЭС являются основными хранилищами данных. Иерархическая структура каждой базы и древовидный метод доступа
СУБД позволяет ответить, например, на вопрос, каковы свойства данного объекта (лица, состава воздуха в точке наблюдения и т. п.). Файловая организация данных СУБД АИС не подменяет базы данных СУБД ИНЭС, а дополняет их, так как является инверсией по отношению к ним. Это дает возможность извлечь информацию о том, например, какие объекты (лица и т. п.) ^ имеют данные свойства.
СУБД ИНЭС предназначена для формирования справочно-информационных запросов по базам данных, файлов специальной структуры из баз данных для дальнейшей статистической обработки пакетом СОМИ, файлов определенной структуры из баз данных для загрузки в файлы СУБД АИС. На основании последних решаются задачи, реализация которых средствами СУБД ИНЭС невозможна или трудоемка и требует больших затрат времени. СУБД АИС позволяет соединить информацию, выбранную из разных баз данных СУБД ИНЭС, в файлы АИС — единый набор данных. Например, объединить динамику обращаемости за медицинской помощью по поводу заболеваний верхних дыхательных путей за определенный период (месяц, квартал, полугодие, год и т. д.) и состояния воздушного бассейна города за это же ^ время для последующего анализа зависимостей между ними.
Целостность банка обеспечивается единством системы управления базами данных (СУБД), единством кода личности во всех базах, единой системой кодирования мест жительства и работы населения, мест сбора информации об окружающей среде, указанием даты получения информации во всех базах, возможностью формирования запроса одновременно к совокупности данных различных баз (функциональная возможность СУБД ИНЭС); уменьшением избыточности данных ссылкой на уже имеющиеся в другой базе (по базам данных о населении).
В настоящее время созданный банк проходит опытную эксплуатацию при решении задач в рамках комплексной целевой программы, пре- ^ дусматривающей разработку научных основ охраны труда, окружающей среды и здоровья населения в районах промышленно-энергетиче-ских комплексов с применением АИС.
Таким образом, использование комбинации из систем управления базами данных иерархического типа ИНЭС и сетевого типа АИС позволило оптимально решить вопросы накопления и передачи данных для многомерного статистического анализа при решении многочисленных гигиенических задач охраны окружающей среды и здоровья населения.
Литература
1. Воробьев Е. И., Прусаков В. М., Митенко В. А.// Щ
Атомная энергия. — 1984. — Т. 56, № 3. — С. 149—
153.
2. Воробьев Е. И., Резниченко В. 10. Ц Там же.—1981.— Т. 50, № 4. — С. 243—248.
3. Мартин Дж. Организация баз данных п вычислительных системах: Пер. с англ. — М., 1980.
Поступила 10.03.86
Summary. Logical structure and management system of data bank bases using the automatic information system, is developed for comprehensive hygienic studies of the environmental state and human health status in the area of a large industrial-and-energy complex. The main information streams and technological scheme of information processing and analysis are defined.
УДК 614.1: [312.6+312.1/.2
Д. К■ Соколов
ЗДОРОВЬЕ НАСЕЛЕНИЯ КАК ОБЪЕКТ ГИГИЕНИЧЕСКИХ
ИССЛЕДОВАНИЙ
НИИ общей и коммунальной гигиены им. А. Н. Сыеина, АМН СССР, Москва
Меры по укреплению и сохранению здоровья все в большей степени связаны с решением широкого круга гигиенических задач, среди которых охрана окружающей среды занимает одно из первых мест [2].
В народнохозяйственных планах экономического и социального развития нашей страны на охрану окружающей среды и здравоохранение выделяются огромные материальные, финансовые ресурсы. Затраты на охрану природы составили 26 млрд. руб. в десятой и около 30 млрд. руб. в одиннадцатой пятилеткеС 1966 по 1980 г. расходы на здравоохранение возросли в 2,4 раза, число больничных коек увеличилось с 2,6 млн. в 1970 г. до 3,6 в 1984 г., а число врачей удвоилось за последние 20 лет.
К сожалению, в последние годы не отмечалось стойкого улучшения показателей, на основании которых принято оценивать здоровье населения: общей и детской смертности,2 уровня заболеваемости, средней продолжительности предстоящей жизни. Это вызывает необходимость более глубокого изучения данного вопроса.
Проводимые исследования позволяют прийти к выводу, что за анализируемый период значительно улучшилось физическое развитие детей и подростков, являющееся одним из показателей здоровья населения [1].
Применение кластерного анализа, позволяющего на основе множества показателей, характеризующих более правильно с гигиенической точки зрения объекты наблюдения, сгруппировать обследуемых в классы (кластеры), чтобы они были более однородными, или, использовав «копии пары», установить, что широкие санитарно-гигиенические мероприятия обусловливают положительные сдвиги в здоровье населения.
Приводимые научные исследования позволяют прийти к выводу, что основными причинами ухудшения здоровья населения являются отрицательное влияние факторов окружающей среды
1 Зломанов Л. П., Уманский Л. А. — Цифры и факты. Политиздат, 1984, ► с. 33.
2 СССР в цифрах в 1984 г. — Финансы и статистика. М, 1985, с. 19.
и неправильное отношение к своему здоровью. С этими факторами, по данным некоторых исследований, связано 77 % всех случаев заболеваний, более половины случаев смерти и 57 % случаев неправильного физического развития.
Меняется и структура заболеваемости и смертности. Если раньше доминирующее положение занимали острые и инфекционные заболевания, то в настоящее время их место заняли хронические болезни [7].
Прежде всего необходимо определить понятие «здоровье». Концепция здоровья (преамбула Устава ВОЗ ООН 1948 г.) о том, что «здоровье — это состояние полного физического, психологического и социального благополучия, а не только отсутствие болезней и физических дефектов», пока не получила своего надежного развития ни в нашей стране, ни за рубежом.
Чтобы как-то восполнить этот пробел, НИИ общей и коммунальной гигиены им. А. Н. Сыеина АМН СССР по специальному «Вопроснику» были собраны мнения ведущих ученых-медиков о том, как они понимают здоровье, затем группа экспертов, включавшая крупных специалистов в области общей, социальной и коммунальной гигиены, определила ряд терминологических понятий. Эти определения в дальнейшем были сопоставлены с материалами зарубежных исследований, в частности с материалами Всемирной эпидемиологической ассоциации и ВОЗ, в подготовке которых от СССР участвовали Д. К. Соколов и Г. Ф. Церковный. Это позволило сформулировать более правильным смысловое значение понятия «здоровье». Установлено, что состояние здоровья трудно определить одной величиной, а используемые в настоящее время показатели — заболеваемость, смертность (общая и детская) — могут рассматриваться только как косвенные условные характеристики здо-'ровья, так как они характеризуют отсутствие здоровья, а следовательно, не могут быть положены в основу его изменения. То же самое можно отнести и к так называемым «группам здоровья», в основе которых опять-таки положена частота возникновения заболеваний.