Научная статья на тему 'Реляционные базы данных и анализ случаев отравления этанолом'

Реляционные базы данных и анализ случаев отравления этанолом Текст научной статьи по специальности «Прочие медицинские науки»

CC BY
248
20
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
Базы данных / структурированный язык запросов (SQL)

Аннотация научной статьи по прочим медицинским наукам, автор научной работы — Коковихин А. В.

В статье представлен краткий исторический обзор использования и организации реляционных баз данных, методика и результаты анализа случаев отравлений этиловым спиртом.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по прочим медицинским наукам , автор научной работы — Коковихин А. В.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Реляционные базы данных и анализ случаев отравления этанолом»

18.Bednarova V., BodlakovaB., PelclovaD, SulkovaS. //CasLek Cesk.-1999.-V. 138.-N 17.-P. 540.

19.Calvino J., Romero R., Pintos E. etal. //Am.J. Nephrol.-1998.- V. 18.-N6.-P. 565-569.

20.deHaro L., Jouglard J., Arditti J., David J.M. //Nephrologie.-1998.- V. 19.-N 1.-P. 221-224.

21.Hohn H., Schoenemann J. //Dtsch MedWochenschr .-2000.-V. 125.-N45.-P.1366-1368.

22.Iliev Y.,Andonova S.,Akabaliev V. //Folia Med (Plovdiv).- 1999.- V. 41.-N4.-P. 30-37.

23.Katsaros P. Familiar mushrooms .-Knopf ed.- NY.-1995.-192p.

24.Kilner R.G.,D’Souza R.J.,Oliveira D.B. etal. //Nephrol Dial Transplant.-1999.-V. 14.-N 11.-P. 2779-2780. 25.OstryV.//CasLek Cesk.-1999,- V. 138.-N 17.-P. 515-521.

26. Stickel F.,Egerer G.,Seitz H.K. //Public Health Nutr.-2000.-V. 3.-N2.-P. 113-124.

27.Sutton D.A.,Forthergill A.W.,Rinaldi M. Guide to clinically significant fungi.- NY, London.-1997.- 468p. 28.Warden C.R., Benjamin D.R. //Acad EmergMed.-1998 .-199.-V. 5.-N8.-P. 808-812.

© A.B. Коковихин, 2002 УДК 340.67

A.B. Коковихин РЕЛЯЦИОННЫЕ БАЗЫ ДАННЫХ И АНАЛИЗ СЛУЧАЕВ ОТРАВЛЕНИЯ ЭТАНОЛОМ

Государственное Учреждение Здравоохранения «Бюро судебно-медицинской экспертизы» г. Ижевска (Начальник бюро - В.И. Жихорев)

В статье представлен краткий исторический обзор использования и организации реляционных баз данных, методика и результаты анализа случаев отра.влений этиловым спиртом.

Ключевые слова: Базы данных, структурированный язык запросов (SQL).

A.V.Kokovikhin

RELATIONAL DATABASES AND ANALYSIS OF ETHANOL POISONING CASES

Summary historical review of usage and organization of relational databases, methods and analysis results of ethanol poisoning.

Key words: databases, structured query language (SQL).

В судебной медицине существует проблема анализа собранных сведений. В условиях ограниченности сил и средств решением проблемы является использование вычислительной техники.

Как указывается в пункте 5 решения коллегии Министерства здравоохранения РФ от 15.03.2000 г. требует совершенствования система информационного обеспечения здравоохранения через использование компьютерных технологий.

В настоящее время в крупных учреждениях при реализации масштабных научных проектов хранение и обработка сведений осуществляется с использованием специализированных компьютерных программ -баз данных (БД). Использование БД обеспечивает оперативный доступ к данным, высокую мобильность и компактность носителей информации. БД способны эффективно манипулировать информацией, поддерживать системы учрежденческого документооборота, обеспечивать технологические процессы.

Наиболее ранней из известных нам отечественных работ, которая посвящена анализу судебно-медицинской информации с использованием вычислительной техники является публикация Л.С Велишевой и А.А. Сартан (1972) [1]. В работе описывалось строение используемых БД касающихся широкого круга вопросов исследования трупов и экспертизы, либо освидетельствования, живых лиц. При исследовании трупа учитывался комплекс из 15 признаков, таких как пол, возраст, место смерти, месяц смерти, наличие алкоголя, род смерти и др. В случае насильственной смерти кон-

кретизировался вид повреждения. При ненасильственной смерти указывались классы заболеваний. Для анализа экспертизы живых лиц учитывался комплекс 9 признаков. Отмечалось: «...Статистические карты экспертиз одновременно служат картотекой и хранятся в архиве по годам. Шифровка признаков позволяет производить массовую быструю обработку карт на машиносчетной станции, а также значительно облегчает ручную их раскладку.». Запись и кодирование велись на перфокарты и обрабатывались с помощью счетно-перфорационных машин.

В ходе исследования E.-G. Ducho (1967) [2] применялась вычислительная техника, проводилось сопоставление выявленной неврологической симптоматики с результатами лабораторной диагностики экспертизы опьянения. Объем выборки составлял 3400 перфокарт.

При исследовании H. Mallach, P. Torpisch (1968) [3] обрабатывались 13615 перфокарт с целью анализа повторных правонарушений, совершаемых под воздействием алкоголя, и их выявление посредством машиносчетной обработки. При этом выявлено: увеличение концентрации алкоголя в крови рецидивистов от случая к случаю, описана методика исследования.

Следует отметить, что использовавшаяся ранее вычислительная техника и методика анализа морально устарели. Другим недостатком работ по анализу данных в 60-80-е годы XX века является относительно высокая стоимость и ограниченная функциональность.

В областных бюро работают специализированные БД. Целью их работы является проведение расчета па-

раметров годового отчета. Так, например, с середины 90-х годов в Кировском областном бюро СМЭ (начальник - проф. В.С. Мельников) проводится работа по созданию и ведению БД. Однако, возможности БД используются не полностью. Это связано с отсутствием отработанных методик и осознания потребности в глубоком анализе собранных сведений.

Использование современных методов работы с БД позволяет анализировать судебно-медицинскую информацию с качественно более высоким уровнем детализации. Это позволяет обобщить и систематизировать большой объем разнородной информации недоступной для обычного осмысления человеком. К факторам, способствующими детальному анализу следует отнести:

- Расширение спектра признаков за счет сокращения затрат труда на ввод и хранение сведений.

- Быстрый доступ к произвольному числу и набору признаков. Современные БД позволяют анализировать комбинации признаков с нужным уровнем детализации. Ранее, при «бумажном» документировании исследований, увеличение числа признаков увеличивало затраты труда в геометрической прогрессии и требовало работы крупных коллективов).

- Возможность рассчитать все возможные комбинации анализируемых признаков с изысканием наиболее значимых действующих факторов.

- доступность обработки сведений программами многофакторного анализа для вскрытия скрытых зависимостей.

Для реализации всех этих возможностей необходимо представление об организации и внутреннем устройстве БД. За последние 30 лет направление использования вычислительной техники для анализа сведений получило широкое развитие.

Теоретическую основу современных реляционных БД получивших наибольшее распространению, заложил в 70-х годах Е.Ф. Кодд (Б.Б. Codd) [4]. Развитие направления систем управления базами данных (СУБД) выразилось в описании и разработке языка

[13]. Большую работу в области исследования и популяризации разработки реляционных БД провел К.Дж. Дейт [4]. В последние годы в России проектирование и использование реляционных БД была популяризована в работах Г.М. Ладыженского [7] и С.Д. Кузнецова [6]. Разработанные на основе данной концепции базы данных дают в руки исследователя мощный инструмент хранения и анализа собранной информации, как по отдельным атрибутам, так и учитывая весь комплекс выявленных признаков.

Следует отметить, что основные принципы проектирования реляционных БД заложенные работами Е.Ф. Кодда актуальны и сегодня. Основой реляционных БД служат таблицы (table) (см. таблицы 1 и 2) состоящие из столбцов - полей (field) и строк - записей (record). Каждое поле при этом характеризует отдельный признак исследуемого объекта, а отдельная запись содержит конкретные значения признаков объекта. Поля одних таблиц могут быть связаны отношением (relation) с записью связанной таблицы равными значениями поля. Соединением отдельных таблиц формируется представление (view) данных, наглядно отображающее содержимое БД. В структуре языка программирования SQL предусмотрены развитые средства управления данными. С помощью «бизнес-правил» (trigger) проводится контроль вводимых в БД сведений, обеспечивается их непротиворечивость. Наибольшее распространение получили два класса БД: основанные на локальных таблицах (dBase, Paradox, FoxPro,Clipper) и SQL-серверы (OracleMS SQLInterBase, DB2). Следует отметить, что SQL-серверы предназначены для обеспечения крупных проектов с множеством одновременно работающих пользователей.

Для анализа БД к ней на языке SQL формируются обращения - запросы произвольной сложности и объема. Рассмотрим следующий пример запроса к БД:

Задача: "определить количество мужчин младше 40 лет умерших от травмы острыми предметами и

Таблица 1

No FIO Sex No Diagnos Alcohol Date Sympt1 Sympt2 Sympt3

1 Петров И.И. 1 21 5,3 12.03 1 1 0

2 Иванова П.П. 2 11 0 13.03 0 0 1

12 Смит Дж.С. 1 1 0,8 14.03 1 0 1

Таблица 2

No Diagnos Name

1 Атеросклеротическая болезнь сердца

2 Новообразования

11 Травма тупым предметом

12 Падение из положения стоя

21 Отравление этиловым спиртом

управления базами данных— SQL (читается «сэквэл», Structured Query Language, структурированный язык запросов) [12] который стал стандартом при работе с БД, текущая версия которого утверждена в 1992 году

находившихся в состоянии среднего и сильного алкогольного опьянения"-

Запрос: SELECT COUNT(*) FROM akts WHEREyear = 1998 AND dep = 1 AND sex = 1 AND age < 40 AND ds

= 14 AND Alcohol > 1.5; Ответ: 37.

{Выбрать и сосчитать все записи из таблицы akts где год = 1998 и отделение = 1 и пол = 1 и лет <40 и диагноз = 14 и алкоголь > 1,5.}.

Работа с БД осуществляется в интерактивном режиме, что позволяет провести масштабные расчеты в сжатые сроки. В простой и логичной форме определяются параметры отбора искомых случаев по исследуемым признакам. Изменяя значения и повторяя запросы заполняются все графы результирующей таблицы.

Для демонстрации возможностей метода и демонстрации его ме-тодики была избрана проблема отравления этиловым спиртом, что связано с высокой её социальной значимостью. Нами был проведен анализ случаев отравления этиловым спиртом за 1998-2000 годы в Ижев-ске и Завьяловском районе Удмуртской республики. Было исследовано распределение случаев отравления этанолом по возрасту и полу.

Наумовым Э.С. [11] были проанализированы отравления этиловым спиртом в г. Сыктывкаре Республики Коми. В его выборке соотношение случаев отравления этиловым спиртом у мужчин и женщин составило соответственно - 69,1% и 30,9%. Распределение по возрасту соответствовало: 20-40 лет - 21,5%, 41-50 лет -36,6%, 51-60 лет - 26,8% и более 61 года - 16,1%.

В исследованной нами выборке за 1998-2000 года мужчины соста-вили 71,5%, женщины - 28,5%. Распределение по возрасту составило: 20-40 лет - 22,3%, 4150 лет - 37,8%, 51-60 лет - 22,6% и более 61 года - 17,3%. При очевидной близости пропорций следует отметить

больший удельный вес мужчин и доли лиц трудоспособного возраста в нашей выборке по г. Ижевску.

В ходе исследования было выдвинуто предположение о наличии влияния комплекса физиологических, психологических и социальных факторов присущих полу и возрасту на уровень алкоголизации насе-ле-ния и крайней её формы случаев отравления этанолом. Для проверки этой гипотезы и характеристики выборки, раздельно по полам исследовались случаи отравления этиловым спиртом.

Выборка исследовалась по признаку возраста и пола. Для исследования средних показателей использовалась медиана - средний возраст делящий число случаев выборки на две равные части, причем одна половина меньше, а другая больше, не меньше его значения. Наглядно характеризует общую картину средний возраст половины случаев - определение от 1-го до 3-го квартиля или 25-ого и 75-ого процентилей [1, 3]. Определялся возраст 5% наиболее молодых и наиболее пожилых лиц (5-ый и 95-ый процентили).

Для объективной характеристики выборки вычислялся средний возраст, ошибка средней арифметической при его вычислении, стандартное отклонение значения, отклонение средней и коэффициент вариации в группах. В таблицах №№ 3, 4, 5 и 6 демонстрируются результаты анализа БД по полу и возрасту.

При проведении расчетов использовались реляционная SQL БД "Акты" танатологического отдела ГУЗ БСМЭ УР (заведующий - Кошкин Д.Ю.) и электронная таблица MS Excel.

Таблица 3

Средний возраст лиц умерших от отравления этиловым спиртом, ошибка средней в группах

по полу и стандартное отклонение

ГОД Общее Мужчины Женщины

1998 - 2000 48,04±1,08, 5 =11,47 47,31±1,17, 5 =11,43 52,44±2,70, 5 =10,74

1998 48,28±2,10, 5 =11,17 46,58±2,17, 5 =09,67 52,21±4,57, 5 =13,39

1999 47,98±2,42, 5 =12,39 44,75±2,66, 5 =11,59 56,39±3,86, 5 =10,43

2000 48,00±1,48, 5 =11,21 46,30±1,70, 5 =10,95 52,44±2,70, 5 =10,74

Таблица4

Характеристика выборки случаев отравления этиловым спиртом в Ижевске и Завьяловском районе за 1998 - 2000 годы

Общее Мужчины Женщины

Средний возраст 48,04 45,96 53,29

Стандартное отклонение 11,47 10,79 11,48

Отклонение средней 1,08 1,21 2,04

Коэфф. вариации (%) 23,87 23,48 21,55

Медиана 47,00 46,00 52,00

5 процентиль 31,00 30,35 37,10

25 процентиль 40,00 39,00 46,00

50 процентиль 47,00 46,00 52,00

75 процентиль 57,00 53,00 62,00

95 процентиль 67,00 64,00 69,00

Таблица S

Мужчины

1998 1999 2000

Средний возраст 46,58 44,75 46,30

Стандартное отклонение 9,67 11,59 10,95

Отклонение средней 2,17 2,66 1,70

Коэфф. вариации (%) 20,76 25,91 23,65

Медиана 47,00 45,00 46,00

5 процентиль 31,75 29,40 28,90

25 процентиль 38,75 40,00 39,00

50 процентиль 47,00 45,00 46,00

75 процентиль 53,25 52,00 53,50

95 процентиль 61,50 63,80 65,00

Таблица 6

Женщины

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

1998 1999 2000

Средний возраст 52,21 56,39 52,44

Стандартное отклонение 13,39 10,43 10,74

Отклонение средней 4,57 3,86 2,70

Коэфф. вариации (%) 25,65 18,49 20,49

Медиана 53,00 58,50 51,00

5 процентиль 39,60 40,35 33,00

25 процентиль 46,00 48,00 46,00

50 процентиль 53,00 58,50 51,00

75 процентиль 60,00 66,25 62,00

95 процентиль 68,40 70,30 68,00

Программа Excel включает развитые функции ста- Обращает на себя внимание снижение за после-

тистической обработки сведений и работы с базами дние 3 года возраста 5% наиболее молодых отравив-

данных. Использовались функции БСЧЁТ (операция шихся мужчин.

подсчета количества записей по условию), БДДИСП Подводя итог, следует отметить, что использование

(оценка дисперсии выборки), ДСРЗНАЧ (среднее зна- в ходе судебно-медицинских исследований реляцион-

чение выборки), ДСТАНДОТКЛ (стандартное откло- ной базы данных позволяет сократить затраты труда

нение выборки), МЕДИАНА и ПЕРСЕНТИЛЬ [10]. и поднять на иной уровень анализа качества проводи-

Выявлено различие возраста мужчин и женщин, мых исследований. умерших от отравления этанолом, при этом средний возраст мужчин меньше среднего возраста женщин.

Литература:

1. Бессметный Б.С. Математическая статистика в клинической профилактической и экспериментальной медицине. М.: Медицина. - 1967., 303 с. - 24 с.

2. Велишева Л.С., Сартан A.A. Методика статистической разработки материала судебно-медицинской экспертизы на счетно-перфорационных машинах // Суд.-мед. экспертиза. - М.: Медицина, 1972. - № 2. - С. 49-50.

3. Гланц С. Медико-биологическая статистика. Пер с англ. - М., Практика. -1998. - 459 с. - С.33-35.

4. Дейт К.Дж. Введение в системы баз данных, 6-е издание: Пер. с англ. - К.; М.; СПб.: Издательский дом «Вильямс», 2000. - 848 с.

5. ДучоЕ.-Г. Статистическая оценка данных экспертизы опьянения//Суд.-мед. экспертиза. —М.: Медицина, 1967. - № 4.- С. 55.

6. Кузнецов С.Д. Введение в системы управления базами данных. // Системы управления базами данных. - М.: Открытые системы, 1995, № 1.

7. Ладыженский Г.М. Системы упра.вления базами данных - коротко о главном. // Системы управления базами данных. -М.: Открытые системы, 1995, № 1.

8. Малач Г., Торпиш П. Повторные правонарушения, совершаемые под воздействием алкоголя, и их выявление посредством машиносчетной обработки // Суд. - мед. экспертиза. - М.: Медицина, 1968. - № 4. - С. 52.

9. Наумов Э.С. Экспертная система диагностики острого алкогольного отравления: Автореф. дис.... канд. мед. наук -М., 2000, -28 с.

10.Николь Н, Альбрехт Р. Электронные таблицы Excel 5.0 для квалифицированных пользователей: Практ. пособ. /Пер с нем. - М.: ЭКОМ., 1996 - 304 с.

11. Codd E.F. А Relational Model of Data for Large Shared Data Banks // CACM. -1970. - № 6.

12. Chamberlin D.D.,Boyce R.F. SEQUEL: A Structured English Query Language // Workshop on Data Description. Access, and Control. - Ann Arbor, Mich., 1974.

13. FIPS PUB 127-2. Database Language SQL. U.S. Department of Commerce, National Institute ofStandarts and Technology, 1992.

i Надоели баннеры? Вы всегда можете отключить рекламу.