Научная статья на тему 'ПРОСТРАНСТВЕННЫЙ АНАЛИЗ ДАННЫХ В ЭПИДЕМИОЛОГИИ СЕНСОНЕВРАЛЬНОЙ ТУГОУХОСТИ'

ПРОСТРАНСТВЕННЫЙ АНАЛИЗ ДАННЫХ В ЭПИДЕМИОЛОГИИ СЕНСОНЕВРАЛЬНОЙ ТУГОУХОСТИ Текст научной статьи по специальности «Медицинские технологии»

CC BY
107
33
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ПРОСТРАНСТВЕННЫЙ АНАЛИЗ ДАННЫХ / СЕНСОНЕВРАЛЬНАЯ ТУГОУХОСТЬ / ЭПИДЕМИОЛОГИЧЕСКИЙ МЕТОД / ЯЗЫК R / КЛАСТЕРНЫЙ АНАЛИЗ / ГЕОГРАФИЧЕСКАЯ ВЗВЕШЕННАЯ РЕГРЕССИЯ / SPATIAL DATA ANALYSIS / SENSORINEURAL HEARING LOSS / EPIDEMIOLOGICAL METHOD / R LANGUAGE / CLUSTER ANALYSIS / GEOGRAPHIC WEIGHTED REGRESSION

Аннотация научной статьи по медицинским технологиям, автор научной работы — Корнеенков А.А., Рязанцев С.В., Фанта И.В., Вяземская Е.Э., Левин С.В.

Выявление факторов риска, особенностей и закономерностей возникновения и распространения болезней в пространстве требует большого массива разнообразных данных и использования серьезного математико-статистического аппарата. Распределение заболеваний в пространстве изучается с помощью инструментов пространственного анализа (англ., spatial analysis), получивших в настоящее время широкое распространение по мере внедрения информационных систем и накопления данных, имеющих отношение к здоровью населения. Для большинства задач работы с пространственными данными (данными, событиями, которые имеют географические, пространственные координаты) используются различные геоинформационные системы. В качестве заболевания для пространственного анализа была выбрана сенсоневральная тугоухость, с которой проходили лечение пациенты в Санкт-Петербургском НИИ уха, горла, носа и речи в течение одного года исследования. Основными задачами пространственного анализа данных заболеваемости сенсоневральной тугоухости (СНТ) по госпитализации являлись: визуализация точечного образа (англ., point pattern), который могут формировать географические координаты мест проживания стационарных пациентов с СНТ; оценка свойств пространственного процесса, который порождает этот точечный образ (оценка интенсивности процесса, его закономерностей) с помощью различных статистических показателей; проверка гипотезы о пространственной случайности этого процесса и влиянии на него отдельных факторов. Все расчеты, использованные в статье, сопровождаются R-кодом, поэтому они легко могут быть воспроизведены, текст статьи может быть использован как пошаговая инструкция для их выполнения.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по медицинским технологиям , автор научной работы — Корнеенков А.А., Рязанцев С.В., Фанта И.В., Вяземская Е.Э., Левин С.В.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

SPATIAL DATA ANALYSIS IN EPIDEMIOLOGY OF SENSORINEURAL HEARING LOSS

The identification of risk factors, features and patterns of the emergence and spread of diseases in space requires a large array of diverse data and the use of a serious mathematical and statistical apparatus. The distribution of diseases in space is studied using spatial analysis tools, which are now widely used as information systems are introduced and data are accumulated that are relevant to public health. For most tasks of working with spatial data (data, events that have geographical, spatial coordinates), various geographic information systems are used. As a disease for spatial analysis, sensorineural hearing loss was chosen, with which patients were treated at the Saint-Petersburg Research of Ear, Throat, Nose and Speech during one year of the study. The main tasks of the spatial analysis of data on the incidence of sensorineural hearing loss (SNHL) for hospitalization were: visualization of a point pattern, which can form the geographical coordinates of the places of residence of inpatients with SNHL; assessment of the properties of the spatial process that generates this point image (assessment of the intensity of the process, its laws) using various statistical indicators; testing the hypothesis about the spatial randomness of this process and the influence of individual factors on it. R-code accompanied all calculations in the article. Calculations can be reproduced quite easily. The text of the article can be used as step-by-step instructions for their implementation.

Текст научной работы на тему «ПРОСТРАНСТВЕННЫЙ АНАЛИЗ ДАННЫХ В ЭПИДЕМИОЛОГИИ СЕНСОНЕВРАЛЬНОЙ ТУГОУХОСТИ»

ORIGINAL ARTICLES

УДК 519.237.5:303.7:004.43:616.28-009-036.2 https://doi.org/10.18692/1810-4800-2020-4-13-20

Пространственный анализ данных в эпидемиологии сенсоневральной тугоухости

А. А. Корнеенков1, С. В. Рязанцев1, И. В. Фанта1, Е. Э. Вяземская1, С. В. Левин1, Е. А. Левина1

1 Санкт-Петербургский научно-исследовательский институт уха, горла, носа и речи, Санкт-Петербург, 190013, Россия

Spatial Data Analysis in epidemiology of sensorineural hearing loss

A. A. Korneenkov1, S. V. Ryazantsev1, I. V. Fanta1, E. E. Vyazemskaya1, S. V. Levin1, E. A. Levina1

1 Saint Petersburg Research Institute of Ear, Throat, Nose and Speech, Saint Petersburg, 190013, Russia

Выявление факторов риска, особенностей и закономерностей возникновения и распространения болезней в пространстве требует большого массива разнообразных данных и использования серьезного математико-статистического аппарата. Распределение заболеваний в пространстве изучается с помощью инструментов пространственного анализа (англ., spatial analysis), получивших в настоящее время широкое распространение по мере внедрения информационных систем и накопления данных, имеющих отношение к здоровью населения. Для большинства задач работы с пространственными данными (данными, событиями, которые имеют географические, пространственные координаты) используются различные геоинформационные системы. В качестве заболевания для пространственного анализа была выбрана сенсоневральная тугоухость, с которой проходили лечение пациенты в Санкт-Петербургском НИИ уха, горла, носа и речи в течение одного года исследования. Основными задачами пространственного анализа данных заболеваемости сенсоневральной тугоухости (СНТ) по госпитализации являлись: визуализация точечного образа (англ., point pattern), который могут формировать географические координаты мест проживания стационарных пациентов с СНТ; оценка свойств пространственного процесса, который порождает этот точечный образ (оценка интенсивности процесса, его закономерностей) с помощью различных статистических показателей; проверка гипотезы о пространственной случайности этого процесса и влиянии на него отдельных факторов. Все расчеты, использованные в статье, сопровождаются R-кодом, поэтому они легко могут быть воспроизведены, текст статьи может быть использован как пошаговая инструкция для их выполнения.

Ключевые слова: пространственный анализ данных, сенсоневральная тугоухость, эпидемиологический метод, язык R, кластерный анализ, географическая взвешенная регрессия.

Для цитирования: Корнеенков А. А., Рязанцев С. В., Фанта И. В., Вяземская Е. Э., Левин С. В., Левина Е. А. Пространственный анализ данных в эпидемиологии сенсоневральной тугоухости. Российская оториноларингология. 2020;19(4):13-20. https://doi.org/10.18692/1810-4800-2020-4-13-20

The identification of risk factors, features and patterns of the emergence and spread of diseases in space requires a large array of diverse data and the use of a serious mathematical and statistical apparatus. The distribution of diseases in space is studied using spatial analysis tools, which are now widely used as information systems are introduced and data are accumulated that are relevant to public health. For most tasks of working with spatial data (data, events that have geographical, spatial coordinates), various geographic information systems are used. As a disease for spatial analysis, sensorineural hearing loss was chosen, with which patients were treated at the Saint-Petersburg Research of Ear, Throat, Nose and Speech during one year of the study. The main tasks of the spatial analysis of data on the incidence of sensorineural hearing loss (SNHL) for hospitalization were: visualization of a point pattern, which can form the geographical coordinates of the places of residence of inpatients with SNHL; assessment of the properties of the spatial process that generates this point image

&

© Коллектив авторов, 2020 1 13

о

s

pr

1

0

S'

1

i о

(assessment of the intensity of the process, its laws) using various statistical indicators; testing the hypothesis about the spatial randomness of this process and the influence of individual factors on it. R-code accompanied all calculations in the article. Calculations can be reproduced quite easily. The text of the article can be used as step-by-step instructions for their implementation.

Keywords: spatial data analysis, sensorineural hearing loss, epidemiological method , R language, cluster analysis, geographic weighted regression.

For citation: Korneenkov A. A., Ryazantsev S. V., Fanta I. V., Vyazemskaya E. E., Levin S. V., Levina E. A. Spatial Data Analysis in epidemiology of sensorineural hearing loss. Rossiiskaya otorinolaringologiya. 2020;19(4):13-20. https://doi.org/10.18692/1810-4800-2020-4-13-20

Введение

Выявление факторов риска, закономерностей возникновения и распространения болезней требует разнообразных исходных данных и использования серьезного математико-стати-стического аппарата. Распределение заболеваний в пространстве изучается с помощью инструментов пространственного анализа (англ., spatial analysis), получивших в настоящее время широкое распространение по мере внедрения информационных систем и накопления данных, имеющих отношение к здоровью населения. Пространственный анализ в медицине не ограничивается общественным здоровьем, его методы активно развиваются, например, в биологии [1] для поиска неслучайных объединений (кластеров) в исследованиях генома и клеточных мембран и т. д.

Чтобы уменьшить субъективизм в оценке пространственных данных и получить более точное представление о пространственных закономерностях, трендах, процессах применяется пространственная статистика. Она предлагает большое количество инструментов, которые эффективно дополняют визуальные, картографические и традиционные (непространственные) статистические методы анализа данных.

С помощью методов пространственного анализа изучались эпидемиологические вопросы распространения заболеваний, относящихся к сенсоневральной тугоухости (СНТ), по данным госпитализации пациентов с СНТ в Санкт-Петербургский НИИ уха, горла, носа и речи (СПб НИИ ЛОР) в течение одного года исследования с использованием программной среды R. а Основными задачами пространственного анализа данных заболеваемости СНТ по госпитали-~ зации являлись: визуализация точечного образа ^ (англ., point pattern), который могут формиро-а вать географические координаты мест прожива-g ния пациентов с СНТ; оценка свойств простран-'С ственного процесса, который порождает этот о точечный образ (оценка интенсивности процесса, его закономерностей) с помощью различных статистических показателей; проверка гипотезы о пространственной случайности этого процесса и влиянии на него отдельных факторов.

Материалы и методы исследования

В исследовании использованы деперсонифи-цированные данные о пациентах, находившихся на стационарном лечении в СПб НИИ ЛОР в 2018-2019 годах с сенсоневральной тугоухостью (коды МКБ 10: H90.3 / H90.4 / H90.5/ H91.1/ H91.2 / H91.8). Вычисление географических координат по адресам регистрации пациентов проведено с помощью пакетного геокодирования. Полученный набор данных содержал код основного заболевания пациента и данные геокодирования (загрубленную широту и долготу места регистрации).

В качестве основного программного продукта для решения пространственных задач был использован программный пакет R с различными библиотеками для обработки и визуализации пространственных данных (ggplot2, rdal, mapview и другие), который хорошо себя зарекомендовал для решения широкого круга статистических задач [2, 3]. Все данные и R-коды-решения поставленных задач, использованные в настоящей статье, находятся в открытом доступе и представлены на сайте СПб НИИ ЛОР в разделе https:// lornii.ru/press-centr/publikatsii/. Данные об административно-территориальном делении Санкт-Петербурга (полигоны муниципальных округов, районов, дорог и т. п.) через сервис Overpass Turbo (http://overpass-turbo.eu/) экспортированы в R-формате geojson. Данные о населении Санкт-Петербурга получены из публикаций Федеральной службы государственной статистики (https://gks.ru/compendium).

Для пространственного представления данных и их анализа использовались картограммы на основе частот (интенсивностей событий госпитализации) и производных (относительных) показателей, точечный анализ и расчет плотности вероятности появления события, анализ точечных образов на основе метода «ближайшего соседа», K- и L-функции, географически взвешенная регрессия и пространственный кластерный анализ.

Результаты исследования

Как правило, большинство пространственной информации, имеющей отношение к здоровью на-

селения собирается, группируется и представляется в виде картограмм на основе административного деления территории (численность популяции, распространенность болезней, факторов и т. д.). Минимальной административно-территориальной единицей деления для Санкт-Петербурга (СПб), по которой агрегируется различная статистическая информация, является муниципальный округ (образование) (МО). Картограммой считается графическое изображение статистических данных, сведенных по географическому принципу (например, по административному делению), представляющее собой географическую карту, территории, которые окрашены (или заштрихованы) в соответствии со значением исследуемого показателя, наблюдаемого на данной территории (заболеваемость, обеспеченность медпомощью и т. д.). Одна, но наиболее часто встречающаяся разновидность картограмм - это хороплет (англ., Логор1еЛ, от греческого %<йрос; «район/регион» и «множество, количество»).

а) ^-г^тч

При создании картограмм географические координаты интересующих событий могут вообще не использоваться, а подсчет числа событий в каждой области картограммы производится по определенному признаку события, например названию района проживания. Уровни риска, интенсивность воздействия различных факторов по мере укрупнения пространственных объектов на картограмме могут значительно меняться. Так, в среднем на большой территории риск возникновения интересующего события достаточно низкий, одновременно внутри более мелкой области такой риск может быть очень высоким, а для конкретного индивидуума в конкретной точке пространства - чрезвычайным.

На рис. 1 представлены три картограммы для иллюстрации:

а) численность населения в различных муниципальных округах (МО) Санкт-Петербурга; б) частота госпитализации (отн. значение, 0/00) в НИИ ЛОР на 1 тыс. жителей МО СПб; в) общее

б)

жителей (ТЫС НОТ )

в)

Рис. 1. Картограммы (хороплеты): а - численности населений муниципальных образований СПб; б - частоты госпитализации (отн. значение, 0/00) в НИИ ЛОР на 1 тыс. жителей МО СПб; в - общего числа госпитализированных (абс. значение) в НИИ ЛОР

из МО СПб.

Fig. 1. Cartogram (choropleth) of the population of the municipalities of citi (a), the frequency of hospitalization (w. value, 0/00) in the IR of 1,000 inhabitants of the municipalities of citi (b) and the total number of hospitalizations (ab. value) in the ENT Institute from the

municipalities of citi (с).

о

s

pr

1

0

т

S' f

1 If

число госпитализированных (абс. значение) в НИИ ЛОР из МО СПб. Карты б) и в) визуально совершенно разные, хотя основаны на одних данных: первая показывает оценку вероятности быть госпитализированным в НИИ ЛОР из определенного МО СПб, вторая - интенсивность госпитализации из МО СПб.

Например, по картограмме на рис. 1, а наиболее интенсивным оказался муниципальный округ Лахта - Ольгино, с численностью населения около 4,5 тыс. человек, хотя из него поступил только 1 человек. По сравнению с другими муниципальными округами с гораздо большей численностью населения этот показатель наибольший. Эта ситуация иллюстрирует один из основных недостатков картограмм - влияние на результат заранее предопределенного территориального деления.

Чтобы отойти от заранее предопределенного в виде административно-территориального деления вида картограмм к созданию точечных образов, проверке их на неслучайность, а также определению вероятности появления событий (в нашем случае госпитализации пациента с СНТ из конкретной пространственной точки или области), мы используем создание точечного образа из локаций пациентов с СНТ с использованием статистических методов оценивания. Статистические методы позволяют получить более точное представление о пространственных закономерностях, трендах, процессах и отношениях, оценить вероятность события или опре-

деленного значения случайной величины. Для пространственных данных это также актуально, так как если мы предполагаем, что наблюдаемое явление неслучайно, что же становится причиной, законом появления именно таких случаев в этой пространственной точке. Так как мы имеем дело с географическими координатами события, которые могут быть измерены с математической точки зрения с бесконечной точностью, они являются непрерывными случайными величинами, а одним из способов задания распределения такой случайной величины является плотность вероятности.

На рис. 2 представлены места проживания пациентов с СНТ, поступивших на госпитализацию в НИИ ЛОР (красные треугольники), и изолинии (синий цвет), охватывающие области с одинаковой плотностью вероятности появления пациентов с СНТ. Для определения плотности вероятности был использован метод ядерной оценки плотности (англ. Kernel Density Estimation, KDE), предназначенный для сглаживания данных, когда делается заключение о генеральной совокупности, основываясь на выборках данных. Этот метод получил широкое распространение для пространственного анализа данных, но он достаточно чувствителен к одному из важнейших параметров - полосе пропускания ядра (англ., bandwidth), который оказывает сильное влияние на результат оценки. Установка малого значения делает кривую недостаточно сглаженной, по-

о

^ Рис. 2. Места проживания пациентов с СНТ, поступивших на госпитализацию в НИИ ЛОР (красные треугольники); изолинии (синий цвет), охватывающие области с одинаковой плотностью вероятности появления пациентов с СНТ, требующих госпита-¡2 лизации.

$ Fig. 2. Places of residence of patients with SNHL admitted for hospitalization at the ENT Institute (red triangles); Insulation (blue) 3 covering areas with the same probability density of SNHL patients, who in need of hospitalization.

скольку она содержит слишком много случайных выбросов, большого - чрезмерно сглаженной, поскольку такая полоса пропускания существенно скрывает структуру. Другими словами, большая полоса пропускания приводит к очень обобщенной поверхности плотности событий, в то время как малая полоса пропускания фокусируется на меньшем масштабе.

Имеется несколько распространенных в пространственном анализе данных функций и показателей, с помощью которых можно статистически выявить и охарактеризовать возможные неоднородности пространственного распределения интересующих событий, выявить возможные скопления, кластеры. K-функция (ее еще называют fc-функция Рипли) [Ripley B. D., 1976] является наиболее часто используемым методом и определяет, идентифицирует расстояние, на котором происходит кластеризация или пространственная агрегация событий. Например, для нашей задачи, в случае предположения, что процесс появления пациентов с СНТ, которым требуется госпитализация в НИИ ЛОР, является изотропным (т. е. имеющим одинаковую интенсивность на всей территории Санкт-Петербурга) с интенсивностью X событий (ожидаемое количество событий) на единицу площади, К-функция на расстоянии r от места жительства любого другого госпитализированного пациента с СНТ в НИИ ЛОР может быть определена как K(r), а XK(r) дает ожидаемое число госпитализированных пациентов на этом расстоянии r.

Диаграммы K-функции позволяют оценить, отличается ли агрегация событий, пространственных точек от полностью случайного процесса и в какую сторону. Если значение K-функции больше ожидаемого значения для определенного расстояния r, распределение является более кластеризованным, чем случайное распределение на этом расстоянии, если меньше - распределение

а) Kioh

будет более рассеянным, чем случайное распределение на этом расстоянии. Когда наблюдаемое значение K находится вне границ доверительного интервала для ожидаемого значения K, пространственная кластеризация на этом расстоянии является статистически значимой, если оно находится внутри, то пространственная кластеризация статистически не значима. На рис. 3, а показана диаграмма зависимости оценки K-функции от расстояния r (в географических единицах -градусах). На диаграмме красная линия Kpois(r) представляет теоретическую K-функцию, соответствующую нулевой гипотезе, что точки полностью случайным образом распределены (CSR). Как видно из рисунка, наблюдаемое значение K больше ожидаемого значения для всех расстояний r, поэтому распределение является более кластеризованным, чем случайное распределение.

Диаграмма L-функции (рис. 3, б) является по сути преобразованной K-функцией для удобства восприятия, так как красная линия теоретической K-функции, соответствующей нулевой гипотезе, представляется в виде прямой линии, без тенденции к загибанию кверху при больших значениях r.

Рисунки показывают, что при всех значениях расстояния r наблюдаемые значения K-функции отличаются от тех, при которых K-функцию, соответствующую нулевой гипотезе, что точки полностью случайным образом распределены (англ., complete spatial randomness — CSR), они более сгруппированы, чем ожидалось на этом расстоянии r.

Учитывая, что наблюдаемый точечный образ из мест проживания госпитализированных с СНТ в НИИ ЛОР отличается от случайно пространственного распределенного точечного образа, мы можем сделать несколько предположений о возможных факторах, определяющих эту неслучайность. Логично было бы предположить, что интен-

б) Lloh

Рис. 3. Графики функций пространственного анализа: а - К-функция распределения пациентов с СНТ на разных расстояни- 3

ях r; б - L-функция; Kp0is(r) - теоретическая K-функция, соответствующая случайному распределению; KIS0(r) - K-функция, 3

соответствующая изотропному процессу позникновения событий; K hici(r) - верхняя граница доверительного интервала для ^

K-функции; KloCI(r) - нижняя граница доверительного интервала для K-функции. 3.

Fig. 3. Spatial analysis function graphs: а - К-function of distribution of patients with SNHL at different distances (r); б - L-function: dq

Kpois(r) - is a theoretical K-function corresponding to a random distribution; KiS0(r) - K-function corresponding to the isotropic event 3

occurrence process; Khici(r) - top limit of confidence interval for K-function; KloCI(r) - lower bound of the confidence interval for the 3.

K-function. б

gwr(formula = countpatTU ~ population, data = geoy05Pb@-data,

coords = cbind(lon, lat), adapt = GWRbandwidth, hatmatrix = true.

Adaptive quantille: 0.4684747 (about 52 of 111 data points) Summary of GWR coefficient estimates at data points:

X.intercept. -2.0390e-02 6.3259e-02 1.1983e-01 1.7510e-01 2.6950e-01 0.0182

population 4,2705e-05 4.5471e-05 4.7331e-05 5.0045e-05 5.3113e-05 0.0001

Рис. 4. Машинограмма (часть) расчетов GWR, в которой в качестве показателя-отклика использовалось число госпитализированных пациентов с СНТ, а фактора - численность населения, проживающего в МО СПб. Fig. 4. GWR Calculation machine (part). The number of SNHL patients hospitalized was used as a response rate, The population of the

city's municipalities was used as a factor.

сивность госпитализации зависит от численности населения, проживающего на отдельных территориях, откуда госпитализировались пациенты. Для построения модели такой зависимости была использована географически взвешенная регрессия (Geographically Weighted Regression, GWR) -один из нескольких методов пространственного регрессионного анализа, все чаще используемого в географии и других дисциплинах. Метод GWR создает локальную модель предсказываемой переменной, применяя уравнение регрессии к каждому пространственному объекту (в нашем случае -муниципальному округу СПб) в наборе данных. В GWR вместо одного глобального коэффициента регрессии для каждой переменной коэффициенты могут меняться в зависимости от пространственного объекта. Это пространственное изменение коэффициентов может выявить интересные закономерности, которые в противном случае были бы не видны или замаскированы.

На рис. 4 приведена часть машинограммы расчетов GWR, в которой в качестве показателя-отклика использовалось число госпитализированных пациентов с СНТ (countpatTU), а в качестве фактора - численность населения, проживающего в 111 муниципальных образованиях Санкт-Петербурга (population).

Эта модель имеет скорректированное значение Д-квадрата 0,4623. Таким образом, мы можем предположить, что около 46% дисперсии числа госпитализированных пациентов из разных МО СПб можно объяснить моделью. Так как это значение менее принятого для таких моделей значения 0,5 (или в процентах - 50%), эта модель может считаться неадекватно описывающей зависимость изучаемых переменных.

На основании сравнения цвета (рис. 5) можно сделать вывод, в каких округах численность населения как фактор оказывает большее влияние на интенсивность госпитализации пациентов с СНТ в НИИ ЛОР (красный цвет), а в каких - меньше (синий цвет). Для восточной и юго-восточной территории города численность населения оказывает большее влияние на интенсивность госпитализации, чем в северных районах Санкт-Петербурга.

Еще одним пространственным инструментом является метод иерархической кластеризации показателя, позволяющий определять пространственные скопления (агрегации) и их пространственные центры (центроиды). Кластеризация (англ. cluster analysis) - задача группировки множества объектов на подмножества (кластеры) таким образом, чтобы объекты из одного кластера

f

1 S-

•5 'С о

0

1

о

о;

Рис. 5. Картограмма, показывающая значения коэффициентов регрессии GWR в разных муниципальных образованиях СПб. Fig. 5. Map showing GWR regression coefficients in different municipalities of the city.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Рис. 6. Результаты иерархического кластерного анализа мест проживания пациентов, госпитализированных с СНТ, при произвольном выборе количества центров: а - шесть; б - четыре. Одинаковым цветом показаны места проживания пациентов,

отнесенных к одному кластеру.

Fig. 6. Results of hierarchical cluster analysis of the places of residence of patients hospitalized with SNHL with an arbitrary choice of the number of centers: a - six; b - four. Places of residence of patients assigned to the same cluster are shown in the same color.

были более похожи друг на друга, чем на объекты из других кластеров по какому-либо критерию. На рис. 6 показаны результаты кластеризации мест проживания госпитализированных пациентов с произвольно выбранным числом центров (центроидов). Такой инструмент может помочь, например, в создании оптимально расположенной сети медицинских учреждений, которые будут иметь максимальную доступность для пациентов с определенной патологией.

Выводы

Пространственный анализ данных о местах, откуда были госпитализированы пациенты с СНТ в Санкт-Петербургский НИИ ЛОР, позволил получить общее представление о пространственной интенсивности этого процесса. С помощью построения точечного пространственного образа мест проживания госпитализированных пациентов с СНТ и оценки вероятности появления пациентов с СНТ можно сделать вывод об их преимущественной локализации вокруг географического центра Санкт-Петербурга, при редкой

встречаемости на окраинах города. Расчеты пространственных ^ и 1-функций показывают, что места проживания пациентов не распределены полностью случайным образом (CSR), они более сгруппированы, чем ожидалось при случайном характере появления таких пациентов. На основе использования географически взвешенной регрессии (GWR) можно сделать вывод, в каких округах численность населения как фактор оказывает большее влияние на интенсивность госпитализации пациентов с СНТ в НИИ ЛОР, а в каких - меньшее. Для восточной и юго-восточной территорий города численность населения оказывает большее влияние на интенсивность госпитализации, чем в северных районах Санкт-Петербурга.

Представленные выше методы составляют лишь небольшую часть инструментария пространственного анализа данных о заболеваемости населения и могут быть с успехом использованы при решении различных медицинских задач.

Авторы заявляют об отсутствии конфликта интересов.

Л

о

ЛИТЕРАТУРА

1. Kiskowski M. A., Hancock J. F., Kenworthy A. K. On the use of Ripley's K-function and its derivatives to analyze domain size. Biophys J. 2009;97(4):1095-1103. https://doi.org/10.1016/j.bpj.2009.05.039.

2. Корнеенков А. А. Разработка скоринговой карты для прогнозирования клинического исхода в оториноларингологии. Российская оториноларингология. 2019; 18(2):25-35. https://doi.org/10.18692/1810-4800-2019-2-25-35

3. Корнеенков А. А., Фанта И. В., Вяземская Е. Э. Оценка динамики симптомов болезни методами анализа выживаемости. Российская оториноларингология. 2019;4:8-14. https://doi.org/10.18692/1810-4800-2019-4-8-14

4. Ripley B. 1976. The second-order analysis of stationary point processes. Journal of Applied Probability. 13(2):255-266. https://doi.org/10.2307/3212829

s

pr

1

0

S' f

1 If

REFERENCES

1. Kiskowski M.A., Hancock J.F., Kenworthy A.K. On the use of Ripley's K-function and its derivatives to analyze domain size. Biophys J. 2009;97(4):1095-1103. https://doi.org/10.1016/j.bpj.2009.05.039.

2. Korneenkov A. A. Development of a scorecard for predicting clinical outcome in otorhinolaryngology. Rossiiskaya otorinolaringologiya. 2019 18 (2): 25-35. https://doi.org/10.18692/1810-4800-2019-2-25-35 (In Russ.)

3. Korneenkov A.A. Fanta I.V. Vyazemskaya E.E. The Assessment of disease symptom dynamics by using survival analysis methods. Rossiiskaya otorinolaringologiya. 2019 4: 8-14. https://doi.org/10.18692/1810-4800-2019-4-8-14 (In Russ.)

4. Ripley B. 1976. The second-order analysis of stationary point processes. Journal of Applied Probability. 13(2), 255-266. https://doi. org/10.2307/3212829

Информация об авторах

H Корнеенков Алексей Александрович - доктор медицинских наук, профессор, заведующий лабораторией информатики и статистики, Санкт-Петербургский научно-исследовательский институт уха, горла, носа и речи (190013, Россия, Санкт-Петербург, Бронницкая ул., д. 9); тел.: + 7 (904) 554-07-40, e-mail: korneyenkov@gmail.com ORCID: https://orcid.org/0000-0001-5870-8042

Рязанцев Сергей Валентинович - заслуженный врач РФ, доктор медицинских наук, профессор, заместитель директора по научно-координационной работе, Санкт-Петербургский научно-исследовательский институт уха, горла, носа и речи (190013, Россия, Санкт-Петербург, Бронницкая ул., д. 9); тел.: +7 (812) 316-28-52, e-mail: professor.ryazantsev@mail.ru ORCID: https://orcid.org/0000-0003-1710-3092

Фанта Иван Васильевич - кандидат медицинских наук, заведующий организационно-методическим отделом, Санкт-Петербургский научно-исследовательский институт уха, горла, носа и речи (190013, Россия, Санкт-Петербург, Бронницкая ул., д. 9); тел.: +7 (812) 316-54-29, e-mail: 3165429@mail.ru ORCID: https://orcid.org/0000-0002-1110-7087

Вяземская Елена Эмильевна - инженер лаборатории информатики и статистики, Санкт-Петербургский научно-исследовательский институт уха, горла, носа и речи (190013, Россия, Санкт-Петербург, Бронницкая ул., д. 9); тел.: +7 (911) 996-08-89, e-mail: vyazemskaya.elena@gmail.com

ORCID: https://orcid.org/0000-0002-4141-2226

Левин Сергей Владимирович - кандидат медицинских наук, старший научный сотрудник, Санкт-Петербургский научно-исследовательский институт уха, горла, носа и речи (190013, Россия, Санкт-Петербург, Бронницкая ул., д. 9); тел. +7 (812) 495-36-71, e-mail: sergeyln@mail.ru

ORCID: https://orcid.org/0000-0001-9770-7739

Левина Елена Алексеевна - кандидат медицинских наук, старший научный сотрудник, Санкт-Петербургский научно-исследовательский институт уха, горла, носа и речи (190013, Россия, Санкт-Петербург, Бронницкая ул., д. 9); тел. +7 (812) 49536-71, e-mail: xramoval@gmail.com

ORCID: https://orcid.org/0000-0003-0285-6526

Information about the authors

H Alexei A. Korneenkov - MD, Professor, Head of the Laboratory of Informatics and Statistics Saint-Petersburg Research Institute of Ear, Throat, Nose and Speech (9, Bronnitskaya str., St. Petersburg, 190013, Russia); phone +7(904)554-07-40, e-mail: korneyenkov@ gmail.com

ORCID: https://orcid.org/0000-0001-5870-8042

Sergei V. Ryazantsev - Honored Doctor of the Russian Federation, MD, Professor, Deputy Director for Scientific Coordination Work, Saint-Petersburg Research Institute of Ear, Throat, Nose and Speech (9, Bronnitskaya str., St. Petersburg, 190013, Russia); phone + 7(812)316-28-52, e-mail: professor.ryazantsev@mail.ru ORCID: https://orcid.org/0000-0003-1710-3092

Ivan V. Fanta - PhD, Head of the organizational and methodological department, Saint-Petersburg Research Institute of Ear, Throat, Nose and Speech (9, Bronnitskaya str., St. Petersburg, 190013, Russia); phone +7(812)316-54-29, e-mail: 3165429@mail.ru ORCID: https://orcid.org/0000-0002-1110-7087

Elena E. Vyazemskaya - engineer of the Laboratory of Informatics and Statistics, Saint-Petersburg Research Institute of Ear, Throat, Nose and Speech (9, Bronnitskaya str., St. Petersburg, 190013, Russia); phone +7(911)996-08-89, e-mail: vyazemskaya.elena@gmail.com ORCID: https://orcid.org/0000-0002-4141-2226

Sergei V. Levin - PhD, Researcher, Saint-Petersburg Research Institute of Ear, Throat, Nose and Speech (9, Bronnitskaya str., St. Petersburg, 190013, Russia); phone +7(812)495-36-71, e-mail: sergeyln@mail.ru ORCID: https://orcid.org/0000-0001-9770-7739

Elena A. Levina - PhD, Researcher, Saint-Petersburg Research Institute of Ear, Throat, Nose and Speech (9, Bronnitskaya str., St. Petersburg, 190013, Russia); phone +7(812)495-36-71, e-mail: xramoval@gmail.com ORCID: https://orcid.org/0000-0003-0285-6526

f

о

• S

о о

i Надоели баннеры? Вы всегда можете отключить рекламу.