Научная статья на тему 'ОПТИМАЛЬНЫЙ ПОДБОР ПАР СУБЪЕКТОВ В ИССЛЕДОВАНИЯХ ДИЗАЙНА "СЛУЧАЙ-КОНТРОЛЬ": ДЕМОНСТРАЦИЯ МЕТОДА СОПОСТАВЛЕНИЯ НА ПРИМЕРЕ АНАЛИЗА ВЛИЯНИЯ ПАНДЕМИИ COVID-19 НА ПЕРСОНАЛ МЕДИЦИНСКИХ ОРГАНИЗАЦИЙ'

ОПТИМАЛЬНЫЙ ПОДБОР ПАР СУБЪЕКТОВ В ИССЛЕДОВАНИЯХ ДИЗАЙНА "СЛУЧАЙ-КОНТРОЛЬ": ДЕМОНСТРАЦИЯ МЕТОДА СОПОСТАВЛЕНИЯ НА ПРИМЕРЕ АНАЛИЗА ВЛИЯНИЯ ПАНДЕМИИ COVID-19 НА ПЕРСОНАЛ МЕДИЦИНСКИХ ОРГАНИЗАЦИЙ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
64
19
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
СУБЪЕКТ ИССЛЕДОВАНИЯ / ГРУППА ВОЗДЕЙСТВИЯ ЛЕЧЕНИЯ / ГРУППА КОНТРОЛЯ / ГРУППА "СЛУЧАИ" / ГРУППА "КОНТРОЛИ" / "НЕ СЛУЧАИ" / СТАТУС ВОЗДЕЙСТВИЯ / СОГЛАСОВАНИЕ СОПОСТАВЛЕНИЕ ПАР СУБЪЕКТОВ ИССЛЕДОВАНИЯ / ДИЗАЙН СОГЛАСОВАННЫХ ПАР "СЛУЧАЙ-КОНТРОЛЬ" / ПЕРЕМЕННЫЕ СОГЛАСОВАНИЯ СОПОСТАВЛЕНИЯ / ВМЕШИВАЮЩИЙСЯ ФАКТОР / ПЕРЕМЕННАЯ КОНФАУНДЕР / ПЕРЕМЕННЫЕ СОПОСТАВЛЕНИЯ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Корнеенков Алексей Александрович, Овчинников Павел Александрович, Резванцев Михаил Владимирович, Вяземская Елена Эмильевна, Дворянчиков Владимир Владимирович

Исследования дизайна «случай-контроль» ретроспективное наблюдательное исследование, предназначенное для определения взаимосвязи между интересующим результатом и его потенциальной причиной. У этого дизайна исследований есть известные недостатки: возможные смещения в результатах, предвзятость отбора в контрольную группу и т. п. Чтобы избежать несоответствия исследуемой и контрольной групп, а значит, недоучета возможного влияния вмешивающихся факторов (сonfounder), используется целый класс методов, обеспечивающих подбор, сопоставление пар «случай-контроль»-matching. Цель исследования. Обсуждение и демонстрация возможности формирования групп субъектов исследования (воздействия и контроля) на основе переменных сопоставления с помощью процедуры оптимального сопоставления и сравнение результатов анализа связи с помощью парного и непарного анализа. Материалы и методы. Исходными данными для анализа являлись результаты кросс-секционного исследования влияния пандемии COVID-19 на поведение работников медицинских организаций. В качестве примера реализации алгоритма используется оценка влияния уровня информированности о различных аспектах SARS-CoV-2 на здоровье медицинских специалистов. Обработка велась в программной среде R. Обсуждение. В настоящем исследовании решались две задачи: демонстрация метода оптимального сопоставления пар «случай-контроль» для конкретных данных и оценка эффекта от воздействия определенных факторов на интересующий исход. Использование метода позволяет достичь максимальной согласованности групп исследования и контроля по выбранным переменным согласования. Этот инструмент позволяет упростить и автоматизировать процедуру подготовки данных для последующего анализа, когда данные о случаях и потенциальных контролях представлены в едином наборе данных. Так, на примере показано: при разном значении показателя «число контролей на случай» точечная и интервальная оценка отношения шансов меняется незначительно и указывает на статистически не значимую ассоциацию между потребностью в дополнительной информации и вынужденным использованием отпуска медицинским работником из-за различных опасений по поводу влияния COVID-19.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Корнеенков Алексей Александрович, Овчинников Павел Александрович, Резванцев Михаил Владимирович, Вяземская Елена Эмильевна, Дворянчиков Владимир Владимирович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

OPTIMAL SELECTION OF PAIRS OF SUBJECTS IN CASE-CONTROL STUDIES: DEMONSTRATION OF MATCHING METHOD USING EXAMPLE OF ANALYSIS OF IMPACT OF COVID-19 PANDEMIC ON STAFF OF MEDICAL ORGANIZATIONS

Case-control studies are retrospective observational studies designed to determine the relationship between the outcome of interest and its potential cause. This study design has known disadvantages: possible bias in the results, selection bias in the control group, etc. In order to avoid inconsistency between the study and control groups and thus underestimating of the possible influence of intervening factors (confounder), a whole class of methods is used to ensure that case-control matching pairs are selected and matched. Objective. To discuss and demonstrate the possibility of forming groups of research subjects (impact and control) on the basis of matching variables using the optimal matching procedure and compare the results of paired and unpaired analysis. Materials and methods. The baseline data were the results of a cross-sectional study of the impact of pandemic COVID-19 on health worker behavior. An example algorithm was used to assess the impact of awareness of different aspects of SARS-CoV-2 on health professionals. The processing was done in the R software environment. Discussion. The present study had two objectives: to demonstrate a method for optimal matching of case-control pairs for specific data and to estimate the effect of certain factors on the outcome of interest. Using this method allows for maximum consistency between study and control groups on selected matching variables. This tool simplifies and automates data preparation for subsequent analysis when case and potential control data are presented in a single dataset. Thus, the example shows that with different values of the number of controls per case indicator the point and interval estimate of the odds ratio varies slightly and indicates a statistically insignificant association between the need for more information and the forced use of leave by the health professional due to various concerns about the impact of COVID-19.

Текст научной работы на тему «ОПТИМАЛЬНЫЙ ПОДБОР ПАР СУБЪЕКТОВ В ИССЛЕДОВАНИЯХ ДИЗАЙНА "СЛУЧАЙ-КОНТРОЛЬ": ДЕМОНСТРАЦИЯ МЕТОДА СОПОСТАВЛЕНИЯ НА ПРИМЕРЕ АНАЛИЗА ВЛИЯНИЯ ПАНДЕМИИ COVID-19 НА ПЕРСОНАЛ МЕДИЦИНСКИХ ОРГАНИЗАЦИЙ»

УДК 519.23/24:004.43:616.98-036.11 https://doi.org/10.18692/1810-4800-2022-5-34-46

Оптимальный подбор пар субъектов в исследованиях дизайна «случай-контроль»: демонстрация метода сопоставления на примере анализа влияния пандемии COVID-19 на персонал медицинских организаций

A. А. Корнеенков1, П. А. Овчинников2, М. В. Резванцев3, Е. Э. Вяземская1,

B. В. Дворянчиков1, М. А. Будковая1

1 Санкт-Петербургский научно-исследовательский институт уха горла носа и речи, Санкт-Петербург, 190013, Россия

2 Центральный военный клинический госпиталь имени А. А. Вишневского, Красногорск, Московская область, 143420, Россия

3 Военно-медицинская академия имени С. М. Кирова, Санкт-Петербург, 194044, Россия

Исследования дизайна «случай-контроль» - ретроспективное наблюдательное исследование, предназначенное для определения взаимосвязи между интересующим результатом и его потенциальной причиной. У этого дизайна исследований есть известные недостатки: возможные смещения в результатах, предвзятость отбора в контрольную группу и т. п. Чтобы избежать несоответствия исследуемой и контрольной групп, а значит, недоучета возможного влияния вмешивающихся факторов (соп&ш^ег), используется целый класс методов, обеспечивающих подбор, сопоставление пар «случай-контроль»-matching. Цель исследования. Обсуждение и демонстрация возможности формирования групп субъектов исследования (воздействия и контроля) на основе переменных сопоставления с помощью процедуры оптимального сопоставления и сравнение результатов анализа связи с помощью парного и непарного анализа. Материалы и методы. Исходными данными для анализа являлись результаты кросс-секционного исследования влияния пандемии COVID-19 на поведение работников медицинских организаций. В качестве примера реализации алгоритма используется оценка влияния уровня информированности о различных аспектах SARS-CoV-2 на здоровье медицинских специалистов. Обработка велась в программной среде R. Обсуждение. В настоящем исследовании решались две задачи: демонстрация метода оптимального сопоставления пар «случай-контроль» для конкретных данных и оценка эффекта от воздействия определенных факторов на интересующий исход. Использование метода позволяет достичь максимальной согласованности групп исследования и контроля по выбранным переменным согласования. Этот инструмент позволяет упростить и автоматизировать процедуру подготовки данных для последующего анализа, когда данные о случаях и потенциальных контролях представлены в едином наборе данных. Так, на примере показано: при разном значении показателя «число контролей на случай» точечная и интервальная оценка отношения шансов меняется незначительно и указывает на статистически не значимую ассоциацию между потребностью в дополнительной информации и вынужденным использованием отпуска медицинским работником из-за различных опасений по поводу влияния COVID-19.

Ключевые слова: субъект исследования, группа воздействия лечения, группа контроля, группа «случаи», группа «контроли», «не случаи», статус воздействия, согласование сопоставление пар субъектов исследования, дизайн согласованных пар «случай-контроль», переменные согласования сопоставления, вмешивающийся фактор, переменная конфаундер, переменные сопоставления.

Для цитирования: Корнеенков А. А., Овчинников П. А., Резванцев М. В., Вяземская Е. Э., Дворянчиков В. В., Будковая М. А. Оптимальный подбор пар субъектов в исследованиях дизайна «случай-контроль»: демонстрация метода сопоставления на примере анализа влияния пандемии COVID-19

"3 на персонал медицинских организаций. Российская оториноларингология. 2022;21(5):34-46. https://

doi.org/10.18692/1810-4800-2022-5-34-46

•5

о

0

_________________________________________________________

© Коллектив авторов, 2022 2022;21;5(120)

Optimal selection of pairs of subjects in case-control studies: demonstration of matching method using example of analysis of impact of COVID-19 pandemic on staff of medical organizations

A. A. Korneenkov1, P. A. Ovchinnikov2, M. V. Rezvantsev3, E. E. Vyazemskaya1, V. V. Dvoryanchikov1, M. A. Budkovaya1

1 Saint Petersburg Research Institute of Ear, Throat, Nose and Speech, Saint Petersburg, 190013, Russia

2 Vishnevsky Central Military Clinical Hospital, Krasnogorsk, Moscow region, 143420, Russia

3 Kirov Military Medical Academy, Saint Petersburg, 194044, Russia

Case-control studies are retrospective observational studies designed to determine the relationship between the outcome of interest and its potential cause. This study design has known disadvantages: possible bias in the results, selection bias in the control group, etc. In order to avoid inconsistency between the study and control groups and thus underestimating of the possible influence of intervening factors (confounder), a whole class of methods is used to ensure that case-control matching pairs are selected and matched. Objective. To discuss and demonstrate the possibility of forming groups of research subjects (impact and control) on the basis of matching variables using the optimal matching procedure and compare the results of paired and unpaired analysis. Materials and methods. The baseline data were the results of a cross-sectional study of the impact of pandemic COVID-19 on health worker behavior. An example algorithm was used to assess the impact of awareness of different aspects of SARS-CoV-2 on health professionals. The processing was done in the R software environment. Discussion. The present study had two objectives: to demonstrate a method for optimal matching of case-control pairs for specific data and to estimate the effect of certain factors on the outcome of interest. Using this method allows for maximum consistency between study and control groups on selected matching variables. This tool simplifies and automates data preparation for subsequent analysis when case and potential control data are presented in a single dataset. Thus, the example shows that with different values of the number of controls per case indicator the point and interval estimate of the odds ratio varies slightly and indicates a statistically insignificant association between the need for more information and the forced use of leave by the health professional due to various concerns about the impact of COVID-19.

Keywords: study subject, treatment exposure group, control group, case group, control group, noncases, exposure status, subject pair matching, design of case-control matched pairs, matching variables, confounder, confounder variable, matching variables.

For citation: Korneenkov A. A., Ovchinnikov P. A., Rezvantsev M. V., Vyazemskaya E. E., Dvoryanchikov V. V., Budkovaya M. A. Optimal selection of pairs of subjects in case-control studies: demonstration of matching method using example of analysis of impact of COVID-19 pandemic on staff of medical organizations. Rossiiskaya otorinolaringologiya. 2022;21(5):34-46. https://doi.org/10.18692/1810-4800-2022-5-34-46

Введение

Исследования дизайна «случай-контроль» (англ. case control study) - ретроспективное наблюдательное исследование, предназначенное для определения взаимосвязи между интересующим результатом, исходом (заболеванием или состоянием) и его потенциальной причиной (вмешательством, фактором риска или воздействием). Общая процедура исследования включает два этапа: сначала исследователи формируют группу пациентов с указанным исходом (случаи, англ. case) и группу пациентов без указанного исхода (контроли, англ. control), затем сравнивают «историю» случаев и контролей, чтобы определить факт или уровень воздействия факторов на наступление исхода. Таким образом, этот дизайн исследования приводит от исхода (заболевания

или состояния) обратно (т. е. ретроспективно) к причине (вмешательству, фактору риску или воздействию) [1]. Он достаточно привлекателен для исследователя из-за низких финансовых и временных затрат, зачастую не требует контакта с субъектами исследования, потому что выполня- ^ ется по уже имеющимся архивным данным, реги- § страм и т. п. Он часто используется тогда, когда §§ интересующий исход (болезнь, состояние) встре- ^ чается в популяции редко или когда все сведения ° об этих пациентах можно получить в одном месте, £ например в специализированном медицинском д-регистре или специализированной медицинской ~ организации. д.

Однако, несмотря на очевидные преимуще- £ ства и кажущуюся простоту такого дизайна иссле- ^ дования, уровень доказательности его выводов не

слишком высокий. Такие исследования чаще выдвигают гипотезы о связи воздействия и исхода, а не доказывают эту связь. У этого дизайна исследований есть известные недостатки: возможные смещения в результатах, предвзятость отбора в контрольную группу, неслучайные ошибки и т. п. В отечественной литературе статистические вопросы, связанные с дизайном исследования «случай-контроль» и анализом его результатов, рассмотрены достаточно подробно, например, в работе Гржибовского А. М. с соавт., 2015 [2], но тем не менее из-за сложности и многообразности проблем этого дизайна способы их решения постоянно развиваются и совершенствуются.

Чтобы избежать несоответствия исследуемой и контрольной групп, а значит, недоучета возможного влияния вмешивающихся факторов (кофаун-деров), используется целый класс статистических методов, обеспечивающих подбор, сопоставление пар «случай-контроль». Как указывают многие авторы [3], решить, кто будет контролем, пожалуй, самая тяжелая задача при планировании исследования «случай-контроль». В специализированной литературе для обозначения этих методов уже используется транслитерация англоязычного термина matching - матчинг. Метод подбора пар заключается в подборе для каждого «случая» одного или нескольких «контролей», сходных по определенным признакам (переменным сопоставления), например по социальным, демографическим, антропометрическим и прочим характеристикам. Однако если провести подбор пар по слишком большому числу признаков, то существует вероятность того, что «контроли» перестанут быть репрезентативной выборкой из генеральной совокупности, из которой произошли «случаи». Метод подбора пар предполагает принципиально иной подход к формированию выборки и анализу результатов исследования.

Разновидностью дизайна исследования «случай-контроль» является парный дизайн на основе сопоставленных друг другу пар «случай» и «контроль» - matched pairs, когда к каждому исследуемому с заболеванием ставится в соответствие исследуемый без выявленного заболевания. Пары могут составляться по полу, возрасту и другим а факторам, не относящимся к исследованию, значения которых максимально похожи у субъектов Ц пары [4].

s^ Исследователь должен определить «случаи» ^ как можно более конкретно. Иногда определение ^ заболевания может основываться на несколь-'С ких критериях; поэтому все эти моменты должен ны быть четко указаны в определении «случая». ^ Следующим важным моментом при разработке исследования типа «случай-контроль» является отбор пациентов контрольной группы, «контролей». В серии статей авторы (Wacholder с соавт.,

1992) [5-7] подробно обсудили аспекты дизайна исследований «случай-контроль» и выбора «контролей». По их мнению, важным аспектом выбора «контролей» является то, что они должны быть из той же «исследовательской базы», что и случаи. Таким образом, пул населения, из которого будут зарегистрированы «случаи» и «контроли», должен быть одинаковым. Еще одним важным аспектом исследования «случай-контроль» является то, что исследователь должен измерять характеристики (уровень, продолжительность) воздействия аналогично как в группе «случаи», так и у «контролей». Принято группу «контролей» выбирать из населения, родственников или друзей «случаев» из других пациентов больницы, лечебного отделения, в которых «случаям» оказывалась медицинская помощь. Как показывает практика, в качестве контролей для клинических исследований чаще выбираются последние, так как получить сопоставимые данные для них гораздо проще из тех же источников, что и для «случаев» -из медицинских карт. Однако вполне вероятно, что, если мы наберем много таких пациентов в контрольную группу, интересующее воздействие может оказаться сходным в «случаях» и «контроле», потому что причина, по которой пациент, выбранный «контролем», вообще попал в лечебное отделение может быть прямо или опосредованно причиной развития болезни у «случая».

К сожалению, «врожденные» недостатки дизайна исследования «случай-контроль» в силу его ретроспективной природы не могут быть устранены полностью, но могут в значительной степени компенсироваться различными информационными, статистическими методами и подходами, которые в последнее время активно совершенствуются [8, 9]. В настоящем исследовании рассматриваемые методы дизайна сопоставленных «случай-контроль» применялись для повышения качества обработки и анализа результатов проведенного в 2021 году исследования влияния пандемии COVID-19 на персонал медицинских организаций.

Цель исследования

Обсуждение и демонстрация возможности формирования групп субъектов исследования (воздействия и контрольной) на основе переменных сопоставления с помощью процедуры оптимального сопоставления и сравнение результатов анализа связи с помощью парного и непарного анализа.

Материалы и методы исследования

Исходными данными для анализа являлись результаты кросс-секционного исследования влияния СОУГО-19 на поведение работников медицинских организаций [10]. В качестве примера

Т а б л и ц а 1

Переменные, используемые в статистических вычислениях, их источники в анкете. Из одного вопроса могут быть получены как числовые переменные (например, age), так и категориальные (например, возрастная группа AGEGR

T a b l e 1

Variables used in statistical calculations and their sources in the questionnaire. Both numerical variables (e.g. age) and categorical variables (e.g. age group AGEGR) can be derived from a single question

Вопрос Переменная

Q2. Пожалуйста, укажите свой возраст age, AGEGR

Q3. Выберите свой пол GENDER

Q9. Как долго Вы работаете в сфере здравоохранения? TIMEHSGR

Q16. В какой мере Вам необходима дополнительная информация о COVID-19, кроме той, которую Вы уже имеете NDADDINF

Q29. Были ли Вы настолько обеспокоены COVID-19, что даже брали отпуск, чтобы не ходить на работу? BEHCG

Q34. Вы в настоящее время участвуете в оказании медицинской помощи пациентам с COVID-19 (включая пациентов с подозрением на COVID-19)? CONTACT.GROUP

реализации алгоритма используется оценка влияния уровня информированности о различных аспектах пандемии COVID-19 на здоровье медицинских специалистов (врачей) (табл. 1).

В настоящем исследовании решались две задачи: оптимальное сопоставление пар «случай-контроль» для конкретных данных и оценка эффекта от воздействия определенных факторов на интересующий исход. Для решения задач исследования использовалось статистическое программное обеспечение R, которое находится в свободном доступе, его можно загрузить и установить для систем Windows, Mac и Linux с вебсайта: https://www.r-project.org

1. Оптимальное сопоставление пар «случай-контроль»

Решение задачи оптимального подбора пары (т. е. «контроля») для «случая» было разбито на два этапа: 1) подготовительный, в ходе которого подготавливаются исходные данные для применения алгоритма; 2) непосредственное применение оптимального алгоритма сопоставления пар, реализованного в пакете ccoptimalmatch статистической среды R. Исчерпывающее описание этой процедуры с помощью пакета ccoptimalmatch приведено в работе[8].

В нашем случае мы имеем дело с данными, полученными в ходе кросс-секционного исследования (опроса) о влиянии пандемии COVID-19 на медицинских работников, их отношение к работе и изменения в поведении. Как выяснилось в ходе исследования, воздействие пандемии оказалось для некоторых работников настолько большим, что они вынуждены были взять отпуск из-за опасений за свое здоровье, здоровье своих родственников и т. д. Учитывая высокую избыточную смертность в условиях пандемии коронавируса среди населения в целом и оториноларингологов в частности, неопределенность в эффективных

средствах лечения и профилактики оказывала серьезное психологическое воздействие на медицинских работников. В нашем исследовании в качестве научной гипотезы было сформулировано предположение о влиянии информационной неопределенности (т. е. необходимости дополнительной информации) на решение медицинских работников взять внеочередной отпуск.

Наличие неопределенности (информационной) о COVID-19 определялось вариантом ответа на вопрос анкеты Q1 «В какой мере Вам необходима дополнительная информация о COVID-19, кроме той, которую Вы уже имеете?». Была создана вычисляемая фиктивная (dummy) бинарная переменная, которая принимала значение 0, если респондентом был выбран вариант ответа: «1. Никаких дополнительных деталей, сверх необходимого», и принимала значение 1, если выбирались любые другие варианты ответа. «Случаями» считались респонденты, ответившие «да» на вопрос «Q1. Были ли Вы настолько обеспокоены COVID-19, что даже брали отпуск, чтобы не ходить на работу?», а «контролями» (или их иногда, для уменьшения путаницы с контрольной группой в когортных исследованиях, называют «не случаями», no case) - ответившие «нет».

На первом подготовительном этапе загружаются необходимые библиотеки (см. табл. 5), r выполняются следующие шаги для получения % набора данных в формате, который может ис- ^ пользоваться алгоритмом. Исходная таблица для воспроизведения результатов расчета в среду R 3 загружается с сайта lornii.ru функцией csv.get() 8 пакета Hmisc (см. табл. 6, строка 1). Из загружен- 3' ной таблицы в набор данных отбираются только Г те переменные, которые будут использованы в за- 3' даче (строка 2), и трансформируются в необходи- ^ мые для работы функций типы данных (строка 3). с§ После формальной подготовки переменных, за- р

пускается первый этап (подготовительный) алгоритма оптимального сопоставления.

1.1. Сопоставление «случаев» и «контролей» по комбинациям переменных сопоставления.

На этом шаге в базе данных случаев по переменным, используемым для поиска и сопоставления пар «случай-контроль», формируется список уникальных комбинаций значений этих категориальным переменных (строка 4). В качестве переменных сопоставления были выбраны три переменные: «возрастная группа» (AGEGR), «пол» (GENDER) и «время работы в системе здравоохранения» (TIMEHSGR). Для «случаев» могут наблюдаться несколько комбинаций пола, возраста и времени работы в системе здравоохранения (СЗ): «пол: женский - старше 60 лет - в СЗ более 25 лет» или «пол: мужской - старше 25 лет - в СЗ более 5 лет» и т. д. Набор таких комбинаций образует факторную переменную «подмножества» -subset. Затем из всех «контролей» удаляются те, у которых такие комбинации не наблюдаются, а оставшиеся образуют пул подходящих случаям «контролей» с соответствующим значением переменной subset. Мы объединяем данные, содержащие переменную subset, с данными, содержащими только «случаи» (строка 5). Потом мы объединяем данные, содержащие переменную subset, с данными, содержащими только контро-ли (строка 6). Наконец, мы построчно объединяем наборы данных «случаев» и «контролей», которые теперь будут иметь новую переменную subset (строка 7).

1.2. Создание искусственных наблюдений и выбор приемлемого диапазона значений, при котором наблюдения включаются в набор «контролей»

После объединения «случаев» и «контролей» в определенные подмножества с одним значением факторной переменной subset в одном подмножестве может оказаться несколько «случаев». Например, к одному subset может принадлежать 2 «случая» и 30 «контролей», а так как каждый из этих случаев должен иметь возможность получения пары из всех подходящих «контролей» (из 30), то общее количество доступных для сопоставления «контролей» в подмножестве должно а увеличиваться в 2 раза до 60. Эти дополнительные копии «контролей» являются искусственны-~ ми наблюдениями.

s^ Кроме того, на этом шаге сопоставления ^ должен быть определен диапазон значений чис-"g ловых переменных, по которому бы «контроли» С считались подходящими «случаю». Это необходи-о мо, так как числовые переменные сопоставления не могли быть использованы в силу своего типа

о .

при создании переменной subset на 1-м шаге. § Диапазон значений включения «контролей» в (§ пул для сопоставления может быть основан на

клинических рекомендациях или на заданных исследованием условиях. Для некоторых исследований возраст «контроля» должен быть как можно ближе «случаю» (например, не более 1-летней абсолютной разницы), в то время как для других исследований разброс значений возраста может быть больше (например, до 5 лет абсолютной разницы). Чтобы можно было применить это правило, должна быть рассчитана переменная разница числовой переменной (например, в возрасте, age difference) между каждым «контролем» и «случаем» в одном подмножестве.

Разделяем набор данных на «контроли» (строка 8), в котором создаем переменную cluster_case (строка 9), и «случаи» cases (строка 10). В наборе данных «случаев» добавляем переменную cluster_case (строка 11), представляющую собой результат конкатенации слова case и порядкового номера «случая». Затем мы связываем и объединяем «случаи» и «контроли», которые теперь будут иметь новую переменную cluster_case (строка 12). После создания переменной cluster_case мы снова разделяем «случаи» (строка 13) и «кон-троли» (строка 14) на два разных набора данных.

1.3. Создание переменных «общее число контролей на один случай» (total controls per case) и «частота контролей» (frequency of controls)

Переменная total controls per case отображает общий пул, набор, число «контролей», доступных для каждого случая. Переменная frequency of controls показывает, сколько раз «контроль» был сопоставлен «случаю». Обе переменные необходимы для выполнения алгоритма. Переменная «total controls per case» необходима для того, чтобы назначить контроль случаю, для которого было наименьшее количество «контролей». Переменная frequency of controls необходима, чтобы сначала сопоставлялись «контроли» с самой низкой частотой, а «контроли» с высокой частотой были доступны для сопоставления следующим случаям.

Далее мы создаем пустой фрейм данных (строка 15) и уникальный список переменной cluster_case (строка 16).

Далее запускается цикл для создания псевдонаблюдений для «контролей» (строка 18). Но перед этим необходимо указать на следующее. На первом шаге набор «контролей» был сопоставлен со «случаями» по категориальным переменным, однако у наблюдений могут быть числовые переменные, которые должны быть сопоставлены. Учитывая, что сопоставлять по точным значениями числовых переменных часто бывает невозможно, целесообразно указывать приемлемый диапазон значений числовой переменной сопоставления, по которому пары «случай-контроль» будут считаться сопоставленными. В нашем примере, такой числовой переменной выступает возраст age. Хотя переменная AGEGR тоже основана

на возрасте, диапазоны значений возраста, покрываемых этой переменной, слишком большие. Поэтому целесообразно либо дополнительно к переменной AGEGR, либо вместо нее использовать сопоставление по числовой переменной age. Для этого явно указывается максимально возможная разница между возрастом «случая» и «контроля», внутри которой их возрасты будут считаться сопоставленными (строка 17).

Мы создаем переменную «всего контролей на случай» (total controls per case) (строка 19), которая содержит общий набор «контролей», доступных для каждого «случая». Мы также создаем переменную case_ind, которая принимает значение 1, если пациент является «случаем», и 0, если пациент является «контролем» (строка 20). Наконец, мы выбираем только релевантные переменные (relevant variables) (строка 21). Переменная freq_of_controls (частота контролей) показывает, сколько раз «контроль» назначается для «случая» (строка 22).

1.4. Ранжирование переменных сопоставления

Упорядочение переменных в правильном порядке имеет огромное значение (строка 23). Предположим, что есть две переменные: «разница в возрасте» и «частота контролей». Набор данных должен быть упорядочен по переменным case, control, age difference и, наконец, по frequency of controls. Переменная age difference может быть упорядочена после frequency of controls, поскольку последняя имеет больший вес. Упорядочивание по frequency of controls гарантирует, что «контро-ли» с самой низкой частотой будут сопоставлены в первую очередь. Этот последний шаг очень важен, так как ближайший «случаю» «контроль» (т. е. оптимальный) будет доступен первым для сопоставления.

После выполнения всех четырех подготовительных этапов мы имеем фрейм данных, который содержит: «случаи» и «контроли»; количество «контролей» в сопоставляемых парах; переменную, значения которой объединяет «случай» со всеми доступными для него «контролями»; идентификатор пациента; общее количество «контролей», доступных для сопоставления каждому «случаю»; переменную, определяющую наблюдение: case или control.

Подготовленные таким образом данные далее обрабатывались функцией optimal_matching() пакета ccoptimalmatch. Для ее выполнения необходимо указать несколько параметров, которые были вычислены в том числе на подготовительном этапе. Более подробно о пакете ccoptimalmatch можно прочитать в работе [8]

Учитывая, что положительно ответили на вопрос Q29 «Были ли Вы настолько обеспокоены COVID-19, что даже брали отпуск, чтобы не ходить на работу?» всего 14 респондентов, можно

привести всю таблицу сопоставленных наблюдений при отношении «случай»-«контроль» 1:1. Как видно из табл. 2, практически все наблюдения идентичны за исключением трех пар, в которых возраст различается на 1-2 года.

На рис. 1 приведены результаты сопоставления наблюдений «случай» и «контроль» по переменной возраста: рис. 1, а - исходные данные (сопоставление не проводилось); рис. 1, б - сопоставление проведено.

2. Оценка эффекта от воздействия определенным фактором на интересующий исход

Как известно, для обсервационных ретроспективных аналитических исследований в случае дихотомических переменных воздействия и исхода, когда результаты могут быть представлены в виде таблицы сопряженности 2 х 2, ассоциация может быть оценена разными тестовыми статистиками: частотами, отношением риска (Risk Ratio), шансами (Odd), отношением шансов (Odds Ratio), логшансами (Log Odds), статистикой Phi, хи-квадратом (если размер выборки не слишком мал), критерием Фишера (если размер выборки не слишком велик).

Статистический анализ включал в себя: 1) традиционный расчет точечной и интервальной оценки отношения шансов для таблиц 2 х 2 «воздействие - исход» (Exposed - Outcome) с помощью пакета epiR; 2) вычисление точечных и интервальных оценок отношения шансов для сопоставленных «случай-контроль» (на основе расчетов по дискордантным парам); 3) cравнение результатов анализа, полученных разными методами и по разным аргументам. Так как все расчеты выполнялись в международной стандартной среде R, где все понятия для единого понимания всеми пользователями представляются на английском языке, используются англоязычные обозначения: outcome - исход, результат, exposed - подвергшийся воздействию (экспозиции) фактором, odds - шансы, odds ratio - отношение шансов, case - субъект исследования с интересующим исходом, т. е. «случай», control - субъект исследования без интересующего исхода, «контроль», upper - верхняя (граница), lower - нижняя (граница), 95% CI - 95% доверительный интервал, confidence interval. Чтобы не вносить путаницу и r не лишать статистические понятия исходной ла- % коничности, мы их оставим англоязычными.

2.1. Вычисление точечных и интервальных оценок отношения шансов для данных «случай- 3 контроль» традиционным способом 8

Отношение шансов - статистический показа- 3' тель (в англоязычных работах его название при- ^ нято сокращать OR от odds ratio), один из основ- 3' ных способов описать в численном выражении °§ то, насколько отсутствие или наличие опреде- с^ ленного исхода связано с присутствием или от- Г

Т а б л и ц а 2

Таблица результатов сопоставления пар «случай-контроль» 1 : 1 с помощью алгоритма оптимального

сопоставления

T a b l e 2

Table of results of 1:1 case-control pair matches using the optimal matching algorithm

cid case age case AGEGR case TIMEHSGR case cid ctrl age ctrl AGEGR «г1 TIMEHSGR ^

id2 50 Зрелый 2 п. Более 12 лет и менее 15 лет id28 52 Зрелый 2 п. Более 12 лет и менее 15 лет

id109 30 Зрелый 1 п. Более 6 лет и менее 9 лет id96 30 Зрелый 1 п. Более 6 лет и менее 9 лет

id136 30 Зрелый 1 п. Более 3 лет и менее 6 лет id112 30 Зрелый 1 п. Более 3 лет и менее 6 лет

id160 52 Зрелый 2 п. Более 15 лет id90 52 Зрелый 2 п. Более 15 лет

id198 54 Зрелый 2 п. Более 15 лет id101 54 Зрелый 2 п. Более 15 лет

id239 50 Зрелый 2 п. Более 15 лет id99 50 Зрелый 2 п. Более 15 лет

id11 57 Зрелый 2 п. Более 15 лет id48 57 Зрелый 2 п. Более 15 лет

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

id13 40 Зрелый 2 п. Более 15 лет id107 40 Зрелый 2 п. Более 15 лет

id22 43 Зрелый 2 п. Более 15 лет id23 43 Зрелый 2 п. Более 15 лет

id32 77 Старческий Более 15 лет id182 75 Старческий Более 15 лет

id33 65 Пожилой Более 15 лет id216 65 Пожилой Более 15 лет

id38 61 Пожилой Более 15 лет id61 61 Пожилой Более 15 лет

id73 59 Зрелый 2 п. Более 15 лет id88 60 Зрелый 2 п. Более 15 лет

id82 44 Зрелый 2 п. Более 15 лет id18 44 Зрелый 2 п. Более 15 лет

а)

б)

I

I

s-

•S

'С о

■uj

0

1

О

Нет Да

Потребовался отпуск?

Без сопоставления

Нет Да

Потребовался отпуск?

С сопоставлением

Рис. 1. Результаты сопоставления наблюдений «случай» и «контроль» по переменной возраста: а - исходные данные (сопоставление не проводилось); б - сопоставление проведено Fig. 1. Results of the comparison between the «case» and «control» observations on the age variable: а - baseline data (no comparison

was made); b - comparison performed

Т а б л и ц а 3

Таблица сопряженности (2 х 2) статуса воздействия и статуса исхода для расчета отношения шансов (OR)

T a b l e 3

Contingency table (2 х 2) for exposure status and outcome status to calculate odds ratio (OR)

Case (Outcome+) Control (Outcome-)

Exposed (+) A B

Not exposed (-) C D

сутствием определенного фактора в конкретной статистической группе. Основой для традиционного расчета отношения шансов служит таблица сопряженности 2 х 2 (табл. 3) [11]. R-код для выполнения расчетов с помощью пакета epiR приведен в табл. 7, также в табл. 8 приведен R-код для выполнения аналогичных расчетов с помощью встроенных в R базовых функций расчета OR на основе модели логистической регрессии:

A / B A ■ D

Odds Ratio =

C / D ln( OR)+1,96

ln( OR)-1,96

B ■ C

1 ( - ( 1 ( 1

+l — l+l - l+l —

A, 1B 1C, 1D,

1 ) ( - Ï ( 1 \ ( 1

l+l — l+l - l+l —

A ) У B ) У C ) У D

Upper 95% CI = e

Lower 95% CI = e

На рис. 2 приведена машинограмма результатов расчета отношения шансов (OR) для соотношения «случай» : «контроль» - 1 : 1.

2.2. Вычисление точечных и интервальных оценок отношения шансов для сопоставленных «случай-контроль» (на основе расчетов по дискор-дантным парам) - парный анализ [12]

Для дихотомического воздействия согласованные данные «случай»-«контроль» могут быть

отображены в таблице сопряженности 2 х 2, в которой частоты ячеек представляют не количество субъектов, а количество пар субъектов с соответствующими характеристиками (табл. 4).

Например, в ячейке А указывается число пар cases: exposed - controls: exposed (например, «да»-«да»), в ячейке D указывается число пар cases: not exposed - controls: not exposed (например, «нет»-«нет»). В подсчетах по этой методике значения в этих ячейках не используются. Для оценки отношения шансов, доверительного интервала и р-значения необходимы только подсчеты в ячейках B и C (так называемые дискордантные пары, не соответствующие по ответам, discordant pairs), различающихся как по экспозиции, так и по результату. Отношение шансов исхода (становления случая) среди подвергшихся воздействию по сравнению с не подвергшимися воздействию составляет В/C.

OR = B.

C

Для вычисления 95% доверительного интервала используется формула

OR

95% CI: от — до OR ■ EF, EF

где EF - ошибка фактора (error factor), она вычисляется как [13]

EF = exp

1,96 J- + -

B C

Нижняя граница 95% ДИ = OR/EF, верхняя граница 95% ДИ = OR/EF.

Интерпретация доверительного интервала заключается в том, что мы на 95% уверены, что в популяции шансы респондентов, указавших на необходимость дополнительной информации о COVID-19, использовать внеочередной отпуск колеблется от LL до № раз выше, чем шансы ре-

Exposed + Exposed -Total

Outcome + 12 2 14

Outcome -11 3 14

Total 23 5 28

Prevalence * 52. 2 40. 0 50. 0

Odds 1. 091

0. 667

1. 000

Point estimates and 95% CIS :

Odds ratio

Attrib fraction (est) in the exposed (%) Attrib fraction (est) in the population {%)

1,64 (О.23, 11.70) 37.SI (-554.25, 95.60) 33.33 (-239.79, S6.92)

Yates corrected chi2 test that or = 1: chi2(l) = 0.000 Pr>chi2 = 1.000 Fisher exact test that or = 1: Pr>chi2 = 1.000 wald confidence limits ci: confidence interval

* Outcomes per 100 population units

Рис. 2. Машинограмма результатов расчета отношения шансов (OR) для соотношения «случай»:«контроль» - 1 : 1 Fig. 2. Result of running the program R-code to calculate the odds ratio (OR) for the case:control ratio of 1 : 1

о

s

1

0

S т

S' f

1

f I

Т а б л и ц а 4

Таблица сопряженности (2 х 2) статуса воздействия и статуса исхода для расчета отношения шансов (OR) при сопоставленных в отношении 1:1 пар субъектов «случай-контроль»

T a b l e 4

Contingency table (2 х 2) for exposure status and outcome status to calculate odds ratios (OR) for 1:1 matched pairs of case-control subjects

Controls (Outcome -)

Cases (Outcome +) Exposed (+) Not exposed (-)

Exposed ( + ) A B

Not exposed (-) C D

спондентов, не указавших на необходимость дополнительной информации о COVID-19.

В табл. 9 представлен список R-кодов для вычисления точечной и интервальной (95% доверительного интервала) оценки отношения шансов для сопоставленных пар «случай-контроль».

Сначала создается объединенный набор данных из сопоставленных пар «случай-контроль» и других переменных, которые на предварительном этапе не учитывались при сопоставлении (строка 1). Данные ранжируются по переменной duster_case (строка 2), выделяется отдельный набор объединенных данных для «случаев» (строка 3), и по «контролям» (строка 4). Затем эти наборы объединяются по переменным, при этом переменным из набора «случаев» добавляется суффикс _case, а «контролей» - _йг1 (строка 5). Из переменных ответа на вопрос о необходимости дополнительной информации (NDADDINF)

для «случаев» и «контролей» формируется фрейм данных, где до воздействия (базовый уровень) это те, которые не испытывают потребность, и те, кто ее испытывают (строка 6). Число дискордант-ных пар в таблице сопряженности на основе этого фрейма данных вычисляется в строке 7 и строке 8. Затем вычисляется точечная оценка OR (строка 9), ошибка EF (строка 10), нижний (строка 11) и верхний (строка 12) доверительный интервал OR. Затем точечная и интервальная оценка OR выводится в привычную форму представления этого показателя (строка 13).

2.3. Сравнение результатов анализа, полученных разными методами и по разным аргументам

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

На диаграмме представлены значения отношения шансов (OR) и их 95% доверительных интервалов для разных значений показателя «число контролей на случай». Как видно на диаграмме, при разном значении показателя «число контролей на случай» точечная и интервальная оценка OR меняется незначительно и указывает на статистически не значимую ассоциацию между потребностью в дополнительной информации и вынужденным использованием отпуска медицинским работником из-за различных опасений по поводу влияния COVID-19 (рис. 3).

Для сопоставленных «случай»-«контроль» в соотношении 1 : 1 использовался также метод вычисления OR по дискордантным парам, который специально используется в таких случаях. В табл. 9 приведены R-коды для вычисления OR и его 95% доверительного интервала. Для представленных данных оценка OR составила 1,5 [0,25; 8,98]. Это незначительно отличается от оценок OR, полу-

f

1 S-

•S

'С о

■uj

0

1

о

Рис. 3. Значения отношения шансов (OR) и их 95% доверительных интервалов для разных значений показателя «число контролей на случай»

Fig. 3. Odds ratio (OR) values and their 95% confidence intervals for different values of the number of controls per case indicator

Т а б л и ц а 5

R-коды для загрузки необходимых библиотек

T a b l e 5

R codes for downloading the required libraries

№ Команда R

1 wants <- c("Hmisc", "gmodels", "sjlabelled", "dplyr", "epiR", "ccoptimalmatch", "ggplot2") has <- wants %in% rownames(installed.packages())

2 if(any(!has)) install.packages(wants[!has])

3 lapply(wants, library, character.only = TRUE)

Т а б л и ц а 6

R-коды для решения задачи сопоставления пар «случай»-«контроль»

T a b l e 6

R Codes for solving the case-control pairing problem

№ Команда R

1 not_pr_cov19 <- csv.get(«http://lornii.ru/resources/lib/R/not_processed_cov19.csv», vnames= , skip= , sep=»;»)

2 not_pr_cov19$age<-as.numeric(not_pr_cov19$age) not_pr_cov19$NDADDINF <-as.numeric(not_pr_cov19$NDADDINF) not_pr_cov19$BEHCG<-as.numeric(not_pr_cov19$BEHCG) not_pr_cov19$TIMEHSGR <- factor(not_pr_cov19$TIMEHSGR, levels = с(«Менее 3 лет», «Более 3 лет и менее 6 лет», «Более 6 лет и менее 9 лет»,»Более 9 лет и менее 12 лет», «Более 12 лет и менее 15 лет», «Более 15 лет»), ordered = TRUE) not_pr_cov19$GENDER <- factor(not_pr_cov19$GENDER, levels = c(«M»,»F»)) not_pr_cov19$CONTGR <- factor(not_pr_cov19$CONTGR, levels = с(«контакт», «не контакт»), ordered = TRUE) not_pr_cov19$csctrl <- factor(not_pr_cov19$csctrl,levels = c(«case», «control»), ordered = TRUE) not_pr_cov19$AGEGR <- factor(not_pr_cov19$AGEGR, levels = с(«детство»,»подростковый»,»юношеский», «зрелый 1 п.»,»зрелый 2 п.», «пожилой возраст»,»старческий», «долгожители»), ordered = TRUE) not_pr_cov19$FAMILY <- factor(not_pr_cov19$FAMILY, levels = с(«Да», «Нет»),ordered = TRUE)

3 create_subset_cov19 <- not_pr_cov19 %>% filter(csctrl ==»case») %>% arrange (AGEGR, GENDER, TIMEHSGR) %>% distinct(AGEGR, GENDER, TIMEHSGR,.keep_all = TRUE) %>% mutate(subset = 1:n()) %>% select(AGEGR, GENDER, TIMEHSGR, subset)

4 case_with_subset_cov19 <- not_pr_cov19 %>% filter(csctrl ==»case») %>% full_join(create_subset_cov19, by = c(«AGEGR», «GENDER», «TIMEHSGR»))

5 control_with_subset_cov19 <- not_pr_cov19 %>% filter(csctrl == »control») %>% right_join(create_subset_cov19, by = c(«AGEGR», «GENDER», «TIMEHSGR»))

6 not_pr_cov19 <- rbind(case_with_subset_cov19,control_with_subset_cov19)

7 bdd_ctrl_cov19 <- not_pr_cov19[not_pr_cov19$csctrl== »control»,]

8 bdd_ctrl_cov19 $cluster_case <- 0

9 bdd_cs_cov19 <- not_pr_cov19[not_pr_cov19$csctrl==»case»,]

10 bdd_cs_cov19$cluster_case <- paste(«case»,1:nrow(bdd_cs_cov19 ),sep = «_»)

11 not_pr_cov19 <- rbind(bdd_cs_cov19, bdd_ctrl_cov19)

12 bdd_cs_cov19 <- not_pr_cov19[not_pr_cov19$csctrl==»case»,]

13 bdd_ctrl_cov19 <- not_pr_cov19[not_pr_cov19$csctrl== »control»,]

14 bdd_temp_cov19 <- data.frame()

15 list_p_cov19 <- unique(bdd_cs_cov19 $cluster_case)

16 age_maxdiff<-5

Л

о

s

1

0

s

S' f

1 f

Продолжение табл. 6

№ Команда R

17 for(i in 1:length(list_p_cov19)){ temp <- bdd_cs_cov19 [bdd_cs_cov19 $cluster_case = =list_p_cov19[i],] subset_identified <- temp$subset tempO <- bdd_ctrl_cov19 [bdd_ctrl_cov19 $subset==temp$subset,] temp_final <- rbind(temp,temp0) temp_final$cluster_case <- list_p_cov19[i] temp_final=temp_final %>% group_by(cluster_case) %>% mutate(age_diff = abs(age - age [csctrl== »case»])) temp_final$age_fup <- ifelse(temp_final$age_diff<=age_maxdiff,»accept»,»delete») temp_final <- temp_final[temp_final$age_fup = = »accept»,] temp_final$age_fup <- NULL bdd_temp_cov19 <- rbind(bdd_temp_cov19,temp_final)}

18 bdd_temp_cov19 = bdd_temp_cov19 %>% group_by(cluster_case) %>% mutate(total_control_per_case = n()- )

19 bdd_temp_cov19$case_ind <- ifelse(bdd_temp_cov19$csctrl==»case», , )

20 bdd_temp_cov19 <- subset(bdd_temp_cov19, select=c(cluster_case, cid, csctrl, case_ind, NDADDINF, BEHCG, age_diff, total_control_per_case))

21 bdd_temp_cov19 = bdd_temp_cov19 %>% group_by(cid) %>% mutate (freq_of_controls = n())

22 bdd_temp_cov19 <-bdd_temp_cov19 [order(bdd_temp_cov19$cluster_case, bdd_temp_cov19$csctrl, bdd_temp_ cov19$age_diff, bdd_temp_cov19$freq_of_controls),]

23 final_data_cov19 <- optimal_matching(bdd_temp_cov19, n_con= , cluster_case, cid, total_control_per_case, case_control=csctrl, with_replacement = TRUE)

24 final_data_cov19 <- final_data_cov19 %>% arrange(cluster_case)

25 head(final_data_cov19, L0)

Т а б л и ц а 7

R-коды для стандартной оценки ассоциации «воздействие - исход» при дизайне «случай-контроль»

T a b l e 7

R codes for standardised assessment of exposure-outcome association in case-control design

№ Команда R

1 mccs.table<-xtabs(~NDADDINF+BEHCG, data=final_data_cov19) #первая переменная - строки, вторая -столбцы

2 mccs.table

3 epi.2by2(dat = rev(mccs.table), method = «case.control», conf.level = 0.95, units = 100, interpret = FALSE, outcome = «as.rows») #as.rows

4 unmccs.table<-xtabs(~NDADDINF+BEHCG, data=not_pr_cov19)

5 unmccs.table

6 epi.2by2(dat = rev(unmccs.table), method = «case.control», conf.level = 0.95, units = 100, interpret = FALSE, outcome = «as.rows»)

f I

s-

'si о

■uj

0

1

О

Т а б л и ц а 8

R коды для стандартной оценки ассоциации «воздействие - исход» при дизайне «случай-контроль» (расчет OR аналогичен epi.2by2())

T a b l e 8

R codes for standard assessment of exposure-outcome association in case-control design (OR calculation is

similar to epi.2by2())

Команда R

xx<- glm(BEHCG ~ NDADDINF, data=not_pr_cov19, family=binomial(link=»logit»))

cbind(exp(coef(xx)),

exp(summary(xx)$coefficients[,1] - 1.96*summary(xx)$coefficients[,2]), exp(summary(xx)$coefficients[,1] + 1.96*summary(xx)$coefficients[,2])) # первый коэффициент [,1] для переменной - OR, второй [,2] - 95% LL, третий [,3] 95% UL

1

2

Т а б л и ц а 9

R-коды для оценки ассоциации «воздействие - исход» в сопоставленных парах «случай-контроль»

T a b l e 9

R codes for assessing the impact-outcome association in matched case-control pairs

№ Команда R

1 ccs.all <- merge(subset(final_data_cov19, select = c(cid, cluster_case, csctrl, NDADDINF, BEHCG)), subset(not_ pr_cov19, select = c(cid, age, AGEGR, TIMEHSGR, FAMILY, CONTGR)), by = c(«cid»))

2 ccs.all <- arrange(ccs.all, cluster_case)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

3 ccs.df_cases_cov19 <- ccs.all [ccs.all$csctrl== »case»,]

4 ccs.df_control_cov19 <- ccs.all [ccs.all$csctrl== »control»,]

5 total.ccs <- ccs.df_cases_cov19 %>% inner_join(ccs.df_control_cov19, by = c(«cluster_case» = «cluster_case»), suffix=c(«_case»,»_ctrl»))

6 dfmcc <-data.frame(«before» = as.character(total.ccs$NDADDINF_case), «after»=as.character(total. ccs$NDADDINF_ctrl))

7 B <- table(dfmcc$before, dfmcc$after)[2,1]

8 C <- table(dfmcc$before, dfmcc$after)[1,2]

9 OR <-B/C

10 EF <- exp(((1/B) + (1/C))~a/2)*L96)

11 LL <- OR/EF

12 UL <- OR*EF

13 paste(«OR:»,OR,»[«,round(LL,2),»;»,round(UL,2),»]»)

ченных стандартной методикой точечной и интервальной оценки OR по данным, приведенным выше. Интерпретация доверительного интервала заключается в том, что мы на 95% уверены, что в популяции шансы респондентов, указавших на необходимость дополнительной информации о COVID-19, использовать внеочередной отпуск колеблется от 0,25 до 8,98 раз выше, чем шансы респондентов, не указавших на необходимость дополнительной информации о СОУГО-19.

Выводы

Использование статистического метода оптимального сопоставления пар субъектов в исследованиях дизайна «случай-контроль» позволяет достичь максимальной согласованности групп исследования и контроля по выбранным переменным согласования. Этот инструмент позволя-

ет упростить и автоматизировать процедуру подготовки данных для последующего анализа, когда данные о случаях и потенциальных контролях представлены в едином наборе данных.

Потребность информации о пандемии COVID-19 не дает статистически значимой ассоциации (р < 0,05) с вынужденным уходом в отпуск у медицинских работников. При разном значении показателя «число контролей на случай», точечная и интервальная оценка отношения шансов OR меняется незначительно и указывает на статистически не значимое ассоциацию (р > 0,05) между потребностью в дополнительной информации и вынужденным использованием отпуска медицинским работником из-за различных опасений по поводу влияния СОУГО-19.

Авторы заявляют об отсутствии конфликта интересов.

ЛИТЕРАТУРА/REFERENCES

1. The International Network of Agencies for Health Technology Assessment (inahta.org) HTA Glossary, 2006. http:// htaglossary.net/HomePage (дата обращения: 07.05.2022)

2. Гржибовский А. М., Иванов С. В., Горбатова М. А. Исследования типа «Случай-контроль» в здравоохранении.

2015;4. (In Russ.) https://cyberleninka.rU/artide/n/issledovaniya-tipa-sluchay-kontrol-v-zdravoohranenii

о

s

Наука и здравоохранение. 2015;4.

Grzhibovsky A. M., Ivanov S. V., Gorbatova M. A. Case-control studies in health care. Science and Public Health. ^

о

3

Ö1

-1

3. Качественная клиническая практика с основами доказательной медицины: учебное пособие для системы по- 8 слевузовского и дополнительного профессионального образования врачей. Под общ. ред. Р. Г. Оганова. М.: СилицеяПолиграф, 2011. 136 с. с приложениями.

Quality clinical practice with the basics of evidence-based medicine. Textbook for the system of postgraduate and additional professional education of doctors. Ed. R. G. Oganov. Moscow: SiliceaPolygraph, 2011. 136 p. with ^ appendices. (In Russ.) f

4. Setia M. S. Methodology Series Module 2: Case-control Studies. Indian J Dermatol. 2016 Mar-Apr;61(2):146-151. <S https://doi.org/10.4103/0019-5154.177773 PMID: 27057012; PMCID: PMC4817437 |

5. Wacholder S., McLaughlin J. K., Silverman D. T., Mandel J. S. Selection of controls in case-control studies. I. Principles. Am J Epidemiol. 1992 May 1;135(9):1019-28. https://doi.org/10.1093/oxfordjournals.aje.a116396. PMID: 1595688

6. Wacholder S., Silverman D. T., McLaughlin J. K., Mandel J. S. Selection of controls in case-control studies. II. Types of controls. Am J Epidemiol. 1992 May 1;135(9):1029-41. https://doi.org/10.1093/oxfordjournals.aje.a116397. PMID: 1595689

7. Wacholder S., Silverman D. T., McLaughlin J. K., Mandel J. S. Selection of controls in case-control studies. III. Design options. Am J Epidemiol. 1992 May 1;135(9):1042-50. https://doi.org/10.1093/oxfordjournals.aje.a116398. PMID: 1595690.

8. Mamouris P., Nassiri V., Molenberghs G. et al. Fast and optimal algorithm for case-control matching using registry data: application on the antibiotics use of colorectal cancer patients. BMC Med Res Methodol. 21, 62 (2021) https:// doi.org/10.1186/s12874-021-01256-3]

9. Pearce N. Analysis of matched case-control studies. BMJ. 2016 Feb 25;352:i969. https://doi.org/10.1136/bmj.i969. PMID: 26916049; PMCID: PMC4770817

10. Овчинников П. А., Дворянчиков В. В., Янов Ю. К., Рязанцев С. В., Вяземская Е. Э., Фанта И. В., Корнеенков А. А. Исследование вопросов информированности персонала медицинских организаций оториноларинголо-гического профиля в условиях пандемии COVID-19. Российская оториноларингология. 2022;21(2):51-61. Ovchinnikov P. A., Dvoryanchikov V. V., Yanov Yu. K., Ryazantsev S. V., Vyazemskaya E. E., Fanta I. V., Korneenkov A. A. Study of staff awareness at ENT facilities in pandemic COVID-19. Rossiiskaya otorinolaringologiya. 2022;21(2):51-61 (In Russ.) https://doi.org/10.18692/1810-4800-2022-2-51-61

11. Cornfield J. A Method for Estimating Comparative Rates from Clinical Data. Applications to Cancer of the Lung, Breast, and Cervix. Journal of the National Cancer Institute, 1951;11:1269-1275.

12. Peter Cummings Barbara McKnight. Analysis of matched cohort data. The Stata Journal. 2004;4;Number 3:274-281 School of Public Health and Community Medicine University of Washing. https://citeseerx.ist.psu.edu/viewdoc/do wnload?doi=10.1.1.664.8886&rep=rep1&type=pdf

13. Kirkwood Betty R., Jonathan A. C. Essential medical statistics. Sterne. 2nd ed. June 2003, Wiley-Blackwell, 512 p.

Информация об авторах

H Корнеенков Алексей Александрович - доктор медицинских наук, профессор, заведующий научно-исследовательской лабораторией клинической информатики и биостатистики, Санкт-Петербургский научно-исследовательский институт уха, горла, носа и речи (190013, Россия, Санкт-Петербург, Бронницкая ул., д. 9); e-mail: korneyenkov@gmail.com ORCID: https://orcid.org/0000-0001-5870-8042

Овчинников Павел Александрович - кандидат медицинских наук, начальник 60-го оториноларингологического отделения, Центральный военный клинический госпиталь имени А. А. Вишневского (143420, Московская обл., Красногорский р-н, п/о Архангельское, пос. Новый, д. 1); e-mail: generallor@mail.ru ORCID: https://orcid.org/0000-0002-5235-085X

Резванцев Михаил Владимирович - кандидат медицинских наук, заместитель начальника учебно-методического отдела, Военно-медицинская академия имени С. М. Кирова (194044, Россия, Санкт-Петербург, ул. Академика Лебедева, д. 6); e-mail: rmv_spb@mail.ru

ORCID: https://orcid.org/0000-0001-5649-8440

Вяземская Елена Эмильевна - инженер научно-исследовательской лаборатории клинической информатики и биостатистики, Санкт-Петербургский научно-исследовательский институт уха, горла, носа и речи (190013, Россия, Санкт-Петербург, Бронницкая ул., д. 9); e-mail: vyazemskaya.elena@gmail.com ORCID: https://orcid.org/0000-0002-4141-2226

Дворянчиков Владимир Владимирович - доктор медицинских наук, профессор, заслуженный врач России, директор, Санкт-Петербургский научно-исследовательский институт уха, горла, носа и речи (190013, Россия, Санкт-Петербург, Бронницкая ул., д. 9); e-mail: 3162256@mail.ru

ORCID: https://orcid.org/0000-0002-0925-7596

Будковая Марина Александровна - кандидат медицинских наук, научный сотрудник научно-исследовательского отдела патологии верхних дыхательных путей, Санкт-Петербургский научно-исследовательский институт уха, горла, носа и речи (190013, Россия, Санкт-Петербург, Бронницкая ул., д. 9); e-mail: budkovaya@lornii.ru ORCID: https://orcid.org/0000-0003-0219-1413

Information about authors

H Alexei A. Korneenkov - MD, Professor, Head of the Research Laboratory of Clinical Informatics and Biostatistics, Saint Petersburg Research Institute of Ear, Throat, Nose and Speech (9, Bronnitskaya Str., Saint Petersburg, Russia, 190013); e-mail: korneyenkov@gmail.com ORCID: https://orcid.org/0000-0001-5870-8042

Pavel A. Ovchinnikov - MD Candidate, Head of the 60th Otorhinolaryngological Department, Vishnevsky 3rd Central Military Clinical a Hospital (1, Settlement Novy, p/o Arkhangelskoe, Krasnogorsk district, Moscow region, Russia, 143420); e-mail: generallor@mail.ru .b ORCID: https://orcid.org/0000-0002-5235-085X

Mikhail V. Rezvantsev - MD Candidate, Deputy Head of Educational and Methodical Department, Kirov Military Medical Academy "o (6, st. Academician Lebedev, Saint Petersburg, Russia, 194044); e-mail: rmv_spb@mail.ru ^ ORCID: https://orcid.org/0000-0001-5649-8440

Elena E. Vyazemskaya - engineer of the Research Laboratory of Clinical Informatics and Biostatistics, Saint Petersburg Research -3 Institute of Ear, Throat, Nose and Speech (9, Bronnitskaya Str., Saint Petersburg, Russia, 190013); e-mail: vyazemskaya.elena@gmail.com § ORCID: https://orcid.org/0000-0002-4141-2226

'C Vladimir V. Dvoryanchikov - MD, Professor, director, Saint-Petersburg Research Institute of Ear, Throat, Nose and Speech (9,

■g Bronnitskaya Str., Saint Petersburg, Russia, 190013); e-mail: 3162256@mail.ru a ORCID: https://orcid.org/0000-0002-0925-7596

^ Marina A. Budkovaya - MD Candidate, Researcher of the Department of Development and Implementation of High-Tech Methods

of Treatment, Saint Petersburg Research Institute of Ear, Throat, Nose and Speech (9, Bronnitskaya Str., Saint Petersburg, Russia, 190013); e-mail: budkovaya@lornii.ru § ORCID: https://orcid.org/0000-0003-0219-1413

i Надоели баннеры? Вы всегда можете отключить рекламу.