УДК 615.917 : 616.009
Некоторые примеры применения дискриминантного анализа для обработки данных экспериментально-токсикологического исследования
На примере дополнительной обработки ранее опубликованных данных изолированной и комбинированной субхронической интоксикации крыс свинцом и кадмием, в том числе, при действии комплекса биопротекторов, продемонстрировано, что дискрими-
нантный анализ существенно расширяет возможности трактовки результатов сравнительно-токсикологических экспериментов, дополняя обычное сопоставление величин отдельных показателей обобщённой математической характеристикой состояния организма и оценивая суще-
Казмер Ю.И.1,* Кацнельсон Б.А.1, Вараксин А.Н.2, Киреева Е.П.1
1ФГУН «Екатеринбургский медицинский научный центр профилактики и охраны здоровья рабочих промпредприятий» Роспотребнадзора МЗиСР 2 Институт промышленной экологии УрО РАН
ственность её изменения под влиянием различных условий токсического воздействия.
Ключевые слова: дискри-минантный анализ, кадмий, свинец, комбинированная токсичность, эффективность биопрофилактического комплекса.
заранее известно [5]. Дискри-минантный анализ позволяет определить, какие переменные (показатели) в совокупности наилучшим образом отличают эти группы друг от друга. Для этого разрабатывается решающее правило на основе линейной дискриминантной функции Фишера, позволяющее, например, отнести объект к тому классу, расстояние до центра которого является минимальным. Как правило, используется так называемое расстояние Махаланобиса [6].
При использовании метода дискриминантного анализа основным показателем является точность классификации, количественно оцениваемая долей правильно классифицированных объектов. Следует особо отметить, что даже признак, по которому имеется статистически значимое межгрупповое различие, взятый обособленно, не обязательно обеспечивает 100%-но правильное распознавание индивидуальных объектов, в то время как совокупность признаков, ни по одному из которых такое различие не является значимым, вполне может оказаться достаточно
29
Введение. Одним из наиболее распространённых дизайнов токсикологического эксперимента является поперечное исследование, в котором параллельно наблюдаются группы животных, подвергающиеся воздействиям, качественно или количественно неодинаковым, реакция на которые оценивается по межгрупповым различиям отдельно взятых средних показателей, характеризующих состояние организма. О том, насколько существенно повлияло на развитие интоксикации заданная экспериментатором неодинаковость условий воздействия, обычно судят по тому, насколько велики и статистически значимы эти межгрупповые различия показателей интоксикации и насколько велико число различающихся показателей (с учётом их токсикодинамиче-ской или токсикокинетической значимости). Гораздо реже рассматривается возможность отнесения обобщённого статуса («образа») организма в сравниваемых группах, оцениваемого по совокупности признаков, к несовпадающим множествам, что могло бы существенно повысить обоснованность ука-
занного суждения. Подобного рода задачи могут решаться различными методами классификации, основанными на математической теории распознавания образов, или с помощью дискриминантного анализа. Теоретические основы и опыт использования такого подхода к решению аналогичных задач в области эпидемиологии профессиональных и экологически обусловленных заболеваний описывались ранее [1], но до сих пор имелся лишь ограниченный опыт, относящийся к экспериментальной токсикологии: с помощью дискриминантного анализа была сопоставлена эффективность различных биопротекторов при субхронической свинцовой интоксикации крыс [2].
В принципе, цель дискрими-нантного анализа состоит в том, чтобы на основе различных характеристик объекта (например, экспериментального животного) классифицировать его, то есть отнести к одной из нескольких групп некоторым оптимальным способом, причем число групп, на которые нужно разбить рассматриваемую совокупность объектов,
Фрагмент кандидатской диссертации Ю.И.Казмер
даже для 100%-но правильной классификации. (Примером второго случая может служить второй комплекс из 3 показателей, приводимый ниже в таблице 6.) Наряду с этим, применение дискриминантного анализа для обработки данных токсикологического эксперимента позволяет определить комплекс наиболее информативных показателей, позволяющий однозначно классифицировать объект наблюдения, что с некоторыми оговорками может служить аргументом при обсуждении содержательной (токсикодинамической и ток-сикокинетической, а также диагностической) значимости такого симптомокомплекса.
Материалы и методы исследования. Исходными данными для проведенного нами дискри-минантного анализа явились результаты эксперименталь но-токсикологического исследования эффективности биопрофилактических средств при комбинированном действии свинца и кадмия [4]. Это исследование было проведено в двух сериях опытов на 120 белых аутбредных крысах - самках с исходной массой тела 220-230 г Для создания моделей острой и субхронической интоксикации использовали ацетат свинца -РЪ(СН3С00)2.3 Н20 и хлорид кадмия - СёС12 2,5 Н20.
При острой внутрибрюшин-ной затравке были установлены величины ЛД50 для свинца (220 мг/кг) и кадмия (67 мг/ кг). Затем была создана экспериментальная модель изолированной и комбинированной субхронической интоксикации свинцом и кадмием, для чего их вводили раздельно крысам в дозах 0,05 ЛД50 или совместно дозах 0,025 ЛД50 иди 0,05 ЛД50 на протяжении 6 недель, по 3 раза в неделю. На фоне субхронической интоксикации комбинацией свинец-кадмий в дозах 0,05 ЛД50 каждого оценивали также защитную эффективность биопрофилактического
комплекса (БПК), который включал в себя глутаминат натрия, пектиновый энтеро-сорбент, поливитаминно-ми-неральный препарат «Витрум Кидс», кальцийсодержащую биологически активную добавку «Супермелкий биокальций». Все группы животных наблюдались параллельно. Межгрупповые различия, на основе которых авторы [4] судили о наличии как проявлений комбинированной токсичности, так и эффекта БПК, ранее анализировались только путём сравнения среднегрупповых значений обособленных показателей состояния организма, как это описано во «Введении».
В математической статистике расстояние Махаланобиса - мера расстояния между векторами случайных величин, обобщающая понятие Евклидова расстояния. Предложено индийским статистиком П.Ч.Махаланобисом в 1936 году. С помощью расстояния Махаланобиса можно определить сходство неизвестной и известной выборки. Оно отличается от расстояния Евклида тем, что учитывает корреляции между переменными и инвариантно к масштабу.
Таким образом, на входе дис-криминантного анализа мы имели 6 групп по 10-12 крыс в каждой: интактный контроль; затравленная свинцом в дозе 0,05 ЛД50; затравленная кадмием в дозе 0,05 ЛД50; затравленная комбинацией свинца и кадмия в дозах 0,025 ЛД50 каждого; затравленная комбинацией свинца и кадмия в дозах 0,05 ЛД50 каждого; затравленная комбинацией свинца и кадмия в дозах 0,05 ЛД50 каждого на фоне БПК. Ставилась задача определить, по каким показателям животное можно надёжно классифицировать как относящееся к той или иной группе. Группы (обозначаемые по условиям воздействия) сравнивались
попарно: интакгныи контроль - свинец 0,05 ЛД50; интактный контроль - кадмий 0,05 ЛД50; свинец и кадмий в комбинации в дозах по 0,05 ЛД^ - свинец и кадмий в комбинации в дозах по 0,05 ЛД50 + БПК; свинец 0,05 ЛД50 - кадмий 0,05 ЛД50; свинец 0,05 ЛД50 - свинец и кадмий в ком-бинации в дозах по 0,05 ЛД50; кадмий 0,05 ЛД50 - свинец и кадмий в комбинации в дозах по 0,05 ЛД50.
Для того чтобы отобрать наиболее информативные комплексы показателей при парном сравнении вышеуказанных групп, мы воспользовались пошаговым вперёд (forward stepwise) дискриминантным анализом в программе Statistica. На первом шаге в дискрими-нантную функцию включали переменную, обеспечивающую максимальное расстояние Ма-халанобиса. На втором шаге включали следующую переменную и т.д., пока не получили 100%-но верную классификацию. Затем первую переменную отбрасывали из множества, а далее на первом шаге включали в дискриминантную функцию другую переменную, обеспечивающую максимальное расстояние Махаланобиса и т.д. Поскольку в базе данных имеются пропуски по некоторым показателям, мы воспользовались также процедурой стандартного дискриминантного анализа с учетом информативных показателей, уже отобранных пошаговым анализом.
На выходе дискриминантно-го анализа мы получали: несовпадающие минимальные комплексы признаков, обеспечивающие принятый высокий процент правильной классификации объектов в каждой из групп, коэффициенты линейной дискриминантной функции Фишера и расстояние Махала-нобиса между центрами групп. Чем больше расстояние Ма-халанобиса, тем дальше разнесены между собой группы, т.е. лучше разделение. Однако
Таблица 1
Расстояния Махаланобиса между группами интактный контроль - свинец 0,05 ЛД50 при классификации по различным
показателям
Показатель Расстояние Махаланобиса
Дискриминирование по одному показателю
Свинец в моче 5,2
Копропорфирин в моче 5,0
Ретикулоциты 3,1
Дискриминирование по комплексам из 2-х показателей
Гемоглобин 5,1
Масса почек
Активность сукцинатдегидрогеназы лимфоцитов крови (СДГ) 4,3
Общий белок
Гемоглобин 3,8
СДГ
Дискриминирование по комплексам из 3-х показателей
Общий белок 5,3
Активность аспартат-трансаминазы (АсТ) в сыворотке крови
Масса почек
известно [6-8], что расстояние Махаланобиса увеличивается при добавлении новых компонент в дискриминантную функцию (решающее правило), поэтому сравнивать следует только те расстояния, которые получены для одинакового числа компонент.
Для наглядности результаты дискриминантного анализа мы дополнили лепестковыми диаграммами, на осях которых отложены средние значения наиболее информативных показателей, полученных в процессе дискриминантного анализа. При этом каждый показатель одной из групп сравнения принимался за единицу, а соответствующий показатель второй группы откладывался на оси равным отношению к величине его в первой группе. В результате обобщённый образ состояния организма в первой группе изображён правильным многоугольником, а во второй - неправильным, смещённым по отношению к первому преимущественно по тем осям, которые соответствуют наиболее отличающимся показателям.
Результаты и обсуждение. Результаты дискриминантно-го анализа в каждой из 6 пар сравнения, сгруппированные по числу дискриминирующих показателей, представлены в таблицах 1-6. Дополнительную визуальную информацию дают рисунки 1-6.
Интактный контроль - свинец 0,05 ЛД50. Затравка свинцом привела к развитию характерных признаков свинцовой интоксикации, в частности, к высоко статистически значимому повышению числа ретикулоци-тов, а также концентраций ко-пропорфирина и свинца в моче [8], что позволяло однозначно различить группы между собой по каждому из этих показателей в отдельности . Судя по расстоянию Махаланобиса (табл. 1), лучше всего группы разделяют показатели содержания копропорфирина и свинца в моче, однако, различение жи-
вотных, подвергавшихся и не подвергавшихся свинцовой экспозиции по её маркёру (выведению свинца почками) является достаточно тривиальным результатом. Вместе с тем, дис-криминантный анализ с заданным нами высоким процентом правильной классификации (100%) и с такими же высокими значениями расстояния Ма-халонобиса (табл. 1) продемонстрировал различение статуса организма крыс в двух сравниваемых группах и на основе комплексов из 2-х или 3-х признаков, не включающих в себя столь самоочевидных как маркёр экспозиции и маркёр свинцового нарушения порфирино-вого метаболизма. Интересно, что в эти информативные комплексы, наряду со снижением содержания гемоглобина в крови, относительно специфичным для эффектов действия свинца, входят в разных сочетаниях и
такие интегральные показатели интоксикации как снижение содержания белка и некоторое повышение активности аспартаттрансаминазы (АсТ) в сыворотке крови, снижение активности сукцинатдегидроге-назы (СДГ) лимфоцитов крови, а также увеличение массы почек, являющееся одним из многих показателей нефроток-сичности этого металла, доказанной тем же экспериментом [4]. (Здесь и далее о том, представление о знаке различия величин по каждому показателю читатель может получить, рассматривая соответствующую лепестковую диаграмму.)
Интактный контроль - кадмий 0,05 ЛД50. Как видно из данных, приведенных в табл. 2, в это случае надёжно классифицировать объекты по какому-либо одному показателю не удалось, и найден только один различающий их комплекс из 2
Рис. 1. Лепестковая диаграмма сдвига показателей группы, затравленной свинцом в дозе 0,05 ЛД50 относительно группы интактного контроля.
Рис. 2. Лепестковая диаграмма сдвига показателей группы, затравленной кадмием в дозе 0,05 ЛД50 относительно группы интактного контроля.
--
---
ЗН-грудаы 1.6
/ ' / / / ТчТл^ V \ \
\ \\ \ \х ■ ■ ^
<о хЦфнцкмт д» Ринка
Рь ■ моче
Рис. 4. Лепестковая диаграмма сдвига показателей группы, затравленной свинцом и кадмием в дозах по 0,05 ЛД50 на фоне приема БПК относительно группы, затравленной свинцом и кадмием в дозах по 0,05 ЛД50.
Рис. 5. Лепестковая диаграмма сдвига показателей группы, затравленной свинцом и кадмием в дозах по 0,05 ЛД50 относительно группы, затравленной свинцом в дозе 0,05 ЛД50.
Рис. 3. Лепестковая диаграмма сдвига показателей группы, затравленной свинцом в дозе 0,05 ЛД50 относительно группы, затравленной кадмием в дозе 0,05 ЛД50.
Рис. 6. Лепестковая диаграмма сдвига показателей группы, затравленной свинцом и кадмием в дозах по 0,05 ЛД50 относительно группы, затравленной кадмием в дозе 0,05 ЛД50.
показателей. Вместе с тем, три комплекса из 4-х показателей в различных сочетаниях оказались достаточными для такого различения (в том числе, один, включающий маркёр экспозиции - концентрацию кадмия в моче). Таким образом, обобщённый статус организма при субхронической кадмиевой интоксикации отличается от контрольного в меньшей степени, чем при свинцовой, несмотря на то, что дозы обоих металлов были изоэффективными в долях от ЛД50 при однократном введении. Очевидно, определённую роль играет и то, что в развитии хронических эффектов задействованы не те же самые механизмы, что в развитии острого смертельного (причём более высокая массовая доза свинца по сравнению с кадмием оказывается более существенной, чем одинаковое отношение к ЛД50), и то, что при кадмиевой интоксикации практически все показатели являются не специфичными.
Свинец 0,05 ЛД50 - кадмий 0,05 ЛД50. То, что свинец и кадмий действуют на организм неодинаково и интоксикация ими характеризуется неодинаковой клинической картиной, не нуждается в доказательствах, но именно поэтому успешное различение между соответствующими группами рассматриваемого эксперимента может служить своего рода тестом на адекватность использованной методики. Как видно из табл. 3 и рис. 3, в этом случае классификация объектов опирается, прежде всего, на характерные показатели свинцовой интоксикации, используемые обособленно (повышение числа ретикулоцитов и повышенная экскреции копропорфирина) либо в том или ином комплексе (снижение общего числа эритроцитов и содержания гемоглобина, повышение экскреции дельта-аминолевулиновой кислоты). Вместе с тем, в эти комплексы приходится включать также некоторые инте-
Таблица2
Расстояния Махаланобиса между группами интактный контроль - кадмий 0,05 ЛД50 при классификации по различным показателям
Показатель Расстояние Махаланобиса
Дискриминирование по комплексу из 2-х показателей
Копропорфирин 3,0
Активность сукцинатдегидрогеназы лимфоцитов крови (СДГ)
Дискриминирование по комплексам из 4-х показателей
Альбумин 4,9
СДГ
Активность аланин-трансаминазы (АлТ) в сыворотке крови
Эозинофилы
Норковый рефлекс 4,3
Лимфоциты
Общий белок
СДГ
Альбумин 3,6
СДГ
Коэффициент де Ритиса
Кадмий в моче
Таблица 3
Расстояния Махаланобиса между группами свинец 0,05 ЛД50 - кадмий 0,05 ЛД50 при классификации по различным показателям
Показатель Расстояние Махаланобиса
Дискриминирование по одному показателю
Копропорфирин 4,2
Ретикулоциты 2,6
Дискриминирование по комплексам из 2-х показателей
Общий белок 4,2
Гемоглобин
Общий белок 3,6
Дельта-АЛК в моче
Эритроциты 3,6
Коэффициент деРитиса
Общий белок 3,3
Активность сукцинатдегидрогеназы лимфоцитов крови (СДГ)
НОЯБРЬ
- Д Е К А Б Р Ь 20 1 О
Таблица 4
Расстояния Махаланобиса между группами свинец и кадмий в комбинации в дозах по 0,05 ЛД50 -свинец и кадмий в комбинации 50 в дозах по 0,05 ЛД50 + БПК при классификации по различным показателям
Показатель Расстояние Махаланобиса
Дискриминирование по комплексам из 3-х показателей
SH-группы в плазме крови 4,7
Ретикулоциты
Копропорфирин
Коэффициент деРитиса 3,6
Альбумин
Копропорфирин
Активность аланин-трансаминазы (АлТ) в сыворотке крови 3,1
Копропорфирин
Кадмий в моче
Таблица 5
Расстояния Махаланобиса между группами свинец 0,05 ЛД50 - свинец и кадмий в комбинации в дозах по 0,05 ЛД50 при классификации по различным показателям
Показатель Расстояние Махаланобиса
Дискриминирование по комплексам из 2-х показателей
Активность сукцинатдегидрогеназы лимфоцитов крови (СДГ) 3,6
Кальций в сыворотке крови
Копропорфирин 2,9
Ретикулоциты
Дискриминирование по комплексам из 3-х показателей
Индекс Альбумин/Глобулин 5,3
Свинец в моче
Активность аспартат-трансаминазы (АсТ) в сыворотке крови
гральные показателей обеих интоксикаций (различия по СДГ, по общему белку и по коэффициенту де Ритиса), причём комплекс первых двух названных показателей и сам по себе оказался достаточным для дискриминирования.
Свинец и кадмий в комбинации в дозах по 0,05 ЛД50 - свинец и кадмий в комбинации в дозах по 0,05 ЛД50 + БПК. В табл. 4 представлено три минимальных комплекса показателей, позволяющих достичь 100%-ного распознавания. Судя по лепестковой диаграмме (рис. 3), под влиянием БПК произошли несомненные благоприятные сдвиги числа ретикулоцитов (снижение), копропорфирина в моче (снижение) и SH-групп в крови (повышение). Повышение экскреции металлов с мочой при равной экспозиции к ним также благоприятно свидетельствует об улучшении эли-минационной способности почек, что наблюдалось в нашей лаборатории неоднократно при различных металлоинтоксика-циях под влиянием БПК разного состава [2].
Свинец 0,05 ЛД50 - свинец и кадмий в комбинации в дозах по 0,05 ЛД50. То, что эти две группы надёжно различаются уже при использовании комплексов из двух или всего трёх показателей, видно из табл. 5 и диаграммы на рис. 5. Особо следует обратить внимание на снижение под влиянием кадмия экскреции свинца с мочой (что вполне объяснимо ухудшением элиминационной функции почек под влиянием комбинации двух нефротоксичных металлов [8] ) и, в то же время, на усиление экскреции копро-порфирина (отражающее влияние большей задержки свинца в организме на порфириновый метаболизм). Вместе с тем, такой токсический эффект свинца как ретикулоцитоз оказался ослабленным, а характерное для обоих металлов неспецифическое тормозящее влияние на активность СДГ лимфоци-
тов (рис. 1 и 2) при комбинированной интоксикации не только не было усилено, но даже снизилось по сравнению с действием одного свинца (рис. 5). Возможность различных типов комбинированной токсичности (аддитивность, синергизм, антагонизм) по отношению к разным системам и показателям состояния организма для различных металлов достаточно характерна [3]
Кадмий 0,05 ЛД50 - свинец и кадмий в комбинации в дозах по 0,05 ЛД50. Как видно из Таблицы 6 и Рисунка 6, группа комбинированной интоксикации не менее надёжно дискриминируется и от группы, за-травлявшейся только кадмием, причём опять-таки по разным показателям тип комбинированной токсичности различен.
Заключение. Рассмотренный в статье опыт свидетельствует о том, что дискрими-нантный анализ существенно расширяет возможности трактовки результатов сравнительно-токсикологических экспериментов, дополняя
Р СПИСОК ЛИТЕРАТУРЫ
1. Кацнельсон Б.А., Ползик Е.В., Казанцев В.С. и др. Применение методов распознавания образов для решения задач экологической эпидемиологии // Медицина труда и промышленная экология, 1997. - № 4. - С. 7-11.
2. Кацнельсон Б.А., Дегтярева Т.Д., Привалова Л.И. Принципы биологической профилактики профессиональной и экологически обусловленной патологии от воздействия неорганических веществ. - Екатеринбург, 1999. - 106 с.
Таблица 6
Расстояния Махаланобиса между группами кадмий 0,05 ЛД50 - свинец и кадмий в комбинации в дозах по 0,05 ЛД50 при классификации по различным показателям
Показатель Расстояние Махаланобиса
Дискриминирование по комплексам из 2-х показателей
Гемоглобин 7,5
Копропорфирин
Ретикулоциты 4,3
Свинец в моче
Дискриминирование по комплексам из 3-х показателей
Масса почек 4,6
Свинец в моче
БН-группы в плазме крови
Лимфоциты 4,1
Эритроциты
Кальций в сыворотке крови
обычное сопоставление величин отдельных показателей обобщённой математической характеристикой состояния
организма и оценивая существенность её изменения под влиянием различных условий токсического воздействия.
3. Кацнельсон Б.А. Комбинированное действие химических веществ. // Б.А.Куляндский и В.А.Филов (ред.) «Общая токсикология». -М.: Медицина, 2002- С.497-520
4. Киреева Е.П., Кацнельсон Б.А., Дегтярева Т.Д. и др. Нефротоксическое действие свинца, кадмия и его торможение комплексом биопротекторов // Токсикологический вестник, 2006. - № 3. - С. 26-31.
5. Реброва О.Ю. Статистический анализ медицинских данных. - М.: Медиа Сфера, 2003. - 305 с.
6. Фомин Я.А., Тарловский Г.Р. Статистическая теория распознавания образов. - М.: Радио и связь,1986. - 264 с.
7. Прикладная статистика: Классификация и снижение размерности / Айвазян С.А., Бух-штабер В.М., Енюков И.С. и др.- М.: Финансы и статистика, 1989. - 608 с.
8. Проблемы построения систем анализа данных // Статистические проблемы управления / Ред.Ш. Раудис. - Вильнюс: Институт математики и кибернетики АН Литвы, 1990. - Вып. 93. - 247 с.
Kazmer Yu.I. \ Katsnelson В.А. \ Varaskin A.N.2, Kireyeva Ye.P.1
Some examples of using a discriminant analysis for processing data of experimental toxicological studies
Ekaterinburg Medical Scientific Center for Health Promotion and Protection of Industrial Workers
2Institute of industrial ecology, Ural Branch, Russian Academy of Sciences
On the example of extra processing of previously published data about individual and combined sub-chronic intoxication of rats by lead and cadmium inclusive of, it was shown that the discriminant analysis significantly enhances possibilities of interpreting results of comparative toxicological experiments complementing a usual confrontation of magnitudes of individual indicators by a generalized mathematical characteristics of the organism state and evaluating the significance of its changing under influence of different conditions of toxic exposure.
Материал поступил в редакцию 16.02.2010 г.