УДК 621.37
А. С. Красичков
Санкт-Петербургский государственный электротехнический
университет "ЛЭТИ"
Оценка распределения коэффициента взаимной корреляции в задаче классификации кардиокомплексов
*
при длительном мониторировании электрокардиосигнала
Определено распределение выборочного коэффициента корреляции опорного сигнала и анализируемого фрагмента электрокардиограммы в задаче классификации кардиокомплексов при длительном мониторировании кардиосигнала. Проведено сравнение теоретических результатов с данными компьютерного моделирования.
Электрокардиосигнал, коэффициент взаимной корреляции, компьютерное моделирование, длительный мониторинг
Сердечно-сосудистые заболевания являются одной из основных причин смертности в странах Европы. Согласно статистике в настоящее время частота сердечно-сосудистых заболеваний и в России выросла почти в три раза. В год от болезней сердечно-сосудистой системы умирает 1 млн 260 тыс. человек, из них 640 тыс. - от ишемической болезни сердца и инфаркта миокарда.
Электрокардиография является одним из основных методов исследования сердца и диагностики заболеваний сердечно-сосудистой системы. С помощью основных фрагментов электрокардиограммы (ЭКГ) (зубцов, интервалов, сегментов) можно выявить патологии сердца (миокардиты, перегрузки сердца, патологию проводящей системы сердца и др.).
При обычном проведении ЭКГ-исследований в поликлинике, когда пациент лежит в состоянии максимального покоя на спине, кардиограмма снимается в течение 1-2 мин, что не всегда достаточно для полного выявления всех возможных патологий сердца. Некоторые патологии возможно выявить лишь в условиях обычной жизнедеятельности человека, его повышенных психической и физической нагрузок. Для таких целей используют метод холтеровского мониторирования, позволяющий длительно (сутки и более) регистрировать ЭКГ пациента в условиях обычного образа его жизни днем и ночью.
За сутки при использовании холтеровского мониторирования накапливается более 80 тыс. сердечных циклов, и обработать каждый из них для выявления возможных патологий врачу не представляется возможным, так как это требует большого времени. Ситуация усугубляется тем, что при съеме ЭКГ возникают помехи и артефакты разного рода, искажающие сигнал и не дающие возможности врачу поставить правильный диагноз.
В качестве основных помех, присутствующих в мониторограммах, выступают миографическая помеха (для которой в первом приближении можно использовать модель нормального "белого" шума [1]) и дрейф изоэлектрической линии. В настоящее время су-
* Работа выполнена при поддержке Министерства образования и науки РФ в рамках ФЦП "Научные и научно-педагогические кадры инновационной России на 2009-2013 годы" (Государственный контракт № 14.740.11.1414 от 28 октября 2011 г.). © Красичков А. С., 2012 51
ществуют методы, устраняющие дрейф изоэлектрической линии, поэтому с помощью предварительной обработки электрокардиосигнала от данной помехи можно избавиться [1].
Наиболее удобным способом анализа длительных записей является предоставление врачу основных типов кардиокомплексов, присутствующих в мониторограмме, т. е. сортировка кардиокомплексов каждого вида по соответствующим группам с их одновременным накоплением в группе для увеличения отношения "сигнал/шум" [2].
Подобная сортировка позволяет значительно уменьшить нагрузку на врачебный персонал, сделать возможной оперативную оценку состояния сердечно-сосудистой системы человека, повысить эффективность постановки диагноза за счет уменьшения влияния помех, присутствующих в электрокардиосигнале.
Для того чтобы эффективно реализовать алгоритм выделения основных типов кардио-комплексов, необходимо определить критерии, по которым будет осуществляться сортировка.
Одним из основных критериев сортировки является близость форм различных фрагментов кардиосигнала, характеризуемая коэффициентом взаимной корреляции между опорным (эталонным) сигналом 5оп (') и анализируемым фрагментом. Если коэффициент
взаимной корреляции равен порогу (|г\ > гпор) или превышает его, выносится решение о
принадлежности анализируемого кардиокомплекса к конкретному типу [2]. Однако при использовании данного подхода остается нерешенной задача оценки влияния на результат классификации присутствующей в анализируемом фрагменте миографической помехи.
Наблюдаемая реализация фрагмента сигнала у 0) представляет собой аддитивную
смесь собственно кардиосигнала 5 (t) и нормального "белого" шума п (t) (модель миографической помехи). Наличие шума приводит к тому, что коэффициент взаимной корреляции г является случайной величиной. Для корректного решения задачи классификации необходимо найти закон ее распределения в зависимости от параметров сигнала и от спектральной плотности мощности шума. В рамках настоящей статьи уровень помехи на анализируемом фрагменте положим неизменным. Данное условие справедливо для большинства практических задач анализа непродолжительных фрагментов ЭКГ.
Так как в современных системах мониторинга осуществляется дискретизация сигнала, то с учетом конечной полосы пропускания системы проблему можно сформулировать следующим образом. Пусть имеется N отсчетов опорного сигнала 5оп ('), незашумленного фрагмента кардиосигнала 5(/) и шума п('), ' = 1, ..., I. Отсчеты шума являются независимыми нормальными случайными величинами с нулевым средним значением и дисперсией аЩш : п (') = N (0, аш ). Необходимо найти закон распределения случайной величины г :
г =
I ^ 5оп (') п 0') I
I5оп (')[ 5 (') + п (')] Ж Р+1
' = 1 _ ' 5оп V 5 ' =1
1-1 2 15,2п ('')![ 5 (') + п (' )]2
'=1 '=1
I
I
'=1
5 (') + п (')
1 + 21у (I )А( I )+1 А2 (I)
'=1 '=1
(1)
2
где Е$ = X £дп (г) - энергия опорного сигнала; Е$ = X $2 (г) - энергия анализируемого
0П г =1 г =1
фрагмента незашумленного кардиосигнала; р - коэффициент взаимной корреляции между опорным сигналом и незашумленным фрагментом кардиосигнала; х (г) = $оп (г У^Е$оп
- нормированный отсчет опорного сигнала; у (г ) = $ (г)/Е$ - нормированный отсчет анализируемого сигнала; А (г) = п (гЕ$ - нормированный отсчет шума с дисперсией
а2 =аШ/Е$, А(г) = N(0, а).
Нахождение распределения г в аналитическом виде является математически сложной задачей с нетривиальным решением. Однако данная проблема может быть преодолена, если, введя обозначение
I I
Е = 1 + 2X У (г)А(г) + ^А2 (г), (2)
г=1 г=1
случайную величину 1Д/Ё, входящую в выражение (1), представить аппроксимацией полинома п-го порядка: 1Д/Ё ~ dЕп +... + аЕ2 + ЬЕ1 + с.
Для нахождения коэффициентов полинома определим область наиболее вероятных значений случайной величины Е. Второе слагаемое в выражении (2) является нормальной случайной величиной, третье слагаемое при условии I > 30 распределено приблизительно нормально [3], поэтому при классификации кардиокомплексов (когда I > 30 ) можно считать, что Е является нормальной случайной величиной со средним значением т {Е/к} = Ы +1 и дисперсией Б {Е/к} = 2к (М + 2), где к = а2 = оЩц/Е$ - безразмерный параметр, характеризующий уровень помеховой обстановки.
Таким образом, становится возможным определить вероятность р попадания случайной величины Е в определенный диапазон значений. Например для отклонения Е от среднего значения р (|Е - т {Е/к} > 2^Б {Е/к} ) < 0.05, граница диапазона рассчитывается как
Ег (к) = 2^2к(Ы + 2) . (3)
Из выражения (3) следует, что диапазон зависит от длительности сигнала I и безразмерного параметра к. В дальнейшем для определения границ диапазона будем использовать выражение (3). Таким образом, становится возможным рассчитать диапазон наиболее вероятных значений Е [т {Е/к} - Ег (к), т {Е/к} + Ег (к)] с учетом условия т {Е/к}-Ег (к)> 0.
Зная границу Ег (к, I), методом наименьших квадратов определим коэффициенты аппроксимации d, ..., а, Ь, с с помощью нахождения минимума функции:
™{Е}+Ег / 1 Л2
/(да(Е), Ег, d, ..., а, Ь, с) = | I -р-dЕn - ... - аЕ2 - ЬЕ1 - с dЕ. (4)
т{Е}-Ег )
В качестве первого приближения ограничимся полиномами первого и второго порядков. Для полинома второго порядка минимум выражения (4) достигается при значениях коэффициентов, удовлетворяющих систему уравнений
с = [1/(2^г )](E - aC - bD);
a = Ь {([DC|(2^г )] - B) + P - ВТ/(25г )} [2^/(25г A - C2 ) (25гТ - ВD) (25г А - С2 ) - (25гВ - CD) (25гР - ВС)
(5)
Ь =
(2^гС - D2) (2^г А - С2) - (2^гВ - CD)
а для полинома первого порядка - систему уравнений
Ь = ( 2^гГ - ВD )/( 2^гС - D2 ); с = [ 1/2^ ][В - (2^гГ - ВD)/(2^гС - D2 )
(6)
В (5) и (6) введены обозначения:
т{5}+5г
А = | ^Ч; В = | 5^5; С =
т
(5Кг
т
(5Кг
т{5}+5г
| 54; D = т{5}-5г
т{5}+5г
I 5^5; т{5}-5г
т{5}+5г
т{5}+5г
В = I ^ Т = | 4^5; Р =
т
{5}-5г
т
{«-5,
т{5}+5г 52
I
{5}-5г * 5
т
Из выражений (5), (6) видно, что коэффициенты полиномов аппроксимации зависят только от параметров к и I, поэтому используем обозначения а^ /, Ьк /, с^ I.
В качестве иллюстрации в таблице представлены статистические характеристики случайной величины 5 и значения коэффициентов полиномов первого и второго порядков для кардиокомплекса, состоящего из I = 70 отсчетов (рис. 1, а), вычисленные для
к = 7.46 -10-4 (рис. 1, б), 46.110-4 (рис. 1, в) и 119 -10-4 (рис. 1, г)*.
На рис. 2 приведен пример аппроксимации знаменателя выражения (1) для фрагмента кардиосигнала, представленного на рис. 1, д: 1 - график функции 1/л/5, 2 - аппроксимация
2
к -104 т {5} ^{5} Полином второго порядка Полином первого порядка
а Ь с Ь с
7.46 1.052 0.055 0.331 - 1.162 1.831 - 0.464 1.464
46.1 1.326 0.147 0.189 - 0.837 1.644 - 0.332 1.314
119 1.836 0.260 0.086 - 0.522 1.407 - 0.206 1.124
Рис. 1
б
а
в
г
* На рис. 1, б-г аппроксимируемый кардиокомплекс (рис. 1, а) показан серыми линиями, результаты аппроксимации - черными линиями. 54
полиномом второго порядка, 3 - аппроксима- Б ция полиномом первого порядка.
Ошибка при аппроксимации на интер- 0 8
вале [т {Е}-Ег, т {Е} + Ег ] полиномом
второго порядка составляет менее 0.01 %, 0.7 полиномом первого порядка - менее 1 %, причем максимум ошибки приходится на 0.6 края интервала аппроксимации, где вероятность значений случайной величины Е в несколько раз, меньше чем в окрестности математического ожидания т {Е}.
Выражение (1) при аппроксимации знаменателя полиномом первого порядка для заданного к имеет вид
1.3
1.55
1.8
Рис. 2
2.05
г1 =
I
р + Х х(г )А(г)
г=1
Ь
и, I
I I ,
1 + 2 X У (г )А( г ) + £А2 (;)
г=1 г=1
+ ск, I Г
После ряда преобразований найдем среднее значение случайной величины г:
т{гх} = р{Ьк, I [к(I + 2) +1] + сй, I}
(7)
(8)
или при N » 1 т {гц} = р |^Ьк I (М +1) + ск I ]. Из последнего выражения следует, что математическое ожидание зависит только от параметров к, I и не зависит от формы сигнала. При аппроксимации знаменателя (1) полиномом второго порядка получим
г2 =
I
р + Х х (г )А( г)
г=1
аи, 11 X [у (г) + А (г)]2 [ + Ьи 1| X [У (г) +А(г)]2 [ + ск I
1г =1 J У =1
со средним значением
т {г2 } = ак, I {к2 [12 + 2I + 4р (I + 2)] + рк (21 + 8) + р} + р {Ьи, I [к (I + 2) +1] + ск, I}. (9) При N > 1 справедливы приближения 2! + 8 « 2I; I + 2 «I; 12 + 2I + 4р(I + 2)« 12,
тогда т {
{г2 } « ак, I [р + к2 (12 + р2I)] + р [Ьи, I (М +1) + си, I ]. При
сравнении идентичных
2
фрагментов (р = 1) получим т {г2 }« ак I (Ы +1) + Ьи I (Ы +1) + си I.
Результаты компьютерного моделирования и расчетов по (8) и (9) показывают, что при I = 70 для опорного и для анализируемого кардиокомплексов одного типа (см. рис. 1) (р = 1) все три оценки математического ожидания практически совпадают во всем диапазоне изменения параметра к.
На основе серии экспериментов для различных опорных кардиокомплексов и анализируемых фрагментов ЭКГ установлено, что для расчета математического ожидания можно использовать выражения (8) и (9), причем достаточно применять полином первого порядка. Поэтому далее при нахождения дисперсии случайной величины г ограничимся аппроксимацией (7) (далее полагаем г = г^).
После ряда преобразований, не приведенных в статье ввиду их громоздкости, получим выражение для дисперсии г в виде
М
2 {г} = к3Ь|, 1 (12 + 61 + 8) + к2 [2Ьк, 1 (Ьк 1 + ск, 1) (I + 2) + 4Ь|,м (2р2 +1) +
,2
+8Ьк, IР2 (6 -1)] + к (Ьк, I + ск, I ) + 4Ьк, IР2 (Ьк, I + ск, I) + 4Ьк, IР2
22
откуда при I » 1 имеем I + 2 -I; 6 -1- -I; I + 6I + 8 - I + 6I и
Мп
{г} - ь1 к (12 + 6!) + [Ь2 I (6р2 + 2) + 2Ьк, ICк, I
к21 +
+
Ьк, I (8Р2 +1) + 2Ьк, ICк, I (1 + 2р2 ) + ск
к.
(10)
При р = 1 выражение дополнительно упрощается:
М2 {г} - Ьк, Iк3 (12 + 6I) + (ВЬ2 I + 2Ьк, ICк, I) к21 + (3Ьк, I + ск, I ) к. (11)
На рис. 3 приведены кривые зависимости дисперсии случайной величины г (к) при I = 70 для опорного и для анализируемого кардиокомплексов одного типа (см. рис. 1) (р = 1). Кривая 1 получена на основе компьютерного моделирования (количество испытаний 20 000), кривая 2 - расчетом по (11). Как следует из рис. 3, выражение (11) представляет реальный кардиокомплекс с достаточной для оценки дисперсии г точностью.
Поскольку распределение г в замкнутой форме невозможно, определим модель этой величины, обладающую высокой корреляцией с самой величиной, распределение которой известно или может быть получено достаточно простыми преобразованиями. Найдем коэффициент взаимной корреляции г* между случайными величинами г в (7) и п = X (^),
I=1
среднее значение и дисперсия которой равны, соответственно, т {п} = ^; М2 {п} = 2к21.
С учетом (8) функция корреляции между г и п
К (г, п) = 2Ьк, I рк2 (I + 2) - 2Ьк, I рк21.
На основании (10) коэффициент корреляции имеет вид
Ьк I р42м
*
г=
\ь2, к (12 + 6I) + (8Ьк2 I + 2Ьк, ^к, I) к + (3Ьк, I + ск, I)
(12)
М2 {г}-103 3 2 1
0
5 10
Рис. 3
15 к-103
0.8
0.6
0.4
Рис. 4
к -103
I
2
*
г
На рис. 4 представлена зависимость r* (h) для опорного и для анализируемого кардиокомплексов одного типа (см. рис. 1) (р = 1, I = 70). Кривая 1 получена на основе компьютерного моделирования (количество испытаний 20 000), кривая 2 рассчитана по (12).
_3
Из рис. 4 следует, что для 0 < h < 3.45 -10 случайные величины r и п имеют высокий
уровень взаимной корреляции (|r* > 0.8). Поэтому в качестве первого приближения можно применить подстановку r « _(М2 {r}/M2 {п})(п_m{п}) + m{r}. Для этой подстановки справедлив нормальный закон распределения плотности вероятности W ( r ).
Для оценки W(r) при |r*|< 0.8 проведено детальное компьютерное моделирование для различных видов опорных сигналов и анализируемых фрагментов. Анализ различных типов кардиокомплексов показал, что распределение удовлетворительно аппроксимируется рядами Эджворда [4]. Согласие по критерию х [4] эмпирических распределений с аппроксимирующими распределениями, представленными рядом Эджворда, при уровне значимости 5 % обеспечивается первыми тремя членами ряда.
Анализ показал, что значительные отклонения гистограмм от теоретического нормального распределения наблюдаются в областях, имеющих крайне малую вероятность. Это позволяет для теоретических исследований в качестве первого приближения использовать нормальный закон распределения амплитуд с параметрами, определяемыми (8), (10) (рис. 5). На рис. 5, а представлены распределения коэффициента корреляции W (r) при различных h для опорного и для анализируемого кардиокомплексов одного типа (см. рис. 1) (р = 1, I = 70), на рис. 5, б - аналогичные распределения для опорного сигнала по рис. 1 и для анализируемого кардио-комплекса патологического типа (рис. 6) (р = 0.505, I = 70). Кривые 1 представляют распределение коэффициента корреляции на основе компьютерного моделирования, кривые 2 - аппроксимация нормальным законом распределения.
W 0.75 0.5 0.25
0
■1
2
h = 0.746 -10_
\
h = 4.61-10
h = 11.9-10
W
0.16
0.08
0.6
0.7
0.8 а
0.9
0.22
0.33
0.44 б
0.55
Рис. 5
Таким образом установлено, что распределение коэффициента корреляции г хорошо описываются нормальным законом, однако математическое ожидание является смещенной оценкой, причем смещение возрастает с ростом уровня шума. Значимость этого смещения является предметом дальнейших исследований.
Рис. 6
3
3
0
r
r
Известия вузов России. Радиоэлектроника. 2012. Вып. 1======================================
Полученные в настоящей статье результаты позволяют проводить адаптацию порога при сравнении кардиокомплексов на основе взаимного коэффициента корреляции с помощью оценки уровня помехи, что, в свою очередь, повышает эффективность алгоритмов сортировки кардиокомплексов.
Список литературы
1. Rangayyan R. M. Biomedical signal analysis. New York: Wiley-Interscience, 2002. 439 p.
2. Красичков А. С., Соколова А. А. Оценка точности воспроизведения кардиосигнала в процессе синхронного накопления // Изв. вузов России. Радиоэлектроника. 2010. Вып. 3. С. 48-53.
3. Крамер Г. Математические методы статистики. М.: Мир, 1975. 648 с.
4. Кендалл М. Дж., Стьюарт А. Теория распределений. М.: Наука, 1966. Т.1. 587 с.
A. S. Krasichkov
Saint-Petersburg state electrotechnical university "LETI"
Estimation of the cross-correlation coefficient in classification of electrocardiogram complexes from long-term monitoring
Calculation of the cross-correlation coefficients between the sampling signal and the analyzed electrocardiogram (ECG) fragment in classification of ECG complexes from long-term monitoring is discussed. The theoretical results are validated by computer simulations.
Electro cardio signal, cross-correlation coefficients, computer simulations, long-term monitoring
Статья поступила в редакцию 1 ноября 2011 г.
УДК 621.391.15
В. Н. Бондаренко, Т. В. Краснов
Институт инженерной физики и радиоэлектроники Сибирского федерального университета
Помехоустойчивость корреляционного приемника шумоподобного сигнала с автокомпенсатором структурной помехи*
Приведены результаты исследования помехоустойчивости корреляционного приемника с автокомпенсатором для подавления мощной структурной помехи применительно к шумоподобным сигналам с минимальной частотной манипуляцией. Предложенный автокомпенсатор структурной помехи позволяет повысить помехоустойчивость корреляционного приемника шумоподобного сигнала с 40 до 80 дБ.
Шумоподобный сигнал, структурная помеха, помехоустойчивость, корреляционный приемник, автокомпенсатор помехи
В широкополосных радионавигационных системах (РНС) с кодовым разделением уровень внутрисистемных помех определяется корреляционными свойствами используемых шумоподобных сигналов (ШПС). Для средневолновых широкополосных РНС большой дальности действия превышение мешающего сигнала над полезным может достигать 80 дБ. В этих условиях для обеспечения нормального функционирования приемной аппа-
* Работа выполнена при финансовой поддержке РФФИ, грант № 08-08-00849.
58 © Бондаренко В. Н., Краснов Т. В., 2012