Переход между форматами файлов записи многоканальных биологических и физиологических сигналов
Р.Б. Таов, С.А. Синютин Южный федеральный университет, Таганрог
Аннотация: В статье рассмотрены аспекты согласования форматов файлов используемых для регистрации биологических сигналов. Основное внимание уделено структуре данных и переходу от собственного формата к стандартным форматам и наоборот при проведении государственных испытаний и сертификации медицинского изделия. Ключевые слова: ЭКГ, ЭКС, EDF, MIT-BIH, формат данных, преобразование форматов данных, электрокардиограмма.
Введение
С развитием компьютерных технологий количество форматов данных и способов их организации на дисковом пространстве устройств хранения информации постоянно увеличивается, основными критериями в данном случае являются скорость доступа, надежность и компактность. В различных ситуациях те или иные критерии имеют больший приоритет, что и приводит к существенному разнообразию форматов данных (файлов). В связи с этим часто возникает необходимость в обмене данными между различными форматами для сравнения алгоритмов и полученных результатов.
При разработке мобильного Комплекса кардиомониторирования и эргометрии [1,2], одной из основных задач которого является запись получаемых данных (электрокардиосигнал, миографический сигнал, данные инерциальных датчиков) на micro SD карту памяти в режиме реального времени, встал вопрос о выборе формата данных для хранения на карте памяти. Одним из широко распространенных форматов данных для записи многоканальных биологических и физиологических данных является EDF [3] (European Data Format) - он представляет собой простой и гибкий формат для обмена и хранения многоканальных биологических и физических сигналов. Однако из-за универсальности данный формат обладает избыточной сложностью для простых систем с детерминированными параметрами и
характеристиками. Основным недостатком формата ЕББ в задаче, решаемой авторами явились требования к быстродействию вычислительной системы, на базе который выполнены устройства Комплекса, особенно с учетом того, что наиболее приоритетной задачей является обработка и сохранение полученных данных, а не удобство их последующего анализа. По этой причине при разработке Комплекса кардиомониторирования и эргометрии был разработан собственный формат файла для записи физиологических сигналов. Однако на этапе государственной регистрации медицинского изделия для подтверждения полноты функций изделия и его метрологических характеристик с использованием верифицированных баз данных электрокардиограмм возникла необходимость преобразования данных из собственного формата в ЕББ, М1Т-В1Н [4,5] и наоборот.
Цель и задачи
Цель настоящей работы - создание алгоритмов и программного обеспечения для перехода между различными форматами хранения электрокардиографических данных. Для этого проанализирована техническая документация формата ЕББ и М1Т-В1Н, а так же собственный формат записи. Сопоставлен перечень информационных полей каждого из форматов и их соотношение.
Содержание заголовка, метод расшифровки сигналов и рекомендации
при создании конвертора
ЕББ файл состоит из заголовка, в котором находится информация о технических характеристиках сигналов, а так же информация идентифицирующая пациента, кодирующаяся в иТБ-8, за которой следует последовательные записи сигналов фиксированной продолжительности. Стоит отметить, что размер заголовка имеет переменную длину и напрямую
зависит от количества записанных в него сигналов. Для каждого сигнала в заголовке выделяется по 256 байт:
В = 256 + 256 х к (1)
где В - количество байт в заголовке, к - количество сигналов. Заголовок содержит (все знаения указаны в байтах):
1) Данные, не зависящие от количества сигналов (25):
- номер версия формата (байты 1-8);
- ФИО, пол и возраст пациента (байты 9-88);
- полная дата начала записи сигналов (байты 89-168)
- краткая дата начала записи сигналов (байты 169-176);
- время начала записи сигналов (байты 177-184);
- количество байт выделенное под заголовок (байты 185-192);
- поле для комментария к данному файлу (байты 193-236);
- количество периодов фиксированной продолжительности (байты 237-244);
- продолжительность записей данных (байты 245-252);
- количество сигналов в файле (байты 253-256).
2) Данные, зависящие от количества сигналов:
- наименования сигналов;
- наименования приборов, с помощью которых осуществлялись измерения сигналов;
- размерности сигналов;
- физические минимумы;
- физические максимумы;
- цифровые минимумы;
- цифровые максимумы;
- предварительные поля;
- продолжительность каждой записи сигнала;
- комментарии к сигналу.
Адреса полей данных (указаны в байтах относительно начала файла), зависящие от количества сигналов, определяются по таблице №1.
Таблица № 1
Адресация границ информационных полей
Начальный адрес Конечный адрес
Наименование сигналов 257+16*(п-1) 272+16*(п-1)
Наименование приборов 257+16*к+80*(п-1) 336+16*к+80*(п-1)
Размерности сигналов 257+96*к+8* (п-1) 264+96*к+8* (п-1)
Физические минимумы 257+104*к+8*(п-1) 264+104*к+8*(п-1)
Физические максимумы 257+112*к+8*(п-1) 264+112*к+8*(п-1)
Цифровые минимумы 257+120*к+8*(п-1) 264+120*к+8*(п-1)
Цифровые максимумы 257+128*к+8*(п-1) 264+128*к+8*(п-1)
Предварительные поля 257+136*к+80*(п-1) 336+136*к+80*(п-1)
Продолжительность каждой записи 257+216*к+8*(п-1) 264+216*к+8*(п-1)
Комментарий к сигналу 257+264*к+32*(п-1) 288+264*к+32*(п-1)
На рис. 1 приведен пример заполнения заголовка ЕББ файла с
многоканальным сигналом.
Флйл ТТрвв«* Бид Кэдирзвка Спрвв** Р N ззас
г1|-ЙРЙ-К К I
.13.
7 ЕЕ С: Рг-0,т ЕОС Ьог1гоп£а1 йр^п ргд-пдчд! ЕМр
5иЬдепЬд1 I ото пл'кег Оа-йоС1 oЛ■ect г оде ь
Пдйд*Л (Чг-сТгоДе^
Веи1д1 И1Ёми151:иг Изгкег ЬнГГпп
"30-¡Л-ГВ-55-СёёГ
■ -1^7 -та з» -ааи? т т им?
20Л7 5- ДВ гмв -21МВ -2В'|8 -2 В'р8 -2500 -28
-9Ш7 т? т7 г?в« г731 нр;в,&нг 1Р:ювнг
Геппапсел ЁЩ шз:0лнг 1.Р:1(К1Нг
¡СПЬйпШ! ВН1 НР:«.5Нг 1Р;1АПН;
Гемапеей ии| НРги.оэиг 1_Р:и.днг
НР:1йН7 АегМ^слМпи
[_Р:0.7Н2
Но1й (1иг1 ги| 2 чргпгмК ЗОДЙ зиив зиии зв
эй за за
5 Я 1 ] Ш*** *
«"Мн^итааетшгпггамгта_ш V
3!ШЕИаЛ*^Ч1В'1П1Щ<^'№ ' « и 5 ] Е [ О V * ■ } П I Р *
Рис. 1 - Пример заголовка ЕББ файла в иТБ-8
Благодаря данным из заголовка, можно рассчитать частоту сигналов, для этого нужно найти отношение продолжительности каждой записи сигнала к продолжительности записей данных.
После заголовка находится кусочно-чередующиеся сигналы. Чередование определяется порядковым номером сигналов и имеет заданное в заголовке количество точек на одно повторение. Каждая точка состоит из двух байтов. Первый байт- младший, второй- старший.
При создании конвертора важно учитывать, что:
- количество байт в заголовке должно иметь четко фиксированное значение и определяется по формуле (1);
- значение продолжительности каждой записи сигнала не рекомендуется превышать 61440 байт;
- цифровые минимумы и максимумы каждого сигнала должны указывать крайние значения, которые могут возникать в записях;
- размер файла должен быть равен удвоенному произведению суммы всех продолжительностей записей сигналов на количество периодов фиксированной продолжительности сигналов.
Другим примером могут послужить файлы базы данных аритмии М1Т-В1Н, которая была первым общедоступным набором стандартных тестовых материалов (аннотаций) для оценки детекторов аритмии, а также использовалась для исследований сердечной динамики. М1Т-В1Н содержит записи двухканальных амбулаторных ЭКГ с частотой 360 Гц. Для каждой двухканальной записи М1Т-В1Н есть соответствующая зашифрованная справочная аннотация в расширении файла *.а1г. Аннотация представляет собой готовый анализ типов QRS комплексов соответствующих ЭКГ сигналов с временными отчетами, измеряемыми от предыдущей аннотации.
Методы расшифровки аннотации, ЭКГ сигнала и преобразования частот
Каждая аннотация состоит из четного количества байт (минимум - 2 байта). Первый байт - младшие разряды 16-битного числа, второй - старшие. Шесть старших разрядов 16-битного числа каждой пары байт представляют собой код типа аннотации из которого можно получить тип QRS - комплекса по таблице №2. Десять оставшихся бит представляют собой относительное время, к которому относится данная аннотация, измеряемое в интервалах дискретизации от предыдущей аннотации.
Таблица № 2
Код аннотации и соответствующий ему тип QRS-комплекса
Код аннотации Обозначение Конечный адрес
1 NOTQRS not-QRS
2 NORMAL normal beat
3 LBBB left bundle branch block beat
4 RBBB right bundle branch block beat
5 ABERR aberrated atrial premature beat
6 PVC premature ventricular contraction
7 FUSION fusion of ventricular and normal beat
8 NPC nodal (junctional) premature beat
9 APC atrial premature contraction
10 SVPB premature or ectopic supraventricular beat
11 VESC ventricular escape beat
12 PACE paced beat
13 UNKNOWN unclassifiable beat
14 NOISE signal quality change
16 ARFCT isolated QRS-like artifact
18 STCH ST change
19 TCH T-wave change
20 SYSTOLE systole
21 DIASTOLE diastole
22 NOTE comment annotation
23 MEASURE measurement annotation
24 PWAVE P-wave peak
25 BBB left or right bundle branch block
26 PACESP non-conducted pacer spike
27 TWAVE T-wave peak
28 RHYTHM rhythm change
29 UWAVE U-wave peak
30 LEARN learning
31 FLWAV ventricular flutter wave
32 VFON start of ventricular flutter/fibrillation
33 VFOFF end of ventricular flutter/fibrillation
34 AESC atrial escape beat
35 SVESC supraventricular escape beat
36 LINK link to external data
37 NAPC non-conducted P-wave
38 PFUS fusion of paced and normal beat
39 WFON waveform onset(beginning of QRS)
40 WFOFF waveform end(end of QRS)
41 RONT R-on-T premature ventricular contraction
49 ACMAX value of largest valid annotation code
Коды аннотаций между 42 и 48 включительно определяются исключительно пользователями.
ЭКГ сигнал имеет 2 канала и его единичные значения двух каналов записываются в 3 байта. Первый байт - младшие разряды значения первого канала, первые 4 бита второго байта являются старшими разрядами первого канала, а вторые 4 бита - старшие разряды значения второго канала. Третий байт, аналогично первому байту, - это младшие разряды значения второго канала.
Первый байт
Второй байт
Третий байт
K1 K2 КЗ K4 K5 Кб
i
K4 K1 K2 КЗ К5 Кб
Единичное значение первого канала
Единичное значение второго канала
Рис. 2 - Расшифровка каналов ЭКГ сигнала Одной из основных проблем является корректная передача данных в случае, если не совпадает частота дискретизации у сигнала в базе данных и
сигнала на выходе конвертера. Необходимо иметь точные и весьма быстрые методы преобразования файлов полученных с одной частотой дискретизации в стандарт с другой частотой дискретизации. Поскольку верифицированные базы данных были записаны давно, их частота дискретизации по современным понятиям является весьма низкой.
Рассмотрим пример преобразования сигнала из базы, записанной с частотой дискретизации f1=360 Гц в сигнал с частотой дискретизации f2=400 Гц. Преобразования на повышенную частоту дискретизации [6 - 8] осуществляется несколькими шагами:
- определяем множитель повышения частоты дискретизации в виде дробно-рационального отношения (в нашем случае f2/ fi=400/360=10/9=N2/Ni);
- увеличиваем частоту дискретизации в N2=10 раз путем добавления 9 нулевых отсчетов после каждого отсчета сигнала;
- отфильтровываем высшие гармоники нерекурсивным фильтром высокого порядка с линейной фазой [9,10], частотой дискретизации N2*f1=3600 Гц, частотой пропускания 180 Гц (согласно теореме Котельникова - Шеннона), частотой подавления 300 Гц, неравномерностью в полосе прозрачности 1 дБ, подавлением 60 дБ в полосе подавления (фильтр синтезируется в программе MatLab с помощью свойства toolbox design);
- производим децимацию 1: N1=1:9 (пропускаем 8 отсчетов и выдаем 9-й как очередной отчёт).
Результаты
Учитывая особенности преобразования форматов, описанные в настоящей статье, было создано программное обеспечение, использующееся для проверки и испытаний Комплекса кардиомониторирования и эргометрии разработанного совместно ОАО «НПП КП «Квант» и ФГАО ВО ЮФУ.
Работа выполнена при финансовой поддержке Минобрнауки РФ в рамках реализации проекта «Создание высокотехнологичного производства по изготовлению мобильного многофункционального аппаратно-программного комплекса длительного кардиомониторирования и эргометрии» по постановлению правительства №218 от 09.04.2010 г. Работа выполнялась во ФГАОУ ВО ЮФУ.
Литература
1. Тарасова И.А, Леонова А.В., Синютин С.А. Алгоритмы фильтрации сигналов биоэлектрической природы // Инженерный вестник Дона. 2012. №4 (часть 2). URL: ivdon.ru/magazine/archive/n4p2y2012/1481.
2. Леонова А.В., Зиновкин П.К., Болдырев Е.Б. Аппаратно-программный комплекс регистрации нагрузки для функциональной диагностики // Инженерный вестник Дона. 2012. №4 (часть 1). URL: ivdon.ru/magazine/archive/n4p1y2012/1130.
3. European Data Format. Full specification of EDF. URL: edfplus.info/specs/edf.html.
4. MIT-BIH Arrhythmia Database. URL: physionet.org/physiobank/database/mitdb.
5. Moody G.B. The impact of the MIT-BIH Arrhythmia Database. G.B. Moody; R.G. Mark. IEEE Engineering in Medicine and Biology Magazine. Volume: 20, Issue 3, May-June 2001. pp. 45-50.
6. Коршунов Ю.М., Бобиков А.И., Вакарин И.А., Степаненко В.Н., Степашкин А.И. Расчет и проектирование цифровых сглаживающих и преобразующих устройств / Москва. Издательство «Энергия», 1976. 336 с.
7. Уткин В. А. Статические технологии в медицинских исследованиях / В. А. Уткин - Пятигорск, 2002. 213 с.
8. Блейхут Р. Быстрые алгоритмы цифровой обработки сигналов /Р. Блейхут - Москва, Издательство Мир, 1989. 448 с.
9. Артемьев В. В. Моделирование и синтез цифровых ЦНП-фильтров с линейной фазой // Вестник ННГУ. 2014. №1-2. URL: cyberleninka.ru/article/n/modelirovanie-i-sintez-tsifrovyh-tsnp-filtrov-s-lineynoy-fazoy (дата обращения: 07.12.2017).
10. Сергтенко А.Б. Цифровая обработка сигналов. Учебник для ВУЗов / А.Б. Сергиенко - СПб.: Питер, 2002. - 608 с.
References
1. Tarasova I.A, Leonova A.V., Sinjutin S.A. Inzenernyj vestnik Dona (Rus), 2012, №4. URL: ivdon.ru/magazine/archive/n4p2y2012/1481.
2. Leonova A.V., Zinovkin P.K., Boldyrev E.B. Inzenernyj vestnik Dona (Rus), 2012, №4. URL: ivdon.ru/magazine/archive/n4p1y2012/1130.
3. European Data Format. Full specification of EDF. URL: edfplus.info/specs/edf.html.
4. MIT-BIH Arrhythmia Database. URL: physionet.org/physiobank/database/mitdb.
5. Moody G.B. The impact of the MIT-BIH Arrhythmia Database. G.B. Moody; R.G. Mark. IEEE Engineering in Medicine and Biology Magazine. Volume: 20, Issue: 3, May-June 2001. pp. 45-50.
6. Korshunov Ju.M., Bobikov A.I., Vakarin I.A., Stepanenko V.N., Stepashkin A.I. Raschet i proektirovanie cifrovyh sglazhivajushhih i preobrazujushhih ustrojstv [Calculation and design of digital smoothing and converting devices]. Moskva.: Izdatel'stvo «Jenergija», 1976. 336 p.
7. Utkin V.A. Staticheskie tehnologii v medicinskih issledovanijah [Static technologies in medical research] Pjatigorsk, 2002. 213 p.
8. Blejhut R. Bystrye algoritmy cifrovoj obrabotki signalov [Fast algorithms for digital signal processing] Moskva, Izdatel'stvo Mir, 1989. 448 p.
9. Artem'ev V. V. Vestnik NNGU. 2014. №1-2. URL: cyberleninka.ru/article/n/modelirovanie-i-sintez-tsifrovyh-tsnp-filtrov-s-lineynoy-fazoy.
10. Sergtenko A.B. Cifrovaja obrabotka signalov. Uchebnik dlja VUZov [Digital signal processing. Textbook for High Schools] SPb.: Piter, 2002. 608 p.