Научная статья на тему 'Новые алгоритмы идентификации микроорганизмов с использованием многомерной статистики'

Новые алгоритмы идентификации микроорганизмов с использованием многомерной статистики Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
361
90
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
СТАФИЛОКОКК / ЭНТЕРОБАКТЕРИИ / ХИРУРГИЧЕСКАЯ ИНФЕКЦИЯ / ТЕСТ-СИСТЕМА / A BACTERIUM / STAPHYLOCOCCUS / ENTEROBACTERIA / A SURGICAL INFECTION / THE TESTSYSTEM

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Косинец А. Н., Окулич В. К., Шилин В. Е., Косинец В. А., Федянин С. Д.

При идентификации микроорганизмов в программах автоматизированного учета используется нумерический подход, где вид микроорганизма определяется по совокупности определенного числа признаков. Недостатком такого подхода является тот факт, что определяемыми для этих целей признаками одновременно могут обладать (или не обладать) представители нескольких видов, причем даже внутри одного вида могут встречаться представители с противоположными градациями признака. Более прогрессивной представляется система многомерной статистики, которая для идентификации микроорганизмов вместе с совокупностью признаков, определяет и их значимость. Нами создана программа NewId для идентификации микроорганизмов в автоматическом режиме. В программе в качестве статистического метода выбран кластерный анализ. Смысл его сводится к классификации многомерных наблюдений, каждое из которых описывается набором признаков, используя меру сходства или расстояние между объектами. При этом учитываются все признаки одновременно. Программа NewId позволяет создать автоматизированное рабочее место микробиолога, включающее в себя модель фотометра, изготовленного на РУПП «Витязь» (АИФ-М/340, Ф300, Ф300ТП), адаптированного для анализа результатов по цвету пробы в автоматическом режиме и персональный компьютер

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Косинец А. Н., Окулич В. К., Шилин В. Е., Косинец В. А., Федянин С. Д.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

For identification of microorganisms in programs of the automated account it is used the numbering approach where the kind of a microorganism is defined on set of the certain number of attributes. Lack of such approach is that fact, that attributes defined for these purposes simultaneously are able to possess (or not to possess) representatives of several kinds, and even inside of one kind there can be representatives of opposite gradation of an attribute. The system of multivariate statistics, which is used for the identification of microorganisms together with the set of attributes, defines also their importance being regarded as more progressive. We created a program NewId for identification of microorganisms in an automatic mode. The cluster analysis as a statistical method was is chosen in the program. Its sense reduces to classification of multivariate supervision, each of which is described by a feature set, using a measure of similarity or distance between objects. Thus these signs are considered all at the same time. Program NewId makes possible an automated workplace of the microbiologist including pattern of a photometer, made on "Vityaz" Plant (АИФ-М/340, Ф300, Ф300ТП), adapted for the analysis of results according to the colour of the tests in an automatic mode and the use of personal computer.

Текст научной работы на тему «Новые алгоритмы идентификации микроорганизмов с использованием многомерной статистики»

НОВЫЕ АЛГОРИТМЫ ИДЕНТИФИКАЦИИ МИКРООРГАНИЗМОВ С ИСПОЛЬЗОВАНИЕМ МНОГОМЕРНОЙ СТАТИСТИКИ

КОСИНЕЦ А.Н.. ОКУЛИЧ В.К.. ШИЛИН В.Е.. КОСИНЕЦ В.А..

ФЕДЯНИН С. Д.. ЛАЗИР ТАВФИК. БАБАКО Н.К.

УО «Витебский государственный ордена дружбы народов медицинский

университет»

кафедра госпитальной хирургии, кафедра клинической микробиологии

Резюме. При идентификации микроорганизмов в программах автоматизированного учета используется нумерический подход. где вид микроорганизма определяется по совокупности определенного числа признаков. Недостатком такого подхода является тот факт. что определяемыми для этих целей признаками одновременно могут обладать (или не обладать) представители нескольких видов. причем даже внутри одного вида могут встречаться представители с противоположными градациями признака. Более прогрессивной представляется система многомерной статистики. которая для идентификации микроорганизмов вместе с совокупностью признаков. определяет и их значимость.

Нами создана программа NewId для идентификации микроорганизмов в автоматическом режиме. В программе в качестве статистического метода выбран кластерный анализ. Смысл его сводится к классификации многомерных наблюдений. каждое из которых описывается набором признаков. используя меру сходства или расстояние между объектами. При этом учитываются все признаки одновременно.

Программа NewId позволяет создать автоматизированное рабочее место микробиолога. включающее в себя модель фотометра. изготовленного на РУПП «Витязь» (АИФ-М/340. Ф300. Ф300ТП). адаптированного для анализа

результатов по цвету пробы в автоматическом режиме и персональный компьютер.

Ключевые слова: стафилококк. энтеробактерии. хирургическая

инфекция. тест-система.

Abstract. For identification of microorganisms in programs of the automated account it is used the numbering approach where the kind of a microorganism is defined on set of the certain number of attributes. Lack of such approach is that fact. that attributes defined for these purposes simultaneously are able to possess (or not to possess) representatives of several kinds. and even inside of one kind there can be representatives of opposite gradation of an attribute. The system of multivariate statistics. which is used for the identification of microorganisms together with the set of attributes. defines also their importance being regarded as more progressive. We created a program NewId for identification of microorganisms in an automatic mode. The cluster analysis as a statistical method was is chosen in the program. Its sense reduces to classification of multivariate supervision. each of which is described by a

feature set. using a measure of similarity or distance between objects. Thus these signs are considered all at the same time.

Program NewId makes possible an automated workplace of the microbiologist including pattern of a photometer. made on "Vityaz" Plant (АИФ-М/340. Ф300. Ф300ТП). adapted for the analysis of results according to the colour of the tests in an automatic mode and the use of personal computer.

Keywords: a bacterium. Staphylococcus. Enterobacteria. a surgical infection. the testsystem.

Адрес для корреспонденции: Республика

Беларусь. 210023. г. Витебск. пр. Фрунзе.27. Витебский государственный медицинский университет. кафедра микробиологии. тел. 37-06-12 - Окулич В.К.

Несмотря на достижения современной медицины. остается высокой частота инфекционно-воспалительных заболеваний и осложнений в нейрохирургии. челюстно-лицевой. торакальной. абдоминальной и сосудистой хирургии. травматологии и ортопедии. акушерстве и гинекологии. Таким образом. инфекция в хирургии является одной из важнейших мировых проблем современного здравоохранения. Актуальность этой проблемы определяется широким распространением хирургической инфекции. значительным социальным и экономическим ущербом. наносимым ею.

Больные с гнойно-воспалительными заболеваниями составляют 1/3 всех хирургических больных. большинство послеоперационных осложнений связано с хирургической инфекцией. В настоящее время послеоперационные гнойные осложнения развиваются в среднем у 30% больных. Количество смертельных случаев в общей структуре летальности в хирургических стационарах в связи с инфекционными осложнениями достигает 42-60%. Хирургические инфекции увеличивают сроки временной нетрудоспособности. удлиняют время пребывания в стационаре. значительно ухудшают результаты оперативного лечения. В Республике Беларусь ежегодно регистрируется более 70 тысяч больных с гнойно-воспалительными заболеваниями и осложнениями. экономический ущерб составляет более 100 млрд. белорусских рублей [1. 12].

Представления об этиологической структуре гнойно-воспалительных заболеваний за последнее время существенно расширились. Этиологическая структура экзогенных возбудителей хирургических инфекций весьма разнообразна. Золотистый стафилококк. коагулазоотрицательные

стафилококки. Enterococcus spp.. E.coli. P.aeruginosa. Enterobacter spp. -наиболее часто выделяемые микроорганизмы при хирургической раневой инфекции [7. 13]. У госпитализированных и негоспитализированных пациентов лидирующие позиции могут занимать энтеробактерии (60.8%). которые в 30.6% случаев представлены E.coli. Реже выделяются K.pneumoniae (25.7%) и P.aeruginosa (15.6%) [9].

В настоящее время существует большое количество нерешенных проблем при проведении антибиотикотерапии и антибиотикопрофилактики хирургических заболеваний. что связано с отсутствием достаточного представления о возбудителях гнойно-септических заболеваний. их чувствительности к антибактериальным препаратам. критериев для назначения антибиотиков. неадекватным их подбором (без учёта фармакокинетики) препаратов. недостаточным контролем за циркуляцией нозокомиальных штаммов. Эти трудности ведут к нерациональному использованию антибиотиков и селекции полирезистентных штаммов микроорганизмов [4].

Не утратила своего значения проблема быстрой и достоверной микробиологической диагностики гнойно-воспалительных заболеваний. Многие ферменты микроорганизмов часто являются маркерами данных штаммов возбудителей. Это может быть использовано для их идентификации. а отсутствие методов определения отдельных видов энзимной активности обусловливает необходимость их разработки и совершенствования [4. 11].

Целью наших исследований является разработка алгоритма идентификации микроорганизмов и создание компьютерной программы для учета результатов в автоматическом режиме.

Несмотря на выраженное биологическое своеобразие отдельных видов микроорганизмов. безошибочное выявление их представителей остается одной из сложных задач в повседневной микробиологической практике. Решение этой задачи возможно через тестирование целого спектра биологических и биохимических характеристик микроорганизма. Перечень тестов. приведенных в международном определителе Берджи. оказывается достаточно широк. что существенно осложняет процедуру идентификации и делает ее чрезвычайно трудоемкой [6].

Основная часть современного оборудования и материалов для микробиологических лабораторий производится зарубежными фирмами среди которых следует назвать Becton Dickinson. Abbott Diagnostics. Difco/Pasco Laboratories. Roche Diagnostics. Vitek Systems. BioMerieux. По-прежнему скромность финансовых возможностей большинства лечебных учреждений заставляют ограничиваться приобретением лишь части сложного оборудования. В тоже время минимальный набор современных средств бактериологических исследований. закупаемых обычно у зарубежных производителей. входят материалы для забора и транспортировки клинических проб. среды для культивирования микроорганизмов. тест-системы для идентификации и определения чувствительности к антибиотикам.

Постоянное расширение традиционного перечня видов возбудителей. которые могут быть выделены в настоящее время от пациентов с гнойносептической патологией. а также развитие и усложнение системы классификации микроорганизмов с широкой палитрой используемых тестов сделали практически невозможным применение традиционной ручной техники идентификации с приготовлением всех необходимых сред в самой лаборатории. Так как тест-системы импортного производства являются весьма дорогостоящими. что ограничивает их применение в отечественных

бактериологических лабораториях. возникает необходимость разработки тест-систем отечественного производства [2. 8. 10].

В настоящее время в практике врача-бактериолога при идентификации микроорганизмов в программах автоматизированного учета используется нумерический подход (вид микроорганизма определяется по совокупности определенного числа признаков. т.е. наличию или отсутствию их). Недостатком такого подхода является тот факт. что определяемыми для этих целей признаками одновременно могут обладать (или не обладать) представители нескольких видов. причем даже внутри одного вида могут встречаться представители с противоположными градациями признака [6. 11. 12].

Методы

Более прогрессивной представляется система многомерной статистики. которая для идентификации микроорганизмов вместе с совокупностью признаков. определяет и их значимость [6.5]. Поэтому. несомненно. важна разработка тест-систем с возможностью автоматизированного учета с использованием новых алгоритмов для идентификации микроорганизмов.

Для создания новой тест-системы с автоматизированным учетом результатов необходимо иметь планшет для постановки тестов и ридер. Создать специализированный ридер в наших условиях не представляется возможным. Поскольку иммуноферментный анализатор АИФ-М/340. Ф300. Ф300ТП изготовленный на РУПП «Витязь» имеется во многих лабораториях. мы решили адаптировать его для анализа результатов по цвету пробы. а в качестве планшета для тестов - использовать обычный 96-луночный планшет для ИФА.

Нами разработаны. совместно с ВТЗ «Витязь». две программы. предназначенные для использования в области медицины для идентификации микроорганизмов по их субстратному профилю. На этапе программирования каждой лунке стандартного 96-луночного планшета ставится в соответствие фермент из предварительно сформированной таблицы. а также задается цвет. ожидаемый в случае положительной и отрицательной реакции. Цвет определяется используемым индикатором. Разработанные программы позволяют по результатам ферментативных реакций определять видовую принадлежность микроорганизмов. В одной программе используется нумерический подход (вид микроорганизма определяется по совокупности определенного числа признаков. т.е. наличию или отсутствию их). Вторая программа многомерной статистики с использованием кластерного

анализа.

Для установки программы требуется 1ВМ совместимый компьютер

с ОС ’^пёо,№8 9х либо N1. Инсталлированный программный пакет занимает на жестком диске объем около 9 мегабайт. При работе программы создаются и уничтожаются временные файлы. для которых на диске должно быть зарезервировано место не менее 200 килобайт.

В процессе работы с программой пользователь накапливает на жестком диске информацию: данные об исследованных планшетах. параметры

введенных методик. Объем свободного дискового пространства для этой информации (а также для создания резервных копий) зависит от ее количества и времени накопления.

Графический интерфейс строился на основе видеосистемы с цветовой палитрой High Color (16 бит). Поэтому для комфортной работы с программным продуктом рекомендуется SVGA система с видео RAM не менее 1 мегабайта и системное ОЗУ не менее 16 мегабайт.

Программный продукт написан в среде Delph3.0 компании Borland. Все данные хранятся на диске в виде таблиц типа Paradox. Инсталляционная версия программного продукта создана при помощи интегрированной дистрибутивной системы Express InstallShield3 и включает в себя компакт-диск.

Работа с таблицами осуществляется при участии низкоуровневого ядра баз данных Borland Database Engine (BDE). В состав поставляемой версии NewId входит утилита BDEAdmin.exe. запуск которой позволяет в случае необходимости перенастраивать пути к рабочим таблицам. Программа NewId зарегистрирована в Национальном центре интеллектуальной собственности (№ 015. от 13.02.2008).

В качестве статистического метода для решения поставленной задачи в программе NewId выбран кластерный анализ. Смысл его сводится к классификации многомерных наблюдений. каждое из которых описывается набором признаков. используя меру сходства (r) или расстояние между объектами (D). При этом учитываются все признаки одновременно. В качестве расстояния между объектами выбрано евклидово расстояние. Применительно к разработанной нами программе это означает следующее.

В качестве многомерных наблюдений в разработанной программе используются данные из таблиц определителя бактерий Берджи. 9 издание 1994 г. [3]. в которых каждый микробный вид - это отдельное наблюдение (кластер). а набор признаков (24 биологические характеристики микроорганизма) - числовые значения вероятности наличия соответствующего признака. Эти наблюдения образуют множество эталонных точек в 24-мерном пространстве. Объекты. которые по набору признаков «похожи» друг на друга. принадлежат к одному кластеру. Критерием схожести и различия кластеров является расстояние между точками в 24-мерном пространстве. Анализируемый объект - штамм со своей таксономической характеристикой. также является точкой в этом многомерном пространстве и исследуется на близость до каждой эталонной точки. Расстояние рассчитывается по формуле:

D,

Y, (X - X, )2

V ,=1

где Ц - евклидово расстояние между неизвестным (идентифицируемым) штаммом и )-тым микроорганизмом в 24-х мерном пространстве;

) - номер известного микроорганизма. ь номер анализируемого признака.

- значение 1-того признака )-того микроорганизма

Таким образом. в программе формируется идентификационная таблица: название микроорганизма. значения вероятностей активности для 24 тестов. При составлении таблицы проводится предварительная стандартизация переменных: вместо значений от 0 до 10 записывается «1». диапазону значений от 11 до 25 ставится в соответствие «2». от 26 до 75 - «3». от 76 до 89 - «4». от 90 до 100 - «5». Далее программируется методика: выбирается цвет положительной и отрицательной реакции. местоположение каждого фермента. используемого в тест-системе. В рабочем окне программы формируется субстратный профиль с помощью условных обозначений «+». «-» или «?». И. наконец. проводится аналитическая обработка результатов. Программа NewId интерпретирует полученный набор данных из символьного в числовой ряд. и для каждого микроорганизма из таблицы находится евклидово расстояние по формуле. Полученный массив данных нормируется. представляется в виде % подобия и выстраивается в порядке убывания. Первые четыре элемента массива выводятся в отчет.

Результат

На рис.1 отображены результаты идентификации двух штаммов. Идентификация проводилась по субстратному профилю из тринадцати тестов. Исходя из результатов тестов. первый штамм с вероятностью 82.259% был идентифицирован как Staphylococcus schleiferi. а второй штамм с вероятностью 77.559% как Micrococcus roseus.

Рис.1

Заключение

Программа NewId позволяет создать автоматизированное рабочее место микробиолога, включающее в себя модель фотометра, изготовленного на РУПП «Витязь» (АИФ-М/340, Ф300, Ф300ТП), адаптированного для анализа

результатов по цвету пробы в автоматическом режиме и персональный компьютер (см. рис.2).

Рис.2

Литература

1. Антибактериальная терапия в гнойной хирургии: руководство / под ред. А. Н. Косинца. - Витебск: ВГМУ. 2002. - 600 с.

2. Окулич. В. К. Оценка чувствительности микроорганизмов к антибиотикам с помощью тест-систем «АВ - Стаф». «АВ - Пев». «АВ - Энтер» / В. К. Окулич. С. Д. Федянин // Медицинская панорама. - 2002. - № 8 - С. 19.

3. Определитель бактерий Берджи: в 2 т.: пер. с англ. / под ред. Дж. Хоулта [и др.]. - М.: Мир. 1997. - Т.1. - С. 180-196.

4. Практическое руководство по антиинфекционной химиотерапии / под общ. ред. Л. С. Страчунского. Ю. Б. Белоусова. С.Н. Козлова. - М.. 2002. - 300 с.

5. Руководство по статистике в медицине и биологии: в 2 т. / под ред. Ю. М. Комарова. - М.: Мединина. 2001. - С. 282-338.

6. Фотт. Н. П. Обоснование использования кластерного анализа для видовой идентификации стафилококков / Н. П. Фотт. О. С. Бравичева // Вестник ОГУ. - 2002. - № 3. - С. 132-134.

7. Bowler. P. G. Wound microbiology and associated approaches to wound management / P. G. Bowler. B. I. Duerden. D. G. Armstrong // Clin. Microb. Rev. -2001. - Vol. 14. N 2. - Р. 244-269.

8. Croize. J. Evaluation of a new ministurized and Automated Sistem / J. Croize. M. Desmonceaux // Meeting. Atlanta. May 16-20th 1993. Atlanta. 1993. -Abst. - Р. 302.

9. Distribution and drug-resistance of 3 500 gram-negative bacteria in Guangzhou / Q. Z. Xiao [et al.] // Di Yi Jun. Yi Xue Xue Bao. - 2005. - Vol. 25. N 2

- P. 132-138.

10. Desmonceaux. M. ID. E: A new 24-Hour Semi-automated System for Gram Negatiwe Rods.(1993) ASM / M. Desmonceaux // Annual Meeting.May 1620th. Atlanta. - Abst. - P. C 301.

11. Monnet. D. Ewaluation of Semi-Automated 24 Hour Commercial System for Identification of Enterobacteriaceae and other Gram-Negative Bacteria. (1994) / D. Monnet. D. Lafay // Eur. of Clin. Microbiol. Infect.Dis. - 1994. - Vol. 13. - P. 424-430.

12. Murray. P. R. Manual of Clinical Microbiology / P. R. Murray. E. J. Baron / P. R. Murray // American Society for Microbiology. - 8th ed.. - Washington. 2003.

13. Spectrum of microbes and antimicrobial resistance in a surgical intensive care unit. Barbados / S. Hariharan [et al.] // Am. J. Infect. Cjntrol. - 2003. - Vol. 31. N 5. - P. 280-287.

i Надоели баннеры? Вы всегда можете отключить рекламу.