Научная статья на тему 'Применение методов хемометрики для анализа биоаэрозолей проточно-оптическим методом'

Применение методов хемометрики для анализа биоаэрозолей проточно-оптическим методом Текст научной статьи по специальности «Нанотехнологии»

CC BY
2560
77
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ПРОТОЧНО-ОПТИЧЕСКИЙ МЕТОД / БИОАЭРОЗОЛИ / МЕТОД ГЛАВНЫХ КОМПОНЕНТ / ХЕМОМЕТРИКА / SIMCA / МЕТОД БЛИЖАЙШИХ СОСЕДЕЙ / ИНФОРМАТИВНЫЕ ПРИЗНАКИ / FLOW-OPTICAL METHOD / BIOAEROSOLS / PRINCIPAL COMPONENT ANALYSIS / CHEMOMETRIC / K-NN / INFORMATIVE CHARACTERISTICS

Аннотация научной статьи по нанотехнологиям, автор научной работы — Худяков Е.С., Кочелаев Е.А., Волчек А.О., Кирсанов Д.О., Джагацпанян И.Э.

Предмет исследования. Исследована информативность измерительных каналов анализатора биоаэрозолей. Работа анализатора основана на проточно-оптическом методе. Метод. Проведены измерения сигналов флуоресценции и упругого рассеяния отдельных частиц биоаэрозолей в пяти и двух спектральных диапазонах соответственно. Выполнена регистрация сигналов частиц почвенной пыли, которая использовалась в качестве имитатора фоновых атмосферных веществ. Для возбуждения флуоресценции частиц аэрозолей использованы источники света лазерный на длине волны 266 нм и светодиодный на длине волны 365 нм. Основные результаты. На основе математического аппарата хемометрики произведена классификация признаков по степени информативности и выбраны три наиболее существенных признака, которые в сумме описывают 72% общей дисперсии данных. Тестирование произведено с использованием алгоритмов SIMCA и метода ближайших соседей. Показано, что использование исходного и уменьшенного набора из трех признаков позволяет получать сравнимую точность при классификации биоаэрозолей. Практическая значимость. Показана возможность быстрого обнаружения и идентификации частиц биоаэрозоля респирабельной (задерживаемой в органах дыхания человека) фракции 1-10 мкм проточно-оптическим методом на фоне частиц небиологической природы. Для разработки компактного и недорогого анализатора выбраны наиболее информативные оптические спектральные диапазоны регистрации.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по нанотехнологиям , автор научной работы — Худяков Е.С., Кочелаев Е.А., Волчек А.О., Кирсанов Д.О., Джагацпанян И.Э.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Application of chemometrics for analysis of bioaerosols by flow-optical method

Subject of Research. The informativity of detection channels for bioaerosol analyzer is investigated. Analyzer operation is based on flow-optical method. Method. Measurements of fluorescence and the light scattering of separate bioaerosol particles were performed in five and two spectral ranges, correspondingly. The signals of soil dust particles were registered and used as an imitation of background atmospheric particles. For fluorescence induction of bioaerosol particles we used light sources: a laser one with a wavelength equal to 266 nm and 365 nm LED source. Main Results. Using chemometric data processing the classification of informative parameters has been performed and three most significant parameters have been chosen which account for 72% of total data variance. Testing has been done using SIMCA and k-NN methods. It has been proved that the use of the original and the reduced sets of three parameters produces comparable accuracy for classification of bioaerosols. Practical Relevance. The possibility of rapid detection and identification of bioaerosol particles of 1-10 microns respirable fraction (hindering in the human respiratory system) by flow-optical method on a background of non-biological particles is demonstrated. The most informative optical spectral ranges for development of compact and inexpensive analyzer are chosen.

Текст научной работы на тему «Применение методов хемометрики для анализа биоаэрозолей проточно-оптическим методом»

НАУЧНО-ТЕХНИЧЕСКИИ ВЕСТНИК ИНФОРМАЦИОННЫХ ТЕХНОЛОГИИ, МЕХАНИКИ И ОПТИКИ январь-февраль 2016 Том 16 № 1 ISSN 2226-1494 http://ntv.i1mo.ru/

SCIENTIFIC AND TECHNICAL JOURNAL OF INFORMATION TECHNOLOGIES, MECHANICS AND OPTICS January-February 2016 Vol. 16 No 1 ISSN 2226-1494 http://ntv.ifmo.ru/en

УДК 535.37/535.31

ПРИМЕНЕНИЕ МЕТОДОВ ХЕМОМЕТРИКИ ДЛЯ АНАЛИЗА БИОАЭРОЗОЛЕЙ ПР ОТОЧНО-ОПТИЧЕСКИМ МЕТОДОМ Е.С. Худяков3, Е.А. Кочелаев% А.О. Волчек3, Д. О. Кирсановь,е, И.Э. Джагацпанянь

a АО «НПО «Прибор», Санкт-Петербург, 199034, Российская Федерация ь Университет ИТМО, Санкт-Петербург, 197101, Российская Федерация c Санкт-Петербургский государственный университет, Санкт-Петербург, 199034, Российская Федерация

Адрес для переписки: drjie@mail.ru Информация о статье

Поступила в редакцию 21.09.15, принята к печати 01.12.15

doi:10.17586/2226-1494-2016-16-1-30-38

Язык статьи - русский

Ссылка для цитирования: Худяков Е.С., Кочелаев Е.А., Волчек А.О., Кирсанов Д.О., Джагацпанян И.Э. Применение методов хемометрики для анализа биоаэрозолей проточно-оптическим методом // Научно-технический вестник информационных технологий, механики и оптики. 2016. Т. 16. № 1. С. 30-38.

Аннотация

Предмет исследования. Исследована информативность измерительных каналов анализатора биоаэрозолей. Работа анализатора основана на проточно-оптическом методе. Метод. Проведены измерения сигналов флуоресценции и упругого рассеяния отдельных частиц биоаэрозолей в пяти и двух спектральных диапазонах соответственно. Выполнена регистрация сигналов частиц почвенной пыли, которая использовалась в качестве имитатора фоновых атмосферных веществ. Для возбуждения флуоресценции частиц аэрозолей использованы источники света - лазерный на длине волны 266 нм и светодиодный на длине волны 365 нм. Основные результаты. На основе математического аппарата хемометрики произведена классификация признаков по степени информативности и выбраны три наиболее существенных признака, которые в сумме описывают 72% общей дисперсии данных. Тестирование произведено с использованием алгоритмов SIMCA и метода ближайших соседей. Показано, что использование исходного и уменьшенного набора из трех признаков позволяет получать сравнимую точность при классификации биоаэрозолей. Практическая значимость. Показана возможность быстрого обнаружения и идентификации частиц биоаэрозоля респирабельной (задерживаемой в органах дыхания человека) фракции 1-10 мкм проточно-оптическим методом на фоне частиц небиологической природы. Для разработки компактного и недорогого анализатора выбраны наиболее информативные оптические спектральные диапазоны регистрации. Ключевые слова

проточно-оптический метод, биоаэрозоли, метод главных компонент, хемометрика, SIMCA, метод ближайших

соседей, информативные признаки

Благодарности

Работа частично выполнена при государственной финансовой поддержке ведущих университетов Российской Федерации (субсидия 074-U01).

APPLICATION OF CHEMOMETRICS FOR ANALYSIS OF BIOAEROSOLS

BY FLOW-OPTICAL METHOD E.S. Khudyakov", E.A. Kochelaev", A.O. Volchek", D.O. Kirsanovb,c, I.E. Jahatspanianb

Ь JSC "NPO "Pribor", Saint Petersburg, 199034, Russian Federation ь ITMO University, Saint Petersburg, 197101, Russian Federation c Saint Petersburg State University, Saint Petersburg, 199034, Russian Federation Corresponding author: drjie@mail.ru Article info

Received 21.09.15, accepted 01.12.15 doi:10.17586/2226-1494-2016-16-1-30-38 Article in Russian

For citation: Khudyakov E.S., Kochelaev E.A., Volchek A.O., Kirsanov D.O., Jahatspanian I.E. Application of chemometrics for analysis of bioaerosols by flow-optical method. Scientific and Technical Journal of Information Technologies, Mechanics and Optics, 2016, vol. 16, no. 1, pp. 30-38.

Abstract

Subject of Research. The informativity of detection channels for bioaerosol analyzer is investigated. Analyzer operation is based on flow-optical method. Method. Measurements of fluorescence and the light scattering of separate bioaerosol

particles were performed in five and two spectral ranges, correspondingly. The signals of soil dust particles were registered and used as an imitation of background atmospheric particles. For fluorescence induction of bioaerosol particles we used light sources: a laser one with a wavelength equal to 266 nm and 365 nm LED source. Main Results. Using chemometric data processing the classification of informative parameters has been performed and three most significant parameters have been chosen which account for 72% of total data variance. Testing has been done using SIMCA and k-NN methods. It has been proved that the use of the original and the reduced sets of three parameters produces comparable accuracy for classification of bioaerosols. Practical Relevance. The possibility of rapid detection and identification of bioaerosol particles of 1-10 microns respirable fraction (hindering in the human respiratory system) by flow-optical method on a background of non-biological particles is demonstrated. The most informative optical spectral ranges for development of compact and inexpensive analyzer are chosen. Keywords

flow-optical method, bioaerosols, principal component analysis, chemometric, SIMCA, k-NN, informative characteristics Acknowledgements

This work was partially financially supported by the Government of the Russian Federation (Grant 074-U01).

Введение

Биологическое загрязнение воздуха может произойти в результате утечек и аварий на предприятиях фармакологического профиля, эпидемий, стихийных бедствий, а также при применении биологического оружия. При этом аэрозольный путь распространения биологических агентов в настоящее время принято считать наиболее вероятным, а патогенные бактерии, входящие в состав биоаэрозоля, могут вызывать такие инфекционные заболевания, как бруцеллез, сибирская язва, сальмонеллез, столбняк, туляремия и др. [1].

Эффективность противодействия последствиям биологического загрязнения воздуха во многом определяется скоростью установления факта присутствия патогенных частиц в составе атмосферы, поэтому определение факта биологической угрозы должно происходить в условиях реального времени. Дополнительная информация об отнесении биологического агента к какому-либо классу, например, спорам, бактериям или белкам [2], способствует повышению эффективности мер медицинской помощи пострадавшим.

Существующие в настоящее время методики и технологии прямого микробиологического контроля, основанные на пробоотборе из воздуха микробных клеток с последующим осаждением на поверхность плотной питательной среды, культивирования и подсчета выросших колоний, имеют такие минусы, как длительность, громоздкость, трудозатратность. Помимо этого, в процессе отбора пробы воздуха и посева на питательную среду клетки микроорганизмов могут травмироваться, что приводит к искажению результатов [3-5]. В связи с этим актуальна задача разработки высокочувствительных экспресс-методов обнаружения патогенных биоаэрозолей в общей массе фоновых атмосферных аэрозолей как биологической, так и небиологической природы1.

Для быстрого обнаружения и идентификации патогенных биологических частиц респирабельной (задерживаемой в органах дыхания человека) фракции 1-10 мкм может быть применен проточно-оптический метод (ПОМ) анализа, использующий измерения флюоресценции и рассеяния света от отдельных частиц аэрозоля [6-8]. В ПОМ отбор пробы и освещение частиц происходит в потоке воздуха, что позволяет анализировать до 104 отдельных частиц аэрозоля в секунду и выдавать результат анализа за время, не превышающее нескольких минут.

В общем случае в различных приборных реализациях ПОМ разделение биологического и небиологического аэрозоля, как правило, происходит на основе анализа флуоресценции триптофана, присутствующего в частицах биоаэрозоля в составе белков и остатков аминокислот и возбуждаемого в области длин волн 250-290 нм [6, 7]. Кроме того, для биоаэрозолей, относящихся к различным таксономическим группам [2], проявляются различия в спектральных характеристиках: форме, положению максимума, величине флуоресценции [9-11], что позволяет проводить их идентификацию [12].

При анализе ПОМ наличие в окружающем воздухе определенного уровня естественного (не патогенного) биологического фона, частицы которого также содержат триптофан, может приводить к ложно-положительным результатам обнаружения патогенных биоаэрозолей. Задача осложняется тем, что биоаэрозольный фон атмосферы - динамичная система, флуоресцентные свойства которой могут меняться в естественных условиях при воздействии солнечного света, температуры, влажности и других факторов [8]. Таким образом, задача правильной идентификации патогенных частиц в составе аэрозоля с помощью ПОМ требует повышения селективности метода. В существующих устройствах ПОМ для повышения селективности включают в оптическую систему дополнительные источники излучения и (или) фотодетекторы [2, 7, 8]. Например, применяют дополнительный источник возбуждения в области длин волн 330-380 нм, что позволяет, помимо спектра флуоресценции триптофана, регистрировать спектры флуо-

1 Ответные меры системы общественного здравоохранения на угрозу применения биологического и химического

оружия. Руководство ВОЗ. 2001. http://www.who.int /mc/pdfs/PublicHealthR.pdf

ресценции МЛБН и флавинов в границах спектрального диапазона 400-600 нм [7]. Еще одним способом повышения селективности ПОМ является детектирование рассеянного света. Нормировка сигналов флуоресценции на сигнал упругого рассеяния позволяет значительно сократить разброс регистрируемых данных, связанный с нестабильностью источников излучения, неравномерностью распределения интенсивности излучения в области анализа, а также уменьшить разброс данных, связанный с широким распределением частиц аэрозоля по размерам [7]. Вместе с тем увеличение числа оптических элементов (источников и детекторов света) приводит к усложнению конструкции прибора, росту энергопотребления и массогабаритных характеристик, к значительному увеличению стоимости, усложняет его наладку и ухудшает надежность. Это вступает в противоречие с требованиями, предъявляемыми к «полевым» устройствам ПОМ - компактность, надежность, малое энергопотребление.

Целью настоящей работы является оценка информативности различных измерительных каналов ПОМ на основе данных по измерениям сигналов флуоресценции и упругого рассеяния от отдельных частиц биоаэрозолей и выбор признаков (информативные признаки), которые описывают наиболее существенную информацию при разделении четырех классов аэрозолей.

Для решения данной задачи были получены экспериментальные данные на проточно-оптическом анализаторе биоаэрозолей, описанном ранее в [13]. Анализ данных выполнен с применением математического аппарата хемометрики. Данный аппарат обеспечивает эффективное и корректное использование методов современной математической статистики для извлечения полезной информации из многомерных данных и получил широкое распространение для решения задач количественного анализа результатов инструментальных измерений (спектроскопических, электрохимических и т.д.) [14, 15].

Описание эксперимента

Для создания аэрозоля использовалась аэрозольная камера (рис. 1), рабочий объем которой составляет 0,7 м3. В камере подача частиц внутрь бокса осуществлялась с использованием вакуумного насоса (эжектора). Порошки проб веществ по отдельности наносились на фильтр АФА ВП-10 и при создании давления около 2 атм воздушным насосом 1 на входе эжектора уносились возникшим потоком с поверхности фильтра в бокс аэрозольной камеры. В процессе измерений воздух бокса перемешивался вентиляторами, что обеспечивало однородность дисперсного состава создаваемого аэрозольного облака по всей высоте бокса.

Воздух

Рис. 1. Блок-схема аэрозольной камеры

После создания аэрозольного облака включался анализатор аэрозолей, воздушный вход которого соединялся с боксом аэрозольной камеры. После включения поток воздуха из бокса камеры поступал на вход виртуального импактора [16] анализатора.

При работе анализатора виртуальный импактор обеспечивает удаление из анализа частиц размером менее 1 мкм и формирует поток воздуха, содержащий частицы с размерами более 1 мкм. На выходе импактора поток аэрозольных частиц с помощью аэродинамической фокусировки [17] сжимается до диаметра 0,2 мм и поступает в область оптического анализа.

Оптическая схема (рис. 2), подробно описанная в [13], обеспечивает измерение сигналов флуоресценции и упруго рассеянного света частицами аэрозолей. Для возбуждения флуоресценции частиц аэрозоля взаимно ортогональные световые потоки ультрафиолетового (УФ) излучения лазера и светодиода фокусируются в точке О (область анализа), через которую проходит воздушный поток частиц аэрозоля. Ось воздушного потока (на рисунке не показана) ортогональна плоскости световых потоков. Пройдя через область анализа, излучение от лазера и от светодиода попадает на оптические ловушки и практически полностью поглощается. В качестве детекторов использованы фотоэлектронные умножители (ФЭУ).

Рис. 2. Оптическая схема измерительной системы

В качестве источников излучения в анализаторе использованы:

1. опытный образец импульсно-периодического лазера с длиной волны Х=266 нм, частотой импульсов n=22 кГц и средней мощностью излучения 4 мВт. Плотность энергии возбуждающего излучения в пятне засветки 70-150 мкДж/см2;

2. светодиод NSU-033A (Nichia соrporation) с длиной волны излучения Х=365 нм.

Скорость движения частицы аэрозоля в области анализа v, частота повторения импульса n и размер области анализа вдоль струи аэрозоля L согласованы и удовлетворяют соотношению n=v/L. Выполнение данного условия обеспечивает облучение импульсом лазера каждой частицы, поступающей в анализируемый объем [6]. Импульс светодиода запускается после импульса лазера только при условии, если пришедший от частицы сигнал рассеяния лазерного луча превышает величину порогового значения

- минимального уровня сигнала, соответствующего сигналу от частицы размером 1 мкм.

При освещении частицы аэрозоля УФ излучением она переизлучает в виде флуоресценции часть светового потока, падающего на ее поверхность, а также частично упруго рассеивает его. Так как центр освещенной зоны совпадает с передним фокусом объектива регистрации - эллиптического зеркала, то световые потоки флуоресценции и рассеяния отражаются зеркалом (телесный угол светосбора Q =2я стер) в область второго фокуса и далее направляются системой линз и спектроделительных зеркал на приемные площадки ФЭУ Комбинация характеристик отражения и пропускания спектроделительных зеркал и установленных перед ФЭУ широкополосных оптических светофильтров обеспечивает разделение излучения в четырех каналах регистрации по четырем спектральным диапазонам 260-290, 300-400, 400-500 и 500-600 нм.

В качестве фотодетекторов использованы ФЭУ-175. Разделение во времени моментов освещения частицы импульсами лазера и светодиода позволяет использовать одни и те же каналы ФЭУ для регистрации сигналов флуоресценции, возбуждаемых обоими источниками.

В процессе измерений от каждой отдельной частицы аэрозоля регистрируются сигналы флуоресценции в диапазонах длин волн 300-400 нм (F11), 400-500 нм (F21) и 500-600 нм (F31), возбуждаемые импульсом лазера; сигналы флуоресценции в диапазонах длин волн 400-500 нм (F22) и 500-600 нм (F32), возбуждаемые импульсом светодиода, сигналы упругого рассеяния на частицах аэрозоля световых потоков лазера и светодиода - 266 нм (S1) и 300-400 нм (S2) соответственно. В приведенных обозначениях подстрочный индекс 1 соответствует освещению частиц УФ лазером, 2 - светодиодом. Всего измеряются 7 независимых показателей: F11, F21, F31, S1, F22, F32 и S2.

В качестве образцов проб биоаэрозолей в работе использовались:

- порошки двух типов сухого яичного белка (Ovalbumin), отличающиеся методами пробоподготовки, аналогичные использованным ранее в [6];

- споры бактерий Bacillus subtilis.

Спектральные характеристики интенсивности флуоресценции двух типов биоаэрозолей на основе яичного белка были измерены на люминесцентном спектрометре LS-50B (Perkin Elmer, США).

Спектральные характеристики спор Bacillus subtilis по форме подобны кривым на рис. 3 и приведены в работе [12].

В качестве имитатора, показывающего влияние фоновых атмосферных веществ на измерения и классификацию биоаэрозолей, использовалась естественная примесь - почвенная пыль. Для этого отбирались образцы грунта с поверхности земли, из которых просеиванием удалялись крупные частицы. Затем образцы высушивали при температуре выше 100 °С.

Таким образом, в аэрозольной камере создавались порошки для трех типов биоаэрозолей и порошок почвенной пыли. Аэрозоли этих порошков составили 4 класса для исследования ПОМ. Количество отдельных зарегистрированных частиц аэрозоля за время создания аэрозольного облака каждого класса

Рис. 3. Интенсивность флуоресценции 2 типов белков Ovalbumin в зависимости от длины

волны: 1 - первый тип; 2 - второй тип

Обработка экспериментальных данных

Для многомерного статистического анализа данных использовался метод главных компонент, (МГК) [14, 15].

Основная идея МГК заключается в снижении размерности исходного набора многомерных данных за счет построения линейной комбинации переменных, наилучшим образом объясняющей их разброс. При этом новые координаты находятся путем построения проекций точек в пространстве исходных данных на оси новой системы координат - системы главных компонент (ГК). Направление оси первой ГК соответствует направлению наибольшего разброса данных. Каждая последующая ось ГК ортогональна предыдущим и описывает максимальный разброс данных в пространстве ортогональном предыдущим ГК. Положение осей новой системы координат определяется направляющими косинусами, или нагрузками (в терминологии МГК). В силу независимости новых переменных, измеряемых вдоль осей ГК, общая дисперсия данных А0 может быть представлена как

5 5 N N8 N

А =1 Ог + 0(Б) = 2 Ог 2 а2, + О(А) * 21а= 2Я ,

•=1 •=1 ,=1 ,=1 •=1 ,=1

где А - дисперсия вдоль /-ой главной компоненты; 8 - число значимых главных компонент, сумма дисперсий которых близка к А0, О(А) - остаточная дисперсия, описываемая ГК с номерами выше 8(О(А)<< А0), N - число исходных переменных (N=5), а, - направляющий косинус между осями /-ой ГК и ,-ой переменной.

8

Коэффициенты Я, = 2 а2 определяют вклад ,-ой переменной в общую дисперсию данных А0.

/=1

В настоящей работе значимость исходных переменных определялась на основе вычислений коэффициентов Я/А0, описывающих вклад отдельных переменных в общую объясненную дисперсию. Обработка исходных данных происходила в несколько этапов:

— построение графиков счетов и нагрузок и определение числа 8 существенных ГК;

— определение значимых переменных на основе величины коэффициентов Я,/А0;

— тестирование и сравнение способности классификации аэрозолей по исходному и уменьшенному набору признаков.

Построение графиков счетов исходных данных (рис. 4, а) показало большой разброс показаний внутри каждого класса аэрозолей и отсутствие выраженных различий между классами. Такой «шум» данных может быть связан с большим разбросом размеров частиц аэрозолей, временной нестабильностью источников излучения, неоднородностью пятна засветки. Для уменьшения разброса показаний дальнейшие расчеты проводились после нормировки сигналов флюоресценции на сигнал рассеяния. Таким образом, количество обрабатываемых признаков было уменьшено до 5: первый - F11/ £1, второй -F21/ £ь третий - F31/ £ь четвертый - F22/ £2, пятый - F32/ £2.

На рис. 4, б, в, показаны двумерные графики счетов по первым трем главным компонентам для 5 признаков и 4 классов. Так как ГК 1, 2 и 3 описывают 58, 21 и 10% общей объясненной дисперсии, было принято, что число значимых главных компонент £=3. Как видно из рис. 4, после нормировки разброс показаний внутри каждого класса значительно уменьшился, появилось визуально различимое разделение по классам.

Рис. 4. Графики счетов для 7 (а) и 5 (б, в) признаков по первым главным компонентам для аэрозолей: 1 - спор Bacillus subtilis; 2 - Ovalbumin тип 1; 3 - Ovalbumin тип 2; 4 - пыль

Для пяти новых переменных были определены коэффициенты Rj/D0 (табл. 1). Как следует из табл. 1, вклад признаков 1, 3 и 4 в общую объясненную дисперсию составляет 72%, что существенно превышает вклад признаков 2 и 5 (28%). При этом доля дисперсии, объясненной признаками 1, 3 и 4, оказывается примерно одинаковой. Следовательно, признаки 1, 3 и 4 приняты как наиболее важные. График нагрузок измеренных признаков приведен на рис. 5.

j 1 2 3 4 5

Rj/D0 0,26 0,12 0,20 0,26 0,16

Таблица 1. Коэффициенты Rj/Do для пяти новых переменных

ГК2 1

0,5

-0,5

1

ГК3 1

0,5

ГК1

0,2

0,3

°-4 2 035 5 °,64

-0,5

3

2

ГК1

0,2

0,3

0,4

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

0,5 0,6 ♦ 5

4

б

Рис. 5. Графики нагрузок по первым трем главным компонентам по пяти признакам для 4 классов

аэрозолей (а-б)

Тестирование и сравнение возможности классификации отдельных частиц аэрозолей по исходному и уменьшенному набору признаков происходило с применением методов SIMCA (Soft independent modeling of class analogy) [15, 18] и метода ближайших соседей (^-Nearest Neighbors, &-NN) [19].

Для устройств ПОМ приборного исполнения принятие решения об обнаружении в составе воздуха облака аэрозоля включает два этапа:

- определение класса каждой отдельной зарегистрированной частицы;

— обнаружение аэрозоля определенного класса, для которого частота поступления частиц превышает заданный уровень порогового значения.

1

0

0

а

Точность принятия решения при классификации отдельных частиц во многом определяется тем, используется ли в алгоритме классификации часть информации или все известные данные о функции распределения характеристик аэрозолей в пространстве признаков. Преимуществом алгоритмов первого типа является высокое быстродействие и возможность реализации «в полевых» условиях; алгоритмов второго типа - более высокая точность анализа. Однако вследствие высоких требований к вычислительным ресурсам реализация последних алгоритмов затруднительна в приборном исполнении устройств ПОМ. Метод 81МСЛ является примером алгоритмов, использующих часть информации о функции распределения обучающей выборки, а метод Л-ЫЫ использует всю информацию.

В 81МСЛ на этапе обучения каждый класс моделируется обособленно, независимо от остальных. В качестве критерия для классификации новых образцов используется модельное расстояние /сгй, определяемое расстоянием до центра класса и квантилем ^-статистики Фишера. При этом каждая частица может быть одновременно отнесена к нескольким классам [15, 18].

В методе Л-ближайших соседей при классификации рассчитывается эвклидово расстояние до всех образцов обучающего набора и выделяется Л-ближайших соседей, расстояние до которых минимально. Параметр Л подбирается эмпирическим путем. Увеличение Л приводит к уменьшению влияния погрешностей, но ухудшает разделение на классы. Объект присваивается тому классу, который является наиболее распространенным среди его Л-соседей [19].

Для оценки качества классификации в обоих алгоритмах данные разделялись на обучающую (90%) и контрольную (10%) выборки. Результаты классификации по методу 81МСЛ представлены в табл. 2.

Классификация методом ближайших соседей была проведена со значениями Л =3-10. Лучшие результаты были получены с Л = 5 (табл. 3).

Номер класса, из которого были отобраны тестируемые данные Процент идентификации по классам по методу 81МСЛ

по пяти признакам по трем признакам

1 2 3 4 1 2 3 4

1 биоаэрозоли 95 73 34 70 95 88 36 55

2 82 95 24 17 80 96 12 14

3 35 21 96 4 19 15 96 2

4 пыль 44 54 13 94 30 63 11 95

Таблица 2. Тестирование модели МГК по пяти и трем признакам по методу Э!МСА

Номер класса, из которого были отобраны тестируемые данные Процент идентификации по классам по методу ближайших соседей (Л-ЫЫ)

по пяти признакам по трем признакам

1 2 3 4 1 2 3 4

1 биоаэрозоли 53 30 10 7 48 30 12 10

2 2 95 2 1 2 95 1 2

3 1 5 94 0 1 4 95 0

4 пыль 5 9 4 82 6 11 5 78

Таблица 3. Проверка модели по пяти и трем признакам по методу ближайших соседей (^-NN1)

Из данных табл. 2, 3 следует:

- для исходного набора из пяти признаков, также как и для уменьшенного (из трех), большинство определяемых частиц соответствуют правильному классу;

- использование всей накопленной статистики измерений позволяет проводить правильную классификацию обнаруживаемого биоаэрозоля, если в качестве критерия использовать максимальную частоту появления биаэрозолей выше порогового значения. При этом допускается, что одновременное появление двух облаков патогенных биоаэрозолей маловероятно;

- ухудшение точности измерений при использовании уменьшенного числа признаков является незначительным и может считаться приемлемым для устройств ПОМ «полевого» исполнения.

Для приборного исполнения аппаратуры ПОМ практическим результатом проведенного анализа явилось бы уменьшение числа используемых в устройстве оптических приемников с одновременным использованием «быстрого» алгоритма типа 81МСЛ. При использовании одного, трех и четырех признаков уменьшить число приемников невозможно, так как для измерения трех данных признаков требуется регистрация излучения во всех исходных спектральных диапазонах всеми четырем приемниками (рис. 2). Однако более подробный анализ нагрузок показал, что вклад 2-го признака (^21/5'1) в дисперсию вдоль первой и второй главной компонент незначительно отличается от вклада третьего признака (Р31/51), что позволяет ожидать незначительного снижения избирательности при замене третьего признака на второй. Результаты тестирования по методу 81МСЛ (табл. 4), на основе трех признаков (Р11/5Ь Р^/^, Р22/52) подтверждают это. Следовательно, в устройстве ПОМ «полевого» исполнения целесообразно использо-

вать три оптических приемника с диапазонами регистрации 266 нм (SI), 300-400 нм (F1b S2), 400-500 нм (F2b F22).

Номер класса, из которого были отобраны тестируемые данные Процент идентификации по классам по методу SIMCA

1 2 3 4

1 94 88 36 55

2 биоаэрозоли 81 95 12 14

3 19 15 97 2

4 пыль 30 83 11 95

Таблица 4. Проверка модели по трем признакам: F11/S1, F21/S1, F22/S2 по методу SIMCA

Заключение

На основе математического аппарата хемометрики выбраны информативные признаки, которые описывают наиболее существенную информацию при разделении четырех классов аэрозолей. При этом исходное число из пяти нормированных признаков уменьшено до трех, которые в сумме описывают 72% общей дисперсии данных: F11/S1, F31/S1, F22/S2.

Тестирование алгоритма классификации по исходному и уменьшенному набору признаков показало сравнимую точность при классификации биоаэрозолей, что позволяет использовать уменьшенный набор параметров в измерениях проточно-оптическим методом без существенной потери избирательности. Результаты анализа показывают также, что число используемых приемников может быть уменьшено с четырех до трех без заметного снижения избирательности.

Использованный подход при отборе «важных» признаков может быть применен при разработке анализаторов проточно-оптическим методом. При определении таких признаков является существенным использование максимально полной базы данных биоаэрозолей, подлежащих обнаружению и идентификации.

Литература

1. Dutkiewicz J. Bacteria and fungi in organic dust as potential health hazard // Annals of Agriculture and Environmental Medicine. 1997. V. 4. N 1. P. 11-16.

2. Sivaprakasam V., Huston A.L., Scotto C., Eversole J.D. Multiple UV wavelength excitation and fluorescence of bioaerosols // Optics Express. 2004. V 12. N 19. P. 4457-4466. doi: 10.1364/0PEX.12.004457

3. Pepper I.L., Geiba C.P., Gentry T., Raina M. Environmental Microbiology. 2nd ed. San Diego: Academic Press, 2011. 624 p. doi: 10.1016/B978-0-12-370519-8.50002-9

4. Kikikawa M., Iwasaka Y., Kobayashi F., Maki T. Molecular identification of microorganisms in bioaerosols // Earozoru Kenkyu. 2010. V. 25. P. 29-34.

5. Usachev E.V., Pankova A.V., Rafailova E.A., Pyankov O.V., Agranovski I.E. Portable automatic bioaerosol sampling system for rapid on-site detection of targeted airborne microorganisms // Journal of Environmental Monitoring. 2012. V. 14. N 10. P. 2739-2745. doi: 10.1039/c2em30317e

6. Кочелаев Е.А., Волчек А.О. Оптическая система регистрации для проточно-оптического метода анализа биоаэрозолей // Оптический журнал. 2011. Т. 78. № 6. C. 23-30.

7. Jeys T.H., Herzog W.D., Hybl J.D., Czerwinski R.N., Sanchez A. Advanced trigger development // Lincoln Laboratory Journal. 2007. V. 17. N 1. P. 29-60.

8. Pan Y-L. Detection and characterization of biological and other organic-carbon aerosol particles in atmosphere using fluorescence // Journal of Quantitative Spectroscopy and Radiative Transfer. 2015. V. 150. P. 1235. doi: 10.1016/j.jqsrt.2014.06.007

9. Burstein E.A., Abornev S.M., Reshetnyak Y.K. Decomposition of protein tryptophan fluorescence spectra into log-normal components. I. Decomposition algorithms // Biophysical Journal. 2001. V. 81. N 3. P. 16991709.

10. Reshetnyak Y.K., Burstein E.A. Decomposition of protein tryptophan fluorescence spectra into log-normal components. II. The statistical proof of discreteness of trytophan classes in proteins // Biophysical Journal. 2001. V. 81. N 3. P. 1710-1734.

11.Reshetnyak Y.K., Koshevnik Y., Burstein E.A. Decomposition of protein tryptophan fluorescence spectra into log-normal components. III. Correlation between tryptophan and microenvironment parameters of individual tryptophan residues // Biophysical Journal. 2001. V. 81. N 3. P. 1735-1758.

12.Pan Y.-L., Hill S.C., Pinnick R.G., Huang H., Bottiger J.R., Chang R.K. Fluorescence spectra of atmospheric aerosol particles using one or two excitation wavelengths: comparison of classification schemes employing different emission and scattering results // Optics Express. 2010. V. 18. N 12. P. 12436-12457. doi: 10.1364/0E.18.012436

13. Кочелаев Е.А., Волчек А.О. Способ оптической регистрации сигналов флуоресценции и рассеяния аэрозольных частиц в потоке и оптическая система для его осуществления. Патент РФ № 2448340. 2012.

14. Esbensen K.H. Multivariate Date Analysis - In Practice. 5th ed. Oslo, Norway, CAMO Process AS, 2002, 598 p.

15. Родионова О.Е., Померанцев А.Л. Хемометрика в аналитической химии. М.: Ин-т химической физики РАН, 2006. 61 с.

16.Loo B.W., Cork C.P. Development of high efficiency virtual impactors // Aerosol Science and Technology. 1988. V. 9. N 3. P. 167-176.

17.Rao N.P., Navanscues J., Fernandez de la Mora J. Aerodynamic focusing of particles in viscouts jets // Journal of Aerosol Science. 1993. V. 24. N 7. P. 879-892. doi: 10.1016/0021-8502(93)90068-K

18. Beebe K.R., Pell R.J., Seasholtz M.B. Chemometrics: A Practical Guide. NY: John Wiley & Sons, 1998. 360 p.

19.Hastie T., Tibshirani R., Friedman J. Elements of Statistical Learning: Data Mining, Inference, and Prediction. 2nd ed. NY: Springer, 2009. 745 p. doi: 10.1007/978-0-387-84858-7

Худяков Евгений Сергеевич Кочелаев Евгений Александрович

Волчек Андрей Олегович

Кирсанов Дмитрий Олегович

Джагацпанян Игорь Эдуардович

Evgeniy S. Khudyakov Evgeniy A. Kochelaev Andrey O. Volchek Dmitry O. Kirsanov

Igor E. Jahatspanian

инженер, АО «НПО «Прибор», Санкт-Петербург, 199034, Российская Федерация, laanbird@gmail.com

кандидат технических наук, руководитель группы, АО «НПО «Прибор», Санкт-Петербург, 199034, Российская Федерация, kochelaev@bk.ru

кандидат физико-математических наук, главный конструктор, АО «НПО «Прибор», Санкт-Петербург, 199034, Российская Федерация, volchek@npo-pribor.ru

кандидат химических наук, инженер, Университет ИТМО, Санкт-Петербург, 197101, Российская Федерация; доцент, Санкт-Петербургский государственный университет, Санкт-Петербург, 199034, Российская Федерация, d.kirsanov@gmail.com кандидат технических наук, инженер, Университет ИТМО, Санкт-Петербург, 197101, Российская Федерация, drjie@mail.ru

engineer, JSC "NPO "Pribor", Saint Petersburg, 199034, Russian Federation, laanbird@gmail.com

PhD, Head of group, JSC "NPO "Pribor", Saint Petersburg, 199034, Russian Federation, kochelaev@bk.ru

PhD, Chief Designer, JSC "NPO "Pribor", Saint Petersburg, 199034, Russian Federation, volchek@npo-pribor.ru

PhD, engineer, ITMO University, Saint Petersburg, 197101, Russian Federation; Associate Professor, Saint Petersburg State University, Saint Petersburg, 199034, Russian Federation, d.kirsanov@gmail.com PhD, engineer, ITMO University, Saint Petersburg, 197101, Russian Federation, drjie@mail.ru

i Надоели баннеры? Вы всегда можете отключить рекламу.