Научная статья на тему 'Алгоритм обнаружения биологических аэрозолей в воздухе при наличии тестовых данных'

Алгоритм обнаружения биологических аэрозолей в воздухе при наличии тестовых данных Текст научной статьи по специальности «Математика»

CC BY
122
20
i Надоели баннеры? Вы всегда можете отключить рекламу.
Журнал
Научное приборостроение
ВАК
RSCI
Область наук
Ключевые слова
ПРИБОР / DEVICE / ПРОТОЧНО-ОПТИЧЕСКИЙ МЕТОД / ЕМ-АЛГОРИТМЫ / EM-ALGORITHMS / СМЕСЬ РАСПРЕДЕЛЕНИЙ / MIXTURE OF DISTRIBUTIONS / ФУНКЦИЯ МАКСИМАЛЬНОГО ПРАВДОПОДОБИЯ / FUNCTION OF MAXIMUM LIKELIHOOD / ОЦЕНКА ПЛОТНОСТИ / DENSITY ESTIMATE / ЭКСПЕРИМЕНТАЛЬНЫЕ ДАННЫЕ / EXPERIMENTAL DATA / PARTICLE FLUORESCENCE SPECTROMETER

Аннотация научной статьи по математике, автор научной работы — Ермаков С. М., Рукавишникова Анна Игоревна, Волчек А. О., Кочелаев Е. А.

Предлагается алгоритм, который на основе данных с прибора, основанного на проточно-оптическом методе, принимает решение о наличии в воздухе искомых патогенных веществ. Строятся оценки плотностей распределения измерений параметров частиц для известных веществ, оценивается процентная концентрация содержащихся в воздухе аэрозольных частиц. Используя пороги, рассчитанные на этапе обучения, принимается решение об обнаружении опасных веществ. Приводятся результаты тестирования алгоритма.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Ермаков С. М., Рукавишникова Анна Игоревна, Волчек А. О., Кочелаев Е. А.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

A SELF-LEARNING ALGORITHM FOR DETECTION OF BIOLOGICAL AEROSOLS IN THE AIR

We propose an algorithm that uses data from the particle fluorescence spectrometer in order to take decision on presence of known pathogens in the air. Density estimates of measurements for particles of the known substances are constructed, percentage concentration of aerosol particles in the air is estimated. Decision on detection of dangerous substances is made with the use of thresholds, calculated at the training stage. The results of testing the algorithm are discussed.

Текст научной работы на тему «Алгоритм обнаружения биологических аэрозолей в воздухе при наличии тестовых данных»

ISSN 0868-5886

НАУЧНОЕ ПРИБОРОСТРОЕНИЕ, 2015, том 25, № 2, c. 27-33

- СИСТЕМНЫЙ АНАЛИЗ ПРИБОРОВ ^

И ИЗМЕРИТЕЛЬНЫХ МЕТОДИК

УДК 59.14.02

© С. М. Ермаков, А. И. Рукавишникова, А. О. Волчек, Е. А. Кочелаев

АЛГОРИТМ ОБНАРУЖЕНИЯ БИОЛОГИЧЕСКИХ АЭРОЗОЛЕЙ В ВОЗДУХЕ ПРИ НАЛИЧИИ ТЕСТОВЫХ ДАННЫХ

Предлагается алгоритм, который на основе данных с прибора, основанного на проточно-оптическом методе, принимает решение о наличии в воздухе искомых патогенных веществ. Строятся оценки плотностей распределения измерений параметров частиц для известных веществ, оценивается процентная концентрация содержащихся в воздухе аэрозольных частиц. Используя пороги, рассчитанные на этапе обучения, принимается решение об обнаружении опасных веществ. Приводятся результаты тестирования алгоритма.

Кл. сл.: прибор, проточно-оптический метод, ЕМ-алгоритмы, смесь распределений, функция максимального правдоподобия, оценка плотности, экспериментальные данные

ВВЕДЕНИЕ

Среди методов мониторинга аэрозолей можно выделить проточно-оптический метод (ПОМ), позволяющий в реальном времени обнаруживать в составе воздуха небольшие концентрации патогенных биоаэрозолей [1-8]. Предлагаемый в работе алгоритм предназначен для обработки в режиме реального времени данных с прибора [1], основанного на ПОМ. Целью алгоритма является принятие решения об обнаружении в воздухе небольших концентраций патогенных биоаэрозолей и классификация их на несколько условных таксономических групп. Полученная информация о группе обнаруженного вещества важна для организации мер оперативной профилактики поражающего действия указанных веществ на организм человека.

Принцип работы приборов на основе ПОМ: отдельные частицы аэрозоля освещаются ультрафиолетовым (УФ) излучением и переизлучают часть света в виде флуоресцентного свечения. Для каждой облученной частицы измеряется набор сигналов флуоресценции в нескольких широких спектральных интервалах, а также сигналы упругого рассеяния. Результаты измерений являются случайными величинами, см. [2].

Задача анализа патогенных частиц на основе ПОМ существенно осложняется наличием флуоресцирующего аэрозольного фона, концентрация которого может на 1-2 порядка превышать концентрацию целевых веществ и зависит от множества факторов: погодных условий, времени суток, сезона измерений, географического положения [3]. Присутствие данных веществ, как правило, ухудшает достоверность анализа, поэтому является актуальной разработка алгоритма анализа данных,

полученных устройством ПОМ, который позволит получить высокую вероятность правильного обнаружения при вероятности ложноположительного срабатывания не выше заданной (обычно 5%).

Кроме того, дополнительными требованиями к разрабатываемому алгоритму являются: возможность проведения анализа в условиях реального времени; объем требуемой для работы памяти должен укладываться в аппаратные ограничения, накладываемые исполнением прибора.

Авторы предложили алгоритм анализа частиц в ПОМ, в целом удовлетворяющий этим требованиям. Ниже приводится описание алгоритма и представлены результаты экспериментов, проведенных на реальных данных на устройстве [1].

Экспериментальные данные получены при регистрации биоаэрозолей (БА) (см. [2], [4]), содержащих белок Ovalbumin и отличающихся методом пробоподготовки, и примесей — почвенной пыли [2], — а также трех неоднородных аэрозольных фонов из воздуха лаборатории. В экспериментах отдельные частицы аэрозолей возбуждались УФ-излучением на длинах волн Я^к = 266 нм и Я^ = = 365 нм. Облучение каждой частицы длиной волны Авоз = 266 нм происходило с использованием УФ-лазера; при этом регистрировались сигналы флуоресценции Lb L2, L3 в диапазонах AALl = = 300^400, АЯи = 400^500, АХи = 500^600 нм и сигнал упругого рассеяния S. Облучение частицы длиной волны Я»з = 365 нм происходило УФ-светодиодом; при этом регистрировались сигналы L2', L3' в диапазонах АЯ^' = 400^500 и АЯ^,' = = 500^600 нм и сигнал упругого рассеяния S. Таким образом, число измеряемых сигналов от каждой частицы было равно 7.

АЛГОРИТМ ВЫЯВЛЕНИЯ ИСКОМЫХ ВЕЩЕСТВ

На основе вышесказанного для данной задачи все аэрозоли могут быть разделены на классы.

• Фон — частицы различных типов, выявление которых не представляет интереса. Например, различные виды пыли, дым, косметика и т. п. В нормальной ситуации в виде фона одновременно присутствуют частицы нескольких типов.

• Искомые вещества — определенные исследователем вещества, заранее разделенные на подгруппы.

Предложенный алгоритм выявления искомых веществ содержит следующие шаги.

1. Оценка плотности распределения измерений, сделанных по отдельным частицам искомых веществ и фона. В качестве модели распределения используется смесь независимых многомерных нормальных распределений.

2. Оценка процентной концентрации содержащихся в воздухе частиц, зафиксированных прибором за один цикл работы. Для этого строится модель распределения попавших в прибор частиц в виде смеси известных распределений.

3. Принятие решения об обнаружении в воздухе искомых частиц при допущении, что в пробе может присутствовать только один тип искомого вещества. При этом вероятность ошибки первого рода (ложного срабатывания) фиксируется. В настоящей работе бралось значение 0.05. Вероятность ошибки второго рода (пропуск события) минимизируется.

4. Тестирование построенного алгоритма обнаружения.

Для сравнения: в работе [5] предлагаются алгоритмы классификации отдельных частиц, работающие по следующему принципу. По каждой частице измеряется от двух до порядка 30 параметров. Решение о принадлежности частицы искомому классу принимается, если все измеренные параметры попадают в свои заранее насчитанные отрезки. Такой подход ввиду своей простоты хорош, когда распределения измерений сигналов веществ сильно отличаются. Тем не менее в более сложных случаях такие алгоритмы могут оказаться неприменимыми, т. к. вносят следующие упрощения.

• Распределения измерений фактически аппроксимируются независимыми равномерными распределениями, в то время как ясно, что частицы могут вносить разный вклад в процесс принятия решения в зависимости от значения оценки совместной плотности их параметров.

• Каждая частица классифицируется по отдельности, что затруднит разработку качественно-

го алгоритма принятия решения в случае, когда искомое вещество похоже на какой-либо фон.

При разработке алгоритма в настоящей работе авторы преследовали цель избавиться от этих недостатков.

ОЦЕНИВАНИЕ ПЛОТНОСТЕЙ

РАСПРЕДЕЛЕНИЯ ИЗВЕСТНЫХ ВЕЩЕСТВ

Пусть прибор по каждой частице может измерить K параметров, тогда измерения, сделанные по каждой частице, можно представить как точку в K-мерном пространстве. Пусть имеется M известных веществ без примесей. Присвоим каждому веществу номер от 1 до M. Плотность распределения iN

го вещества оценивается как pi (х) = ^ aijQij (х),

j=i

где Qj — многомерное нормальное распределение. Величины N и aj могут быть найдены с помощью EM-алгоритмов (см. [9]).

В настоящей работе бралась реализация EM-алгоритмов из пакета Mclust (см.[10]) для языка R (см. [ 11]—[15]). Использованный метод Mclust позволяет выбирать разумные параметры вида плотностей Qjj и число N элементарных распределений в смеси, используя байесовский информационный критерий (см. [16]).

Например, в одном из экспериментов число наблюдений K равнялось 5 (в эксперименте из-за малости величин не учитывались сигналы L3, L3'), в других экспериментах K = 7. Метод Mclust определил, что для аппроксимации плотности распределения БА 4 оптимально использовать N = 8, а в качестве Qj брать "неповернутые эллипсоиды" с разным размером и положением в пространстве. В терминах пакета Mclust такая модель распределения называется VVI.

Время расчетов достаточно велико, но т. к. это подготовительный этап, который проводится однократно при настройке параметров алгоритма, этим фактом можно пренебречь.

Пример

Для анализа были взяты четыре биоаэрозоля Ovalbumin, указанные выше: БА 1, БА 2, БА 3, БА 4, и четыре фоновых аэрозоля: почвенная пыль, фон 1, фон 2 и фон 3 (неоднородные фоновые вещества, обнаруженные в воздухе лаборатории в разное время при разных условиях, см. Введение). Для каждой регистрируемой частицы вещества исследовались следующие показатели: S, Lb L2.

На рисунке приведен пример аппроксимации плотности выборочного распределения БА 4. На левой части рисунка (а) эллипсы соответствуют нормальным распределениям, с помощью которых

о

со

ю

г^

о

г^

ю

со Щ

о ' * у

со 4-

ю 1 :.

ю

о

ю

' V -.л •• ' V ...

.....

•гД*•• ■• .:• г.;. •. ; /„;•

5.0

6.5

7.0 X

о

СО

т г--

о

ю

со

о со

т 10

о ю

5.0

5.5

6.0

6.5

б

7.0

Аппроксимация исходного выборочного распределения вещества БА 4.

а — проекция распределения на плоскость ху: х = 1п(£2 +1), у = 1п(^1 +1); число распределений N = 8, модель УУ1. б — изолинии плотности распределения; внешний контур соответствует значению 0.1; шаг между изолиниями 0.1

X

а

аппроксимируется исходное распределение, их число N = 8. На правой части (б) показана оценка плотности распределения для БА 4 в пространстве 1П(£1 +1), 1п^2 +1).

Для хранения параметров распределений в данном примере оказалось достаточно небольшого объема памяти — около 3 Кб.

ОЦЕНКА ПРОЦЕНТНОЙ КОНЦЕНТРАЦИИ СОДЕРЖАЩИХСЯ В ВОЗДУХЕ ЧАСТИЦ

Пусть имеется т частиц, представляющих смесь из нескольких веществ. Каждой частице сопоставляется точка х1, 1 = 1, 2,..., т в пространстве измерений.

Плотность этой смеси может быть записана

в виде р (х) = £ (х), где в, — неизвестные

г

коэффициенты, определяющие доли веществ в смеси, г = 1, 2,., М — количество веществ в смеси. Выделим подмножества D = {г1,.,га} номеров искомых веществ и S = {га+1,...,гм} номеров фоновых веществ. По условию задачи в смеси может присутствовать только одно искомое вещество.

Таким образом, задача поиска коэффициентов в, сводится к задаче максимизации функции прав-

т

доподобия ^ р (х1) , при условиях, что

1=1

1) в, > 0;

М

2) £ в,= 1;

г=1

3) если для некоторого , из D выполняется в, > 0, то для всех у е D \ выполняется в] = 0.

Для решения данной задачи использовался метод maxLik из одноименного пакета для языка R (см. [17]). Метод maxLik не позволяет задавать условия вида 3, поэтому этот метод применялся последовательно для каждого , е {,1, ..., га}. Во время каждого такого расчета накладывалось условие в, = 0 для всех у е D \ . Далее среди полученных результатов расчета выбирался тот, для которого значение функции правдоподобия было максимальным.

При выполнении исследований в настоящей работе для поиска коэффициентов в, использовался квазиньютоновский метод BFGS (Бройдена— Флетчера—Гольдфарба—Шанно, см. [18]). Были опробованы и другие алгоритмы, но у BFGS время работы до получения приемлемого результата оказалось минимальным.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Используя различные оптимизации, удалось достичь приемлемой скорости расчета. Так, для следующих параметров:

- число измерений по каждой точке К = 5;

- число известных веществ М = 8;

- число нормальных распределений, используемых для оценки плотности однородных веществ, Ni е 9,14;

- число частиц в выборке m = 2000,

время расчета коэффициентов Д составляет порядка 200 мс на Core i3 2.8 GHz.

ПРИНЯТИЕ РЕШЕНИЯ ОБ ОБНАРУЖЕНИИ ВЕЩЕСТВА

На предыдущем этапе были оценены коэффициенты в смеси веществ, а также был выбран индекс i, соответствующий опасному веществу, наличие которого считается возможным в смеси. Теперь необходимо принять решение об обнаружении в воздухе частиц искомого вещества.

Заранее рассчитываются функции ap (r) , заданные для i е D, j е S, соответствующие порогу принятия решения об обнаружении вещества на

фоне r частиц вещества j. В настоящей работе функции a j (r) вычислялись на основе экспериментальных данных следующим образом.

1. Для выбранного объема u выборки и для каждого фонового вещества k е S строим случайную подвыборку из u частиц фонового вещества типа k. К полученной выборке применяем алгоритм расчета коэффициентов в для всех j е S u {i} . Для всех прочих индексов в = 0.

2. Повторяем вычисления из п. 1 достаточно большое число раз ш.

3. Полагаем, что aj (uPj ) = quantile0 95 (uPi).

Здесь надчеркивание означает выборочное среднее значение соответствующей величины. Данная величина говорит, что если было выявлено uftj фонового типа j и не меньше aj (ufij ) частиц искомого вещества типа I, то, приняв решение о наличии искомого вещества в выборке, мы ошибемся с оценкой вероятности не более 0.05.

4. Для произвольного r значение aj (r) оценивается путем линейной интерполяции значений, оцененных в пп. 1-3.

Шаги 1-3 выполняются однократно при настройке алгоритма. В связи с большим объемом рассчитываемых данных эта операция достаточно ресурсоемка.

Далее проверяется условие mfit> ^ aj (mfij ).

j^S

Это условие читается как проверка оценки числа обнаруженных искомых частиц на превышение порогового значения, которое зависит от оценок

числа частиц фона. Если это условие выполняется, то принимается решение об обнаружении искомого вещества i.

В некоторых случаях величины ajJ (r) могут

оказаться столь большими, что критерий принятия решения на тестовых данных никогда не срабатывает. Такое возможно, если распределение одного из видов фона похоже на распределение искомого вещества. Также такое возможно при малых объемах выборок, что выражается в малых значениях аргумента r.

Рассматривались более сложные критерии принятия решения о наличии искомого вещества, в том числе была сделана попытка восстановления числа частиц в смеси по оцененным коэффициентам в. Однако подобные более сложные критерии обладали неустойчивостью, особенно при выборках небольшого объема.

После вычисления порогов можно перейти непосредственно к принятию решения о наличии в воздухе искомых аэрозолей. Для этого предлагается следующий алгоритм.

1. Для каждого фонового вещества рассчитывается абсолютный порог обнаружения искомого вещества. Для этого осуществляется интерполяция значений aj (r), полученных в ходе численного

эксперимента, описанного выше. Смысл этих порогов: если бы в смеси содержалось только одно фоновое вещество и, возможно, искомое вещество, то решение о наличии последнего было бы принято, если оценка числа частиц искомого вещества превысила порог.

2. Рассчитывается итоговый порог обнаружения как сумма абсолютных порогов по всем фоновым веществам.

3. Если оценка числа частиц искомого вещества превышает порог, принимается решения об обнаружении.

ТЕСТИРОВАНИЕ АЛГОРИТМА И ОБСУЖДЕНИЕ РЕЗУЛЬТАТОВ

Алгоритм тестировался на данных, полученных прибором [3] на тестовых образцах. Для решения задачи была разработана программа на языке R. Функциями программы являются:

1) генерация выборок смесей на основе реальных данных (bootstrapping);

2) выборочная оценка вероятности обнаружения фиксированного числа частиц искомого вещества при наличии в смеси фиксированного числа частиц фона; в примере использовалось по 100 подвыборок для построения каждой оценки;

3) поиск минимального числа частиц искомого вещества, при котором обнаружение выполнялось с выборочной оценкой вероятности не ниже 0.95;

Табл. 1. Обнаружение вещества БА 1 при разных концентрациях веществ фон 1, фон 2, фон 3 и почвенная пыль (1111)

Табл. 2. Обнаружение вещества БА 3 при разных концентрациях веществ фон 1, фон 2, фон 3 и почвенная пыль (ПП)

Тип Количество Количество Вероят-

фона частиц фоно- частиц ис- ность обна-

вого вещества комого вещества (минимум) ружения (оценка)

100 7 0.97

Фон 1 500 10 0.95

1000 14 0.995

100 6 0.97

Фон 2 500 11 0.98

1000 11 0.975

100 7 0.95

Фон 3 500 10 0.95

1000 12 0.985

100 5 0.97

ПП 500 8 0.95

1000 10 0.985

Тип Количество Количество Вероят-

фона частиц фоно- частиц ис- ность

вого вещества комого вещества (минимум) обнаружения (оценка)

100 50 0.805

Фон 1 500 80 0.79

1000 252 0.999

100 50 0.395

Фон 2 500 128 0.99

1000 252 0.985

100 50 0.37

Фон 3 500 128 0.85

1000 56 0.97

100 20 0.96

ПП 500 45 0.975

1000 252 0.998

для поиска такого числа частиц использовался специально разработанный алгоритм, построенный по образцу бинарного поиска, но учитывающий случайный характер целевой функции.

В табл. 1, 2 демонстрируются результаты тестирования для веществ БА 1 и БА 3. Для различных конфигураций фона ищется наименьшее число частиц искомого вещества, для которого гарантируется правильное обнаружение с вероятностью не ниже 0.95 и вероятностью ложного срабатывания не выше 0.05. По результатам, представленным в табл. 1, видно, что обнаружение БА 1 с вероятностью 0.95 возможно при концентрациях от 1 до 7 % (от общего количества зарегистрированных частиц) в зависимости от количества частиц и типа фонового вещества. Обнаружение БА 3 с вероятностью 0.95 возможно при концентрациях, не меньших 6 %, но при этом нужно накопление достаточно большого объема выборки — порядка тысячи замеров по частицам. При меньших объемах выборки такая достоверность не всегда достижима.

При вычислениях задавалось ограничение, что число частиц искомого вещества не должно превышать 30 % от числа частиц фона. Это объясняет тот факт, что приведенные в таблице вероятности обнаружения растут с ростом числа частиц.

Видно, что в некоторых случаях нельзя гарантировать вероятность обнаружения 0.95 ни при каком объеме выборки. Это объясняется следующими факторами:

- размер тестовой выборки был ограничен;

- распределение частиц некоторых искомых веществ похоже на распределение некоторых видов фона, поэтому они трудно отделимы в смеси.

Данные по веществу БА 2 соизмеримы с данными по БА 3. БА 4 обнаруживается с неудовлетворительной точностью ввиду описанных выше сложностей.

Для преодоления плохого разделения отдельных искомых веществ и фона необходимо повышение отношения сигнал/шум измерений либо использование дополнительных информативных признаков, см. [1], [3].

Полученные результаты могут быть полезны для других приборов на основе ПОМ.

СПИСОК ЛИТЕРАТУРЫ

1. Кочелаев Е.А., Волчек А.О. Способ оптической регистрации сигналов флуоресценции и рассеяния аэрозольных частиц в потоке и оптическая система для его осуществления. Патент (РФ) на изобретение № 2448340, 2012. Патентообладатель: ОАО "НПО Прибор".

2. Кочелаев Е.А., Волчек А.О. Оптическая система регистрации для проточно-оптического метода анализа биоаэрозолей // Оптический журнал. 2011. Т. 78, № 6. С. 23-30.

3. Pan Yong-Le. Detection and characterization of biological and other organic-carbon aerosol particles in atmosphere using fluorescence // Journal of Quantitative

Spectroscopy & Radiative Transfer. 2015. Vol. 150. P. 12-35.

4. Кочелаев Е.А., Волчек А.О., Елизаров Б.А., Сидоренко В.М.Исследование индикатрисы флуоресценции частиц биоаэрозоля: моделирование и эксперимент // Оптический журнал. 2012. Т. 79, № 6. С. 10-19.

5. Pan Yong-Le, Hill S.C., Pinnick R.G. et al. Fluorescence spectra of atmospheric aerosol particles measured using one or two excitation wavelengths: Comparison of classification schemes employing different emission and scattering results // Optics Express. 2010. Vol. 18, No. 12. P. 12436-12457.

6. Sivaprakasam V., Lin H.-B., Huston A.L., Eversole J.D. Spectral characterization of biological aerosol particles using two-wavelength excited laser-induced fluorescence and elastic scattering measurements // Optics Express. 2011. Vol. 19. P. 6191-6208.

7. Sivaprakasam V., Pletcher T., Tucker J.E. et al. Classification and selective collection of individual aerosol particles using laser-induced fluorescence // Appl. Opt. 2009. Vol. 48, No. 4. B126-B136.

8. PinnickR.G., Hill S.C., Nachman P. et al. Fluorescent particle counter for detecting airborne bacteria and other biological particles // Aerosol Sci. Technol. 1995. Vol. 23, No. 4. P. 653-664.

9. Королев В.Ю. EM-алгоритм, его модификации и применение к задаче разделения смесей вероятностных распределений. М.: Изд-во ИПИ РАН, 2007.

10. CRAN (Comprehensive R Archive Network). URL: (http://cran.r-project.org/web/packages/mclust/ mclust.pdf).

11. Torgo L. Data mining with R — learning with case studies. Boca Raton, FL: CRC Press. Torche, F., 2011.

12. Spector P. Data manipulation with R — Use R. New York: Springer, 2008.

13. Karian Z. et al. Handbook of Fitting Statistical Distri-

butions with R. CRC Press, Taylor and Francis Group, Chapman & Hall, 2011.

14. Everitt B. et al. Handbook of Statistical Analyses Using R. CRC Press, Taylor and Francis Group, 2010.

15. Cohen Y. et al. Statistics and Data with R — An Applied Approach Through Examples. Wiley, 2008.

16. Burnham K.P., Anderson D.R. Model selection and multimodel inference: a practical information-theoretic approach. Springer, 2002. 488 p. ISBN 0387953647.

17. CRAN. URL: (http://cran.r-project.org/web/packages/ maxLik/maxLik.pdf).

18. Floudas C.A., Pardalos P.M. Encyclopedia of Optimization. Springer Science & Business, 2008.

19. Королев В.Ю. Вероятностно-статистические методы декомпозиции волатильности хаотических процессов. М.: Издательство Московского университета, 2011.

Санкт-Петербургский государственный университет (Ермаков С.М., Рукавишникова А.И.)

ОАО "НПО Прибор", Санкт-Петербург (Волчек А.О.,

Кочелаев Е.А.)

Контакты: Рукавишникова Анна Игоревна, [email protected]

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Материал поступил в редакцию: 20.02.2015

ISSN 0868-5886

NAUCHNOE PRIBOROSTROENIE, 2015, Vol. 25, No. 2, pp. 27-33

A SELF-LEARNING ALGORITHM FOR DETECTION OF BIOLOGICAL AEROSOLS IN THE AIR

S. М. Ermakov1, A. I. Rukavishnikova1, A. O. Volchek2, E. A. Kochelaev2

1 Saint-Petersburg State University, Russia 2JSC "NPO Pribor", Saint-Petersburg, Russia

We propose an algorithm that uses data from the particle fluorescence spectrometer in order to take decision on presence of known pathogens in the air. Density estimates of measurements for particles of the known substances are constructed, percentage concentration of aerosol particles in the air is estimated. Decision on detection of dangerous substances is made with the use of thresholds, calculated at the training stage. The results of testing the algorithm are discussed.

Keywords: device, particle fluorescence spectrometer, EM-algorithms, mixture of distributions, function of maximum likelihood, density estimate, experimental data

REFERENСES

1. Kochelaev E.A., Volchek A.O. Sposob opticheskoy registrazii signalov fluoreszenzii i rasseyaniya aerozol'nych chastiz v potoke i opticheskaya sistema dlya ego osuschestvleniya [Way of optical registration of signals of fluorescence and dispersion of aerosol particles in a stream and optical system for its implementation]. Patent (Russian Federation) for the invention No. 2448340, 2012. Patent holder: Joint stock company " NPO Pribor". (In Russ.).

2. Kochelaev E.A., Volchek A.O. [Optical system of registration for a flowing and optical method of the analysis of bioaerosols]. Opticheskiy zhurnal [Optical magazine], 2011, vol. 78, no. 6, pp. 23-30. (In Russ.).

3. Pan Yong-Le. Detection and characterization of biological and other organic-carbon aerosol particles in atmosphere using fluorescence. Journal of Quantitative Spectroscopy & Radiative Transfer., 2015, vol. 150, pp. 12-35.

4. Kochelaev E.A., Volchek A.O., Elizarov B.A., Sidorenko V.M. [Research of an indikatrisa of fluorescence of particles of a bioaerosol: modeling and experiment]. Opticheskiy zhurnal [Optical magazine], 2012, vol. 79, no. 6, pp. 10-19. (In Russ.).

5. Pan Yong-Le, Hill S.C., Pinnick R.G. et al. Fluorescence spectra of atmospheric aerosol particles measured using one or two excitation wavelengths: Comparison of classification schemes employing different emission and scattering results. Optics Express, 2010, vol. 18, no. 12, pp. 12436-12457.

6. Sivaprakasam V., Lin H.-B., Huston A.L., Eversole J.D. Spectral characterization of biological aerosol particles using two-wavelength excited laser-induced fluorescence and elastic scattering measurements. Optics Express, 2011, vol. 19, pp. 6191-6208.

7. Sivaprakasam V., Pletcher T., Tucker J.E. et al. Classification and selective collection of individual aerosol

Contacts: Rukavishnikova Anna Igorevna, anyaruk@mail. ru

particles using laser-induced fluorescence. Appl. Opt, 2009, vol. 48, no. 4, B126-B136.

8. Pinnick R.G., Hill S.C., Nachman P. et al. Fluorescent particle counter for detecting airborne bacteria and other biological particles. Aerosol Sci. Technol., 1995, vol. 23, no. 4, pp. 653-664.

9. Korolev V.Yu. EM-algoritm, ego modifikazii i primenenie k zadache razdeleniya smesey veroyatnostnych raspredeleniy [EM algorithm, its modifications and application to a problem of division of mixes of probabilistic distributions]. Moscow, Izd-vo IPI RAN Publ., 2007.

10. CRAN (Comprehensive R Archive Network). URL: (http://cran.r-project.org/web/packages/mclust/ mclust.pdf).

11. Torgo L. Data mining with R - learning with case studies. Boca Raton, FL: CRC Press. Torche, F., 2011.

12. Spector P. Data manipulation with R - Use R. New York, Springer, 2008.

13. Karian Z. et al. Handbook of Fitting Statistical Distributions with R. CRC Press, Taylor and Francis Group, Chapman & Hall, 2011.

14. Everitt B. et al. Handbook of Statistical Analyses Using R. CRC Press, Taylor and Francis Group, 2010.

15. Cohen Y. et al. Statistics and Data with R - An Applied Approach Through Examples. Wiley, 2008.

16. Burnham K.P., Anderson D.R. Model selection and multimodel inference: a practical information-theoretic approach. Springer, 2002. 488 p. ISBN 0387953647.

17. CRAN. URL: (http://cran.r-project.org/web/packages/ maxLik/maxLik.pdf).

18. Floudas C.A., Pardalos P.M. Encyclopedia of Optimization. Springer Science & Business, 2008.

19. Korolev V.Yu. Veroyatnostno-statisticheskie metody dekompozizii volatil'nosti chaoticheskich prozessov [Probabilistic and statistical methods of decomposition of volatility of chaotic processes]. Moscow, Izdatel'stvo Moskovskogo universiteta Publ., 2011. (In Russ.).

Article received in edition: 20.02.2015

i Надоели баннеры? Вы всегда можете отключить рекламу.