Научная статья на тему 'Классификация ядер ПКИ по пространственно-временному распределению черенковского света широких атмосферных ливней с использованием метода опорных векторов'

Классификация ядер ПКИ по пространственно-временному распределению черенковского света широких атмосферных ливней с использованием метода опорных векторов Текст научной статьи по специальности «Математика»

CC BY
93
34
i Надоели баннеры? Вы всегда можете отключить рекламу.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Журенков О. В.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Классификация ядер ПКИ по пространственно-временному распределению черенковского света широких атмосферных ливней с использованием метода опорных векторов»

УДК 537.591.15

О.В. Журенков

Классификация ядер ПКИ по пространственновременному распределению черенковского света широких атмосферных ливней с использованием метода опорных векторов

В настоящее время для изучения химического состава первичных космических лучей (ПКЛ) энергии свыше 1012 эВ используются установки наземного базирования, которые регистрируют широкие атмосферные ливни (ШАЛ), порождаемые первичными частицами, вошедшими в атмосферу. Такие установки, как правило, включают в себя систему атмосферных черенковских телескопов (АЧТ), с помощью которой можно измерять такие характеристики черенковского света ШАЛ, как пространственное и пространственно-временное распределение. Информация, полученная на основе черенковской компоненты ШАЛ, обеспечена большой статистикой, поэтому самые эффективные методы оценки параметров ПКИ строятся на ее основе. Наиболее перспективные технологии основываются на пространственно-угловом распределении черен-ковского света ШАЛ (так называемом двумерном распределении), получаемом с помощью имиджинговых АЧТ, однако такие телескопы стоят намного дороже обыкновенных АЧТ. Наш подход основывается на пространственно-временном распределении и может быть реализован на многих действующих установках без дополнительных технических затрат.

Для классификации сложных многопараметрических объектов (в данном случае пространственно-временное распределение черенковско-го света ШАЛ таковым и является) используют алгоритмы самоорганизации, такие как адаптивные нейронные сети, эволюционные, генетические алгоритмы и т.п.

В предыдущей работе мы провели исследования возможности классификации первичных ядер, используя многопараметрический анализ пространственно-временного распределения черенковского света ШАЛ [1, 2]. Для этого мы применяли параметры временного импульса, взятого на разном удалении от оси ливня, т.е. не полное пространственно-временное распределение, а лишь его параметрическое описание.

В наших расчетах использовались данные о времени регистрации черенковских фотоэлектронов, полученные в результате моделирования ШАЛ программой «ALTAI». Эта программа

предназначена для детального моделирования методом Монте-Карло черенковского света ШАЛ, инициированного первичной частицей сверхвысокой энергии. Она хорошо зарекомендовала себя в течение многих лет эксплуатации, в том числе в международном проекте HEGRA. Подробное описание алгоритмов вычислительной программы можно найти в [3].

Для моделирования эксперимента была выбрана геометрия установки в виде квадратной решетки (5x5 телескопов) с шагом 50 м. Схема размещения телескопов представлена на рисунке 1. Положение оси ливня разыгрывалось в центральном квадрате размером 150x150 м.

о-0-00......

Рис. 1. Геометрия установки

Параметры всех телескопов одинаковы: радиус зеркала - 1 м, фокусное расстояние f = 1,5 м, угол зрения телескопа a = 10о. Порог срабатывания (условие запуска телескопа) - I = 150 ф.э.,

w «/ / порог 1 7

установка запускается при условии одновременного срабатывания 16 телескопов. Нами моделировались только вертикальные ливни, уровень наблюдения был выбран 800 г/см2, что соответствует 2200 м над уровнем моря (примерный уровень установки AIROBICC [4]). Следует отметить, что именно такой установки в действительности

111

не существует, однако имеются установки с близкими техническими характеристиками и регулярным расположением телескопов, такие как АШОВ1СС [4], ТиЫКА-13 [5, 6], РагсЬшап [7].

Мы использовали три группы первичных ядер: Н, О и Ее. Для каждого типа первичного ядра было смоделировано по шесть основных банков событий*, соответствующих различным диапазонам энергии (см. табл. 1). Число событий в каждом банке уменьшается с 1500 (для 1-го банка) до 100 (для 6-го банка), при этом размер каждого файла (или, что то же самое, количество фотоэлектронов от всех событий в банке) примерно одинаков. Хотя в нашем подходе использовалось упрощенное, ступенчатое представление энергетического спектра (внутри каждого диапазона события распределены равномерно), с ростом энергии размер диапазона увеличивается, а число событий уменьшается, таким образом, с ростом энергии среднее число частиц на 1 ТэВ уменьшается, что отражает качественную картину энергетического спектра ПКИ в этом диапазоне.

Таблица 1

Структура энергетических диапазонов (банков данных) для разных первичных ядер

Соответствие банков разных первичных частиц выбиралось из условия близости среднего значения полного вклада черенковского света в показания детекторов (аналогичный подход используется на Тянь-шаньской установке [8]):

- 1 N- - - 1 к

I = N Е In. I = к ЕI. (1)

N і n=1 K k=1

где N. - число зарегистрированных событий

в i-м банке, а для каждого (n-го) события I -средний вклад в детектор, здесь K - количество запустившихся детекторов.

Для запуска детектора число фотоэлектронов должно превысить выбранный нами порог 15G ф.э. и выполниться условие запуска установки (так называемый триггер) - число одновременно сработавших детекторов должно быть не меньше N = 16. Число N было выбрано

trig trig 1

как максимальное число телескопов, образующих квадрат и почти не снижающих число прошедших отбор событий. По такому принципу проводилась оценка энергии неизвестного первичного ядра.

В нашем модельном эксперименте дополнительные ошибки вносятся не только неточностью определения энергии, но и за счет погрешности оценки положения оси ШАЛ. Для определения координат (х, у) оси ливня (в плоскости установки) используется простой метод (подробно он описан в [9]): выбираются 9 телескопов с наибольшими амплитудами, тогда х и у вычисляются как

Е *i. Е yi

i=1 9 ’ y II

№ №

(2)

где х , уі - координаты і-го телескопа, а вес I. равен полному числу фотоэлектронов в і-м телескопе.

Пространственно-временное распределение было восстановлено с шагом по времени Ді = 0,25 нс и шагом по расстоянию от оси ливня (прицельным параметром) Дг = 25 м. Таким образом, были получены пространственно-временные распределения черенковского света ШАЛ, для примера, на рисунке 2 приведены распределения че-ренковских фотонов ШАЛ одиночных событий.

Рис. 2. Пространственно-временные распределения черенковского света ШАЛ инициированных первичными ядрами Н: а - Е = 20^30 ТэВ; б - Е = 30^50 ТэВ и Ее; в - Е = 50^70 ТэВ

Данные, по которым в дальнейшем будет проводится идентификация первичных ядер.

В нашем описании пространственно-временное распределение представляет собой массив размером 11x400. Для классификации первичных ядер по такому распределению был использован метод опорных векторов или SVM (Support Vector Machine), реализованный в свободно распространяемой программе Торстена Джоаким-са (Thorsten Joachims) SVM-lite [10].

SVM представляет собой алгоритм обучения «с учителем» задаче распознавания объектов двух классов (подробнее см., например: [11] или [12, с. 22-38]). Этот метод хорошо работает с данными больших объемов, представленными в упакованной форме (в виде векторов большого размера без нулевых элементов). Классифицирующая функция представляется в виде линейной комбинации скалярных произведений тестового вектора с опорными векторами из тренировочного набора. Таким образом, можно использовать линейный классификатор для корректной работы с нелинейно разделяемыми классами без существенного усложнения вычислений.

Для обучения применялись пространственновременные распределения, построенные по достоверно известным значениям энергии и прицельному параметру (расстоянию от оси ливня). Для тестирования использовались те же банки событий, однако прицельный параметр и энергия получены на основе восстановленного пространственно-временного распределения. Таким образом, на основе одних и тех же смоделированных данных были получены разные наборы данных - для обучения и тестирования.

Для решения многоклассовой задачи классификации методом SVM можно использовать разные стандартные подходы. Предварительно мы опробовали способы «каждый против всех» (такой подход применялся нами в работе [2]), «каждый против каждого» и «турнир на выбывание». Наилучший результат показал последний способ, к тому же он является наиболее быстрым [12].

Для классификации способом «турнир на выбывание» было создано три модели: «ядра H против ядер О», «ядра H против ядер Fe», «ядра F e против ядер О». Для каждого события двумерное пространственно-временное распределение преобразовывалось в одномерное: строился вектор в виде набора пар - N : I (t, r) , где N - порядковый номер ячейки в одномерном представлении пространственно-временного распределения; I (t, r)- количество фотоэлектронов, соответствующих этой ячейке.

Такие пары записывались только для ненулевых значений I (t, r). Первым элементом вектора записывалась ‘1’ - для событий Z1 и 1’ — для событий Z2. Таким образом, было получено

по три модели для каждого из шести энергетических банков (см. табл. 1).

Количество опорных векторов, определяющих классифицирующую функцию, зависит не только от размера обучающей выборки, но и от класса первичных ядер, «составляющих» модель (см. рис. 3 а-в). Так как больше всего отличаются ядра Н и Ее, то для модели Н-Ее требуется меньше опорных векторов: -100^600 при изменении размера обучающей выборки от ~170 до 3000 (см. рис. 3б). Наиболее похожими ядрами являются О и Ее, поэтому для модели Ее-О требуется больше опорных векторов: -160^1850 при таких же размерах обучающей выборки (см. рис. 3в).

В результате работы классификатора каждому вектору (событию) было сопоставлено число - значение классифицирующей функции. Если это число положительное, то событие относилось к классу 21, а если отрицательное, то - к классу Ъ2, причем, чем больше абсолютное значение этого числа, тем больше уверенности в правильности решения. Таким образом, после проведения «турнира» каждое событие было отнесено к одному из трех классов.

Для каждого типа ядра Ъ мы сосчитали вероятность правильного определения и эффективность классификации

к0 =

Полученные результаты классификации представлены на рисунках 3г-е и в таблице 2.

Таблица 2

Эффективность классификации первичных ядер

Как и следовало ожидать, наибольшее число ошибок приходится на ядра О. Такой результат не противоречит теории и хорошо согласуется с известными экспериментальными данными и результатами моделирования, использующими трехкомпонентную модель ПКИ (см., например: [13, 14]).

Низкая эффективность для ядер Н (в 5 и 6 энергетическом диапазоне) и О (в 4 и 5 энергетическом диапазоне), видимо, связана с недостаточным размером (<400) обучающих выборок (рис. 3-а, в, д). В работе [2] размер обучающих выборок был взят 900. Следует отметить, что в данной работе, в отличие от [2], моделирование выполнялось в условиях, приближенных к реаль-

113

2500

2000

1500

1000

500

о

Кал ичествэ опорный векторов ♦ Размер обучающей выборки .......

—Г™*»

1 2 3 4 5 6

Энергетичеа<ий диапазон

100

80

VO 0^ 66

Q.

LL 40

20

0

P X 0 * x, статистика; * -

►— — *>-— /\,У / \.

A j ~-/\ -1 ■! : t - і Ж ! , Г

&

300 03 О-

2 3 4 5

Энергетический диапазон

3000

2500

2000

1500

1000

500

О

1 2 3 4 5

Энергетический диапазон

Количество спорных векторов * Размер Обучающей выборки 100 80 Р X О • статистика * \

vP 0х 60 V / \ \ і \ \ •' \

о CL 40 > / X V / V *::A4-vW\ /

Л І j 20 ‘ Лі''' ■ ..X' j

, і , Г * t t 4=^ 0>

1 2 3 4 5

Энергетический диапазон

1500

S

1200 *

ь

900 р і 600

300 (О

Q.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

д

3000

2500

2000

1500

1000

500

О

кшичёствЕопорных^оаорбв * Размер обучающей выбфки :=::э

t4

\

\

^

2 3 4 5

Энергетический диапазон

100

80

N° о4 60

<5

ll_

Cl 40

20

0

1500

Т\

.У І Ї

статистика і=

\

S

1200 *

300 G3

О.

2 3 4 5

Энфгетический диапазон

Рис. 3. Зависимость числа опорных векторов от размера обучающей выборки для моделей: а - Н-О; б - Н-Ее; в - Ее-О и результат классификации ядер г - Н; д - О; е - Ее

ным, - энергия и положения оси при моделировании ШАЛ варьировались, а затем восстанавливались по функции пространственно-временного распределения черенковского света ШАЛ.

Несмотря на близкие свойства ядер, данная методика (в условиях надежной статистики) все же позволяет с высокой вероятностью распознать ядра Ее (Кре »5 г 65) и с хорошей вероятнос-

тью распознать ядра Н (Кн »2,8 г 3,3) и ядра О (К »1,4 г 3,3).

Данный подход работает гораздо эффективней использованного нами метода комплексиро-вания аналогов в работе [15], особенно для ядер О и Ее. Однако следует отметить, что метод ком-плексирования аналогов может эффективно работать с меньшим набором обучающих данных.

114

Литература

1. Бессонов А.С. Классификация ядер ПКИ по параметрам пространственно-временного распределения черенковского света ШАЛ с использованием нейронных сетей класса многослойного перцептрона / А.С. Бессонов, О.В. Журенков // Известия АГУ. 2004. №1.

2. Журенков О.В. Использование пространственно-временного распределения черенковского света ШАЛ для классификации ядер ПКИ / С.Е. Татарин-цев, О.В. Журенков // Известия АГУ. 2004. №1.

3. Konopelko A.K. ALTAI: computational code for simulations of TeV air showers as observed with the ground based imaging atmospheric Cherenkov telescopes / A.K. Konopelko, A.V. Plyasheshnikov // J. Phys. G: Nucl. Part. Phys. 2000. Vol. 26.

4. The wide angle air Cherenkov detector AIROBICC at La Palma / V. Fonseca, F. Arqueros, S. Bradbury et al. // Proc. of 24-th ICRC. Roma, 1995. Vol. 1.

5. TUNKA-13 EAS Cherenkov light array. http:// www.tunka.bhg.ru.

6. Tunka EAS Cherenkov array - status 2001 / N. Budnev, D. Chernov, V. Galkin et al. // Proc. of 27-th ICRC. 2001. Vol. 1.

7. Very High Energy Gamma Ray Astronomy. http://www.tifr.res.in/sns.html.

8. Yakovlev V.I., Zhukov V.V. Energy dependence of EAS parameters / V.I. Yakovlev, V.V. Zhukov // Proc. of 27-th ICRC. 2001. Vol. 1.

9. Журенков О.В. К вопросу определения положения оси широкого атмосферного ливня в экспериментах, оснащенных системой атмосферных черенковс-ких телескопов // Известия АГУ. 2001. №1.

10. SVM-Light Support Vector Machine. http:// svmlight.joachims.org.

11. Cortes C. Support-vector networks / C. Cortes, V. Vapnik // Machine Learning. 1995. Vol. 20, № 3. citeseer.ist.psu.edu/cortes95supportvector.html.

12. Мерков А.Б. Основные методы, применяемые для распознавания рукописного текста. http://www.recognition.mccme.ru/pub/ RecognitionLab.html/methods.html.

13. Alessandro B., for THE EAS-TOP COLLABORATION. Study of the composition around the knee through the electromagnetic and muon detectors data at EAS-top // Proc. of 27-th ICRC. 2001. Vol. 1.

14. Nonparametric determination of energy spectra and mass composition of primary cosmic rays for slant depth / M. Roth, T. Antoni, W.D. Apel et al. // Proc. of 27-th ICRC. 2001. Vol. 1.

15. Yushkov A.V. Using of the analog complexing of parameters of space-temporal distribution of the eas cherenkov light for the analysis of the mass composition of cosmic rays / A.V. Yushkov, O.V. Zhurenkov // Proc. of 29-th ICRC, HE Abstracts. Puna, 2005.

i Надоели баннеры? Вы всегда можете отключить рекламу.