Научная статья на тему 'Вейвлет-анализ звездной плотности астрометрических катало- гов'

Вейвлет-анализ звездной плотности астрометрических катало- гов Текст научной статьи по специальности «Физика»

CC BY
140
72
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ВЕЙВЛЕТЫ / ЗВЕЗДНЫЕ СКОПЛЕНИЯ / АСТРОМЕТРИЧЕСКИЕ КАТАЛОГИ / WAVELETS / STELLAR CLUSTERS / ASTROMETRIC CATALOGUES

Аннотация научной статьи по физике, автор научной работы — Витязев В. В., Цветков А. С.

Мы представляем быстрый и эффективный алгоритм поиска скоплений звезд и других неоднородностей звездной плотности массовых астрометрических каталогов. Наш подход основан на использовании одномерного вейвлет-преобразования, достаточного для исследования неоднородностей малых (до 1 градуса) масштабов. В каталоге NOMAD, содержащем более 1 миллиарда звезд, с помощью этого метода обнаружены известные и, по-видимому, новые звездные скопления в различных фотометрических полосах. Найдены также многочисленные артефакты каталога. Предлагаемая техника может быть использована при анализе будущих 147 массовых каталогов, в частности, данных, которые будут получены космическим аппаратом GAIA.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Wavelet analysis of stellar density in huge astrometric catalogues

The fast and effective wavelet technique for searching the heterogeneities of stellar density in large astrometric catalogues is presented. Our approach is based on one dimension wavelet transform which turned out to be sufficient for detecting small scale (up to 1 degree) details in stellar distribution on the celestial sphere. Among one billion NOMAD stars the known and unknown globular and open clusters have been detected in various photometric bands. A lot of artifacts in NOMAD data were found in addition. This technique can be used for catalogues of the nearest future including the products of GAIA mission.

Текст научной работы на тему «Вейвлет-анализ звездной плотности астрометрических катало- гов»

АСТРОНОМИЯ

УДК 524.4

ВЕЙВЛЕТ-АНАЛИЗ ЗВЕЗДНОЙ ПЛОТНОСТИ АСТРОМЕТРИЧЕСКИХ КАТАЛОГОВ*

В. В. Витязев1, А. С. Цветков2

1. С.-Петербургский государственный университет, д-р физ.-мат. наук, профессор, [email protected]

2. С.-Петербургский государственный университет, канд. физ.-мат. наук, доцент, [email protected]

1. Введение

Обнаружение звездных скоплений и их исследование является одной из основных задач галактической астрономии, поскольку распределение скоплений в пространстве, их кинематические характеристики и звездный состав отражают общие свойства диска Галактики. По современным оценкам в Галактике содержится около 100 000 скоплений, из которых в настоящее время выявлено около 2%. Успех поиска скоплений определяется двумя факторами. Во-первых, необходимо иметь звездные обзоры, содержащие данные

о миллионах звезд. Во-вторых, необходимы специальные математические методы, позволяющие перерабатывать огромные массивы данных в разумные сроки. В последнее время наблюдается взрывообразный процесс создания массовых астрометрических каталогов. Отметим здесь каталог TYCHO-2 [1], содержащий более 2.5 миллионов звезд. Каталог полон на 99% для V=11 и на 95% для V=11.5. Положения звезд были получены с помощью переработки измерений, сделанных в рамках проекта TYCHO на борту искусственного спутника HIPPARCOS, а в качестве первой эпохи для вывода собственных движений звезд было использовано около 140 наземных астрометрических каталогов. Временной базис приблизительно в 100 лет обеспечил высокую точность собственных движений звезд (1-3 мсд в год), а повторная обработка наблюдений, выполненных в космосе, дала точность координат около 10 мсд для V<9 и 100 мсд для V<12.

Использование современных технологий позволило наземной астрометрии создать каталоги, содержащие десятки и сотни миллионов звезд. Хорошим примером является

*Работа выполнена при финансовой поддержке РФФИ (грант №07-02-92114-ГФЕН-а) и Совета по грантам Президента РФ для государственной поддержки молодых российских ученых и ведущих научных школ (грант № НШ-1323.2008.2).

© В.В.Витязев, А.С.Цветков, 2009

проект UCAC (USNO CCD Astrographic Catalog). Предварительная версия этого каталога UCAC2 [2] содержит 48 миллионов звезд от южного полюса небесной сферы до склонения +50 градусов. Координаты звезд измерены на 8-дюймовом рефракторе в Чили и во Флагстаффе (США). Для звезд ярче 12.5 звездной величины собственные движения были получены с привлечением наблюдений на спутнике HIPPARCOS по методике TYCHO-2, для более слабых звезд использовались измерения пластинок, снятых по программам Lick Northern Proper Motions (NPM) и Southern Proper Motions (SPM). Позиционная точность колеблется от 20 до 70 мсд, в зависимости от блеска звезд; ошибки собственных движений звезд составляют 1-7 мсд в год и также зависят от звездной величины. После завершения этот каталог охватит все небо и будет содержать 80 миллионов звезд от V=7.5 до V=16.5. Прогнозируемая точность координат звезд составит 15-70 мсд, а точность собственных движений звезд будет находиться в интервале от 1 до 5 мсд в год.

В настоящее время своеобразным рекордсменом стал каталог USNO-B1.0, в котором содержится информация о 1 042 618 261 звезде [3]. Этот каталог представляет собой полный список звезд до V=21, построенный с помощью оцифровки пластинок нескольких фотографических обзоров неба. В каталоге B1.0 приведены прямые восхождения, склонения, собственные движения и оценки блеска звезд. Позиционная точность на современную эпоху оценивается величиной 200 мсд. Точность определения собственных движений звезд не приводится.

Для удобства использования столь обширных данных в Военно-морской обсерватории США создана астрометрическая база данных NOMAD (Naval Observatory Merged Astrometric Dataset) [4]. Для более чем 1 миллиарда звезд в ней приведены наиболее точные координаты, собственные движения и многополосная фотометрия, включая ближнюю инфракрасную область, заимствованную из проекта 2MASS. Средняя плотность каталога достигает нескольких десятков тысяч звезд на кв. градус.

Массовые каталоги звезд, ставшие доступными астрономической общественности в последние годы, позволяют поставить целый ряд новых задач, решение которых ранее не было доступным. Однако работа с такими огромными массивами данных сопряжена со значительными вычислительными трудностями. Отметим здесь, что авторы каталога NOMAD не представили пользователям никаких программных продуктов, способствующих работе с этой базой данных.

Настоящая статья ставит перед собой две цели. Первая из них — это разработка необходимых программных средств доступа к массиву данных NOMAD. Второй целью является поиск рассеянных скоплений в Галактике. Для выявления неоднородностей в распределении звезд на небесной сфере будет применяться техника вейвлет-преобразования. В наших предыдущих исследованиях [5], проводимых по данным каталога TYCHO-2, содержащего около 2,5 млн. звезд, была показана высокая эффективность применения вейвлет-анализа для выделения скоплений звезд, а также для оценки вероятности присутствия в областях повышенных концентраций звезд физических скоплений. Усовершенствованное программное обеспечение и полученные результаты в будущем смогут быть использованы для обработки данных для 1 млрд. звезд, ожидаемых в результате выполнения миссии GAIA.

2. Каталог NOMAD

Каталог NOMAD является компиляцией нескольких астрометрических каталогов: Hipparcos [6], UCAC2 [2], Tycho-2 [1] и USNO-B [3], кроме этого для примерно половины всех звезд в каталог включены данные о фотометрии в полосах J, H, K, взятые из

проекта 2MASS [7]. Около 340 млн. звезд имеют данные о собственных движениях. Скажем только, они очень разнородные и имеют низкую точность. В данной работе мы не будем их рассматривать. Конечно же, в каталоге такой мощности отсутствуют параллаксы.

Для звезд каталога NOMAD приведены данные о шестиполосной фотометрии в диапазонах B, V, R, J, H, K. Однако далеко не для всех звезд имеются все шесть звездных величин одновременно, а точность значений B, V и, особенно, R оставляет желать лучшего. В таблице 1 представлены данные о наличии фотометрии. Следует отметить, что наличие данных в полосах B, V, R носит существенно зонный характер. Существуют площадки небесной сферы, в которых данных много, и наоборот, существуют площадки, в которых данных почти нет, либо данные носят выборочный характер. Данные о звездных величинах J, H, K (заимствованные из каталога 2MASS) значительно менее подвержены наблюдательной селекции.

Таблица 1. Число звезд каталога NOMAD с фотометрическими данными

Полоса Есть данные Нет данных

В 912 млн. 205 млн.

V 267 млн. 850 млн.

R 1 млрд. 117 млн.

J, Н, К 471 млн. 647 млн.

Распределение звездной плотности показано на рис. 1. Как мы видим, каталог охватывает весьма обширные области галактики, поскольку хорошо виден не только галактический диск, но и центральный балдж. Звездная плотность в отдельных направлениях превосходит 1 млн. на кв. градус! Каталог содержит даже звезды некоторых ярких галактик (рис. 2)!

Рис. 1. Распределение звездной плотности каталога NOMAD.

Основная информация каталога — информация о звездных величинах и звездной плотности в различных фотометрических полосах. Такая информационная структура каталога позволяет решать не только задачи малого поля (звездные карты отдельных областей, например, для идентификации объектов, поиска малых планет и т.п.), но и глобальные задачи, когда важна информация всего каталога как единого целого. Одной их таких задач может быть задача поиска неизвестных рассеянных (или даже шаровых) звездных скоплений и иных аномалий в концентрации звезд.

Рис. 2. Карта распределения звезд каталога NOMAD в окрестности галактики M31.

3. Одномерный вейвлет-анализ

Развитие техники вейвлет-анализа дает мощный аппарат для решения подобного рода задач. Существует большое разнообразие вейвлет-техник: вейвлеты на плоскости, используемые при анализе фотопластинок и ПЗС-изображений, и даже специальные вейвлеты на сфере [8], применяющиеся при анализе фонового микроволнового излучения. Вейвлеты на плоскости применялись нами ранее [5] при анализе звезд каталога Tycho-2. Однако неоднородности, которые представляют для нас интерес в настоящей статье, имеют малый размер (не более одного-двух десятков угловых минут), поэтому мы предложим более простой способ проведения обзора всей небесной сферы с помощью одномерного вейвлет-анализа [9] с использованием MHAT-функции. Как оказалось, одномерный анализ позволяет существенно ускорить вычисления, что очень важно при работе с большими каталогами. Предположим, что у нас имеется одномерный и равномерный ряд какой-либо величины, например, звездной плотности с постоянным шагом по галактической долготе для выбранного значения галактической широты. С помощью техники вейвлет-анализа мы можем выделить неоднородности разных масштабов в этом ряду. Приведем основные формулы, решающую данную задачу.

Пусть Хк — ряд исходных значений, At — шаг выборки, N — число точек ряда:

xk = x(tk), tk = At • к, к = 1, 2,..., N. (1)

В качестве первого этапа обработки найдем среднее значение ряда

1 N

(*> = ^ Xk k=1

и центрируем ряд

х°к = Хк — (х), к = 1, 2, . .., N. (3)

Оценим также дисперсию ряда

1 N

" К)2, (4)

1 N

N — 1 ^(

fc=i

которая будет использована в критерии значимости (13).

В качестве вейвлет-функции в нашей задаче будем использовать так называемый MHAT-вейвлет (Mexican HAT, «Мексиканская шляпа»):

v>(t) = (1 — t2)e-t2/2. (5)

В случае MHAT-вейвлета дискретное вейвлет преобразование описывается следующими выражениями [9]:

W(a,i,bj) = '^^х°к'Ф (~ ~ ) ; (6)

nKA') к=1 V а 1

N / 1 / . 7, \ 2^

1 / tk bj

”э) -^ехР —2

к=1 V

Здесь а* = гДа — масштаб вейвлета; 6о- = ^’Д6 — сдвиг вейвлета.

Для практической реализации мы должны договориться о дискретизации аргументов. В нашем случае удобно принять шаг масштаба и сдвига равными друг другу и равными шагу Д£:

Да = Д6 = Д£. (8)

Как мы увидим, это позволит сильно упростить формулы, применяемые в вычислениях. Функция (5) сильно локализована в пространственной области. Можно показать, что

/<1 - ^ *< 0.01 (.,

для Ь « 3.6, что позволяет значительно уменьшить число слагаемых в формулах (6) и (7). Окончательно, принимая во внимание (8), мы можем записать

И'.; ' (10)

щ о V г

к=0~0*

(11)

в этих выражениях граница индексов суммирования будет записываться как ]* = [3.6 г].

В вейвлет-анализе существует еще одна проблема — краевые эффекты, которые ограничивают допустимые значения индекса ] в формулах (10), (11), так как происходит выход за границу массива Хк. В случае анализа звездной плотности вдоль круга

заданной широты эти эффекты отсутствуют в силу замкнутости на себя ряда Хк, а именно, всегда можно считать Хк+N = Хк и Хк-N = Хк, где N — общее число элементов массива.

Формулы (10) и (11) имеют еще один плюс — они, насколько это возможно, оперируют с целыми числами, что положительно влияет на производительность вычислений.

В качестве результата вейвлет-анализа обычно рассматривают не сами элементы массива Wi}j, а квадраты их модулей. В нашем случае оказалось более целесообразным использовать не квадрат модуля, а величину

Si,j = Wi,j • |Wi,j|. (12)

Положительное значение величины Si,j свидетельствует о повышенной концентрации звезд по сравнению с окружающими областями, а отрицательное — о пониженной. Массив значений Si,j (или |Si,j |) в вейвлет-анализе часто называют скалограммой.

К полученному массиву значений Si,j нужно применить еще критерий выделения сигнала из шума. Поскольку для чисто шумового сигнала значения квадратов вейвлет-преобразования (6) представляют собой случайные величины, распределенные по закону хи-квадрат с одной степенью свободы, можно показать, что значение |Si,j | является статистически значимым с вероятностью p в случае, если

|Si,j| > ^Zi,j Тр, (13)

где порог обнаружения сигнала Zi,j Тр определяется следующими величинами:

^ = )> (14)

n2(ai,bj) к=1 V а )

Р = erf (^[y^ ’ (15)

2 (x

erf(x) = —= exp (—t2)dt. (16)

Vn Jо

4. Пример одномерного вейвлет-анализа

Для начала проведем вейвлет-анализ модельного ряда Хк, содержащего две концен-

трации разного масштаба (рис. 3). Мы видим, что на вейвлет-изображении «скопление» меньшего размера находится в области меньших масштабов, максимальное значение соответствует 20°. При резкой границе неоднородностей возникают «дифракционные»

лепестки с отрицательной плотностью.

Рассмотрим теперь пример вейвлет-анализа реальной области небесной сферы, рас-

положенной вдоль малого круга небесной сферы, ограниченной галактическими широ-

тами 6 = +32° ± 0.5°. В качестве ряда данных Хк возьмем средние значения звездной

плотности с шагом Д^; = 10'. В силу принятого нами соотношения (8) это же значение

будут иметь шаг сдвига Д6 и шаг масштаба Да. Осталось определиться с максимальным

размером масштабов искомых неоднородностей плотности. Хотя теоретически возмо-

жен поиск неоднородностей с угловым размером вплоть до 180°, в нашем случае это

не имеет никакого смысла. Угловой размер рассеянных звездных скоплений в большинстве не превышает с! =1°, поэтому мы можем ограничиться диапазоном индекса

Рис. 3. Вейвлет-преобразование (верхний рисунок) тестового ряда (нижний рисунок).

г < (1/ Аа. На рис. 4 представлен фрагмент вейвлет-анализа звездной плотности в области галактических долгот -170° —120°. В районе I = -153° вейвлет-анализ показывает отчетливую концентрацию, вызванную звездным скоплением М 44 (Ясли). Конечно, в данном случае эта концентрация заметна непосредственно на графике звездной плотности (нижняя часть рис. 4), но, как мы увидим далее, метод вейвлет-анализа позволяет обнаруживать аномалии концентраций и в менее очевидных случаях.

со

Тй йЗо йЗо I

Рис. 4. Пример вейвлет-преобразования в области звездного скопления Ясли.

5. Вейвлет-обзор всей небесной сферы

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Для широкомасштабного поиска локальных неоднородностей звездной плотности был предложен следующий алгоритм.

• Задавался некоторый критерий отбора звезд, например, по принадлежности звезды заданному диапазону звездной величины в определенной полосе.

• Выполнялось деление небесной сферы на узкие (обычно 1° или 0.5°) зоны по галактической широте, которые затем разбивались на площадки с заданным шагом по долготе (от 5' до 10').

I = _30° 05286 / = 60°

ч:

05236

Q646^

05286 / 60'

0511

С

b

b=30°—

Рис. 5. Фрагмент вейвлет-обзора небесной сферы с нанесенными объектами каталога N00.

• Для каждой площадки определялась звездная плотность, таким образом, строился ряд данных хк для каждой зоны.

• Полученные ряды звездной плотности по долготе для всех значений галактической широты обрабатывались с помощью техники вейвлет-анализа.

Далее, возникает вопрос о визуализации полученных массивов как единого целого. Построение трехмерного изображения всей небесной сферы не только проблематично, но и не будет обладать большой наглядностью. Для того чтобы остаться в рамках двух измерений, преобразуем скалограмму Si,j в одномерный массив Оj•, называемый скейлограммой:

Задавая разные значения пределов суммирования imin и imax, можно сделать так, чтобы скейлограммы отражали более или менее крупные детали. Например, суммируя от imin = 1 до imax = 6 при Да = 10', мы получаем в скейлограмме следы от деталей, размер которых заведомо меньше 1°. Напротив, задавая imin > 6, мы переходим к изучению структур размером больше 1°. Таким образом, скейлограмма хотя и преобразует одномерный массив xk в одномерный же Gj, однако, варьируя значения imin и imax, мы можем фильтровать масштаб видимых в скейлограмме деталей.

Полученные для каждого круга галактической широты скейлограммы можно отображать в какой-либо проекции небесной сферы, например в широко распространенной проекции Айтоффа [6]. Такие изображения мы назвали вейвлет-обзорами небесной сферы. При значении Д£ = 10' и менее такие вейвлет-обзоры представляют собой весьма большие изображения (3000 х 1500 точек и больше) и опубликованы в интернете на сайте Астрономического института СПбГУ [10]. В данной работе мы показываем лишь фрагмент одного изображения (рис. 5), построенного для выборки звезд, имеющих звездную величину J = 14m ^ 16m. Выделение сигнала из шума произведено с заданной вероятностью p = 0.99. На полученный вейвлет-обзор мы нанесли объекты каталога Revised NGC [11].

Анализ данного изображения показывает, что мы должны рассматривать три класса объектов:

• известные объекты, выделяемые методом вейвлет-анализа;

(17)

• известные объекты, не обнаруживаемые методом вейвлет-анализа;

• неизвестные объекты, выделяемые методом вейвлет-анализа.

Если с первыми объектами все понятно, то уже вторые нуждаются в объяснении. Действительно, звездные скопления видны не во всех диапазонах звездных величин. Например, такое звездное скопление как Плеяды (М 45) не заметно в области слабых звезд, зато прекрасно выделяется вейвлет-анализом при переходе к звездам с блеском

8т_10т

Наибольший интерес для нас представляет третий класс объектов: области повышенной концентрации звезд, которые не отмечены в каталогах шаровых [12] и рассеянных [13] звездных скоплений. Можно надеяться на открытие новых, ранее неизвестных рассеянных скоплений в ИК-диапазоне при использовании звездных величин ^ К, Н или И. Похоже, это имеет место в области с координатами I = -47°, Ь = +32°, которая показана на рис. 6, хотя этот факт нуждается в уточнении.

Рис. 6. Вероятно найденное слабое рассеянное скопление.

Иногда мы встречаемся с объектами, природу которых еще надо выяснять. Например, в области с координатами I = -57, Ь = 40.5 мы видим странную полосу, которая, в принципе, может быть галактикой, видимой с ребра (рис. 7), но может быть и чем-то иным.

Однако значительная часть обнаруженных пиков звездной плотности является образованиями совсем другого рода, не связанными с реально существующими объектами. Например, рассмотрим четко выделенный объект на рис. 5, расположенный рядом с N00 5236. На рис. 8 мы видим, что из-за автоматического построения каталога в него по ошибке попали дифракционные лучи яркой звезды, и эти лучи записаны в каталоге как звезды! Следует сказать, что в полосе И такие артефакты нами были выявлены ранее, но мы не ожидали что и в каталоге 2МЛ88 мы встретимся с подобными явлениями (хотя и в меньшем количестве).

Рис. 7. Объект неизвестной природы.

Рис. 8. Артефакт каталога — дифракционные лучи.

6. Заключение

Данная работа является первым шагом в области вейвлет-обзоров больших каталогов. На следующей стадии будет построен каталог обнаруженных объектов и их классификация. Применение техники вейвлет-анализа может помочь в решении и чисто астрометрической задачи — улучшения каталога, избавлении его от ошибочных данных.

1. Hog E. et al. Tycho-2 // Astron. Astrophys., 2000. Vol. 355, L27.

2. Zacharias N. et al. UCAC2 // Astron. J., 2004. Vol. 127. P. 3043.

3. Monet D. G. et al. USNO-B // Astron. J., 2003. Vol. 125. P. 984.

4. Naval Observatory Merged Astrometric Dataset, http://www.navy.mil/nomad (2002).

5. Kazakevich E., Vityazev V., Orlov V. Tycho-2: Search for Stellar Groups using Wavelet Transform // ASP Conf. Ser. Order and Chaos in Stellar and Planetary Systems. Vol. 316. 2004. P. 243-246.

6. ESA. The Hipparcos and Tycho Catalogues 1997, ESA SP-1200, (1997).

7. 2MASS. URL: http://www.ipac.caltech.edu/2mass/releases/allsky/

8. McEwen J. D., Hobson M. P., Mortlock D. J., Lasenby A. N. // IEEE Transactions on Signal Processing, 2005.

9. Витязев В. В. Вейвлет-анализ временных рядов. СПб.: Изд-во С.-Петерб. ун-та, 2001.

10. URL: http://astro.pu.ru.

11. Sulentic J. W., Tifft W. G. Revised New General Catalogue of Nonstellar Astronomical Objects. Tuscon (1977).

12. Harris W. E. A catalog of parameters for globular clusters on the Milky Way // Astron. J., 1996. Vol. 112. P. 1487.

13. Dias W. S., Alessi B. S., Moitinho A., Lepine J. R. D. New catalog of optically visible open clusters and candidates (V2.8) // Astron. Astrophys., 2002. Vol. 389. P. 871.

Статья поступила в редакцию 30 июля 2009 г.

i Надоели баннеры? Вы всегда можете отключить рекламу.