АСТРОНОМИЯ
УДК 524.4
ВЕЙВЛЕТ-АНАЛИЗ ЗВЕЗДНОЙ ПЛОТНОСТИ АСТРОМЕТРИЧЕСКИХ КАТАЛОГОВ*
В. В. Витязев1, А. С. Цветков2
1. С.-Петербургский государственный университет, д-р физ.-мат. наук, профессор, [email protected]
2. С.-Петербургский государственный университет, канд. физ.-мат. наук, доцент, [email protected]
1. Введение
Обнаружение звездных скоплений и их исследование является одной из основных задач галактической астрономии, поскольку распределение скоплений в пространстве, их кинематические характеристики и звездный состав отражают общие свойства диска Галактики. По современным оценкам в Галактике содержится около 100 000 скоплений, из которых в настоящее время выявлено около 2%. Успех поиска скоплений определяется двумя факторами. Во-первых, необходимо иметь звездные обзоры, содержащие данные
о миллионах звезд. Во-вторых, необходимы специальные математические методы, позволяющие перерабатывать огромные массивы данных в разумные сроки. В последнее время наблюдается взрывообразный процесс создания массовых астрометрических каталогов. Отметим здесь каталог TYCHO-2 [1], содержащий более 2.5 миллионов звезд. Каталог полон на 99% для V=11 и на 95% для V=11.5. Положения звезд были получены с помощью переработки измерений, сделанных в рамках проекта TYCHO на борту искусственного спутника HIPPARCOS, а в качестве первой эпохи для вывода собственных движений звезд было использовано около 140 наземных астрометрических каталогов. Временной базис приблизительно в 100 лет обеспечил высокую точность собственных движений звезд (1-3 мсд в год), а повторная обработка наблюдений, выполненных в космосе, дала точность координат около 10 мсд для V<9 и 100 мсд для V<12.
Использование современных технологий позволило наземной астрометрии создать каталоги, содержащие десятки и сотни миллионов звезд. Хорошим примером является
*Работа выполнена при финансовой поддержке РФФИ (грант №07-02-92114-ГФЕН-а) и Совета по грантам Президента РФ для государственной поддержки молодых российских ученых и ведущих научных школ (грант № НШ-1323.2008.2).
© В.В.Витязев, А.С.Цветков, 2009
проект UCAC (USNO CCD Astrographic Catalog). Предварительная версия этого каталога UCAC2 [2] содержит 48 миллионов звезд от южного полюса небесной сферы до склонения +50 градусов. Координаты звезд измерены на 8-дюймовом рефракторе в Чили и во Флагстаффе (США). Для звезд ярче 12.5 звездной величины собственные движения были получены с привлечением наблюдений на спутнике HIPPARCOS по методике TYCHO-2, для более слабых звезд использовались измерения пластинок, снятых по программам Lick Northern Proper Motions (NPM) и Southern Proper Motions (SPM). Позиционная точность колеблется от 20 до 70 мсд, в зависимости от блеска звезд; ошибки собственных движений звезд составляют 1-7 мсд в год и также зависят от звездной величины. После завершения этот каталог охватит все небо и будет содержать 80 миллионов звезд от V=7.5 до V=16.5. Прогнозируемая точность координат звезд составит 15-70 мсд, а точность собственных движений звезд будет находиться в интервале от 1 до 5 мсд в год.
В настоящее время своеобразным рекордсменом стал каталог USNO-B1.0, в котором содержится информация о 1 042 618 261 звезде [3]. Этот каталог представляет собой полный список звезд до V=21, построенный с помощью оцифровки пластинок нескольких фотографических обзоров неба. В каталоге B1.0 приведены прямые восхождения, склонения, собственные движения и оценки блеска звезд. Позиционная точность на современную эпоху оценивается величиной 200 мсд. Точность определения собственных движений звезд не приводится.
Для удобства использования столь обширных данных в Военно-морской обсерватории США создана астрометрическая база данных NOMAD (Naval Observatory Merged Astrometric Dataset) [4]. Для более чем 1 миллиарда звезд в ней приведены наиболее точные координаты, собственные движения и многополосная фотометрия, включая ближнюю инфракрасную область, заимствованную из проекта 2MASS. Средняя плотность каталога достигает нескольких десятков тысяч звезд на кв. градус.
Массовые каталоги звезд, ставшие доступными астрономической общественности в последние годы, позволяют поставить целый ряд новых задач, решение которых ранее не было доступным. Однако работа с такими огромными массивами данных сопряжена со значительными вычислительными трудностями. Отметим здесь, что авторы каталога NOMAD не представили пользователям никаких программных продуктов, способствующих работе с этой базой данных.
Настоящая статья ставит перед собой две цели. Первая из них — это разработка необходимых программных средств доступа к массиву данных NOMAD. Второй целью является поиск рассеянных скоплений в Галактике. Для выявления неоднородностей в распределении звезд на небесной сфере будет применяться техника вейвлет-преобразования. В наших предыдущих исследованиях [5], проводимых по данным каталога TYCHO-2, содержащего около 2,5 млн. звезд, была показана высокая эффективность применения вейвлет-анализа для выделения скоплений звезд, а также для оценки вероятности присутствия в областях повышенных концентраций звезд физических скоплений. Усовершенствованное программное обеспечение и полученные результаты в будущем смогут быть использованы для обработки данных для 1 млрд. звезд, ожидаемых в результате выполнения миссии GAIA.
2. Каталог NOMAD
Каталог NOMAD является компиляцией нескольких астрометрических каталогов: Hipparcos [6], UCAC2 [2], Tycho-2 [1] и USNO-B [3], кроме этого для примерно половины всех звезд в каталог включены данные о фотометрии в полосах J, H, K, взятые из
проекта 2MASS [7]. Около 340 млн. звезд имеют данные о собственных движениях. Скажем только, они очень разнородные и имеют низкую точность. В данной работе мы не будем их рассматривать. Конечно же, в каталоге такой мощности отсутствуют параллаксы.
Для звезд каталога NOMAD приведены данные о шестиполосной фотометрии в диапазонах B, V, R, J, H, K. Однако далеко не для всех звезд имеются все шесть звездных величин одновременно, а точность значений B, V и, особенно, R оставляет желать лучшего. В таблице 1 представлены данные о наличии фотометрии. Следует отметить, что наличие данных в полосах B, V, R носит существенно зонный характер. Существуют площадки небесной сферы, в которых данных много, и наоборот, существуют площадки, в которых данных почти нет, либо данные носят выборочный характер. Данные о звездных величинах J, H, K (заимствованные из каталога 2MASS) значительно менее подвержены наблюдательной селекции.
Таблица 1. Число звезд каталога NOMAD с фотометрическими данными
Полоса Есть данные Нет данных
В 912 млн. 205 млн.
V 267 млн. 850 млн.
R 1 млрд. 117 млн.
J, Н, К 471 млн. 647 млн.
Распределение звездной плотности показано на рис. 1. Как мы видим, каталог охватывает весьма обширные области галактики, поскольку хорошо виден не только галактический диск, но и центральный балдж. Звездная плотность в отдельных направлениях превосходит 1 млн. на кв. градус! Каталог содержит даже звезды некоторых ярких галактик (рис. 2)!
Рис. 1. Распределение звездной плотности каталога NOMAD.
Основная информация каталога — информация о звездных величинах и звездной плотности в различных фотометрических полосах. Такая информационная структура каталога позволяет решать не только задачи малого поля (звездные карты отдельных областей, например, для идентификации объектов, поиска малых планет и т.п.), но и глобальные задачи, когда важна информация всего каталога как единого целого. Одной их таких задач может быть задача поиска неизвестных рассеянных (или даже шаровых) звездных скоплений и иных аномалий в концентрации звезд.
Рис. 2. Карта распределения звезд каталога NOMAD в окрестности галактики M31.
3. Одномерный вейвлет-анализ
Развитие техники вейвлет-анализа дает мощный аппарат для решения подобного рода задач. Существует большое разнообразие вейвлет-техник: вейвлеты на плоскости, используемые при анализе фотопластинок и ПЗС-изображений, и даже специальные вейвлеты на сфере [8], применяющиеся при анализе фонового микроволнового излучения. Вейвлеты на плоскости применялись нами ранее [5] при анализе звезд каталога Tycho-2. Однако неоднородности, которые представляют для нас интерес в настоящей статье, имеют малый размер (не более одного-двух десятков угловых минут), поэтому мы предложим более простой способ проведения обзора всей небесной сферы с помощью одномерного вейвлет-анализа [9] с использованием MHAT-функции. Как оказалось, одномерный анализ позволяет существенно ускорить вычисления, что очень важно при работе с большими каталогами. Предположим, что у нас имеется одномерный и равномерный ряд какой-либо величины, например, звездной плотности с постоянным шагом по галактической долготе для выбранного значения галактической широты. С помощью техники вейвлет-анализа мы можем выделить неоднородности разных масштабов в этом ряду. Приведем основные формулы, решающую данную задачу.
Пусть Хк — ряд исходных значений, At — шаг выборки, N — число точек ряда:
xk = x(tk), tk = At • к, к = 1, 2,..., N. (1)
В качестве первого этапа обработки найдем среднее значение ряда
1 N
(*> = ^ Xk k=1
и центрируем ряд
х°к = Хк — (х), к = 1, 2, . .., N. (3)
Оценим также дисперсию ряда
1 N
" К)2, (4)
1 N
N — 1 ^(
fc=i
которая будет использована в критерии значимости (13).
В качестве вейвлет-функции в нашей задаче будем использовать так называемый MHAT-вейвлет (Mexican HAT, «Мексиканская шляпа»):
v>(t) = (1 — t2)e-t2/2. (5)
В случае MHAT-вейвлета дискретное вейвлет преобразование описывается следующими выражениями [9]:
W(a,i,bj) = '^^х°к'Ф (~ ~ ) ; (6)
nKA') к=1 V а 1
N / 1 / . 7, \ 2^
1 / tk bj
”э) -^ехР —2
к=1 V
Здесь а* = гДа — масштаб вейвлета; 6о- = ^’Д6 — сдвиг вейвлета.
Для практической реализации мы должны договориться о дискретизации аргументов. В нашем случае удобно принять шаг масштаба и сдвига равными друг другу и равными шагу Д£:
Да = Д6 = Д£. (8)
Как мы увидим, это позволит сильно упростить формулы, применяемые в вычислениях. Функция (5) сильно локализована в пространственной области. Можно показать, что
/<1 - ^ *< 0.01 (.,
-Ь
для Ь « 3.6, что позволяет значительно уменьшить число слагаемых в формулах (6) и (7). Окончательно, принимая во внимание (8), мы можем записать
И'.; ' (10)
щ о V г
к=0~0*
(11)
в этих выражениях граница индексов суммирования будет записываться как ]* = [3.6 г].
В вейвлет-анализе существует еще одна проблема — краевые эффекты, которые ограничивают допустимые значения индекса ] в формулах (10), (11), так как происходит выход за границу массива Хк. В случае анализа звездной плотности вдоль круга
заданной широты эти эффекты отсутствуют в силу замкнутости на себя ряда Хк, а именно, всегда можно считать Хк+N = Хк и Хк-N = Хк, где N — общее число элементов массива.
Формулы (10) и (11) имеют еще один плюс — они, насколько это возможно, оперируют с целыми числами, что положительно влияет на производительность вычислений.
В качестве результата вейвлет-анализа обычно рассматривают не сами элементы массива Wi}j, а квадраты их модулей. В нашем случае оказалось более целесообразным использовать не квадрат модуля, а величину
Si,j = Wi,j • |Wi,j|. (12)
Положительное значение величины Si,j свидетельствует о повышенной концентрации звезд по сравнению с окружающими областями, а отрицательное — о пониженной. Массив значений Si,j (или |Si,j |) в вейвлет-анализе часто называют скалограммой.
К полученному массиву значений Si,j нужно применить еще критерий выделения сигнала из шума. Поскольку для чисто шумового сигнала значения квадратов вейвлет-преобразования (6) представляют собой случайные величины, распределенные по закону хи-квадрат с одной степенью свободы, можно показать, что значение |Si,j | является статистически значимым с вероятностью p в случае, если
|Si,j| > ^Zi,j Тр, (13)
где порог обнаружения сигнала Zi,j Тр определяется следующими величинами:
^ = )> (14)
n2(ai,bj) к=1 V а )
Р = erf (^[y^ ’ (15)
2 (x
erf(x) = —= exp (—t2)dt. (16)
Vn Jо
4. Пример одномерного вейвлет-анализа
Для начала проведем вейвлет-анализ модельного ряда Хк, содержащего две концен-
трации разного масштаба (рис. 3). Мы видим, что на вейвлет-изображении «скопление» меньшего размера находится в области меньших масштабов, максимальное значение соответствует 20°. При резкой границе неоднородностей возникают «дифракционные»
лепестки с отрицательной плотностью.
Рассмотрим теперь пример вейвлет-анализа реальной области небесной сферы, рас-
положенной вдоль малого круга небесной сферы, ограниченной галактическими широ-
тами 6 = +32° ± 0.5°. В качестве ряда данных Хк возьмем средние значения звездной
плотности с шагом Д^; = 10'. В силу принятого нами соотношения (8) это же значение
будут иметь шаг сдвига Д6 и шаг масштаба Да. Осталось определиться с максимальным
размером масштабов искомых неоднородностей плотности. Хотя теоретически возмо-
жен поиск неоднородностей с угловым размером вплоть до 180°, в нашем случае это
не имеет никакого смысла. Угловой размер рассеянных звездных скоплений в большинстве не превышает с! =1°, поэтому мы можем ограничиться диапазоном индекса
Рис. 3. Вейвлет-преобразование (верхний рисунок) тестового ряда (нижний рисунок).
г < (1/ Аа. На рис. 4 представлен фрагмент вейвлет-анализа звездной плотности в области галактических долгот -170° —120°. В районе I = -153° вейвлет-анализ показывает отчетливую концентрацию, вызванную звездным скоплением М 44 (Ясли). Конечно, в данном случае эта концентрация заметна непосредственно на графике звездной плотности (нижняя часть рис. 4), но, как мы увидим далее, метод вейвлет-анализа позволяет обнаруживать аномалии концентраций и в менее очевидных случаях.
со
Тй йЗо йЗо I
Рис. 4. Пример вейвлет-преобразования в области звездного скопления Ясли.
5. Вейвлет-обзор всей небесной сферы
Для широкомасштабного поиска локальных неоднородностей звездной плотности был предложен следующий алгоритм.
• Задавался некоторый критерий отбора звезд, например, по принадлежности звезды заданному диапазону звездной величины в определенной полосе.
• Выполнялось деление небесной сферы на узкие (обычно 1° или 0.5°) зоны по галактической широте, которые затем разбивались на площадки с заданным шагом по долготе (от 5' до 10').
I = _30° 05286 / = 60°
ч:
05236
Q646^
05286 / 60'
0511
С
b
b=30°—
Рис. 5. Фрагмент вейвлет-обзора небесной сферы с нанесенными объектами каталога N00.
• Для каждой площадки определялась звездная плотность, таким образом, строился ряд данных хк для каждой зоны.
• Полученные ряды звездной плотности по долготе для всех значений галактической широты обрабатывались с помощью техники вейвлет-анализа.
Далее, возникает вопрос о визуализации полученных массивов как единого целого. Построение трехмерного изображения всей небесной сферы не только проблематично, но и не будет обладать большой наглядностью. Для того чтобы остаться в рамках двух измерений, преобразуем скалограмму Si,j в одномерный массив Оj•, называемый скейлограммой:
Задавая разные значения пределов суммирования imin и imax, можно сделать так, чтобы скейлограммы отражали более или менее крупные детали. Например, суммируя от imin = 1 до imax = 6 при Да = 10', мы получаем в скейлограмме следы от деталей, размер которых заведомо меньше 1°. Напротив, задавая imin > 6, мы переходим к изучению структур размером больше 1°. Таким образом, скейлограмма хотя и преобразует одномерный массив xk в одномерный же Gj, однако, варьируя значения imin и imax, мы можем фильтровать масштаб видимых в скейлограмме деталей.
Полученные для каждого круга галактической широты скейлограммы можно отображать в какой-либо проекции небесной сферы, например в широко распространенной проекции Айтоффа [6]. Такие изображения мы назвали вейвлет-обзорами небесной сферы. При значении Д£ = 10' и менее такие вейвлет-обзоры представляют собой весьма большие изображения (3000 х 1500 точек и больше) и опубликованы в интернете на сайте Астрономического института СПбГУ [10]. В данной работе мы показываем лишь фрагмент одного изображения (рис. 5), построенного для выборки звезд, имеющих звездную величину J = 14m ^ 16m. Выделение сигнала из шума произведено с заданной вероятностью p = 0.99. На полученный вейвлет-обзор мы нанесли объекты каталога Revised NGC [11].
Анализ данного изображения показывает, что мы должны рассматривать три класса объектов:
• известные объекты, выделяемые методом вейвлет-анализа;
(17)
• известные объекты, не обнаруживаемые методом вейвлет-анализа;
• неизвестные объекты, выделяемые методом вейвлет-анализа.
Если с первыми объектами все понятно, то уже вторые нуждаются в объяснении. Действительно, звездные скопления видны не во всех диапазонах звездных величин. Например, такое звездное скопление как Плеяды (М 45) не заметно в области слабых звезд, зато прекрасно выделяется вейвлет-анализом при переходе к звездам с блеском
8т_10т
Наибольший интерес для нас представляет третий класс объектов: области повышенной концентрации звезд, которые не отмечены в каталогах шаровых [12] и рассеянных [13] звездных скоплений. Можно надеяться на открытие новых, ранее неизвестных рассеянных скоплений в ИК-диапазоне при использовании звездных величин ^ К, Н или И. Похоже, это имеет место в области с координатами I = -47°, Ь = +32°, которая показана на рис. 6, хотя этот факт нуждается в уточнении.
Рис. 6. Вероятно найденное слабое рассеянное скопление.
Иногда мы встречаемся с объектами, природу которых еще надо выяснять. Например, в области с координатами I = -57, Ь = 40.5 мы видим странную полосу, которая, в принципе, может быть галактикой, видимой с ребра (рис. 7), но может быть и чем-то иным.
Однако значительная часть обнаруженных пиков звездной плотности является образованиями совсем другого рода, не связанными с реально существующими объектами. Например, рассмотрим четко выделенный объект на рис. 5, расположенный рядом с N00 5236. На рис. 8 мы видим, что из-за автоматического построения каталога в него по ошибке попали дифракционные лучи яркой звезды, и эти лучи записаны в каталоге как звезды! Следует сказать, что в полосе И такие артефакты нами были выявлены ранее, но мы не ожидали что и в каталоге 2МЛ88 мы встретимся с подобными явлениями (хотя и в меньшем количестве).
Рис. 7. Объект неизвестной природы.
Рис. 8. Артефакт каталога — дифракционные лучи.
6. Заключение
Данная работа является первым шагом в области вейвлет-обзоров больших каталогов. На следующей стадии будет построен каталог обнаруженных объектов и их классификация. Применение техники вейвлет-анализа может помочь в решении и чисто астрометрической задачи — улучшения каталога, избавлении его от ошибочных данных.
1. Hog E. et al. Tycho-2 // Astron. Astrophys., 2000. Vol. 355, L27.
2. Zacharias N. et al. UCAC2 // Astron. J., 2004. Vol. 127. P. 3043.
3. Monet D. G. et al. USNO-B // Astron. J., 2003. Vol. 125. P. 984.
4. Naval Observatory Merged Astrometric Dataset, http://www.navy.mil/nomad (2002).
5. Kazakevich E., Vityazev V., Orlov V. Tycho-2: Search for Stellar Groups using Wavelet Transform // ASP Conf. Ser. Order and Chaos in Stellar and Planetary Systems. Vol. 316. 2004. P. 243-246.
6. ESA. The Hipparcos and Tycho Catalogues 1997, ESA SP-1200, (1997).
7. 2MASS. URL: http://www.ipac.caltech.edu/2mass/releases/allsky/
8. McEwen J. D., Hobson M. P., Mortlock D. J., Lasenby A. N. // IEEE Transactions on Signal Processing, 2005.
9. Витязев В. В. Вейвлет-анализ временных рядов. СПб.: Изд-во С.-Петерб. ун-та, 2001.
10. URL: http://astro.pu.ru.
11. Sulentic J. W., Tifft W. G. Revised New General Catalogue of Nonstellar Astronomical Objects. Tuscon (1977).
12. Harris W. E. A catalog of parameters for globular clusters on the Milky Way // Astron. J., 1996. Vol. 112. P. 1487.
13. Dias W. S., Alessi B. S., Moitinho A., Lepine J. R. D. New catalog of optically visible open clusters and candidates (V2.8) // Astron. Astrophys., 2002. Vol. 389. P. 871.
Статья поступила в редакцию 30 июля 2009 г.