Научная статья на тему 'Ледяной покров Японского моря: исходные данные и  процедуры  восстановления пропущенных значений'

Ледяной покров Японского моря: исходные данные и процедуры восстановления пропущенных значений Текст научной статьи по специальности «Науки о Земле и смежные экологические науки»

CC BY
79
21
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по наукам о Земле и смежным экологическим наукам, автор научной работы — Четырбоцкий А. Н., Плотников В. В.

Приводится описание репрезентативной выборки многомерных наблюдений, характеризующей ледяной покров Японского моря. Рассматриваются процедуры восстановления пропущенных значений, которые основаны на методах непараметрической регрессии. Для выявления сгущений для подобного рода задач предлагается использовать рекурсивный метод отображения точек многомерного пространства с помощью кривых Пеано, который обладает высоким быстродействием и характеризуется высокой надежностью. Непосредственное восстановление осуществляется в исходном признаковом пространстве на основании совокупности точек из построенной подобным образом окрестности.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Ice cover of sea of Japan: the initial data and procedures restoration of the missed values

The description of representative sample of the multivariate supervision describing an ice cover of sea of Japan is resulted. Procedures of restoration of the missed values which are based on methods of nonparametric regress are considered. For revealing condensations for a similar sort of problems it is offered to use a recursive method of display of points of multivariate space with the help of curves ђeano which has high speed and it is characterized by high reliability. Direct restoration is carried out in initial space on the basis of set of points from the vicinity constructed in a similar way.

Текст научной работы на тему «Ледяной покров Японского моря: исходные данные и процедуры восстановления пропущенных значений»

Ледяной покров Японского моря: исходные данные и процедуры восстановления пропущенных значений

Четырбоцкий А.Н. (chetyrbotsky@fegi.ru ),Плотников В.В.

Дальневосточный институт геологии ДВО РАН

Ледяной покров замерзающих водоемов представляет собой результат взаимодействия атмосферы и гидросферы. В практике океанологических следований для его количественного описания используют ряд параметров. И из них только толщина покрова имеет локальный физический смысл, а остальные - не обладают подобным качеством, а являют собой осредненные по площади района акватории определенные величины. В частности, под термином «сплоченность» понимают отношение площади занятой льдом к площади самого района [8]. Очевидно, что подобная экзотичность терминов обусловлена спецификой покрова как физической среды. Но поскольку именно эта среда присутствует на акваториях ряда перспективных во всех отношениях морей, то актуальными являются задачи создания репрезентативных выборок количественного описания непосредственно ледяных покровов этих морей.

Основой используемого фактографического материала послужили: карты ледовых авиаразведок над дальневосточными морями; спутниковые снимки ледяного покрова морей, получаемые с ИСЗ серий "КОАЛ", "Метеор", "Космос" и т. п. ; гидрометеорологические ежемесячники (ежегодники) по дальневосточному региону, содержащие данные прибрежных гидрометеорологических станций и постов. В качестве дополнительной информации привлекались прибрежные радиолокационные и вертолетные наблюдения за льдом, попутные судовые наблюдения и. т. д.

Обычно в течение декады имелось несколько карт или снимком ледяного покрова. В дальнейшем полученные фрагменты ледовой обстановки, включая данные прибрежных наблюдений гидрометеостанций и постов, усреднялись для данной декады. Одновременно проводился и критконтроль получаемой информации. Минимальная дискретность построения карт ледовой обстановки, охватывающих всю акваторию конкретного моря и представляющих практически непрерывный ряд в течение ледового периода, составила одну декаду. Более высокое временное разрешение, учитывая сложность получения ледовой информации (обширные акватории, наличие неблагоприятных погодных условий и т. д.) возможно только для отдельных локальных акваторий, причем, получаемые ряды, в силу уже изложенных причин, будут заведомо неэквидистантны. По средним декадным картам ледовых условий оценивались декадные значения занятых льдом площадей определенных

участков акватории (ледовитости), выделялись области с заданными ледовыми условиями и оценивались их площади, снимались значения различных ледовых характеристик. Для численного представления полей ледовых характеристик акватории морей разбивались на ряд сравнительно однородных районов. Использовались осредненные в рамках этих районов значения ледовых элементов, отнесенных к центрам соответствующих районов. Степень детализации сведений о ледовых условиях в данном случае напрямую зависит от размеров элементарных ячеек сетки, которой покрывается акватория моря для снятия значений ледовых характеристик. В прибрежных зонах, наиболее интересных с точки зрения их хозяйственного освоения, площади районов для снятия ледовых характеристик обычно уменьшались.

В результате для Японского моря была сформирована информационная матрица размерностью М*Р*К, где М-количество декад, К - размерность пространственной сетки для задания параметров (К=114), а Р-количество фиксируемых для данного моря ледовых параметров. В каждом выделенном районе фиксировались значения общей сплоченности ледяного покрова N (выражается отношением занятой льдом площади к общей площади района акватории), его преобладающей толщины льда (возраста) Н и преобладающем размере льдин (форму) Б. Период наблюдений составил 29 лет: с 1961 по 1989 годы.

Именно для указанного периода имеется исчерпывающая и однородная статистическая выборка, составленная на основании результатов регулярных авиаразведок и характеризующая состояния ледяного покрова. Более ранние наблюдения в связи с их исходной неполнотой и низким качеством наблюдений в выборку не включались. Сведения о ледяном покрове, начиная с 1990 года, преимущественно основаны на спутниковых снимках и с целью сохранения однородности выборки на этом этапе также не рассматривались. Вся используемая терминология и обозначения соответствуют "Международной символике для морских ледовых карт и номенклатуре морских льдов" [5]. Расположение и нумерация узлов в точках наблюдений представлены нижеследующим рисунком.

Период ежегодного присутствия ледяного покрова на акватории Японского моря составляет 22 декады. При этом выборку составили наблюдения только тех участков, где непосредственно лед присутствовал. В используемой выборке общее число таких случаев составляет 11130 наблюдений. Следует отметить, что в 1890 случаях некоторая их часть значений параметров была пропущена, а в 514 и вовсе были пропущены все три параметра. Учитывая высокую значимость и уникальность исходных наблюдений, пропущенные в узлах сетки значения параметров восстанавливались с помощью методов непараметрической регрессии [1-4,7,9]. Выбор именно этих методов обусловлен, прежде всего, следующими обстоятельствами. Статистический анализ выборки показал отсутствие значимых линейных

зависимостей, как между отдельными параметрами, так и их линейными комбинациями. Если бы такая зависимость присутствовала, то для восстановления пропущенного значения следовало бы подставить в соответствующее линейное регрессионное уравнение присутствующие в наблюдении параметры. Однако низкие значения этих коэффициентов не позволяют использовать для восстановления пропущенных значений аппарат линейной регрессии (максимальный коэффициент корреляции равен 0. 283 и был отмечен только между толщиной покрова H и замеченным преобладающим размером отдельных льдин F). Анализ соответствующих парных и трехмерных графиков указывает так же отсутствие взаимосвязи между параметрами ледяного покрова. При указанных условиях наиболее естественным способом восстановления пропущенных значений являются методы непараметрической регрессии.

130 131 132 133 134 135 136 137 138 139 1У0 Ш Ш2 143

Расположение и нумерация районов для снятия значений ледовых характеристик. (Непрерывная линия показывает границу максимального распространения льда).

Формулировка задачи непараметрической регрессии состоит в том, что по значениям функционала на некотором случайном множестве точек (узлах нерегулярной сетки) восстановить значение функционала на другом, заранее заданном и достаточно "плотном"

множестве точек этой области [1]. Поставленная задача, в особенности для двумерно распределенных узлов с произвольной формой границы (не исключаются многосвязанные области), оказывается далеко не тривиальной. Свидетельством этому является, в частности, существование большого числа методов интерполяции [1-4,7], ориентированных в конечном итоге на идентичные ситуации. В общем случае оценка У в точке X определяется следующим образом:

У(Х) = £ ф(хг,Х)¥г / ,X),

Х1 еО (X ) Х1 еО (X )

где О(Х) - непустая окрестность точки Х^Яп, а>(Х{, X) - неотрицательная весовая функция. Она является монотонно убывающей от значения функционала близости ее аргументов, например а>(Xi, X) =|| Xi - X ||-1. В выражении для У(Х) суммирование выполняется по всем выборочным точкам Xi е 0(X) .

В подобной постановке задачи непараметрической регрессии открытым остается вопрос о способе построения окрестности точки Х. В практических приложениях в качестве точек этой окрестности выступают к наиболее близких к точке Х исходных точек, где к заданное исследователем число. Заметим, что в случае большого числа исходных точек для решения задачи интерполяции требуется существенное время: среди всех узлов исходной сетки для каждой точки Х требуется определить к ближайших. Специфика настоящих наблюдений также состоит в том, что исходная выборка содержит 8-мь типов наблюдений: для первого типа отсутствуют пропущенные значения; для второго типа - отсутствует значение сплоченности К;третьего - толщина Н;четвертого - форма льдины Б. Остальные пять типов содержат пропущенные значения комбинаций этих параметров. Поэтому в зависимости от числа пропущенных в определенном наблюдении параметров значение п варьирует от 4 (пропущены все 3 значения и в наблюдение содержит год и номер декады, пространственные координаты узла) до 7(отсутствие пропущенных значений). При этом наблюдения каждого типа представляет собой выборочную точку пространства соответствующей размерности, а задача непараметрической регрессии сводится к оценке числа и состава сгущений в этом пространстве. Тогда окрестностью точки Xi е О^) является совокупность наблюдений (где

присутствуют все параметры) из ближайшего к точке X { сгущения. Для выявления сгущений

для подобного рода задач целесообразно использовать рекурсивный метод отображения точек многомерного пространства с помощью кривых Пеано [6,2-3,9], который обладает высоким быстродействием и характеризуется высокой надежностью [3,10-11]. Непосредственное восстановление осуществляется в исходном ^мерном пространстве на основании совокупности точек из построенной подобным образом окрестности.

Исходные метрические параметры состояния ледяного покрова представлены баллами соответствующих ординальных шкал [5,8]. В частности, ординальная шкала сплоченности насчитывает 10 градаций, толщин - 6 градаций и размеры льдин - 7 градаций. Поэтому непосредственное наблюдение содержит сведения о конкретных диапазонах изменения параметров, где присутствуют их истинные значения. Очевидно, что совокупность подобного типа данных для отдельного района акватории и конкретной осредненной декады характеризует гистограмму или распределение частот появления каждого из интервала значений. Чтобы получить указанные распределения следует суммировать информацию по той части выборки, которая соответствует именно этому району. Выполнение этой процедуры позволяет сформировать выборку совокупности статистического распределения сплоченности, статистического распределения толщины и статистического распределения размера льдин для каждого из представленных на схеме районов акватории. Результатом подобной трансформации исходных данных является выборка многомерных наблюдений. Каждое отдельное наблюдение насчитывает 24 признака: первый из них указывает частоту случаев отсутствия ледяного покрова в этом непосредственном районе акватории для рассматриваемой декады; признаки со 2-го по 11-й характеризуют распределение сплоченности, с 12-го по 17-й - распределение толщин и с 18-го по 24-й - распределение размера льдин. Общее число таких наблюдений составило 799 реализаций. Поскольку функция распределения содержит основные сведения о характере изменения случайной величины (наблюдаемые значения сплоченностей, толщин и размеров льдин), то указанное преобразование позволяет выявить многолетнюю тенденцию эволюционного процесса. Для оценки численных значений следует использовать принципы статистического моделирования. При их использовании важен факт равновероятности принятия параметром отдельного значения из диапазона, соответствующего наблюдаемому баллу ординарной шкалы.

Литература

1. Айвазян С. А., Енюков И.С.,Мешалкин Л. Д. Прикладная статистика.Исследование зависимостей. - М.: Финансы и статистика,1985.- 487 с.

2. Александров В.В., Горский Н.Д.,Поляков А.О. Рекурсивные алгоритмы обработки и представления данных.- Препр. Ленинград: ЛНИВЦ АН СССР,1979.-53 с.

3. Александров В.В., Горский Н.Д. Алгоритмы и программы структурного метода обработки данных.- Л. : Наука,1983.-208 с.

4. Веселов В.В., Гонтов Д.П. ,Пустыльников Л.М. Вариационный подход к задачам интерполяции физических полей.- М.:Наука,1983.-119 с.

5. Международная символика для морских ледовых карт и номенклатура морских льдов. -Л.:Гидрометеоиздат,1984.-56 с.

6. Стронгин Р.Г. Численные методы в многоэкстремальных задачах (информационно-статистические алгоритмы).- М.: Наука,1978.-240 с.

7. Суховей В.Ф. Восстановление полей гидрологических элементов по экспедиционным наблюдениям // Мор. гидрофиз. исслед.-1971.-№ 3.-с.91-116

8. Тимохов Л.А., Хейсин Д.Е. Динамика морских льдов (математические модели). -Л.,Гидрометеоиздат,1987.-272 с.

9. Четырбоцкий А. Н. Методы и алгоритмы решения задач снижения размерности пространства описания. - Владивосток, ДВО АН СССР,1991.-95 с.

10. Четырбоцкий А. Н. Пакет прикладных программ для решения задач снижения размерности пространства описания // Управляющие системы и машины. - Киев, Наукова думка, Т.1(111),1991.-с.103-106

11. Шемендюк Г.П., Бабцев В. А., Четырбоцкий А.Н. Статистическое исследование износов наружной обшивки корпусов судна ледового плавания // Техническая эксплуатация флота.-М.: Судостроение, № 23(763),1991.-23 с.

i Надоели баннеры? Вы всегда можете отключить рекламу.