УДК 004.7
А.Я. КУЗЕМИН, В.В. ЛЯШЕНКО, А.А. ТОРОЕВ
СТАТИСТИЧЕСКИЙ АНАЛИЗ В ОБОСНОВАНИИ ЗНАЧИМЫХ ПАРАМЕТРОВ МОДЕЛЕЙ ПРЕДУПРЕЖДЕНИЯ ЛАВИНООПАСНЫХ СИТУАЦИЙ
Рассматриваются актуальные вопросы предварительного статистического анализа для обоснования моделей прогнозирования лавиноопасных ситуаций. Обосновывается выбор статистически значимых метеорологических параметров для прогнозирования схода лавин. Описываются дискриминантные функции прогноза лавиноопасных ситуаций. Формулируются ключевые задачи общей схемы анализа лавиноопасной обстановки.
Введение. Лавиноопасные районы занимают 6% площади суши. Однако несмотря на это, проблема исследования лавиноопасных ситуаций является довольно важной и актуальной, ибо подобные явления способны вызвать гибель людей и причинить значительные разрушения [1, 2]. Выявление лавиноопасных территорий и определение параметров данного явления основывается на результатах, полученных с использованием технологии геоинформационных систем (ГИС) [3, 4], которые в целом позволяют также моделировать процессы и явления, определяющие условия схода снежных лавин, выявлять зоны аккумуляции, сноса и динамики снега. Традиционно, для определения вероятности схода лавин используются данные номограмм, которые, в общем виде, обобщают взаимосвязь таких показателей как температура, величина снежного покрова и осадков. Такие номограммы строятся исходя из данных по каждой лавиноопасной зоне, т.е. в неявном виде учитываются и другие параметры исследуемой лавиноопасной ситуации. Однако остающаяся непредсказуемость лавиноопасной обстановки не всегда позволяет избежать негативных последствий от чрезвычайных ситуаций, вызванных сходом лавин. Одна из причин кроется в недостаточном учете множества факторов, влияющих на возникновение лавиноопасных ситуаций, что подтверждает актуальность рассматриваемого направления исследований.
Таким образом, целью данной работы является обоснование наиболее значимых факторов для моделирования в последующем процессов образования и схода лавин.
Целесообразность проведения данного исследования также взаимосвязана с необходимостью обосновать наиболее точные модели прогноза процесса образования лавин, так как моделирование является одним из наиболее мощных средств исследования подобных систем на сегодняшний день [5, 6].
Исходные данные для анализа факторов лавиноопасной обстановки. В качестве исходных данных для решения поставленной задачи были использованы сведения относительно схода лавин в ИТАГАР Чычканском районе республики Кыргызстан, которые получены в рамках проведения совместных научно-исследовательских робот. На рис. 1 представлены графики изменения характерных метеорологических параметров при сходе лавин в данном районе.
Статистические характеристики этих графиков даны в табл. 1.
Таблица 1. Статистические характеристики метеорологических параметров при сходе лавин в ИТАГАР Чычканском районе республики Кыргызстан на протяжении 2001-2006 гг.
Отдельные Статистические характеристики
метеорологические Среднее Медиана Стандартное Дисперсия
параметры отклонение
Температура воздуха -2,56 -5,25 7,31 53,42
Относительная влажность 72,27 74,00 6,16 38,01
Скорость ветра 0,66 0,60 0,27 0,07
Осадки 58,09 51,5 26,64 710,03
150 100 50 0 -50
Рис. 1. Графики изменения характерных метеорологических параметров при сходе лавин в ИТАГАР Чычканском районе республики Кыргызстан на протяжении 2001-2006 годов
Как видно из рис. 1 и табл. 1, диапазон исходных данных является довольно обширным, что в целом усложняет задачу предупреждения схода лавин. При этом еще одним параметром, который является характерным для описания лавиноопасной обстановки, можно считать тип подстилающей поверхности в местах схода лавин. Однако данный параметр не столько облегчает решение поставленной задачи, сколько усложняет ее. Это связано с тем, что для разных подстилающих поверхностей метеорологические параметры схода лавин могут оказаться практически одинаковыми. В итоге прогнозирование лавиноопасной ситуации может быть ошибочным или неточным.
Значимые параметры в прогнозировании лавиноопасной ситуации. Решить поставленную задачу позволяют методы предварительного статистического анализа, с точки зрения учета значимости анализируемых факторов и их относительной взаимосвязи. При этом для такого анализа необходимо выбрать некоторую обобщающую характеристику лавиноопасной ситуации. В качестве такой характеристики может служить как частота схода лавин, так и суммарные объемы такого схода (рис. 2).
При этом статистический анализ взаимосвязи частоты схода лавин (у) в ИТАГАР Чычкане дает следующую аддитивную зависимость:
У = 0,671* XI + 0,612 * X2 + 0,520 * Х4 - 0,330 * Х3, (1)
где XI - температура воздуха; X 2 - относительная влажность; Х3 - скорость ветра; Х4 - осадки.
Статистическая значимость модели (1) может быть обоснована значениями коэффициента детерминации, который объясняет не мене 60% вариации частоты схода лавин от таких метеорологических параметров как температура воздуха, относительная влажность и величина осадков. Это связано с тем, что статически значимыми являются данные параметров XI, X2 , X4 . При этом частота схода лавин имеет положительную статистически значимую взаимосвязь с указанными параметрами. В то же время действие таких факторов, согласно модели (1), примерно одинаково. Скорость ветра при этом, возможно, некоторым образом сдерживает частоту схода лавин, как это видно из модели (1). Однако делать окончательные выводы нельзя, ибо статистическая значимость данного вывода незначительна (табл. 2).
Таблица 2. Параметры коэффициентов при исследуемых метеорологических факторах регрессионной модели 1
Метеорологические Значение коэффициентов Оценка значимости р-^е1
факторы при метеорологических факторах по критерию Стьюдента
Температура воздуха 0,671 2,61 0,018
Относительная влажность 0,612 2,58 0,019
Скорость ветра -0,330 -1,44 0,169
Осадки 0,520 2,71 0,015
Температура воздуха.
Температура воздуха, С Осадки, мм
Скорость ветра 1 6
-- 1,4 -- 1,2 1
0,8 + 0,6
________0,4
Анализируемый - - 0 2 период времени 0
Влажность, % Скорость ветра, м/с
1500 1000 500 0
Суммарные объемы
Частота схода лавин
40 30 -- 20 10
0
Анализируемый период
-Суммарные объемы схода лавин, тыс. м3 - - Частота схода лавин
Рис. 2. Суммарные объемы и частота схода лавин в ИТАГАР Чычканском районе
При этом стандартная ошибка отклонения, которая характеризует меру рассеивания наблюдаемых величин относительно линии регрессии в модели (1), колеблется в пределах 6,3% (рис. 3).
Чартота схода лавин |
Анализируемые периоды времени Рис. 3. Исходные и прогнозные данные по модели (1) Если же учесть тип подстилающей поверхности в лавиноопасной зоне, то стандартная ошибка отклонения, которая характеризует меру рассеивания наблюдаемых величин относительно линии регрессии в соответствии с моделью 1, несколько уменьшается и не превосходит 4,2% (рис. 4).
Частота схЪда лавин ! \ \
Анализируемые периоды времени
Рис. 4. Исходные и прогнозные данные по модели (1) с учетом типа подстилающей поверхности в
лавиноопасной зоне
Таким образом, при прогнозировании вероятности схода лавин целесообразно учитывать такие факторы как: температура воздуха, влажность и величина осадков. Обобщенная гистограмма предсказания наиболее вероятной частоты схода лавин по модели (1) на основе имеющихся данных изображена на рис. 5.
5 4 3 2 1 0
-2,0 -1,0 0,0 1,0 2,0 3,0
Рис. 5. Гистограмма предсказания частоты схода лавин по модели (1)
Если проанализировать объемы схода лавин (Ъ) от исследуемых факторов, можно получить следующую зависимость:
Ъ = 0,514 * XI + 0,446 * X2 - 0,26 * X3 + 0,516 * X4 , (2)
где наиболее статистически значимой есть взаимосвязь объемов схода лавин с выпавшими осадками, что является естественным объективным фактом. При этом в целом статистическая значимость модели (2) не хуже, чем в модели (1). Тем не менее, усиление такой взаимосвязи наблюдается в сочетании, прежде всего, с влажностью и скоростью ветра:
Ъ = 0,258* X2 - 0,05* X3 + 0,587*X4, (3)
Ъ = 0,322* XI - 0^X3 + 0,43^X4, (4)
Ъ = 0,386 *X1 + 0,511* X2 + 0,513* X4, (5)
Ъ = 0,459 * X4 , (6)
Ъ = -0,^X3 + 0,517 *X4, (7)
Ъ = 0,286 *X2 + 0,582 * X4 , (8)
Ъ = 0,084 *X1 + 0,42* X4. (9)
Целесообразность применения для прогнозирования лавиноопасной обстановки (вероятного схода лавин) именно выбранных метеорологических факторов подтверждает также проведение эксперимента с применением методов дискриминантного анализа.
Суть такого эксперимента сводится к оцениванию вероятности отнесения тестовых наборов данных к классу данных, которые либо характерны, либо нехарактерны для ситуаций схода лавин. При этом был определен набор метеоданных, который характеризует класс ситуаций, не характерных для схода лавин. Статистические характеристики такого набора данных представлены в табл. 3.
Таблица 3. Статистические характеристики метеорологических параметров, не характерных при сходе лавин
Отдельные метеорологические параметры Статистические характеристики
Среднее Медиана Стандартное отклонение Дисперсия
Температура воздуха 0,81 0,45 6,18 38,23
Относительная влажность 65,41 72,50 4,43 19,63
Скорость ветра 6,67 0,90 6,03 36,36
Осадки 53,2 50,00 19,71 388,48
В результате были получены различные дискриминантные функции измеряемых метеорологических характеристик возникновения лавиноопасной ситуации, значения которых и объясняют разбиение рассматриваемого набора данных (исходных данных, характерных и нехарактерных для лавинообразной ситуации) на введенные выше два класса в зависимос-
ти от рассматриваемых групп метеорологических параметров:
W1 = -27,95 + 0,19 * XI + 0,63 * X2 - 0,29 * X3 + 0,18 * X4, (10)
W2 = -23,57 + 0,31* XI + 0,58 * X2 - 0,07 * X3 + 0,13 * X4 , (11)
W1 = -26,45 + 0,26 * XI + 0,61 * X2 + 0,14 *X4, (12)
W2 = -23,48 + 0,32 * X! + 0,58 * X2 + 0,12 * X4 , (13)
W1 = -27,35 + 0,59 * X2 - 0,34 * X3 + 0,19 * X4, (14)
W2 = -21,99 + 0,52 * X2 - 0,14 * X3 + 0,16 * X4 , (15)
где W1 - обобщенное значение класса, метеорологические параметры которого характерны для лавиноопасной ситуации; W 2 - обобщенное значение класса, метеорологические параметры которого не характерны для лавиноопасной ситуации.
Для определения вероятности отнесения тестовых наборов данных к тому или иному классу на вход определенной дискриминантной функции подавался новый набор метеоданных, принадлежность которого к определенному классу была заранее известна.
При этом само отнесение тестового набора данных к тому или иному классу имеет определенную вероятность. Если такая вероятность является меньше, чем 0,5, по отношению к искомому классу, то отнесение к определенному классу является ошибочным.
Таким образом, была вычислена частота правильного отнесения тестового набора к определенному классу. Одновременно с этим тестировалась частота правильного отнесения как лавиноопасных, так и нелавиноопасных ситуаций. Такое тестирование проводилось для различных дискриминантных функций в зависимости от рассматриваемых значимых групп метеоданных. Соответствующие результаты представлены в табл. 4. Под ошибкой в определении класса данных, характерных для лавиноопасной ситуации, в табл. 4 понимается соответствующий процент неправильно классифицированных данных. Под ошибкой в определении класса данных, не характерных для лавиноопасной ситуации, в табл. 4 понимается соответствующий процент неправильно классифицированных данных.
Таким образом, рассмотренные группы метеорологических параметров могут быть использованы для построения адекватных моделей прогноза лавиноопасных ситуаций.
В заключение отметим, что в целом общая схема анализа лавинообразной обстановки может быть сведена к решению двух задач: прогнозированию схода лавин и прогнозированию объемов схода. Именно этим и объясняется многообразие полученных дискриминантных функций.
Таблица 4.Результаты оценивания вероятности отнесения тестовых наборов данных к классу данных, которые либо характерны, либо не характерны для ситуаций схода лавин в зависимости от группирования для этих целей определенных выше метеорологических параметров
Ошибка в определении Ошибка в определении Частота правильного Диапазон вероятности
класса данных, класса данных,не отнесения тестового правильного отнесения
характерного для характерного для набора к определенному тестового набора к
лавиноопаснои ситуации лавиноопасной ситуации классу определенному классу
Тестовый набор содержит только данные, которые характеризуют лавиноопасную ситуацию
Группа метеоданных, которая была использована для определения дискриминантной функции:
Х1, Х2, Х3, Х4
12,3% 14,1% 78,3% 0,64-0,87
Группа метеоданных, которая была использована для определения дискриминантной функции: XI, Х2 , Х4
8,1% 11,6% 84,2% 0,62-0,94
Группа метеоданных, которая была использована для определения дискриминантной функции: Х2, Х3, Х4
8,2% 12,2% 81,9% 0,74-0,91
Тестовый набор содержит только данные, которые характеризуют не лавиноопасную ситуацию
Группа метеоданных, которая была использована для определения дискриминантной функции:
Х1, Х2, Х3, Х4
12,3% 14,1% 69,3% 0,58-0,73
Группа метеоданных, которая была использована для определения дискриминантной функции: XI, Х2 , Х4
8,1% 11,6% 83,4% 0,61-0,88
Группа метеоданных, которая была использована для определения дискриминантной функции: Х2, Х3, Х4
8,2% 12,2% 79,8% 0,65-0,86
Вместе с тем метод номограмм дает ответ преимущественно только на первый вопрос, т.е. позволяет прогнозировать, прежде всего, сход лавин. Более аргументированное решение общей задачи прогнозирования лавиноопасной обстановки возможно на основе методов статистического анализа. Обобщенная процедура такого анализа заключается в:
- выборе наиболее значимых метеорологических данных для прогнозирования лавиноопасных ситуаций;
- построении дискриминантных функций в целях определения классов лавиноопасных и нелавиноопасных ситуаций;
- тестировании и уточнении полученных дискриминантных функций на основе предсказания возможных лавиноопасных ситуаций;
- постоянном уточнении полученных дискриминантных функций на основе их использования для предсказания лавиноопасных ситуаций.
Выводы. Изложены основные этапы предварительного статистического анализа для обоснования моделей предупреждения лавиноопасных ситуаций. Показано, что при прогнозировании вероятности схода лавин целесообразно учитывать такие факторы как: температура воздуха, влажность и величина осадков, а при анализе объемов схода
лавин есть смысл учитывать такие факторы: влажность, скорость ветра и величина осадков. Получены дискриминантные функции для прогнозирования лавиноопасной ситуации по данным ИТАГАР Чычканского района республики Кыргызстан.
Список литературы: 1. Federici P., Tamburin A.i, Luzi G., Rott H, Schaffhauser A., Strozzi T., Bernardini G. GALAHAD: AN EU PROJECT FOR THE REMOTE MONITORING OF GLACIERS, AVALANCHESAND LANDSLIDES // IDRC. DAVOS, 2006. Vol. 2. P. 177-180. 2. Войтковский К. Ф. Лавиноведение. М.: МГУ, 1989. 158 с. 3. Durand Y., Brun E., Merindol L., Guyomarc'h, Lesaffre B., Martin E. A meteorological estimation of relevant parameters for snow models. Ann. Glaciol.,18, 1993. Р. 65-71. 4. KuzeminA., ToroevA. Mobile means of control and prediction of avalanche climate using information conversion in acoustic range 291 // IDRC. DAVOS, 2006. Vol. 2. P. 291-294. 5. СкурихинВ.И., ШифринВ.Б., ДубровскийВ.В. Математическое моделирование. К.: Техшка, 1983. 270 с. 6. МолчановА.А. Моделирование и проектирование сложных систем. К.: Выща школа, 1988. 359 с.
Поступила в редколлегию 06.12.2006 Куземин Александр Яковлевич, канд. техн. наук, проф. кафедры информатики, начальник инновационно-маркетингового отдела ХНУРЭ. Адрес: Украина, 61166, Харьков, пр. Ленина, 14, тел.: 8 (057) 702-15-15, e-mail: kuzy@kture.kharkov.ua.
Ляшенко Вячеслав Викторович, с.н.с. кафедры информатики ХНУРЭ. Научные интересы: статистическая обработка многомерных массивов данных, распознавание изображений. Хобби: филателия и нумизматика. Адрес: Украина, 61166, Харьков, пр. Ленина, 14, тел.: 8 (057) 702-15-15, e-mail: kuzy@kture.kharkov.ua.
Тороев Асамбек Абакирович, соискатель ХНУРЭ, генеральный директор совместного киргизско-российского предприятия «Вычислительная техника и средства автоматизации». Адрес: Киргизская республика, 720082, Бишкек, ул. Шабодан баатыра, 4А, тел./факс (996312) 53-00-31, e-mail: vtnsa@rambler.ru .
УДК 681.3 В.1. САЛАПАТОВ
ОСОБЛИВОСТ1 ФОРМУВАННЯ 1НФОРМАЦ1ЙНИХ РЕСУРС1В ДЛЯ Р1ЗНИХ БЛОК1В ПРОГРАМ
Розглядаються особливоси формування шформацшних ресурав, яю породжуються тд час виконання програм з циклами та розгалуженнями. Неефективне використання цих ресурав у вигляд певних даних у програмно-доступних репстрах е основною причиною надшрносп машинного коду програм, яка породжуеться уама комтляторами. Запропо-новано вести облш цих ресурав шд час комшляцл, що моделюе ди квалiфiкованого програ-мюта при створенш програм на мовi Асемблер i забезпечуе машинно-залежну ошгашза-щю програм.
1. Програмш розгалуження та шформацшш ресурси
Для забезпечення синтезу машинного коду програм при компшяци необхщно моделюва-ти ди квалiфiкованого програмюта щодо багаторазового використання шформацп, яка збе-рiгаеться у програмно доступних регiстрах (ПДР). Як було зазначено рашше [1], для ефективного використання тако! iнформацiï в процес синтезу коду програм створюеться спецiальна база даних iнформацiйних ресуршв (1Р), яка пiд час виконання програм постшно змiнюеться, i це необхщно враховувати при компiляцiï. У подальшому при синтезi машинного коду програм на останнш фазi компiляцiï - породженнi машинного коду - щ ресурси можуть бути багаторазово використаш, що забезпечуе ефектившсть коду програм за обраним критерiем у максимальнiй мiрi. В разi розгалуження з кiлькома програмними гшками та одним спiльним виходом з фрагмента розгалуження необхщно враховувати тшьки ri IP, що формуються в ушх програмних гiлках. Для тдпрограм база даних 1Р створюеться заздалепдь при ïхньому попередньому описi. Необхщно також враховувати особливосп формування IP в циклах.