ВЛИЯНИЕ ВИДА СТАТИСТИЧЕСКОГО РАСПРЕДЕЛЕНИЯ НА КАЧЕСТВО ДОСТОВЕРНОСТИ КРИВЫХ ОБЕСПЕЧЕННОСТИ
Д.А. Семанов, канд. хим. наук, науч. сотр.
А.Т. Горшкова, канд. геогр. наук, заведующая лабораторией
О.Н. Урбанова, ст. науч. сотр. лаборатории
Институт проблем экологии и недропользования АН РТ
(Россия, г. Казань)
Аннотация. В практике гидротехнического строительства используются значения гидрологических характеристик, выходящих за пределы выборочного ряда, оценка точности расчета которых вызывает наибольший интерес. Используя значения годовых расходов воды по пунктам наблюдений на р. Свияга, было определено влияние вида функции распределения значений на качество достоверности кривых обеспеченности. Показано, что нормализация исходных данных обеспечивает более простой способ оценки обеспеченности и достаточным является первичный поиск подходящей нормализации по минимуму суммы квадратов отклонений оценок обеспеченности от практически полученных значений ряда. Ключевые слова: гидрологические характеристики, оценка обеспеченности, нормализация, расчет.
Введение
В основе решение всех водохозяйственных задач лежат инженерные гидрологические расчеты, наибольшее распространение среди которых получили вероятностные технические приемы, позволяющие рассматривать многолетний ряд наблюдений любой гидрологической характеристики как выборку некоторой случайной величины, функция вероятности которой подлежит статистическому распределению.
При этом устанавливается связь между возможными значениями гидрологической характеристики и их повторяемостью. Для статистической оценки параметров в выборке разработано большое количество способов, среди которых наибольшее распространение в отечественной гидрологии получили метод моментов, метод наибольшего правдоподобия и метод квантилей [1].
Современные компьютеры позволяют автоматизировать (ускорить) расчетные процессы с использованием больших массивов данных, повышая их точность. В настоящее время многими учреждениями и организациями в практике гидрологических расчетов используют несколько программных продуктов - как специализированных компьютерных программ и сложных компью-
терных комплексов (Гидростатистика, Гидрорасчеты, HudroStatCalc), так и широко распространенных программных средств общего (Microsoft Exsel) и специального (Statistira) назначения [2].
Определение расчетных гидрологических характеристик осуществляется применением аналитических функций распределения ежегодных вероятностей превышения - кривых обеспеченностей. Наибольший интерес при этом представляет оценка точности расчета выборочных квантилей за пределами выборочного ряда, так как именно они используются в практике гидротехнического строительства для установления значения параметров гидрологического режима, определяющих проектные решения.
Параметры аналитических кривых всегда рассчитываются с погрешностями, что обусловлено недостатком исходных данных и малой точностью аппроксимации эмпирических данных аналитическими кривыми. Точное аналитическое решение определения погрешностей расчета параметров и значений стока заданных обеспеченностей отсутствует. Частичное решение этого вопроса основывается на использовании многочисленных формул, многие из ко-
торых не учитывают асимметрию ряда и внутригодовую корреляцию.
Материалы и методы
исследования
Для проверки влияния вида функции распределения на качество достоверности кривых обеспеченности были проведены оценки обеспеченности водного стока основанные на формулах Крицко-го С.Н. и Менкеля М.Ф., специально разработанных для гидрологических и водохозяйственных расчетов [3], а также на самых упрощённых вариантах функций распределения Виноградова Ю.Б. [4].
В качестве исходных данных использовались значения годовых расходов воды по пунктам наблюдений на р. Свияга. Разовые расчёты, выполненные с помощью программы, написанной на языке Python (версия 2.72), не требовательны к компьютерным ресурсам и проводились, в том числе, на вычислительной технике с процессором Intel Atom Z3740.
Предварительное преобразование исходных данных делалось тремя способами: логарифмированием, возведением в степень с двумя вариантами значений 0.5 и 0.75 с последующей оценкой параметров нормального распределения и
обратным преобразованием квантилей нормального распределения.
Использовался метод генерации большого числа подвыборок (500) путём исключения из исходных данных нескольких (5) случайно выбранных значений. Выбор конечного варианта распределения проводился взвешенным усреднением полученных функций распределения [5]. Разброс квантилей распределений и их параметров представлен в независимой от значений форме коэффициента вариации (Су).
Кроме того, определялась разница квадратов отклонений расчётных обес-печенностей от оценок, вытекающих из исходных данных, полученных по формуле квантилей Г.А. Алексеева, рекомендуемой СП 33-101-2003 [6].
Результаты исследования
Результаты оценок значений обеспеченности и параметров функций распределения с указанием коэффициента вариации для пунктов наблюдений Ивашевка, Вырыпаевка, Коромысловка, расположенных на р. Свияга и имеющих ряды наблюдений за стоком продолжительностью от 38 до 66 лет, представлены в таблице. Отклонения расчетных значений расходов воды от практически измеренных в пунктах наблюдений представлены на рисунке 1.
Таблица 1.
Название Трёхпараметрическое Нормализация Cтепенная Cтепенная
поста гамма-распределение логарифмированием нормализация нормализация
(ln(x)) (xn n=0,5) (xn n=0,75)
Ивашевка обесп.50%=21.5 обесп.50%=21.1 обесп.50%=21.7 обесп.50%=22.0
N=54 Cv=0.0149 Cv=0.00324 Cv=0.00443 Cv=0.00660
min=7.44 обесп.5%=37.2 обесп.5%=37.6 обесп.5%=35.3 обесп.5%=34.6
max=38,87 Cv=0.0214 Cv=0.00420 Cv=0.00553 Cv=0.00795
обесп.95%=П.1 обесп.95%=11.9 обесп.95%=11.4 обесп.95%=11.0
Cv=0.0383 Cv=0.00855 Cv=0.0104 Cv=0.0170
обесп.99%=7.98 обесп.99%=9.34 обесп.99%=8.14 обесп.99%=7.10
Cv=0.0413 Cv=0.0121 Cv=0.0157 Cv=0.0303
обесп.1%=45.5 обесп.1%=47.7 обесп.1%=41.8 обесп.1%=40.3
Cv=0.0277 Cv=0.00536 Cv=0.00652 Cv=0.00898
a=0.0618 Cv=0.0616 s=0.351 Cv=0.0270 s=0.777 Cv=0.0212 s=2.50 Cv=0.0207
b=0.896 Cv=0.0216
a=9.82 Cv=0.0655
XA2 = 0.114 XA2 = 0.113 XA2 = 0.094 XA2 = 0.112
Вырыпаевка обесп.50%=8.66 обесп.50%=8.44 обесп.50%=8.76 обесп.50%=8.91
N=66 Cv=0.0128 Cv=0.00409 Cv=0.00385 Cv=0.00596
min=2.54 обесп.5%=15.8 обесп.5%=16.2 обесп.5%=15.1 обесп.5%=14.8
max=19.46 Cv=0.0164 Cv=0.00418 Cv=0.00445 Cv=0.00676
обесп.95%=4.13 обесп.95%=4.40 обесп.95%=4.13 обесп.95%=3.89
Cv=0.0305 Cv=0.0117 Cv=0.00867 Cv=0.0157
обесп.99%=2.87 обесп.99%=3.36 обесп.99%=2.72 обесп.99%=2.16
Cv=0.0390 Cv=0.0180 Cv=0.0134 Cv=0.0309
обесп.1%=19.6 обесп.1%=21.2 обесп.1%=18.2 обесп.1%=17.4
Cv=0.0205 Cv=0.00511 Cv=0.00509 Cv=0.00745
a=0.128 Cv=0.0356 s=0.396 Cv=0.0183 s=0.563 Cv=0.0143 s=1.45 Cv=0.0151
b=0.931 Cv=0.0169
a=7.38 Cv=0.0491
XA2 = 0.0211 XA2 = 0.0493 XA2 = 0.0214 XA2 = 0.0298
Коромыслов обесп.50%=0.636 обесп.50%=0.623 обесп.50%=0.640 обесп.50%=0.647
ка Cv=0.0196 Cv=0.0255 Cv=0.00619 Cv=0.0105
N=38 обесп.5%=1.05 обесп.5%=1.05 Cv=0.320 обесп.5%=1.02 обесп.5%=1.01
min=0.32 Cv=0.0245 обесп.95%=0.368 Cv=0.00725 Cv=0.0116
max=1.16 обесп.95%=0.346 Cv=0.0173 обесп.95%=0.347 обесп.95%=0.332
Cv=0.0293 обесп.99%=0.296 Cv=0.0101 Cv=0.0180
обесп.99%=0.252 Cv=0.0174 обесп.99%=0.252 обесп.99%=0.218
Cv=0.0314 обесп.1%=1.31 Cv=0.0775 Cv=0.0143 Cv=0.0295
обесп.1%=1.27 s=0.320 Cv=0.0233 обесп.1%=1.20 обесп.1%=1.17
Cv=0.0280 Cv=0.00801 Cv=0.0124
a=1.49 Cv=0.0220 s=0.128 Cv=0.0213 s=0.173
b=0.953 Cv=0.0143 XA2 = 0.0669 Cv=0.0229
a=10.2 Cv=0.0731
XA2 = 0.0649 XA2 = 0.0820 XA2 = 0.0926
0.00 0.20 0.40 0.60 0.80 1 .00
Обеспеченность (Коромысловка)
Рис. 1. Отклонения расчетных значений расходов от практически измеренных
Проведенное трёхпараметрическое гамма-распределение и предварительное логарифмирование приводят к сравнительному завышению расчётных значений расходов при обеспеченностях ниже 10%. Нормализация логарифмированием завышает значения расходов воды при обеспеченностях выше 90%.
Степенные функции приводят к небольшому завышению значений 50% обеспеченности. Наиболее равномерно отклоняется от практических измерений вариант с нормализацией степенной функцией при п=0.5. Вывод подтвер-
ждается более низким значением суммы квадратов отклонений оценок обеспеченности от практически полученных результатов.
В нашем случае (р. Свияга, пост Ивашевка) нормализация степенной функцией со степенью 0.5 (для участка с высокими значениями обеспеченности) и нормализация логарифмированием (для участка с низкими значениями обеспеченности) дало практически идентичные результаты с расчётом по формуле Крицкого-Менкеля (рисунок 2).
0.00 0.20 0.40 0.60 0.80 1.00
Обеспеченность
Рис. 2. Параметры распределения исходных данных по посту Ивашевка
Коэффициенты вариации для расчётных обеспеченностей, низкие по сравнению с погрешностями измерения расходов могут объясняться «жесткостью» параметрических функций распределения с малым количеством параметров. Невысокие значения коэффициентов вариации для оценок параметров указывает на их устойчивость при небольшой изменчивости исходных данных, на качество исходных данных и влияние на них объёма исходных данных. Обращает на себя внимание, что при меньшем исходном объёме данных на посту Ко-ромысловка трёхпараметрическое гамма-распределение показало неплохие результаты и существенное снижение коэффициентов вариации параметров.
Заключение
Фактически любая из функций при достаточности данных обеспечивает оценки одного порядка с отклонением, не превышающим погрешностей исходных данных. По этой причине подход с нормализацией исходных данных, обеспечивающий более простой способ оценки обеспеченности, оказывается предпочтительнее, чем расчёт через поиск параметров трёхпараметрического гамма-
распределения. Возможно, достаточным будет первичный поиск подходящей нормализации по минимуму суммы
квадратов отклонений оценок обеспеченности от практически полученных. Возможен также предварительный поиск оптимального значения п, в том числе перебором с достаточно большим шагом, для степенной функции с использованием любого способа оценки отклонения от исходных данных, в том числе и самого простого по величине суммы квадратов отклонений оценок обеспеченности от практически полученных. Некоторая вариация в подборе параметра п для степенной функции не даст существенно отличающегося результата при расчёте обеспеченностей. Так для оценки влияния параметра п при степенной нормализации на £Д2 проводился поиск значения п, для которого минимально. Для поста
Ивашевка при п = 0.35 £Д2 = 0.0909, для поста Вырыпаевка при п = 0.48 ^Д2 = 0.0213, для поста Коромысловка при п = 0.01 £Д2 = 0.0662. В последнем случае это минимальное проверенное значение п, при переборе от 0.01 до 0.95 с шагом 0.1. Это может быть использовано для автоматического поиска параметров распределения, в том числе и для перехода от степенной нормализации к логарифмической или к использованию трехпараметрического гамма-распределения.
Библиографический список
1. Христофоров А.В. Оценка параметров распределения вероятностей величин речного стока/Метеорология и гидрология. №8. 1981. С.78-85.
2. Магницкий Д.В. Речной сток и гидрологические расчеты: практические работы с выполнением при помощи компьютерных программ - М. изд-во «Триумф», 2014. 184 с.
3. Крицкий С.Н., Менкель М.Ф. Гидрологические основы речной гидротехники. Изд. АН СССР, 1950.
4. Виноградов Ю.Б. Математическое моделирование процессов формирования стока. Л.: Гидрометеоиздат, 1988. - 312 с.
5. Hirotugu Akaika A new look at the statistical model identification. IEEE transaction on automatic control, vol ac 19 №6, december 1974.
6. СП 33-101-2003. Определение основных расчетных гидрологических характеристик. М.: Госстрой России, ФГУП ЦПП, 2004. - 73 с.
EFFECT OF TYPE OF STATISTICAL DISTRIBUTION ON QUALITY OF AUTHENTICITY OF CURVES OF MATERIAL WELL-BEING
D.A. Semanov, candidate of chemistry, researcher
A.T. Gorshkova, candidate of geographical sciences, head of laboratory
O.N. Urbanova, senior researcher of the laboratory
Institute of problems of ecology and subsoil use of the Academy of sciences of the Republic of Tajikistan (Russia, Kazan)
Abstract. It is very interesting to estimate the calculation of hydrological characteristics by non-ordinary values for the practice of hydraulic engineering. The influence of the values of the distribution function to ensure the reliability of the quality of curves was determined by the point value of the annual costs of river flow. It is proved that the normalization of the initial data provides a simpler way of assessing the security and it is sufficient to first search for a suitable normalization by minimizing the sum of the squared deviations of the security estimates from the practically obtained values of the series.
Keywords: hydrological descriptions, estimation of water availability, normalization, calculation.