Научная статья на тему 'Анализ и оценка качества модели гидротехнического сооружения'

Анализ и оценка качества модели гидротехнического сооружения Текст научной статьи по специальности «Строительство и архитектура»

CC BY
87
24
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ОЦЕНКА КАЧЕСТВА МОДЕЛЕЙ / ОШИБКА АППРОКСИМАЦИИ / КОЭФФИЦИЕНТ ДЕТЕРМИНАЦИИ R2 / MODELS QUALITY ESTIMATION / APPROXIMATION ERROR / DETERMINATION COEFFICIENT R2

Аннотация научной статьи по строительству и архитектуре, автор научной работы — Кузнецова М.В., Маслак О.Н., Дорожкина О.П.

В данной статье приведена корреляционно-регрессионная модель, которая может быть использована в гидротехническом строительстве для прогнозирования процессов в условиях отсутствия подробной информации об объемах работ и условиях их выполнения. Качество построенной модели оценивается также с помощью средней ошибки аппроксимации, коэффициента детерминации С использованием MSExcel построены графики исходных данных и линий регрессии: линейной, логарифмической, степенной, экспоненциальной и выбран наилучший.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по строительству и архитектуре , автор научной работы — Кузнецова М.В., Маслак О.Н., Дорожкина О.П.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

ANALYSIS AND EVALUATION OF QUALITY MODELS HYDRAULIC STRUCTURES

This article describes the correlation-regression model that can be used in hydraulic engineering to predict the processes in the absence of detailed information on the scope of work and terms of their implementation. The quality of the constructed model is also estimated using the average approximation error, the coefficient of determination Using MSExcel graphs of raw data, and regression lines: linear, logarithmic, power, exponential and the best chosen.

Текст научной работы на тему «Анализ и оценка качества модели гидротехнического сооружения»

УДК 626.01:519.8

М.В. Кузнецова

канд. техн. наук, доцент, кафедра водоснабжения и использования водных ресурсов, Новочеркасский инженерно-мелиоративный институт

им. А.К. Кортунова,

ФГБОУ ВО «Донской государственный аграрный университет»

О.Н. Маслак канд. техн. наук, доцент, кафедра водоснабжения и использования водных ресурсов, Новочеркасский инженерно-мелиоративный институт

им. А.К. Кортунова,

ФГБОУ ВО «Донской государственный аграрный университет»

О.П. Дорожкина

аспирант,

кафедра водоснабжения и использования водных ресурсов, Новочеркасский инженерно-мелиоративный институт

им. А.К. Кортунова,

ФГБОУ ВО «Донской государственный аграрный университет» АНАЛИЗ И ОЦЕНКА КАЧЕСТВА МОДЕЛИ ГИДРОТЕХНИЧЕСКОГО СООРУЖЕНИЯ

Аннотация. В данной статье приведена корреляционно-регрессионная модель, которая может быть использована в гидротехническом строительстве для прогнозирования процессов в условиях отсутствия подробной информации об объемах работ и условиях их выполнения. Качество построенной модели оценивается также

с помощью средней ошибки аппроксимации, коэффициента детерминации R2. С использованием MSExcel построены графики исходных данных и линий регрессии: линейной, логарифмической, степенной, экспоненциальной и выбран наилучший.

Ключевые слова: оценка качества моделей, ошибка аппроксимации, коэффициент детерминации R2.

M.V. Kuznetsova, Novocherkassk Engineering reclamation Institute of A.K. Kortunova, Don State Agrarian

O.N. Maslak, Novocherkassk Engineering reclamation Institute of A.K. Kortunova, Don State Agrarian

O.P. Dorozhkina, Novocherkassk Engineering reclamation Institute of A.K. Kortunova, Don State Agrarian

ANALYSIS AND EVALUATION OF QUALITY MODELS HYDRAULIC STRUCTURES

Abstract. This article describes the correlation-regression model that can be used in hydraulic engineering to predict the processes in the absence of detailed information on the scope of work and terms of their implementation. The quality of the constructed model is also estimated using the average approximation error, the coefficient of determination R2. Using MSExcel graphs of raw data, and regression lines: linear, logarithmic, power, exponential and the best chosen.

Keywords: models quality estimation, approximation error, determination coefficient R2.

Одной из проблем, возникающей при строительстве гидротехнических сооружений является трудность, связанная с нахождением оптимальной длительности периода эксплуатации гидротехнического сооружения в условиях, когда существует возможность превышения расхода воды.

Решение о длительности эксплуатации гидротехнических систем принимается до начала рабочего проектирования, поэтому отсутствует подробная информация об объемах работ и условиях их выполнения. Определить основные параметры инвестиционного проекта приходится в условиях недостатка информации.

Для ориентировочного определения сроков эксплуатации необходимо использовать укрупненные показатели. Основные параметры гидротехнического сооружения, предназначенные к реконструкции, могут быть определены путем анализа их проектов и отчетных данных об эксплуатации.

Основными показателями, характеризующими параметры гидротехнического сооружения, являются: количество шлюзов и затворов, длина гидроузла, расход воды в гидроузле.

После заключения договора подряда производится разработка организационно-

технологической документации на объект. При этом широко используются модели линейного и динамического программирования.

Методика учёта фактора длительности эксплуатации объекта в зависимости от класса надежности гидротехнического сооружения разработана недостаточно при решении задач календарного планирования. Сложность заключается в трудности получения исходных данных для расчета показателей, учитывающих время эксплуатации гидроузла.

При разработке технической документации на эксплуатацию линейно-протяжённых объектов гидротехнических систем ГТС, потребность в различного вида материальных ресурсах может быть определена путем перемножения время эксплуатации на удельный расход ресурсов:

т = к,Г ■ яуд, (1)

где - потребность в ресурсах вида /;

к, - класс надежности;

Т - время эксплуатации ГТС, лет

Яуд - удельный расход ресурса вида / за 1 год эксплуатации объекта.

За период 1998-2000 гг. были собраны данные о длительности эксплуатации линейно-протяженных объектов ГТС Ростовской области (табл. 1).

Таблица 1 -Данные о линейно-протяженных объектах ГТС

Превышение максимального расхода воды в зависимости от класса надежности, % (х) 1 8 3 5 8 10 2 4 2 6

Длительность эксплуатации гидротехнического сооружения, лет (у) 5 3 4 4 3 2 5 4 5 3

По этим данным построим корреляционно-регрессионную модель [1]. Для построения графика построим точки с координатами, взятыми из таблицы 1. Необходимо подобрать уравнение регрессии, т.е. функцию, которая наилучшим образом подходит к данным эмпирическим значениям. Факторным признаком будем считать х, результативным у (рис. 1).

0

у = -0,3281х + 5,4077

2

к2 = 0,9296

1

2

3

4 5 6 7 8 9 10 11 Рисунок 1 - График линейной регрессии

Вид поля корреляции показывает, что с увеличением факторного признака происходит увеличение и результативного, что говорит о линейной зависимости между данными величинами. Данное уравнение запишем в виде: ух = а0 + а1х .

Для нахождения коэффициентов линейной регрессии а0 и а1 удобнее составить таблицу 2, заполнив необходимые для подстановки в формулы столбцы 1-6, затем проанализировав уравнение, заполним остальные.

Таблица 2 - Расчет параметров линейной регрессии

№ п/п Исходные данные Промежуточные данные Проверка качества модели

х: У: х. ■ у. х? у- Ул У: ~ У* У: ~ У. I У:~УХ I*

У:

1 2 3 4 5 с 7 8 10

1 1 5 5 1 25 5.09 -0.09 0.016 0.003

2 3 3 24 64 9 2.76 0.22 0.073 0.048

Э 3 4 12 9 16 4.43 -0.43 0.107 0.165

4 5 4 20 25 16 3.77 0.23 0.056 0.053

5 3 3 24 64 9 2.76 0.22 0.073 0.043

Б 10 2 20 100 4 2.12 -0.12 0.060 0.014

7 2 5 10 4 25 4.76 0.24 0.048 0.058

3 4 4 16 16 16 4.10 -0.10 0.025 0.010

Э 2 5 10 4 25 4.76 0.24 0.048 0.058

13 Б 3 16 36 9 3.44 -0.44 0.147 0.194

Итога 49 38 159 323 154 - - 0,Б57 0,676

Среднее значение - X*, х = ^-^ = 4,9 п п ху= 15,9 х2 = 32,3 у2 = 15,4 - - 0,0657 -

о2 ^М;?)-(х,2 = 8,29 о^ = 0,96 - - - - - - -

СГ £7 =2,66 X ¿т =0,96 У - - - - - - -

Для нахождения параметров а0 и а1 используем систему уравнений, полученную по методу наименьших квадратов (МНК):

пао + а1^ X = Ё У,

п п п

ао Ё X + аЁ х2 = Ё Ух,

тогда

10а0 + 49а1 = 38 49а0 + 323а1 = 159'

/=1 /=1 /=1

Найдем решение данной системы уравнений, используя формулы Крамера и получим: а0 = 5,42 и а1 = -0,33 . Искомое уравнение запишем:

ух = 5,42 - 0,33х.

Вычислим по приводимой ниже формуле коэффициент корреляции, который отражает тесноту линейной зависимости:

г =

ху

п п п

п • Ё х У / - Ё X • Ё уУ

/=1 /=1 /=1

п • Ё х2 - |Ё X

V

= 0,961.

(2)

п • Ё У2 - |Ё у

/=1 V/=1

32 ^2

Определяем коэффициент детерминации: Я = гху = 0,928, который указывает на то,

что 93% вариации срока эксплуатации ГТС объясняется вариацией фактора х - превышением максимального расхода воды.

Одним из критериев качества модели является средняя ошибка аппроксимации, которая вычисляется по известной в математической статистике формуле (3). Для расчета заполняем столбцы 7-9 таблицы. Значения х, подставим в уравнение регрессии и найдем ух .

- 1 п

е =1Ё п Ь

У, - Ух

У,

• 100% = 0,0657 • 100% » 6,63% .

(3)

Полученное значение меньше 15%, что свидетельствует о хорошем качестве модели.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

1=1

,=1

2

2

/=1

1=1

Для проверки статистической значимости модели воспользуемся критерием Фишера. Выдвинем для проверки гипотезу Н0 о статистической незначимости уравнения регрессии и показателя тесноты связи.

Фактическое значение данного критерия Рфакт вычислим, используя формулу:

факт.

*2 >-2) = -^.(10-2) = 093:8»106.

V ' Л Г\ ПО V > " " —

1 -Я2У ' 1 -0,93 4 ' 0,07

Для нахождения критического значения критерия Фишера Ртабл необходимо учитывать

уровень значимости, который обозначается а, число степеней свободы к1 = 1 (т.к. регрессия

линейная) и остаточной дисперсии к2 = п - 2 = 10 - 2 = 8. Примем а=0,05 и по таблице значений

критерия Фишера Р,зная уровень значимости, найдем Ртал = 5,32.

Так как Рфакт > Ртабл , то Н0 - гипотеза о случайной природе оцениваемых характеристик

неверна, она отклоняется и признается статистическая значимость и надежность уравнения регрессии.

Необходимо оценить статистическую значимость найденных параметров. Для этого используем ¿-статистику Стьюдента.

Пусть Н0-гипотеза предполагает, что показатели случайно отличаются от нуля. Найдем число степеней свободы к = п-2 = 10-2 = 8, уровень значимости вводился ранее а= 0,05 и определим значение критерия Стьюдента ¿табл [3]: ¿табл = 2,306 .

Для дальнейших вычислений найдем случайные ошибки та ,та ,тг , используя

а0 а1 'ху

формулы 4-6.

т =

1

п , — п

X(у, - Ух,) Хх,2

п - 2

■X(*, -х)2

0,18

(4)

т, =

т =

X (У>- У)2

п , —% 2

(п-2).X(х -х)

=1

0,13 .

0,03 ,

1 - *2

п - 2

(5)

(6)

Фактические значения находят по отношению показателя к ошибке:

а =^ = 29 = 9; * =

5,42

0,33

'а,

0 т=

0,18

т=

0,03

т.

0,96 0,13

7,0

Сравним фактические и табличные показатели коэффициентов а0, а1 и гху. Все фактические значения оказались больше табличных, поэтому принятая гипотеза Н0 ошибочна. Показатели а0, а1 и гху статистически значимы, что свидетельствует о статистической достоверности уравнения регрессии ух = 5,42 - 0,33х. Принимаем идеализацию для линейной регрессии [2].

С использованием МБЕхсе! построим графики исходных данных и линий регрессии: линейной, логарифмической, полиномиальной, степенной, экспоненциальной (рис. 2).

п

а) линейная регрессия

б) логарифмическая регрессия

в) полиномиальная регрессия

г) степенная регрессия

д) экспоненциальная регрессия Рисунок 2 - Графики линий регрессии

Для выбора наилучшего вида линии регрессии сравним значения коэффициента детерминации *2:

- линейная регрессия: ух =-0,3281х + 5,4077, *2 = 0,9296;

- логарифмическая регрессия: ух =-1,291/_п (х) + 5,5718, *2 = 0,8631;

- квадратичная (полиномиальная, п = 2) регрессия:

ух = 0,0035х2 - 0,3657х + 5,4789 , *2 = 0,9303 ;

- степенная регрессия: ух = 5,9826х-0,358, *2 = 0,7967 ;

- экспоненциальная регрессия: ух = 5,804е"°,0941х, *2 = 0,9179.

Сравнивая коэффициенты детерминации у полученных линий тренда, отмечаем, что исходные данные лучше всего описывает квадратичная регрессия (*2 = 0,9303). Следовательно, в данной задаче для расчета прогнозных значений следует использовать уравнение:

ух = 0,0035х2 - 0,3657х + 5,4789 .

Пользуясь полученными графическими зависимостями и уравнением, можно зная уровень превышения максимального расхода воды ГТС, определить время эксплуатации и количество необходимых строительных материалов и гидротехнических бригад. Это можно будет сделать еще до начала рабочего проектирования, что необходимо для определения требуемого уровня мобильности гидротехнических строительных организаций, претендующих на получение заказа на реконструкцию ГТС.

Список литературы:

1. Барботько, А.И. Основы теории математического моделирования: учебное пособие / А.И. Барботько, А.О. Гладишкин. - Старый Оскол: ТНТ, 2013. - 212 с.

2. Бахвалов, Ю.А. Математическое моделирование: учебное пособие для вузов / Ю.А. Бахвалов; Южн.-Рос. гос. техн. ун-т. - Новочеркасск: ЮРГТУ (НПИ), 2010. - 142 с.

3. Гмурман, В.Е. Теория вероятностей и математическая статистика: учебное пособие для бакалавров / В.Е. Гмурман. - М.: ЮРАЙТ, 2012. - 479 с.

4. Лесин, В.В. Основы методов оптимизации: учебное пособие / В.В. Лесин, Ю.П. Лисо-вец. - 3-е изд., испр. - Санкт-Петербург: Лань, 2011. - 340 с.

i Надоели баннеры? Вы всегда можете отключить рекламу.