Academia. Архитектура и строительство, № 3, стр. 155-160. Academia. Architecture and Construction, no. 3, pp. 155-160.
Исследования и теория
Научная статья
УДК 691.328.1, 693.557
DOI: 10.22337/2077-9038-2024-3-155-160
Обобщённые коэффициенты корреляции и их применимость для определения свойств бетона при испытаниях
Арленинов Пётр Дмитриевич (Москва). Кандидат технических наук. Научно-исследовательский, проектно-конструкторский и технологический институт бетона и железобетона НИЦ «Строительство» (Россия, 109428, Москва, 2-я Институтская ул., 6, корп. 5. НИИЖБ им. А.А. Гвоздева); кафедра железобетонных и каменных конструкций Национального исследовательского Московского государственного строительного университета (Россия, 129337, Москва, Ярославское шоссе, 26. НИУ МГСУ). Эл. почта: [email protected]
Крылов Сергей Борисович (Москва). Доктор технических наук, академик РААСН. Лаборатория механики железобетона Научно-исследовательского, проектно-конструкторского и технологического института бетона и железобетона НИЦ «Строительство» (Россия, 109428, Москва, 2-я Институтская ул., 6, корп. 5. НИИЖБ им. А.А. Гвоздева). Эл. почта: [email protected]
Калмакова Полина Сергеевна (Москва). Лаборатория механики железобетона Научно-исследовательского, проектно-конструкторского и технологического института бетона и железобетона НИЦ «Строительство» (Россия, 109428, Москва, 2-я Институтская ул., 6, корп. 5. НИИЖБ им. А.А. Гвоздева). Эл. почта: [email protected]
Корнюшина Марина Петровна (Москва). Лаборатория механики железобетона Научно-исследовательского, проектно-конструкторского и технологического института бетона и железобетона НИЦ «Строительство» (Россия, 109428, Москва, 2-я Институтская ул., 6, корп. 5. НИИЖБ им. А.А. Гвоздева).
Аннотация. Работа посвящена выявлению геометрического смысла коэффициента парной корреляции, а также множественного коэффициента корреляции. Сделаны широкие обобщения этих коэффициентов. Предложен новый вид множественного коэффициента корреляции - между набором независимых переменных и набором зависимых переменных. Приведены примеры использования предложенных обобщённых коэффициентов корреляции для определения свойств бетона при испытаниях. Показаны их преимущества перед обычными коэффициентами корреляции.
Ключевые слова: корреляция, коэффициент корреляции, парная корреляция, множественная корреляция
Для цитирования. Арленинов П.Д., Крылов С.Б., Корнюшина М.П., Калмакова П.С. Обобщённые коэффициенты корреляции и их применимость для определения свойств бетона при испытаниях // Academia. Архитектура и строительство. - 2024. - № 3. - С. 155-160. - DOI: 10.22337/2077-9038-2024-3-155-160.
Generalized Correlation Coefficients and Their Applicability for Determining the Properties of
Concrete during Testing
Arleninov Petr D. (Moscow). Candidate of Sciences of Technology. Research, Design and Technological Institute of Concrete and Reinforced Concrete of the "National Research Center 'Construction'" (6, build. 5, 2nd Institutskaya, Moscow, 109428, Russia. NIIZHB named after A.A. Gvozdev); Department of Reinforced Concrete and Masonry Structures of the National Research Moscow State University of Civil Engineering (Russia, 129337, 26, YarosLavskoye Shosse, Moscow, Russia. NRU MGSU). E-mail: [email protected]
© Арленинов П.Д., Крылов С.Б., Корнюшина М.П., Калмакова П.С., 2024.
Krylov Sergey B. (Moscow). Doctor of Sciences of Technology, Academician of RAACS. Laboratory of reinforced concrete mechanics of the Research, Design and Technological Institute of Concrete and Reinforced Concrete of the "National Research Center 'Construction'" (6, build. 5, 2nd Institutskaya, Moscow, 109428, Russia. NIIZHB named after A.A. Gvozdev). E-mail: [email protected]
Kalmakova Polina S. (Moscow). Laboratory of reinforced concrete mechanics of the Research, Design and Technological Institute of Concrete and Reinforced Concrete of the "National Research Center 'Construction'" (6, build. 5, 2nd Institutskaya, Moscow, 109428, Russia. NIIZHB named after A.A. Gvozdev). E-mail: niizhb_lab8@ mail.ru
Kornyushina Marina P. (Moscow). Laboratory of reinforced concrete mechanics of the Research, Design and Technological Institute of Concrete and Reinforced Concrete of the "National Research Center 'Construction'" (6, build. 5, 2nd Institutskaya, Moscow, 109428, Russia. NIIZHB named after A.A. Gvozdev).
Abstract. The work is devoted to identifying the geometric meaning of the paired correlation coefficient, as well as the multiple correlation coefficient. Broad generalizations of these coefficients are made. A new type of multiple correlation coefficient is proposed - between a set of independent variables and a set of dependent variables. Examples of the use of the proposed generalized correlation coefficients are given. Their advantages over conventional correlation coefficients are shown.
Keywords: correlation, correlation coefficient, pair correlation, multiple correlation
For citation. Arleninov P.D., Krylov S.B., Kalmakova P.S., Kornyushina M.P. Generalized Correlation Coefficients and Their Applicability for Determining the Properties of Concrete during Testing. In: Academia. Architecture and Construction, 2024, no. 3, pp. 155-160, doi: 10.22337/2077-9038-2024-3-155-160.
Введение
Понятие «корреляция» в настоящее время рассматривается как статистическая взаимосвязь двух или более случайных величин. Часто коэффициент парной корреляции (для двух величин) рассматривается как показатель близости этой взаимосвязи к функциональной зависимости. Корреляционный анализ также находит своё применение и в строительстве. В частности, коэффициенты корреляции применяются для оценки качества регрессионных зависимостей при обработке результатов экспериментов, для выявления взаимосвязей между различными исследуемыми величинами, для оценки точности расчётных моделей и т.д. Смысл этого понятия рассматривается исключительно с позиций статистики. Соответственно, в терминах статистики формулируются все положения корреляционного анализа, математические выражения коэффициентов корреляции строятся исключительно с использованием статистических параметров. Внимательное изучение этих выражений позволяет предложить иной подход к построению таких зависимостей и придать корреляции более широкий смысл.
Рассмотрение этого понятия исключительно с точки зрения статистики скрывает важные геометрические зависимости. В свою очередь, удобная геометрическая интерпретация позволяет сделать важные обобщения корреляции и применить понятие «корреляция» к решению целого ряда задач, связанных с оценкой состояния строительных конструкций.
Таким образом, основная задача проведённого исследования состоит в выявлении геометрического смысла коэффициента корреляции и обобщении его.
При сравнении основных формул, используемых в дисперсионном анализе, и формул, по которым вычисляются нормы
векторов, можно заметить много общего между ними. Это наводит на мысль о возможности примения элементов теории векторных пространств в дисперсионном анализе, а также в регрессионном и корреляционном анализе. Проведённые исследования позволяют сделать обобщения этого понятия с точки зрения теории векторных пространств. В свою очередь, такие обобщения дают возможность лучше понять смысл корреляции и распространить корреляционный анализ на новые виды задач.
Рассмотрение парного коэффициента линейной корреляции с точки зрения векторных пространств
В области строительства для оценки корреляционных связей наиболее широко применяется коэффициент линейной корреляции Пирсона. При этом для двух случайных переменных Х и Y, между которыми предполагается корреляционная зависимость, определяется ковариация (1).
(1)
Коэффициент корреляции при этом определяется как [1; 2]
covXy T,(xi-x)(yi-y)
rXY — '
ax<jY
JzCxi-xfECy-y)2 ' (2)
средние значения вы-
здесь х = и у = У1
борокХи У.
При этом предполагается, что распределение случайных величин близко к нормальному.
Для выявления геометрического смысла коэффициента корреляции, перепишем формулу (2) по-другому:
(3)
Также рассмотрим два вектора а и Ь:
(5)
Пронормируем векторы а и Ь. При этом получим единичные векторы. Обозначим их соответственно еа и еь
У1~У
\
^М-ху)
еь =
^М-у)2
Уп~У
\juyi-y)2)
(6)
ГХУ = (« • еЬ) .
(7)
Поскольку векторы еа и еьявляются нормированными, то их скалярное произведение равно косинусу угла между ними
г™ = I е И е, I cosa = 1•1•cosa .
ХУ а Ь
(8)
не функцией угла, а самим углом а. Поскольку обычный коэффициент корреляции изменяется в пределах от -1 до +1,
то удобнее в качестве данного обобщённого коэффициента
„ а
90°
рассматривать относительный угол, например: г
а
или
(4)
Координаты каждого из этих двух векторов представляют собой отклонение значений величин X и Y от их средних значений - это графически показано на рисунке 1 для трёх точек.
Тогда нормы этих векторов в евклидовом пространстве [3] определяются как
Сравнивая компоненты векторов еа и еь (6) с компонентами формулы (3), можно сделать вывод, что правая часть выражения (3) представляет собой скалярное произведение векторов
Таким образом, коэффициент линейной корреляции Пирсона является косинусом угла между векторами, компоненты которых состоят из отклонений двух случайных величин от их средних значений. По своей сути он выражает степень близости указанных векторов к линейной зависимости.
Обобщения коэффициента парной корреляции
Выяснив геометрический смысл коэффициента корреляции, можем обобщить его, расширив области возможных значений параметров, входящих в него.
1. Вид распределения случайных величин не имеет значения при предлагаемом подходе.
2. Поскольку коэффициент корреляции представляет собой косинус угла между векторами, то можно использовать любую функцию угла, а в некоторых случаях удобно пользоваться
п/2 , где угол а измеряется соответственно в градусах или
радианах (в этой записи предполагается, что угол приведён к величине в пределах от 0 до 90 градусов).
3. Как было показано выше, коэффициент корреляции Пирсона соответствует векторам отклонений значений переменных X и Y от их средних значений. Можно обобщить понятие коэффициента корреляции на случай, когда вычисления отклонений выполняются не относительно среднего значения каждой переменной, а относительно произвольной точки на числовой оси. Эта точка может быть связана с областью значений переменных X и Y (например, привязана к их средним значениям, как коэффициент корреляции Пирсона) или привязана к какой-то фиксированной точке на каждой числовой оси (например, к началу координат) (рис. 2).
В названии такого обобщённого коэффициента корреляции целесообразно указать название точки, относительно которой выполняются вычисления.
Рис. 11. Отклонение значений случайных величин X и Y от средних значений (координаты векторов a и Ь)
Все приведённые в статье рисунки выполнены её авторами.
Рис. 2. Координаты векторов a и Ь, необходимые для вычисления обобщённого коэффициента корреляции, соответствующего точке A
е и е., то есть
аЬ
Информативность коэффициента корреляции
Введённые обобщения позволяют оценить информативность коэффициента парной корреляции. Рассмотрим это на типичном примере оценки точности регрессионной зависимости по методике ГОСТ 22690-2015 «Бетоны. Определение прочности механическими методами неразрушающего контроля»2 (также такую обработку можно провести для любых других результатов испытаний бетонных и железобетонных образцов, включая длительные испытания). Рассмотрим случай, когда у нас есть бетон, для которого известны несколько фактических значений прочности Я . Пусть прочность измерялась прибором неразрушающего контроля и были получены показания прибора (косвенные значения) Я. Для определённости примем значения {1, 2, 3}. После этого показания прибора были пересчитаны в значения прочности по данным неразрушающего контроля Ян. по градуировочной зависимости вида
R = H.
н
Обычно для оценки точности построенной градуировочной зависимости вычисляется коэффициент парной корреляции между измеренными и фактическими значениями прочности. При высокой корреляции градуировочная зависимость признаётся хорошей. Сразу заметим, что нам требуется не корреляция, а, по возможности, точное совпадение фактических и измеренных значений. Для большей наглядности будем рассматривать случай, когда обе переменные Яф и Ян принимают по три значения и все соответствующие точки расположены на одной прямой в координатах К0Ч (рис. 3).
В данном примере коэффициент корреляции между фактическими значениями прочности и значениями, измеренными и пересчитанными по градуировочной зависимости, равен единице.
Теперь рассмотрим случай, когда использована ошибочная градуировочная зависимость, тоже линейная. В качестве такой зависимости выберем произвольную линию, например, описываемую уравнением
или
R = - 2 • H + 5
R = 0,5 • H + 5 .
(9) (10)
! https://docs.cntd.ru/document/1200124396
Рис. 3. Истинная и ошибочные градуировочные зависимости, имеющие одинаковое абсолютное значение коэффициента парной корреляции Пирсона
Если произвести непосредственные вычисления, можно убедиться, что абсолютное значение коэффициента корреляции Пирсона при ошибочных зависимостях по-прежнему получается равным единице. И если не проконтролировать точность этой зависимости по графику (зрительно) или по средней ошибке аппроксимации, то ошибка не будет обнаружена. Это происходит потому, что при смещении значений по оси измеренной прочности на пять единиц в уравнении (9), координаты вектора отклонений от нового значения R остаются прежними и длина вектора не меняется. При умножении на 2 соотношения между этими координатами остаются прежними и направление упомянутого вектора отклонений также не изменяется. Из приведённого примера следует, что коэффициент корреляции Пирсона в общем случае не позволяет оценить точность совпадения фактических и измеренных результатов. Высокий коэффициент корреляции лишь означает, что между измеренными и фактическими результатами существует линейная зависимость, параметры которой могут быть определены только из некоторых дополнительных условий (минимум погрешности, например). Данный результат может показаться парадоксальным с точки зрения инженера, но в действительности он известен в теории корреляции. Здесь этот пример приведён для подтверждения изложенных выше векторных построений.
Применение обобщённого коэффициента парной корреляции в данной ситуации может сразу выявить ошибку. Выберем случайную точку, относительно которой будем вычислять векторы отклонений. Для генерации случайных координат этой точки воспользуемся функцией RandomReal из пакета компьютерной математики Wolfram Mathematica. Для воспроизводимости расчётов генератор инициализировался числом 1234 (SeedRandom [1234]). Генерировалось три случайных числа, имеющих равномерное распределение в интервале от 0 до 5. Получены значения {4,38304; 2,60982; 0,431117}. Эти числа использовались в качестве координат случайной точки (координат случайного вектора А). В соответствии с изложенным выше алгоритмом получим координаты вектора отклонений истинных значений от выбранного случайного вектора:
A -Rф = {3,38304; 0,609821; -2,56888}, и координаты вектора отклонений измеренных значений по уравнению (9) от выбранного случайного вектора:
A -Rh = {1,38304; 1,60982; 1,43112}
Косинус угла между этими векторами равен 0,180631, то есть векторы почти ортогональны. Тем самым ошибка выявлена. При использовании коэффициента Пирсона, как было отмечено, ошибка не выявляется. Справедливости ради следует отметить, что такой результат получился из-за удачного расположения случайной точки. Тем не менее пример является показательным.
Основываясь на изложенном выше представлении о переменных как векторах, можно сделать вывод, что для проверки точности регрессионной зависимости следует рассмотреть, как угол между векторами фактических и измеренных проч-ностей, так и нормы этих векторов. Это справедливо как для обобщённых парных коэффициентов корреляции, так и для коэффициентов корреляции Пирсона.
В соответствии со сделанными обобщениями можем выбрать произвольную фиксированную точку на числовой оси, относительно которой будем вычислять координаты векторов. Выберем в качестве такой точки начало координат. Тогда следует рассмотреть не векторы отклонений, а векторы непосредственно измеренных и фактических значений. То есть необходимо рассмотреть следующие соотношения.
Для оценки совпадения направлений:
г =
1я„П
_ X у
^■ЯнЛМф.У
и для оценки совпадения длин векторов:
а _ =
Нд1Н
Вернёмся к данным из приведённого примера с истинными значениями переменных {1, 2, 3}. В качестве ошибочной гра-дуировочной зависимости рассмотрим уравнение:
Я = 0,5 • Н + 5 .
(11)
ях относительно начала координат получим относительную погрешность 3 = 1,86, а для векторов, сформированных по Пирсону 3 = 0,5. Таким образом, по одной оценке получаем ошибку почти двукратную, по другой оценке - ошибка строго двукратная. Коэффициенты корреляции, вычисленные разными методами, при этом почти одинаково высоки.
В качестве ещё одного примера было выполнено исследование корреляции между нагрузками и прогибами конструкции при нелинейной работе материала при ступенчатом загруже-нии. Проведённые исследования показали, что коэффициент парной корреляции Пирсона при оценке нелинейной работы конструкции (на примере балки) является мало информативным. Он позволяет явно определить развитие пластических деформаций в материале, только когда эти деформации охватят значительную часть поперечного сечения. На начальных этапах пластической работы наблюдается практически полная корреляция между нагрузкой и, например, прогибами конструкции. В этих условиях предложенный обобщённый коэффициент парной корреляции в виде угла между векторами нагрузок и перемещений оказывается значительно более чувствительным и практически сразу реагирует на появление нелинейности в работе материала в сечении.
Множественный коэффициент корреляции
Аналогичный смысл имеет множественный коэффициент корреляции. Так, проведя непосредственные вычисления, можно убедиться, что если зависимую переменную рассмотреть
Выполнив вычисления относительно начала координат, получим для истинной градуировочной зависимости г = 1, d = 1. Для той же ошибочной зависимости (11) получим г = 0,95, d = 2,7. Таким образом, направления векторов почти совпадают, а длины отличаются почти в три раза, что позволяет выявить ошибку. То же для ошибочной зависимости и коэффициента корреляции Пирсона (вычисления относительно среднего значения): г = 1, d=0.5. Таким образом, коэффициент корреляции Пирсона остался равен 1, а длины векторов истинных и измеренных данных, сформированных по Пирсону, отличаются в два раза.
Всё же основным способом проверки качества регрессионной зависимости следует считать оценку её погрешности. Обычно для этого вычисляется средняя ошибка аппроксимации, но, учитывая изложенное, методически более правильно было бы использовать отношение нормы вектора погрешности к норме вектора независимой переменной. То есть необходимо рассмотреть относительную погрешность
(12)
Выполнив такую проверку, получим в данном примере для истинной градуировочной зависимости 5 = 0 (погрешность равна нулю), для ошибочной зависимости (11) и вычислени-
Рис. 4. Геометрический смысл классического коэффициента множественной корреляции.
Рис. 5. Смысл обобщённого коэффициента множественной корреляции
как вектор, а набор независимых переменных рассмотреть как набор векторов, образующих некоторый базис, определяющий гиперплоскость, то множественный коэффициент корреляции будет в точности равен косинусу угла между упомянутым вектором и гиперплоскостью. Соответственно, можно сделать обобщения этого коэффициента корреляции по аналогии с обобщениями, сделанными для коэффициента парной корреляции. Так на рисунке 4 векторы XI и Х2 составлены из отклонений значений независимых переменных от их средних значений. Вектор У составлен из отклонений значений зависимой переменной от среднего значения
Дальнейшим обобщением множественного коэффициента корреляции является не просто корреляция между зависимой переменной и набором независимых переменных, а распространение этого коэффициента на корреляцию между набором независимых переменных и целым набором зависимых переменных. При этом геометрический смысл такого коэффициента корреляции будет прежним - это косинус угла между двумя гиперплоскостями, определяемыми, соответственно, независимыми и зависимыми переменными (рис. 5).
Выводы
Проведённое исследование позволило установить геометрический смысл как парного коэффициента линейной корреляции Пирсона, так и множественного коэффициента корреляции. Показано, что коэффициент корреляции представляет собой косинус угла между вектором зависимой переменной и вектором независимой переменной (при парной корреляции) или косинус угла между вектором зависимой переменной и гиперплоскостью независимых переменных (при множественной корреляции).
Сделаны широкие обобщения коэффициента корреляции. В том числе введено понятие множественной корреляции между наборами зависимых и независимых переменных.
Приведены наглядные примеры, когда сделанные обобщения оказываются полезными при решении различных исследовательских задач и позволяют избежать оценочных ошибок.
Список источников
1. Гмурман, В.Е. Теория вероятностей и математическая статистика / В.Е. Груман ; 9-е изд. - Москва : Высшая школа, 2003. - 479 с. - Текст : непосредственный.
2. Фёзстер, Э. Методы корреляционного и регрессионного анализа / Э. Фёзстер, Б. Рёнц. - Москва : Финансы и статистика, 1983. - 302 с. - Текст : непосредственный.
3. Шилов, Г.Е. Математический анализ. Специальный курс / Г.Е. Шилов. - Москва : Физматгиз, 1961. - 436 с. - Текст : непосредственный.
4. Каазик, Ю.Я. Математический словарь / Ю.Я. Каазик. - Москва : Физматлит, 2007. - 334 с. (в переводе). - ISBN 9785-9221-0847-8. - Текст : непосредственный.
References
1. Gmurman V.E. Teoriya veroyatnostei i matematicheskaya statistika [Probability Theory and Mathematical Statistics]. Moscow, Vysshaya shkola Publ., 2003, 479 p. (In Russ.)
2. Fezster E., Rents B. Metody korrelyatsionnogo i regressionnogo analiza [Methods of Correlation and Regression Analysis]. Moscow, Finansy i statistika Publ., 1983, 302 p. (In Russ.)
3. Shilov G.E. Matematicheskii analiz. Spetsial'nyi kurs [Mathematical Analysis. Special Course]. Moscow, Fizmatgiz Publ., 1961, 436 p. (In Russ.)
4. Kaazik, Yu.Ya. Matematicheskii slovar' [Mathematical Dictionary] (translated). Moscow, Fizmatlit Publ., 2007, 336 p. ISBN 978-5-9221-0847-8. (In Russ.)