УДК 519.862.6
метод наименьших квадратов для косых отклонений точек до прямой линии в прямоугольных декартовых координатах и поворот плоскости
Станислав Петрович Шкроба1, к. ф.-м. н., доцент Николай Витальевич Никифоров , старший преподаватель Дмитрий Сергеевич Комшанов2, д. э. н., доцент
1 ФГБОУ ВО «Петербургский государственный университет путей сообщения императора Александра I», Россия, филиал г. Великие Луки
ФГБОУ ВО «Великолукская государственная сельскохозяйственная академия», Россия, г. Великие Луки
Предлагаются новые методы минимизации взвешенной суммы квадратов косых отклонений заданных точек до искомой прямой. Поставленная задача решается с помощью поворота плоскости и сведения решения основной задачи к решению задачи о минимизации взвешенной суммы квадратов вертикальных отклонений заданных точек до искомой прямой. Новая задача, в свою очередь, сводится к элементарной задаче о нахождении наименьшего значения квадратного трехчлена.
Ключевые слова: метод наименьших квадратов, косые отклонения, специальные тождества, вертикальные отклонения, квадратный трехчлен, поворот плоскости.
Построение прямой линии на плоскости в методе наименьших квадратов для данного набора точек зависит от выбора отклонений этих точек до искомой прямой линии (вертикальные, горизонтальные, кратчайшие, косые и другие отклонения), а также от выбора системы координат (прямоугольные декартовы, косоугольные, полярные и другие координаты). Наиболее популярны среди практиков вертикальные отклонения и прямоугольные декартовы координаты, так как такой выбор позволяет находить аппроксимирующие функциональные зависимости любого типа. В этой статье рассматриваются косые отклонения (в частности, вертикальные и горизонтальные) и прямоугольные декартовы координаты.
Пусть дан набор разных пар вещественных чисел (хк, ук), 1 < к < п, к — целое, п — целое, п > 1. Если на плоскости введена прямоугольная (декартова) система координат, то пары чисел (хк, ук) автоматически порождают точки
Мк — Мк( хк, Ук ).
Определение. Число
7 2 2 п1 + п2
и и —-
|ап2 —Ьп11
называется косым отклонением точки Мк =Мк(хк, ук) от прямой линии Ь: ах + Ьу + с = 0 перпендикулярно данному вектору п = (п1 , п2), где
9 9 9 9
а,Ь, п1 п2,е Я, а + Ь Ф 0, щ + п2 Ф 0, ап2 - Ьп1 ф 0.
Видно, что косое отклонение йк - это длина отрезка МкМр, где Мр -
это точка пересечения прямой линии Ь и прямой линии, проходящей через точку Мк перпендикулярно вектору п .
Считается также, что положительные числа (веса) tk, характеризующие
вклад квадрата отклонения dk в сумму д, заранее заданы и выбраны так, что
п
^ tk = 1. Если точки Мк = Мк(хк, ук) равноправны, то tk = 1/ п, 1 < к < п.
к=1
Основные обозначения (для средних величин):
Я - множество вещественных чисел,
n n _ n
x = Z tkxk > y = Z 1кУк > xy = Z1к*кУк > к=1 к=1 к=1 - n - n n
x2 = Z*кхк > У2 = ZгкУк > °xy = Z h (- x)(Ук - y)>
1кЛк ' У =Z 1кУк >^xy =Z 1к(
к=1 к=1 к=1
n n
= Z h(хк- x )2' = Z h(Ук- У)2 •
к=1 к=1
Определение. R3 = {(a, b, с) | a, b, с e R }, R2 = { (a, b) | a, b e R } •
9 9
Определение. K3 = {(a, b, c)|(a, b, с) e R3, an2 - bn1 Ф 0 и a + b Ф 0}.
9 9
Определение. K2 = {(a, b)|(a, b) e R2, an2 - bn1 Ф 0 и a + b Ф 0}.
9 9 9
/л д с/ j \ ^^ (a.хк + byk + с) (щ + n2)
Определение. o(a,b,с) = Z—к- - 2 1-— - взвешенная сумма
к=1 (an2 -Ьщ)
квадратов косых отклонений dk заданных точек Мк =Мк(хк, Ук) до искомой
прямой L: ax + Ьу + с = 0.
Определение. A(a, b) = 0(a, Ь, - ax - by).
Задача 1 (основная). Найти все тройки чисел (a0 , Ь0 , с0) e K3 такие, что min 0(a, Ь, с) = S(a0, Ь0, с0).
(a,b,e)eK3
Сведем задачу 1 к новой задаче 1.1 на нахождение наименьшего значения функции двух переменных A(a, Ь) на множестве K2 с помощью специального тождества.
Лемма 1. Верны равенства:
2 2 /— \2 2 2 /—■\z — —
Cx = x - (x) , Cy = y - (y) , <7^ = Xy - x • y .
Доказательство.
n n
ax = 2fk(xk - x) = 2fk (xk - 2xxk + (x) ) = k=1 k=1 n n n
= 2 tkx2 - 2x 2 tkxk +(x) 2 tk =
k=1 k=1 k=1
= x2 - 2x • x + 2 \ tk ' (x )2 = x2 - (x )2.
k=1
Остальные равенства доказываются аналогично. Лемма 1 доказана.
Теорема 1 (о сведении задачи 1 к задаче 1.1). Верны утверждения:
1) для любой пары (a, b) е K2
9 9 9 9 9 9
Л, ^ (a C + 2abvxy + bIaIy)(nIi + n|)
A(a, b) =-y-f-1-;
(an2 - bn1)
2) для любой тройки (a, b, c) е K3
(ax + by + c)2(n 2 + n 1)
A(a, b) = ö(a, b, c) - ------\-—;
(an2 - bn1)
3) min S(a, b, c) = min A(a, b).
(a,b,c)eKз (a,b)eK2
Доказательство.
(n2+n2)
Пусть f =-1--.
(an2 - bn1)
1) A(a, b) = S(a, b, - ax - by) =
n n
= f 2 *k (axk+byk- ax - by )2 = f 2 *k(a( xk- x)+b( yk- y ))2 =
k=i k=i n
^—^ _ ^ _ _ ^ _ ^
= f 2 *k(a (xk- x) + 2ab(xk- x )(yk- y)+b (yk- y) ) =
k=i
[n n n ^
a 2 2 tk(xk- x )2 +2ab 2 tk(xk- x)(yk- y)+b2 2 tk(yk- y )2
k=1 k=1 k=1 У
2 2 2 2 V 2 2
2 2 2 2 \ CTx + 2abcxy +b ln+ n2
( 2 2 2 2 V 2 2
a ctx + 2ab&xy + b lnx + n2)
= j \a + 2abc + b cv »=--y--
V x ^ y1 (an2 - bn1)2
2) Применяется первое утверждение и лемма 1.
о
S(a, b, c) - f (ax + by + c) =
n
= f S h(a 2( xk)2 +b2( Ук)2+c2 + 2аЬхкУк+^^ + 2ЬсУк)
к=1
9 9 9 9 9 9 ---
- f(ax + by + c) = f(a x + b y + c + 2 abxy + 2 acx + 2 bcy) -
- f (a2 (x )2 + b2 (y )2 + c2 + 2abxy + 2acx + 2bcy) = A(a, b).
3) Сразу вытекает из равенства во втором утверждении.
Теорема 1 доказана.
В силу теоремы 1 вместо основной задачи 1 возникает новая задача 1.1 о нахождении наименьшего значения функции двух переменных A(a, b) на множестве K2.
Задача 1.1 Найти все пары чисел (a0 , b0) е K2 такие, что min A(a, b) = A(a0, b0).
(a,b)eK2 0 0
Ясно, что переход от задачи 1 к задаче 1.1 фактически говорит о том, что при решении задачи 1 достаточно рассматривать прямые, проходящие через точку Ms(x, y) (так как c = -ax - by) и неколлинеарные вектору n = (n1, n2) (так как an2 - bn1 ф 0). Уравнение искомой прямой будет выглядеть так:
a0( x - x) + b0( у - у ) = 0.
Будем считать, что всюду далее выполнено естественное [3] предположение:
^У >0>0,^У >0. (1)
При этих предположениях в статье [3] было предложено сложное решение задачи 1.1 с помощью полного исследования специальной функции одной переменной с несколькими параметрами средствами математического анализа.
Рассмотрим вначале частный случай задачи 1.1:
n1 ф 0, n2 = 0; вектор n = (n1, n2) = (n1, 0) перпендикулярен оси ординат, косые отклонения естественно назвать вертикальными отклонениями;
an2 -bn1 = -bn1 ф 0, поэтому b ф 0; K2 = { (a,b) | (a,b) е R2, b ф 0 };
a^g2 + 2abam + b^G2 ~ ~ ~ a
A(a, b) =-x--y = а2хк2 + 2аХук + a2y = А^к), к = -.
b b
Задача 1.1 превращается в задачу 1.2 (о вертикальных отклонениях).
Теорема 2 (о решении задачи 1.2). Верны утверждения:
1) min A(a, b) = min Ai(k);
(a,b)eK2 keR
— (Jyy
2) min Ax(k) = A^k0) = A(a0, b0), где k0 =—xl, (a0, b0) — любая пара чи-
aeR (
^ x
a
сел такая, что k0 = — и b0 ф 0;
b0
3) существует единственная прямая, дающая решение задачи 1.2, с урав-
__о _
нением (xy (x — x) — (2(y — y) = 0. Доказательство.
2) A:(k) — квадратный трехчлен относительно переменной k, так как
2
&2 ф 0. Легко находим, используя свойства квадратного трехчлена, что
/ 2 2 2 \
((x(y — ) — 0xy
min A:(a) =-^—— = A:(k0), если k = k0 =—.
aeR ( (
— (
Ясно, что minAx(k) = Ax(k0) = A(a0,b0), где k0 =—^, (a0,b0) — любая
aeR (2
^ x
i an 7 r\
пара чисел такая, что k0 = — и b0 ф 0.
b0
a
3) a0( x — x) + b0( y — y) = 0 о-°( x — x) + (y — y) = 0 о
b0
о k0( x — x) + (y — y) = 0 о
_2 V
(x — x) + (y — y) = 0 о
о
сгу (х - X) -ах(у - у) = 0. Теорема 2 доказана.
Теперь сведем задачу 1.1 к задаче 1.2 с помощью поворота плоскости. Пусть прямоугольная (декартова) система координат ХОУ получена из прямоугольной декартовой системы координат хОу поворотом вокруг начала
О на угол р против часовой стрелки так, что вектор п = (п1, п2) преобразуется
^ 2 2 в орт / = (1,0) оси ОХ, где п + п2 = 1, п1 = еоБр и п2 = Бтр. Будем использовать для обозначения координат одной и той же точки М в старой и новой системе координат малые и большие буквы соответственно: М (х, у), М (X, У). Тогда верны равенства [2]: х = п1 X - п2У, Г X = п1 х + п2у, у = п2X + п1У. ' [У = -п2х + п1 у. Если М(хк , ук ),М(Xk , Ук ), 1 < к < п, М5 (х , у),М5 (X, У ) то, очевидно, верны равенства:
x - x = щ(Х - X) - n2(Y - Y ), fX - X = щ(л - x ) + n2(y - y),
y - y = n2(X - X) + nx(Y - Y),' [Y - Y =-n2(x - x) + nx(y - y). ( )
Ясно, что при переходе к новой системе координат геометрически решения задач 1.1 и 1.2 должны совпадать, меняются только уравнения. Поэтому достаточно преобразовать уравнение прямой линии.
2 2
Лемма 2. Пусть nx + n2 = 1. Тогда верны утверждения:
14 2 22,о ,222 2 2 ^ ,22
1) (Tx = n1 ( + 2n1n2Txy + n2°y , TY = n2Tx - 2n1n2Txy + nl°y,
2 2 2 2 TXXY = -n1n2Tx - n2(xy + n1 Txy + n1n2T2 ;
2) TXTY -TXY =TxTy -Txy , Tx +Ty =TX +TY .
Доказательство.
1) После применения леммы 1, формул (2) и элементарных преобразований получаем
n n n
TX = £ h (Xk - X)2 =n12 £ h (xk - x )2 + 2n1n2 £ tk (xk - X )(yk - y ) +
k=1 k=1 k=1 n
+ n22 £ tk (yk - y)2 =nyт;y + 2n1n2Txy + n^T^. Аналогично доказываются и
k=1
остальные два равенства.
2) После применения первого утверждения и элементарных преобразований получаем
99 9 994 99 4 94 99 4
TXX TY - TXY = TxTy (n1 + 2n1 n2 + n2 ) - Tcy (n1 + 2n1 n2 + n2 ) =
999 99 9 9 99 99 9
= TxT(n1 + n2) (n1 + n2) = Tx.T^2 - . Второе равенство дШЭЖ-
вается аналогично. Лемма 2 доказана.
Теорема 3 (о решении задачи 1.1). Пусть выполнены условия (1) и
22
n1 + n2 = 1. Тогда верны утверждения:
1Л . К( м п (tW2-Tly)(n12 + n2)
1) mm Д(<2, b) = G0 = •
- ' 0 2 2^ 22 ' (а,Ъ№ щ ах + гп^О-у + П^Оу
2) существует единственная прямая линия Ь, дающая решение задачи 1.2 с уравнением
9 9
(п1Оху + П2Оу )(2 - 2) - (п2Оху + П1Ох )(У - У) = 0 (3)
Доказательство.
1) После применения теоремы 1, леммы 2 получаем
9 9 9 /22 2 4/2, 2\
• А/ ОХ -СТ^ (°х°у -О2у )(п1 + п2) _ Ш1П Л(а, Ъ) = ————— = ^ ----—— = G0, так как
(а 'Ъ)еК2 ОХ п1 + 2п1п2°ху + П2
9 9
п1 + п2 = 1. Кроме того, в силу критерия Сильвестра [1] для квадратичных форм
9 9 9 9 9
и условия (1), = П1 Ох + ^^ху + п2 °у > 0 .
2) После применения теоремы 1, формул (2), леммы 2 и элементарных преобразований получаем логическую цепочку:
(У - У = (X - X
9 9 9 9 9
^ (х - х)(<Уху (п1 + п2 )п1 + (п1 + п2 )п2 ) =
= (у - у)(&ху (п2 + п2 >2 + ^ («12 + «2 )«1) ^ (3) ,
так как п1 + п2 = 1. Теорема 3 доказана.
Замечание. В теореме 3 можно в условии отказаться от требования
9 9
п1 + п2 = 1. Действительно, если п = (п1, п2), то
n1 n2
с
т = (т1, т2) = ,
11п I Iп I
9 9
коллинеарен вектору п и уже будет удовлетворять условию т1 + т2 = 1. Если применить теорему 3 к вектору т, то значение G0 не изменится, а уравнение
7 2 2
п1 + п2 будет равносильно
обычному уравнению (3) для вектора п.
Вывод. Основная задача 1 решена, получен простой вывод уравнения (3) искомой прямой линии, это уравнение совпадает с уравнением в статье [3]. В частности, если п1 ф 0 и п2 = 0, то уравнение (3) превращается в уравнение
о
п1^ху (х - х) - п(у - у) = 0, которое равносильно уравнению из третьего утверждения теоремы 2.
Библиографический список
1. Мишина А.П. Высшая алгебра. СМБ. / А.П. Мишина, И.В. Проскуряков. - М.: Наука, 1965. - 300 с.
2. Моденов П.С. Аналитическая геометрия / П.С. Моденов. - М.: Изд-во МГУ, 1969. -608 с.
3. Шкроба С.П. Метод наименьших квадратов для косых отклонений точек до прямой линии в прямоугольных декартовых координатах / С.П. Шкроба, Н.В Никифоров, Д.С. Ком-шанов // Известия Великолукской государственной сельскохозяйственной академии. - 2018. - №2. - С.38-45.
E- mail: [email protected]
182100 Псковская область, г. Великие Луки, проспект Гагарина д. 95 ФГБОУ ВО «Петербургский государственный университет путей сообщения Императора Александра I», Великолукский филиал
Тел.: (81153) 9-62-80