Научная статья на тему 'Линейные операторы, комплексные числа, дифференцируемость функций'

Линейные операторы, комплексные числа, дифференцируемость функций Текст научной статьи по специальности «Математика»

CC BY
2212
306
i Надоели баннеры? Вы всегда можете отключить рекламу.
i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Линейные операторы, комплексные числа, дифференцируемость функций»

Секция 2. Преподавание

УДК 51

Линейные операторы, комплексные числа, дифференцируемость функций

М. Я. Спиридонов

Введение

Введение понятия дифференцируемости (или производной) функции в самом общем случае осуществляется посредством использования понятия линейного оператора.

Первоначальное знакомство с производной происходит в рамках классического математического анализа при изучении вещественнозначных функций одного вещественного аргумента. На этом этапе, конечно, ни о каких линейных операторах даже не упоминается. Однако усложнение рассматриваемых функций, — отображающих область из в Rm или область из одного линейного нормированного пространства в другое, — приводит к необходимости определять дифференцируемость

140

с помощью линейного оператора, который и будет называться производной функции. В настоящей статье скрупулёзно и с различных точек зрения рассматривается этот вопрос, лежащий на стыке математического анализа (дифференцируемость) и линейной алгебры (векторные пространства и линейные операторы).

Сначала напоминаются понятия линейного пространства, его размерности, базиса, затем — линейного оператора и его матрицы, которая зависит от выбора базисов в области определения и области значений линейного оператора.

Детально рассматриваются линейные операторы в одномерных пространствах, которые обладают рядом специфических свойств по сравнению с общим случаем. Например, линейный оператор A : V —> V на одномерном векторном пространстве V над полем P действует на векторах v Е V по правилу Av = а0 v, то есть умножением любого исходного вектора на некоторое фиксированное не зависящее от вектора число а0 Е P; при этом а0 будет матрицей линейного оператора только в том случае, когда в обоих векторных пространствах V выбран один и тот же (неважно, какой) базис. Как правило, подобным вопросам в курсах математики отдельного внимания не уделяют, считая, что универсальными положениями теории линейных операторов всё, собственно, и исчерпывается.

Примером одномерного линейного пространства служит множество V = C комплексных чисел над полем P = C. Рассматриваются линейные операторы A : C —> C и линейные операторы A : R2 —> R2 и устанавливается связь между ними.

Последовательно (от простого к сложному) анализируется дифференцируемость различных функций «вещественного анализа» — вещественнозначной функции одного вещественного аргумента, векторнозначной функции одного вещественного аргумента, вещественнозначной функции нескольких веще-

141

ственных аргументов, векторнозначной функции нескольких вещественных аргументов, а также комплекснозначной функции комплексной переменной и отображения нормированных пространств. При этом показывается, как вынужденно приходится описывать свойство дифференцируемости (существования производной) в терминах линейного оператора и такое описание оказывается универсальным.

Статья будет полезна как преподавателям высшей математики, так и студентам, желающим до конца разобраться в предложенной тематике.

1. Линейные пространства

Пусть V — некоторое (непустое) множество, элементы которого будем называть векторами (хотя их природа может быть произвольной), а P — поле (конечной или бесконечной характеристики), элементы которого будем называть числами (чаще всего в качестве P выступает множество R вещественных или C комплексных чисел). Предположим, что над элементами V определены операции сложения и умножения на числа из P, а именно:

любым двум векторам а Е V и b Е V однозначно сопоставляется вектор а + Ь Е V, называемый суммой векторов а и Ь;

любым вектору а Е V и числу А Е P однозначно сопоставляется вектор А •а = А а Е V, называемый произведением вектора а на число А.

Множество V называется линейным (или векторным) пространством над полем P, если операции сложения векторов и умножения их на числа обладают следующими восемью свойствами (аксиомы векторного пространства):

1 (ассоциативность сложения). а + (b + С) = (а + b) + c для любых векторов а, b, c из V.

142

2 (коммутативность сложения). а + b = b + а для любых векторов а, b из V.

3 (существование нулевого вектора — нуля сложения). Существует такой вектор 0 Е V, что 0 + а = а для любого вектора

а е v.

4 (существование противоположного вектора по отношению к сложению). Для любого вектора а Е V существует такой вектор —а Е V, что а + (—а) = 0.

5. (Л + ^)а = Ла + для любых чисел Л, ^ из P и любого вектора а Е V.

6. (Л ^)а = Л(^а) для любых чисел Л, ^ из P и любого вектора а Е V.

7. Л (а + b) = Ла + ЛЬ для любого числа Л Е P и любых векторов а, b из V.

8. 1 а = а для любого вектора а Е V (здесь число 1 — единица поля P).

Исходя из аксиом 1 -8 векторного пространства несложно доказать, что, например:

нулевой вектор существует только один (единственность нуля сложения);

для любого вектора противоположный ему вектор единствен (единственность противоположного вектора);

0 •а = 0 для любого вектора а Е V (здесь число 0 — нуль поля P);

Л •0 = 0 для любого числа Л Е P;

(—1) •а = —а для любого вектора а Е V.

Кроме того, отметим, что аксиома 2 коммутативности сложения является следствием остальных аксиом.

Всюду в дальнейшем (за исключением последнего пункта) будут рассматриваться только конечномерные линейные пространства. В таких пространствах существует базис — полное линейно независимое конечное множество векторов. Можно доказать, что все базисы данного конечномерного линейного про-

143

странства состоят из одного и того же числа векторов. Это натуральное число называется размерностью линейного пространства V и обозначается символом dim V (от англ. dimension — измерение, размеры). Для удобства вводят в рассмотрение также нульмерные пространства, считая dim V = 0 тогда и только тогда, когда V состоит только из одного нулевого вектора, то есть V = {0}.

Всякий вектор линейного пространства единственным образом представляется в виде линейной комбинации базисных векторов: если v1, v2, ..., vn — произвольный базис n-мерного линейного пространства V, то для любого вектора а Е V существуют такие однозначно определённые числа (то есть элементы поля P) ау, а2, ..., ап, что

а = ауи^ + a2V2 + ... + anvn. (1)

Существование чисел ау, а2, ..., ап обеспечивается полнотой базиса, а их единственность — линейной независимостью базиса.

Числа ау, а2, ..., ап в (1) называются координатами вектора а в базисе v1, v2, ..., vn, а сама формула (1) называется разложением вектора а по базису v1, v2, ..., vn.

Легко видеть, что при сложении векторов их соответствующие координаты (в одном и том же базисе) складываются, а при умножении вектора на число каждая его координата умножается на это число.

Если фиксировать какой-либо базис n-мерного линейного пространства V, то отображение V в Pn, сопоставляющее каждому вектору а последовательность (ау; а2; ...; аГ1) его координат в этом базисе, устанавливает так называемый координатный изоморфизм пространств V и Pn. При этом операциям сложения векторов и умножения их на числа отвечают соответствующие операции над матрицами-строками размером 1 х n (или, в зависимости от выбора формы записи, над матрицами-столбцами размером n х 1 ), представляющими собой последовательности координат векторов. К сожалению, зависимость

144

координатного изоморфизма от выбора базиса не позволяет отождествить каждое n-мерное векторное пространство V с пространством P n.

2. Линейные операторы

Пусть V и W — два линейных пространства над одним и тем же полем P.

Линейным оператором из пространства V в пространство W называется линейное отображение (говорят также: гомоморфизм или морфизм)

этих пространств, то есть такое отображение, которое сохраняет линейные операции:

при любых векторах a, b из V и любого числа A Е P.

Если W = V, то A называется линейным оператором на V или эндоморфизмом линейного пространства V.

Множество всех линейных операторов из V в W является линейным пространством. В самом деле, сумма A+B линейных операторов A и B и произведение AA линейного оператора A на число A Е P определяются естественным образом: для каждого вектора v Е V

При этом выполнение аксиом 1 -8 векторного пространства легко проверяется.

Считая линейные пространства V и W конечномерными с размерностями n и m соответственно, выберем в них некоторые базисы — v1, ..., vn в V и w1, ..., wm в W. Тогда значение оператора A на любом векторе v = x1v1 + ... + xnvn Е V (здесь xl Е P, ..., xn Е P) будет равно

A : V—> W

A(a + b) = Aa + Ab, A(Aa) = A Aa

(A + B )v = Av + Bv, (A A)v = A (Av).

Av = xx Av1 + ... + xn Avn = x1a1 + ... + xnan

n

nn

(3)

145

где a1 = Av1, an = Avn. Понятно, что для произвольного

набора векторов a1, ..., an из W формула (3) будет однозначно определять некоторый линейный оператор A из V в W, причём a1 = AV1, ..., an = Avn.

Таким образом, если базисы в V и W фиксированы, то все линейные операторы из V в W описываются всеми различными семействами из n векторов a1, ..., an, принадлежащих пространству W, и действуют на векторы v Е V в соответствии с приведённой выше формулой (3).

Более того, опираясь на соотношение (3), можно указать вычислительную процедуру, позволяющую находить координаты вектора Av Е W по координатам исходного вектора v Е V.

Действительно, пусть

AV = уци 1 + ... + ymwm, AVfc = ак = ак 1 w 1 + ... + akmwm, где уj Е P, akj Е P, j = 1; ...; m, k = 1; ...; n. Тогда

n n / m \ m / n \

Av = E xk Avk = E xk (E akjW) = E (E akjxk)W,

k=1 k=1 vj=1 7 j=1 vk= 1 7

откуда

n

yj = E akj xk, j = 1;2;...; m.

k= 1

Полученную зависимость между yj и Xk удобно представить в матричной форме:

(Уг\

У2

\Ут )

Матрица

A

(

a11 a21 ' ' ■ an1

a12 a22 ' ' ' an2

a1m a2m ' ' ■ anm

a11 a21 ' ■ ■ an1

a12 a22 ' ■■ an2

\ a1m a2m ' a ■ ■ nm

\

x1

X2

xn

(4)

(5)

146

размером m х n называется матрицей оператора A в базисах v1, vn и w 1; wm пространств V и W соответственно. От-

метим, что столбцы матрицы A состоят из координат векторов а1 = Av1, ..., an = Avn в базисе w 1, ..., wm пространства W.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Формула (4) показывает, что при фиксации базисов в V ив W координаты y1, ..., ym образа Av G W произвольного вектора v G V могут быть получены умножением матрицы A линейного оператора на столбец из координат х1, ..., xn исходного вектора v.

Подчеркнём, что матрица (5) линейного оператора (2) зависит не только от самого оператора, но и от выбора базисов в V ив W. Одно и то же преобразование (2) порождает, вообще говоря, различные матрицы при изменении базисов.

Замечание 1. Соответствие между координатами хк вектора v и координатами yj его образа Av можно было бы описать вместо матричной формы (4) следующим образом:

(у1; У2; •••; ym)

(Х1 ; х2 ; •••; xn)

/ fl11 а21

а12

а22

а1т ^ а2 m

V an1 an2

nm

/

Структура этой формулы связана с записью по строкам координат векторов v, Av, а также векторов Агд, Avn в матрице (afcj-) раз-

мером n х т. Однако по традиции общепринятыми являются формулы (4)—(5), базирующиеся на записи координат векторов в виде матриц-столбцов.

Очевидно, что при выбранных и зафиксированных базисах пространств V и W имеется взаимно однозначное соответствие между всеми линейными операторами из n-мерного пространства V в m-мерное пространство W и всеми матрицами размером m х n, элементами которых являются числа поля P. При этом сумме операторов отвечает сумма их матриц, а умножению оператора на число отвечает умножение на это число матрицы оператора.

147

(Точнее говоря, при выборе базисов в n-мерном пространстве V ив m-мерном пространстве W описанное выше соответствие между линейными операторами (2) и матрицами (5) является биективным и, более того, устанавливает изоморфизм между алгеброй линейных операторов из V в W и алгеброй матриц размером m х n с элементами из поля P.)

3. Линейные операторы в одномерных пространствах

В этом пункте рассмотрим частные случаи линейных операторов A : V —> W, когда хотя бы одно из векторных пространств V, W одномерно. Такие операторы обладают некоторыми специфическими (по сравнению с общей ситуацией) свойствами.

Отметим, что в одномерном линейном пространстве базис состоит ровно из одного элемента, которым может быть всякий ненулевой вектор.

Случай 1: n = dim V =1, m = dim W > 1.

Пусть A — произвольный линейный оператор, отображающий одномерное векторное пространство V в m -мерное векторное пространство W. Оказывается, результат действия такого оператора на векторах из V можно представить в виде произведения числа из поля P (меняющегося при переходе в V от одного вектора к другому) и некоторого неизменного вектора из W.

Действительно, возьмём какой-либо ненулевой вектор v0 Е V, то есть выберем в пространстве V базис {v0}. Тогда для любого вектора v Е V существует такое единственное число к Е P, что v = к • v0; последнее равенство есть разложение v по базису {v0}, а число к — координата v в этом базисе. Следовательно, значение оператора A на векторе v Е V равно

148

Av = А(к ■ v0) = к ■ Av0

'0)

(6)

где Av0 G W. Соотношение (6) означает, что при выборе в одномерном пространстве V какого-либо базиса (то есть любого ненулевого вектора v0) значение Av оператора А на каждом векторе v из V равно произведению координаты к вектора v в

вектора v0.

При этом, в соответствии с общими определениями, матрица A оператора А будет иметь размер m х 1 и представлять собой столбец из координат вектора Av0 в базисе m-мерного пространства W. Формулы (4)-(5) в данном случае примут вид

где (уу ...; ym) и (ау ...; ат) — координаты векторов Av и Av0

соответственно в некотором базисе пространства W, а к — координата v в базисе пространства V. Формулы (7) являются координатной записью равенства (6).

Случай 2: n = dim V > 1, m = dim W = 1.

Рассмотрим теперь оператор А, действующий из n-мерного пространства V в одномерное пространство W. Оказывается, и в этом случае значения оператора на векторах из V выражаются в виде произведения числа из поля P (зависящего от исходного вектора) на некоторый фиксированный вектор, принадлежащий W.

В самом деле, пусть v1, ..., vn — базис в V, а w0 — базис в W. Разложим по базису пространства V произвольный вектор v G V, а по базису пространства W образы Av1, ..., АТП базисных векторов из V:

выбранном базисе на образ (при отображении А) Av0 базисного

(7)

n

v =Е xk vk, Avk = акw

к vki

k

'kw 0)

k= 1

где числа Xk и ak — элементы поля P. Тогда

(8)

149

n

где к = ^2 xk ak — число из поля P (зависящее от оператора A, к= 1

вектора v G V и выбора базисов в V и W), w0 G W, w0 = 0.

В рассматриваемой ситуации матрица A оператора A будет иметь размер 1 х п, то есть будет матрицей-строкой из координат векторов Av1, ..., Avn в базисе (одномерного) пространства W, а формулы (4)-(5) примут вид

y (а1, ..., an) " I ■ ■ ■ I , A (a1, ..., an), (9)

xn

где y = к — координата вектора Av в базисе пространства W (см. (8)). Соотношение (9) фактически представляет собой матричную запись равенства (8).

Важным (имеющим далеко идущие обобщения) частным случаем рассматриваемого класса операторов служат линейные отображения n-мерного векторного пространства V над полем P в одномерное пространство W = P. Такие отображения называются линейными функционалами (или ковекторами пространства V). Множество V всех линейных функционалов на V является линейным пространством, которое называется сопряжённым к пространству V. Доказывается, что dim V = dim V.

Случай 3: п = dim V =1, m = dim W = 1.

Для оператора A, действующего в одномерных пространствах, значения на векторах также, как и в предыдущих двух случаях, сводятся к умножению некоторого вектора из W на различные числа.

Пусть v0 и w0 — базисы (то есть любые ненулевые векторы) в пространствах V и W соответственно. Если v = xv0, Av0 = aw0 — разложения по базису произвольного вектора v G V и вектора Av0 G W (здесь x G P и a G P), то

Av = x ■ Av0 = x ■ aw0 = кw0, (10)

где к = x ■ a G P. Число a в (10) является матрицей (размером 1 х 1) оператора A в выбранных базисах пространств V и W.

150

Отдельно (в силу важности для дальнейшего изложения) рассмотрим линейный оператор A : V —> V на одномерном векторном пространстве V над полем P. В этой ситуации (в отличии от (6), (8), (10)) результат действия оператора на любом векторе может быть получен умножением некоторого фиксированного числа (не зависящего от исходного вектора) на этот же вектор.

Возьмём какой-либо ненулевой вектор vQ (базис V). Тогда любой вектор из V будет пропорционален базисному вектору. Пусть v = xv0, Av0 = a0v0, где v — произвольный вектор из V, x Е P, a0 Е P. Отсюда находим, что

Av = x ■ AvQ = x ■ a0v0 = a0v. (11)

Повторимся: здесь число a0 Е P зависит лишь от оператора A, но не зависит ни от вектора v (так как определяется из равенства Av0 = a0v0), ни от выбора базисного вектора v0 в пространстве V (любой другой базисный вектор vQ будет пропорционален (с ненулевым коэффициентом пропорциональности) v0, а потому равенства Av0 = a0v0 и AvQ = a0vQ равносильны).

Обратим внимание на тот факт, что число a0 из (11) будет матрицей A = (a0) (размером m х n =1 х 1) линейного оператора A : V —> V на одномерном пространстве V только в том случае, когда в обоих векторных пространствах V выбран один и тот же (неважно, какой) базис. Если же базисы взяты разные — например, v0 = 0 в области определения V оператора и v1 = 0 в пространстве W = V, где находятся значения оператора на векторах из V, то

Av = x ■ AvQ = x ■ a1v1,

где AvQ = a1v1 — разложение вектора AvQ Е V по базису v1 пространства V, a1 Е P, и матрицей оператора A (при таком выборе базисов) будет число a1. Установить связь между величиной a1 и характеризующим лишь оператор A коэффициентом a0 из (11) не составляет труда: если x1 — координата vQ в

151

базисе v1; то есть v0 = x1v1, x1 G P, то Av0 = a0v0 = a0xlvl, откуда a1 = a0x1.

Выше (см. (11)) доказано, что любой линейный оператор A : V —> V на одномерном векторном пространстве V над полем P действует на векторах v G V по правилу

Av = a0 v, (12)

где a0 — некоторое фиксированное зависящее лишь от оператора A число (элемент поля P). Верно и обратное утверждение: всякое отображение одномерного линейного пространства V в себя, заданное посредством (12) с произвольно выбранным числом a0 G P, является, очевидно, линейным оператором на V.

Таким образом, в случае одномерного векторного пространства V формула (12) при различных a0 G P описывает все линейные операторы A : V —> V и только их.

4. Линейные операторы

на вещественной плоскости

Пусть V = W = R2. Здесь R2 — это множество всех упорядоченных пар (x; у) вещественных чисел x и у. Определение операций сложения таких пар и умножения их на вещественные числа «покомпонентно», то есть по формулам

(xi; yi) + (x2; У2) = (xi + x2; У1 + У2Х A ■ (x; y) = (Ax; Ay), A G R

превращает R2 в линейное пространство над полем R.

Векторное пространство R2 двухмерно: векторы i = (1; 0) и j = (0; 1), играющие особую роль в R2, являются базисом (так называемый стандартный базис пространства R2). Действительно, i и j, очевидно, линейно независимы (не пропорциональны) и образуют полную систему, так как любой вектор (x; у) из R2 линейно выражается через i и j, а именно,

(x; у) = x -j + у ■j = x (1; 0) + у(0; 1),

152

то есть координатами вектора (x; y) в стандартном базисе {i; j} служат его компоненты х, у.

Чтобы задать линейный оператор A : R2 —> R2, можно

1) взять произвольную числовую матрицу размером 2 х 2

A = ^ ^ ^ , a E R, b E R, c e R, d E R, (13)

2) выбрать в V = R2 ив W = R2 какие-либо базисы (как правило, берут один и тот же базис в области определения и в области значений оператора, но это совсем не обязательно) и

3) считать, что первый столбец матрицы A определяет значение оператора A на первом базисном векторе, а второй — на втором. Тогда A будет матрицей линейного оператора A в выбранных базисах.

Если, к примеру, ив V = R2 ив W = R2 выбран один и тот же стандартный базис {г, j}, то

Ai = ai + bj, A j = c i + dj

и результат действия оператора A на произвольном векторе ---->

(x; y) E R2 вычисляется или непосредственно

A — у) = A(x i + у j ) = xAi + yAj =

= x(a i + bj ) + y(c i + dj ) = (ax + cy)i + (bx + dy)j, или в соответствии с (4)

= (ax + cy; bx + dy) E R2.

Замечание 2. Обратим внимание на то, что о матрице линейного оператора можно говорить только с оглядкой на выбранный базис. Если матрица (13) определяет линейный оператор в стандартном базисе {г, j}, то, например,

A( —16; 38) =

-16

38

— 16а + 38c

— 16b + 38d

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

= (—16а + 38c)i + (—16b + 38d)j = (—16а + 38c; —16b + 38d) E R2.

----> ----------->

Но, скажем, в базисе {el = (1; 2), в2 = (3; —4)} та же матрица

-------->

задаёт другой линейный оператор и (так как ( — 16; 38) = 5e1 — 7в2)

153

= (5а — 7c)ei + (5 b — 7d)e2 = (5 a — 7c)(i + 2 j) + (5 b — 7d)(3i — 4 j) = = (5a + 15b — 7c — 21d)i + (10a — 20b — 14c + 28d) j =

= ( 5a + 1 5 b — 7c — 2 1 d ; 1 0a — 2 0b — 1 4 c + 28 d) e R2.

5. Линейные операторы на комплексной плоскости

Пусть теперь V = W = C, где C — множество комплексных чисел, которые принято записывать в виде z = x + iy, x e R, y e R, i2 = — 1 (x = Re z — действительная часть z, y = Im z — мнимая часть z, i — мнимая единица).

Над комплексными числами определены все четыре арифметические операции — сложение, вычитание, умножение и деление, за исключением деления на нуль.

Множество комплексных чисел является линейным пространством V = C над полем P = C. Чтобы в такой ситуации различать комплексные числа как элементы векторного пространства V и как элементы поля P, первые будут (как и везде ранее) обозначаться через z, а вторые просто через z, то есть z e V, z e P.

Замечание 3. Напомним о геометрической интерпретации комплексных чисел и операций над ними. Поскольку всякое комплексное число z = x + iy полностью определяется своими действительной и мнимой частями x и у, то его можно отождествить с упорядоченной парой чисел (x; y), то есть с точкой плоскости, построенной в прямоугольной системе координат Oxy. Тем самым между комплексными числами и точками плоскости устанавливается взаимно однозначное соответствие. Комплексное число можно изображать также вектором на плоскости, координаты которого равны (x; y).

Положение на плоскости точки, изображающей комплексное число z, можно охарактеризовать с помощью полярных координат r

154

и p. Число r, равное расстоянию от этой точки до начала координат, называется модулем комплексного числа z и обозначается через |z|: r = \z\ = д/x2 + y2, r ^ 0.

Число p £ R, равное углу между радиусом-вектором указанной точки и положительным направлением оси Ox, называется аргументом комплексного числа z и обозначается через Arg z (для каждого комплексного числа z = 0 аргумент p может принимать бесконечно много различных значений, отличающихся друг от друга на слагаемые, кратные 2п).

Сложение и вычитание комплексных чисел сводится к сложению и вычитанию векторов, изображающих эти числа. Поскольку при произведении двух комплексных чисел Zi и Z2 их модули перемножаются, а аргументы складываются:

\Zi ■ Z2\ = \Zi\ ■ \Z2\, Arg(Zi ■ Z2) = Arg Zi + Arg Z2,

то вектор, изображающий произведение Zi ■ Z2 может быть получен из радиуса-вектора, изображающего Zi, поворотом на угол ArgZ2 и умножением его длины на \Z2\ (растяжением в \Z2\ раз).

Векторное пространство V = C над полем P = C комплексных чисел — одномерно, и базис в нём состоит из одного-единственного вектора, которым может быть любое ненулевое комплексное число. Действительно, если z0 = xo + iy0 = 0, то для любого z = x + iy существует такое комплексное число к, что z = к ■ zo, где

к = а = z ■ zo = (x + iy)(x0 - гур) =

Zo \zo\2 x0 + yO

= (xxo + УУо) + i(xoУ - xyo) c C.

x2 + yo '

Перейдём теперь к операторам. Рассмотрим произвольный линейный оператор A : C —> C.

Поскольку такой оператор действует в одномерных линейных пространствах V = C и W = C, то его матрица (при любом выборе базисов) имеет размер 1 х 1, то есть является просто комплексным числом — элементом поля P = C.

Кроме того, мы знаем (см. (12)), что действие произволь-

155

ного линейного оператора A : C —> C на любом векторе z Е C сводится к умножению этого вектора на некоторое фиксированное (не зависящее от z, но зависящее от оператора) комплексное число (элемент поля P = C):

Az = к0 ■ z, к0 Е C. (14)

Формула (14) при различных к0 Е C описывает все линейные операторы A : C —> C и только их.

Отсюда, в частности, следует, что с геометрической точки зрения (при интерпретации комплексных чисел в виде векторов на координатной плоскости) все линейные преобразования комплексной плоскости исчерпываются растяжениями и поворотами, поскольку именно таков геометрический аспект умножения комплексных чисел (см. замечание 3).

6. «Вещественификация» линейного оператора на комплексной плоскости

Поскольку каждое комплексное число z = x + iy геометрически интерпретируется как точка или вектор на плоскости с координатами (x; у) в прямоугольной системе отсчёта Oxy, то вызывает интерес описание действия линейного оператора A : C —> C с помощью только вещественных чисел. Подобный переход естественно назвать «вещественификацией», неологизмом, навеянным известным термином «комплексификация».

Возьмём за основу универсальную формулу (14), описывающую действие любого линейного оператора A : C —> C. Пусть

z = x + iy, Az = u + iv, k0 = a + ift,

где x, y, u, v, a, в — вещественные числа. Тогда

Az = к0 ■ z ^ (u + iv) = (a + ip) ■ (x + iy) ^

(u + iv) = (ax — ву) + i(Px + ay) ^

156

а —в в а

(15)

Следовательно, исходное отображение A между множествами комплексных чисел:

удаётся заменить эквивалентным «вещественифицированным» отображением AR между множествами упорядоченных пар вещественных чисел:

Мы знаем, что A является линейным оператором на C, где множество комплексных чисел рассматривается как векторное пространство V = C над полем P = C. Порождённый оператором A оператор AR является, очевидно, линейным на R2, где R2 выступает в качестве векторного пространства над полем P = R. При этом матрица второго порядка в (15) будет матрицей Ar оператора AR в стандартном базисе {i, j} линейного пространства R2:

В приведённом выше рассуждении нигде даже не упоминается о каком-либо базисе в линейном пространстве C. Это и неудивительно, так как описание действия линейного оператора A опиралось на формулу (14), не использующую понятия координат, а о матрице этого оператора речи также не велось. А вот при упоминании о матрице Ar оператора Ar тут же было указано, в каком базисе эта матрица рассматривается.

Если бы встал вопрос о матрице заданного формулой (14) линейного оператора A : C —> C, то необходимо указывать, какие базисы выбраны в пространствах C. Так, если в пространствах V = C (область определения) и W = C (область значений) в качестве базисных выбраны векторы v0 = 0 и w0 = 0 соответственно, то матрицей оператора A (а она должна иметь

A : C —> C, A(x + iy) = (а + гв) ■ (x + iy) = u + iv

A : R2 —► R2

■R

(16)

157

размер mxn = 1x1) будет комплексное число а' + ip', определяемое из равенства Av0 = (а' + ip') w0.

Если число x' + iy' является координатой исходного вектора z = x + iy G V в базисе v0, то есть z = (X + iy')v0, а число u' + iv' — координатой вектора Az = u + iv G W в базисе w0, то есть Az = (u' + iv')w0, то (в соответствии с определением матрицы линейного оператора)

(u' + iv') = (а' + ip ')(x' + iy').

Связь матрицы а'+iP' оператора A в базисах V0 и w0 пространств V = C и W = C с числом к0 = а + ip, фигурирующим в формуле (14), устанавливается без труда: если v0 = (A+iy)w0, где A G R, у G R, A2 + y2 = 0, то

Av0 = k0v0 = k0(A + iy)w0,

откуда

а' + ip' = k0(A + iy) = (а + iP)(A + iy).

(Последнее утверждение в общем случае для оператора на одномерном пространстве было доказано в конце пункта 3.)

Таким образом, число к0 = а + ip будет служить матрицей заданного формулой (14) линейного оператора A на одномерном пространстве тогда и только тогда, когда в обоих пространствах выбран один и тот же базис z0 = 0.

Добавим, что используемое в (15) соотношение (u + iv) = (а + ip) ■ (x + iy)

можно рассматривать как «матричную запись действия» линейного оператора A с матрицей A = (а + iP) (в смысле (4)) только в том случае, когда в обоих векторных пространствах V = C и W = C выбран один и тот же базис z0, причём равный единице, то есть z0 = 1 = 1 + i0. Лишь при таком выборе базиса комплексные числа x + iy и u + iv будут координатами векторов z = x + iy и Az = u + iv соответственно.

Из приведённых выше рассуждений также следует, что при любом выборе базисов в C (как в области определения

158

V = C, так и в области значений W = C) «вещественифициро-ванная» матрица исходного линейного оператора A : C —> C также будет иметь структуру (16) в стандартном базисе R2.

Таким образом, «вещественификация» линейных операторов A : C —> C выделяет в множестве всех линейных операторов на R2 (матрицами которых в общем случае могут быть любые квадратные матрицы второго порядка) некоторый класс линейных операторов с матрицами вида (16) в стандартном базисе {i, j} линейного пространства R2.

Очевидно, верно и обратное: всякому линейному оператору на R2, имеющему в стандартном базисе матрицу (16), отвечает линейный оператор на C. Действие этого линейного оператора на векторах из C сводится к их умножению на комплексное число а + i/З из поля P = C только тогда, когда в обоих пространствах C выбран один и тот же базис z0 = 0 (не обязательно равный 1 + i0).

Замечание 4. Подчеркнём ещё раз: матрица оператора AR имеет вид (16) именно при выборе стандартного базиса {г, j} в обоих пространствах R2 (как в области определения V = R2, так и в пространстве W = R2, которому принадлежат значения оператора). Если поменять базис в R2, то матрица оператора AR, вообще говоря, поменяется и потеряет структуру (16).

Напомним, что в произвольном n-мерном векторном пространстве V переход от какого-либо одного базиса а^, ..., an к любому другому базису ф, ..., bn может быть записан в виде матричного равенства

(b1, ..., bn) (а1, ..., ап) ' C,

где квадратная матрица C n-го порядка называется матрицей перехода. (В этой матрице координаты векторов ф, ..., bn в базисе (?i, ..., ап располагаются по столбцам.)

Можно показать, что матрица перехода всегда невырождена; и обратно, всякая невырожденная квадратная матрица C n-го порядка является матрицей перехода от базиса (?i, ..., ап, который можно выбрать произвольным, к некоторому другому базису ф, ..., bn.

159

Пусть вектор v G V имеет координаты ж1; xn в базисе а1;

an и координаты yi, ..., yn в базисе bi, ..., bn, то есть

V = xiai + ... + xnan = y1b1 + ... + ynbn

Тогда

V (а1, ..., an)

x1

(b1, ..., bn)

y1

yn

(а1, ..., an) • C I • • • 1 ,

yn

что позволяет выписать формулу, связывающую координаты вектора в двух различных базисах (формула преобразования координат):

x

xn

C •

y1

Уп

Вернёмся к оператору AR на R2. От стандартного базиса {i, j} перейдём в пространстве V = R2 к базису {а1, а,2}, а в пространстве W = R2 к базису {^1, ^2} с матрицами перехода Са и Cb соответственно, то есть

(аЪ а2) = (S, 3) • Ca, (b1, b2) = (b З) • СЪ-(Напомним: Са, Съ — невырожденные квадратные матрицы второго порядка.)

Координаты векторов (x; y) и (u; v) из R2 совпадают с их компонентами только в стандартном базисе {i, j}. Пусть вектор (x; y) в базисе {а^ а2} пространства V = R2 имеет координаты (xa; ya), а вектор (u; v) в базисе {b^ b2} пространства W = R2 имеет координаты (ub, Vb). Тогда

= Ca

xa

ya

=C

Следовательно (см. формулу (15)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

C

u

иЪ

vb

Ъ =

а —в в а

а —в ва

x

y

Ca

=C

1

а —в ва

Ъ

xa

ya

Ca

иЪ

vb

a

ya

v

160

ca

Последнее равенство означает, что матрицей оператора AR при выборе базисов [а^, а2} в пространстве V = R2 и (ф, b2} в пространстве W = R2 будет матрица

/~i—i( а в

С ^ в а

которая, в силу произвольности невырожденных матриц Са и Cb, уже не обязана иметь структуру (16).

Зная «происхождение» оператора AR от A, можно утверждать, что его действие на векторы из R2 сводится (при ненулевом A) к растяжению в |а + iв | раз и повороту на угол Arg (а + ) — именно такова геометрическая трактовка умно-

жения комплексных чисел.

Впрочем, указанный факт легко установить и непосредственно для линейных операторов на R2 с матрицами вида (16) в стандартном базисе. Если а и в одновременно не равны нулю, то существует такой угол <^, что

а _ в

cos

а потому

A

R

а

\J а2 + в2 ’

sin tp

\] а2 + в2 ’

= у/ а2 + в2

cos р sin р

- sin р cos р

ва

Применение последней (собственной ортогональной) матрицы второго порядка к векторам на плоскости приводит к их повороту на угол р, а умножение на величину у/а2 + в2 — к растяжению в у/а2 + в2 раз.

Понятно, что линейный оператор, действие которого на векторах сводится лишь к их повороту (на фиксированный угол) и растяжению, оставляет неизменными углы между векторами. Такого рода отображения выделяют и исследуют особо, называя конформными (от лат. conformis — подобный, сообразный; простейшим примером конформного (то есть не меняющего углы) отображения служит подобие).

Уточним. Линейный оператор A : R2 —> R2 называется конформным, если он невырожден и сохраняет (как по вели-

161

чине, так и по направлению) углы между любыми двумя ненулевыми векторами.

Замечание 5. Напомним, оператор A : V —> V на конечномерном векторном пространстве V называется невырожденным, если невырождена его матрица A (то есть det A = 0) в каком-либо (а тогда и в любом) базисе. Это определение корректно, поскольку при замене одного базиса линейного пространства другим матрица A оператора преобразуется по формуле C-1AC, где C — матрица перехода от исходного базиса к новому. (Последний факт был доказан в предыдущем замечании для двухмерного случая, но приведённые там рассуждения не зависят от размерности пространства.)

В курсе линейной алгебры для линейного оператора, действующего в конечномерном векторном пространстве, доказывается равносильность следующих утверждений: 1) оператор невырожден; 2) оператор биективен; 3) оператор обратим, то есть обратное отображение также является линейным оператором. Отсюда, в частности, следует, что невырожденный оператор всякий ненулевой вектор переводит в ненулевой (так как ker A = 0), а потому (если V евклидово) имеет смысл говорить как об угле между любыми двумя ненулевыми векторами, так и об угле между их (ненулевыми) образами при отображении A.

Вернёмся, однако, к линейным операторам на евклидовом пространстве R2. Оказывается справедливо следующее утверждение: линейный оператор A : R2 —> R2 является конформным тогда и только тогда, когда его матрица A в стандартном базисе пространства R2 имеет вид (16) и а2 + в2 = 0.

Здесь в доказательстве нуждается только один факт — необходимость: у всякого конформного линейного оператора A в R2 матрица в стандартном базисе {i = (1; 0), j = (0; 1)} имеет структуру (16). (Достаточность доказана выше, причём двумя способами — ссылкой на геометрический аспект умножения комплексных чисел и с помощью ортогональных матриц.)

Пусть Ai = ai + bj, Aj = ci + dj, где a, b, c, d — вещественные числа. Тогда матрица оператора в стандартном бази-

162

се пространства R2 равна

A

a c \

b d Г

причём det A = ad — bc = 0, так как A невырожден.

Поскольку векторы i и j перпендикулярны, то также перпендикулярными будут векторы Ai и Aj (в силу конформности A), а потому их скалярное произведение равно нулю:

Ai ■ Aj = ac + bd = 0.

Рассмотрим далее два случая, предполагая в первом a = 0, а во втором a = 0.

—b ■ d/a\ = a ■ d/a J

где Л = d/a. Поскольку линейные операторы с матрицами ( a c\ (a —b\

b d и b a

конформны (первый — по условию, второй — по доказанному), то конформным должен быть оператор с матрицей

Случай 1: a = 0. Тогда c = —bd/a и

a c \ = ( a —bd/a\ = ( a b d = b d = b

A

a —b ba

1 0 0Л

10

Найдём значение Л. Поскольку угол между векторами

1 ^ и ^ 1 ^ — именно в таком порядке — равен п/4 по величине и положителен по направлению, то угол между их образами

1 л)(0)=(;) ■ (; л)(1)-(л

также должен быть равным п/4 по величине и положительным что, очевидно, возможно лишь при Л =1. Следовательно,

a —b\ ( 1 0 \ = / a —b\f 1 0 \ = /" a —b b a J у 0 Л J у b a J у 0 1 у у b a

причём det A = a2 + b2 = 0, так как a = 0.

A

163

Случай 2: a = 0. Но тогда b = 0 и c = 0 (в силу невырожденности A), а d = 0 (в силу перпендикулярности векторов Ai и Aj). Далее,

A

ac

bd

f 0 -b b0

0c

b0

f1 0

l 0 у

0 —b(-c/b) b0

где у = —c/b.

Повторяя теперь рассуждения из случая 1, получим у = 1, а значит, и требуемое.

Впрочем, соотношение c = — b в случае 2 можно вывести непосредственно из условия положительности и равенства по величине п/4 угла между векторами

0 c 1

b 0 0

и

0 c 1

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

b 0 1

c

b

Замечание 6. С точки зрения теории линейных операторов польза от описанной выше «вещественификации» невелика. А вот польза от упомянутой там же комплексификации несомненна.

Напомним, что по любому линейному пространству L над полем R можно построить линейное пространство LC над полем C, которое называется комплексификацией пространства L. Пространство LC обладает тем свойством, что каждый его вектор z единственным образом представляется в виде z = X + iy, где X £ L и У £ L.

Конструкция пространства LC полностью повторяет известную конструкцию поля комплексных чисел: за векторы пространства LC принимают пары вида (X; у), где x £ L, у £ L; сложение таких пар определяют формулой

(Xi; у 1) + (Х2; у2) = (Х 1 + X2; у 1 + у2), а их умножение на комплексные числа — формулой (Л + iy)(X; у) = (AX — уу; ух + Ху), где Л £ R, у £ R, i2 = —1.

Доказывается, что размерности линейных пространств L и LC совпадают, причём любой базис пространства L является базисом пространства LC.

164

Для каждого линейного оператора A : L —> L можно определить линейный оператор AC : LC —> LC, который называется комплексификацией оператора A. На векторах из LC этот оператор задаётся формулой

AC (X + iy) = Ax + iAy.

Очевидно, что в каждом базисе пространства L матрицы A и AC операторов A и AC совпадают, то есть матрица оператора не меняется при его комплексификации. Отсюда, в частности, следует, что характеристические многочлены операторов A и AC равны: det(A — ЛЕ) = det(AC — Л E),

а значит, операторы A и AC имеют одни и те же характеристические корни (иначе говорят: имеют один и тот же спектр). Поскольку все корни характеристического многочлена принадлежат множеству комплексных чисел, то все эти корни будут собственными значениями оператора AC (но только вещественные из них будут собственными значениями оператора A). Кроме того, матрица любого линейного оператора, действующего на линейном пространстве над полем C (и, в частности, матрица AC оператора AC), приводится к жордановой форме.

7. Построение множества комплексных чисел

7.1. Расширение понятия числа

К понятию комплексных чисел привёл исторически длительный процесс постепенного расширения понятия числа. С методической точки зрения этот процесс лучше описать следующим образом, несколько отступая от исторического хода событий.

В самом первом используемом человечеством числовом множестве

натуральных чисел N = {1; 2; 3; ...} всегда выполнимы две основные арифметические операции — сложение и умножение (при этом операция умножения нату-

165

ральных чисел определяется через сложение, например, 3 • 5 = = 3 + 3 + 3 + 3 + 3). Обратное к сложению действие — вычитание — в множестве натуральных чисел выполнимо не всегда.

Чтобы вычитание было выполнимым всегда, множество натуральных чисел следует расширить путём присоединения к нему нуля и целых отрицательных чисел. В результате такого расширения приходят к множеству

целых чисел Z = {0; ±1; ±2; ±3; ...}.

Целые числа можно складывать, вычитать и умножать. Однако обратная к умножению операция — деление — по-прежнему осталась, вообще говоря, невыполнимой. Устранение этого пробела требует дальнейшего обобщения понятия числа, и множество целых чисел расширяют путём присоединения к нему всех обыкновенных дробей. Итогом подобного расширения является совокупность целых и дробных чисел, которая называется множеством

рациональных чисел Q = {m/n : m £ Z, n £ N}.

Это множество замкнуто по отношению ко всем четырём арифметическим операциям: над рациональными числами всегда выполнимы сложение, вычитание, умножение и деление (кроме деления на нуль), то есть в результате совершения любой их указанных операций над двумя рациональными числами вновь получается рациональное число.

Множество Q рациональных чисел является простейшим примером числового поля. Вообще, в математике полем называют всякое непустое множество, над любыми двумя элементами которого можно совершать операции сложения и умножения, причём каждая из этих операций ассоциативна (подчиняется сочетательному закону) и коммутативна (подчиняется переместительному закону), а умножение дистрибутивно (подчиняется распределительному закону) относительно сложения; кроме того, по отношению к сложению существует нуль и для каждого элемента — ему противоположный, а по отношению к умно-

166

жению существует единица (отличная от нуля) и для каждого ненулевого элемента — ему обратный.

Дополнение множества Q рациональных чисел числами иррациональными привело к очередному расширению — множеству

действительных (или вещественных) чисел R. Иррациональные числа возникают при извлечении корней (например, \/2, $5), при сравнении длин отрезков (так, диагональ любого квадрата несоизмерима с его стороной; длина окружности несоизмерима с её диаметром, поэтому их отношение даёт иррациональное число п = 3,14159...), при вычислении пределов (предел последовательности (1 + П )n при n ^ ж существует и равен иррациональному числу e = 2,71828...). Множество действительных чисел является полем и все его элементы находятся во взаимно однозначном соответствии с точками числовой прямой.

Потребность в расширении поля действительных чисел вызвана тем, что в нём не всегда выполнима операция извлечения корней, то есть действие, обратное возведению в степень с натуральным показателем (большим одного). Так, в множестве действительных чисел неразрешимо даже такое на первый взгляд простенькое квадратное уравнение как x2 + 1 = 0.

Комплексные числа C

являются таким расширением множества действительных чисел, которое представляет собой числовое поле и в котором (наряду со всеми четырьмя арифметическими операциями) всегда выполнимо извлечение корней.

7.2. Геометрическая интерпретация комплексных чисел

Стандартное описание процесса построения комплексных чисел выглядит следующим образом. Во-первых, они должны содержать все вещественные числа. Во-вторых, должно быть выполнимо извлечение корней и, в частности, должно быть

167

разрешимо уравнение x2 + 1 = 0; «число», квадрат которого равен -1, обозначают буквой i и называют мнимой единицей. Наконец, в-третьих, от нового числового множества требуется, чтобы оно было полем, поэтому мнимую единицу нужно уметь умножать на действительные числа и складывать с ними; это приводит к выражениям вида x + iy, где x Е R, y Е R, которые, собственно, и называются комплексными числами.

Используя (пока без достаточных на то оснований) известные законы арифметических операций, можно показать, что действия сложение, вычитание, умножение и деление над выражениями вида x + iy приводят вновь к выражениям такого же вида.

Конечно, все эти механически проведённые действия с выражениями вида x + iy, содержащими, к тому же, таинственный символ i, носят нестрогий характер. Но они подсказывают, как можно формализовать введение (описание) комплексных чисел. А именно, комплексным числом z назовём упорядоченную пару (x; y) вещественных чисел x и у. Сложение и умножение двух произвольных комплексных чисел zl = (xy y:) и z2 = (x2; y2) определим посредством равенств

z1 + z2 = (x1 + x2; yi + y2),

z1 ■ z2 = (xi ■ x2 - yi ■ y2; xi ■ y2 + x2 ■ yi).

Несложно проверить, что так введённые операции сложения и умножения подчиняются законам ассоциативности, коммутативности и дистрибутивности:

(zi + z2) + z3 = zi + (z2 + z3) , (zi ■ z2) ■ z3 = zi ■ (z2 ■ z3) ,

zi + z2 = z2 + zi, zi ■ z2 = z2 ■ zi,

(zi + z2) ■ z3 = zi ■ z3 + z2 ■ z3.

Нулём сложения является, очевидно, число (0; 0): z + (0; 0) = (0; 0) + z = z,

а противоположным элементом для числа z = (x; y) служит -z = (-x; -y):

z + (-z) = (-z) + z = (0; 0).

168

Единицей относительно умножения будет, понятно, комплексное число (1; 0):

z ■ (1; 0) = (1; 0) ■ z = z.

Наконец, каждое ненулевое число z = (x; y) имеет в качестве обратного

z-i = ( x ; -у \

z \ х2 + у2 ; х2 + у2 / , так как легко проверяется, что

z ■ z-1 = z-1 ■ z = (1; 0).

Итак, комплексные числа — упорядоченные пары вещественных чисел с введёнными выше операциями сложения и умножения — подчиняются всем обычным законам арифметики и являются числовым полем. Заметим, что арифметика комплексных чисел была только что построена без какого-либо мистического символа i.

Нетрудно видеть, что комплексные числа вида (х; 0) обладают теми же арифметическими свойствами, что и вещественные числа х. Поэтому пару (х; 0) можно отождествить с вещественным числом х; в частности, пары (0; 0) и (1; 0) отождествляются с 0 и 1 соответственно. Такое отождествление превращает множество R всех вещественных чисел в подмножество системы C комплексных чисел.

Наконец, обозначим через i комплексное число (0; 1). Тогда, как легко проверить,

i2 = i ■ i = (0; 1) ■ (0; 1) = (-1; 0) = -1, z = (x; y) = (x; 0) +(0; y) = (x; 0) +(0; 1) ■ (y; 0) = x + iy.

Последнее равенство показывает, что обозначение комплексного числа в виде упорядоченной пары вещественных чисел (x; y) равносильно более привычному x + iy.

Итак, множество комплексных чисел

C = {x + iy : x G R, y G R, i2 = -1}

образует поле и находится во взаимно однозначном соответствии с множеством точек (x; y) на координатной плоскости

169

Oxy.

Можно доказать, что каждое отличное от нуля комплексное число имеет ровно n различных комплексных корней степени n (n = 2; 3; 4; ...).

Более того, в поле комплексных чисел справедлива так называемая основная теорема алгебры (доказанная в 1799 г. выдающимся немецким математиком К. Гауссом): каждый многочлен n-ой степени (n ^ 1) с комплексными коэффициентами имеет хотя бы один комплексный корень. Это утверждение означает алгебраическую замкнутость поля C комплексных чисел. По этой причине уже не возникает надобности в расширении поля комплексных чисел в связи с неразрешимостью в C какого-либо алгебраического уравнения.

(Здесь полезно отметить удивительный факт: расширяя множество вещественных чисел R с помощью всего лишь одного «внешнего» для него объекта i — корня только одного и довольно простого квадратного уравнения х2 + 1 = 0, мы приходим к полю комплексных чисел C, в котором уже любое алгебраическое уравнение с вещественными или комплексными коэффициентами будет иметь решение.)

7.3. Матричная интерпретация комплексных чисел

Напомним рассматриваемую задачу: нужно так расширить множество R действительных чисел, чтобы в новом поле чисел уравнение х2 + 1 = 0 обладало бы корнем.

Рассмотрим множество M квадратных матриц второго порядка вида

Такого сорта матрицы нам уже встречались (см. в пункте 6 равенство (16) и условие конформности линейного оператора в R2); в конце данного пункта будет указан ещё один источник появления таких матриц.

где a £ R, в £ R.

170

Множество M замкнуто относительно операций сложения и умножения матриц (определённых общепринятым способом):

а1

в

а1

в

а1

-01

а1

+

а2 02 в2 а2

а1 + а2 - (в1 + 02) 01 + 02 а1 + а2

Е M;

Е M.

а2 02

02 а2

а1а2 - 0102 -(а102 + в1а2)

01а2 + «1^2 -0102 + а1а2

Каждая из указанных операций ассоциативна, а умножение

дистрибутивно относительно сложения (эти свойства справедливы для сложения и умножения любых квадратных матриц одного и того же порядка и, более того, любых матриц, над которыми указанные операции выполнимы). Коммутативность сложения (вообще, любых матриц) очевидна, а коммутативность умножения матриц из M проверяется непосредственно:

ал

-01 01 а1

02 02 а2

02 02 а2

а1 -в1 в1 а1

M,

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Нулём относительно сложения будет, очевидно, матрица

0 -0 0 0

а противоположной — матрица

а -в \ ( -а -(-в)\ е м.

в а ) у -р -а )

Наконец, единицей относительно умножения служит обычная единичная матрица

' 1 0 \ f 1 -0

0 1 ) v 0 1

а обратная матрица (при а2 + р2 = 0) находится следующим (известным из матричного исчисления) способом:

а - в \ _ 1 I а в

в

E

M,

M.

а ) а2 + в2 у - в а

Итак, установлено, что множество матриц M является полем со стандартными операциями сложения и умножения матриц.

171

Решением матричного уравнения X2 + E является матрица

так как

!2

0 -1

1 0

1 =

0

1

0 -1 10

'0) =

10

01

0 в поле M

—E.

Таким образом, построенное поле M квадратных матриц второго порядка специального вида может служить одной из моделей комплексных чисел. Перейти от матричной (от элементов из M) к привычной геометрической интерпретации комплексных чисел как точек на координатной плоскости не составляет труда, так как матрицы из M определяются двумя вещественными числами а и в. Отображение из M на C по правилу

(а; в) = а + iв.

а —в ва

будет изоморфизмом, если над точками плоскости определить операции сложения и умножения в соответствии с преобразованиями элементов первого столбца матриц из M при их сложении и умножении, то есть положить

(а1; в1) + (а2; в2) = (а1 + а2; в1 + в2),

(а1; в1) ' (а2; в2) = (а1а2 — в1в2; в1а2 + а1 в2).

При этом оказываются изоморфными матрицы вида аЕ и вещественные числа (а; 0) = а. Матрице I будет отвечать точка (0; 1) = i £ C. Представлению любой матрицы из M в виде

а — в ^ = ( а 0 \ . / 0 —в в а J ^ 0 а J ^ в 0

отвечает привычная запись комплексного числа в алгебраической форме

аЕ + в!

z = (а; в) = а ■ 1 + в ■ i = а + iв.

Замечание 7. Ортогональной матрицей называется матрица перехода от одного ортонормированного базиса к другому в конечномерном евклидовом линейном пространстве.

172

c11 c21 c12 c22

Рассмотрим двухмерное линейное пространство и два ортонормированных базиса в нём — {*1, *2} и {j, J2I- Раскладывая векторы второго базиса по первому, получим равенства

J1 = c11 *1 + c12 *2, J2 = c21 *1 + c22 *2,

которые в матричной форме принято записывать так:

въ /2) = (Ь *2)

Здесь матрица

C = I c11 c21

V c12 c22

называется матрицей перехода от базиса {*1, *2} к базису /1, J2I-(Координаты векторов /1, j в базисе *1, *2 в этой матрице располагаются по столбцам.)

Можно доказать, что матрица C тогда и только тогда ортогональна, когда её строки (и столбцы) ортонормированы. В двухмерном случае это приводит к трём условиям ортогональности:

c11 + c21 = 1; c11c12 + c21c22 = 0; c22 + c22 = 1-

Простейшим примером матрицы с ортогональными строками (и столбцами) служит уже встречавшаяся нам

а —в в а

Чтобы из этой матрицы получить ортогональную, нужно «нормировать» её строки и столбцы, поделив каждый элемент на а2 + в2 = 0-

8. Дифференцируемость функций и линейные операторы

В этом разделе будут рассматриваться только так называемые «вещественные» функции — это отображения, действующие (то есть с областями определения и областями значений) в арифметических пространствах

Замечание 8. Напомним, что для каждого натурального n через Rn обозначается множество всех упорядоченных последовательностей из n вещественных чисел. Если в Rn ввести операции

173

сложения элементов и их умножения на вещественные числа покомпонентно, то есть по формулам

а + Ь = (а1 + 61; а2 + Ъ2; ...; ап + Ъ,n),

Ха = (Ла1; Ла2; ...; Аап),

где а = (а1; а2; ...; ап) е Rn, Ъ = (Ъ1; Ъ2; ...; Ъп) е Rn, Л е R, то Rn

становится линейным пространством над полем P = R вещественных чисел. Элементы Rn вида

в1 = (1; 0; 0; ...; 0), = (0; 1; 0; ...; 0), ..., 4 = (0; 0; ...; 0; 1)

(в ек на к-ом месте находится единица, а все остальные компоненты равны нулю, k = 1, 2, ..., n) образуют полное линейно независимое семейство векторов, то есть являются базисом. Последнее означает, что размерность линейного пространства Rn равна n.

Базис [ёк} называется стандартным базисом в Rn. Коэффициентами любого вектора в стандартном базисе будут его компоненты:

а = (а1; а2; ...; an) = а1ё1 + а2ё2 + ... + anen.

Норма любого вектора а = (а1; а2^ ...; an) G Rn определяется равенством

||а|| = \J а\ + а2 + ... + аф

Она позволяет определить в Rn расстояние dist (а, Ъ) между двумя произвольными элементами а и b из Rn:

dist (а, b) = ||а — b||

(что делает Rn метрическим пространством).

Более того, в Rn можно определить скалярное произведение векторов а и Ъ:

а • Ъ = а1 Ъ1 + а2Ъ2 + ... + апЪп.

Тем самым Rn становится евклидовым пространством (так называется векторное пространство со скалярным произведением). Очевидно, что

||а||2 = а •а.

8.1. Вещественнозначные функции одной вещественной переменной

К понятию производной (дифференцируемости) приводят

различные задачи. 174

Рассмотрим задачу о нахождении скорости тела, движущегося по прямой. Пусть функция s(t) описывает положение тела в момент времени t. Если скорость v0 постоянна, то за промежуток времени т перемещение тела будет равно

s(t + т) - s(t) = v0t.

Если же скорость v(t) тела переменна, то отношение (s(t + т) - s(t))/T

даёт лишь величину средней скорости за промежуток времени от t до t + т. Ставится задача об определении скорости v(t) в каждый момент времени t — так называемой мгновенной скорости.

Интуитивные представления о движении в макромире говорят о том, что реальная механическая система за малый промежуток времени мало меняет свои параметры. В частности, скорость тела в течение очень малого интервала времени практически неизменна (почти постоянна) и должно быть

s(t + т) — s(t) ~ v0T

при т, близких к нулю. От этого приближённого равенства можно перейти к точному, если ввести поправочное слагаемое, величина которого при т ^ 0 стремится к нулю быстрее, чем т:

s(t + т) — s(t) = v0t + о(т), т ^ 0, (17)

где функция о(т) есть бесконечно малая величина более высокого по сравнению с т порядка при т ^ 0.

Из (17) величина v0 находится однозначно:

= lim s« + т) — s«). (18)

т ^0 т

Впрочем к соотношению (18) можно прийти и независимо от (17), так как на очень малом временном интервале ([t; t+т] при т ^ 0) скорость практически постоянна, а потому совпадает и со средней скоростью, и со скоростью в начальный момент времени.

Итак, за определение величины v(t) = v0 мгновенной ско-

175

рости тела в момент времени t можно принять как соотношение (17), так и равносильное ему соотношение (18). Эти два равенства и привели к двум основополагающим определениям дифференциального исчисления.

Пусть вещественнозначная функция f определена в некотором интервале (вещественной прямой), содержащем точку x.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Функция f называется дифференцируемой в точке x Е R, если существует такое число A Е R, что приращение функции f (x + h) — f (x) представляется в виде

f (x + h) — f (x) = A ■ h + o(h) при h ^ 0. (19)

Число f' (x) Е R называется производной функции f в точке x, если

f(x) = lim f (x + h) — f (x) (20)

0 h

при условии, что указанный предел существует.

Число A из (19) определено однозначно и совпадает с производной (20): A = f(x). Таким образом,

f (x + h) — f (x) = f'(x) ■ h + o(h) при h ^ 0 (21)

и дифференцируемость функции равносильна наличию у неё производной в соответствующей точке.

Линейная по h функция Ah = f(x)h из (19) и (21) называется дифференциалом функции в точке x (отвечающим приращению аргумента h) и обозначается через df (x). Функция дифференцируема в точке, если её приращение (изменение значений) в окрестности этой точки линейно с точностью до поправки бесконечно малой при h ^ 0 по сравнению с величиной h смещения. Поэтому дифференциал даёт наилучшую линейную аппроксимацию приращения функции (Af ^ df с точностью до o(h) при h ^ 0).

При фиксированном значении x дифференциал df (x) задаёт линейный оператор A : V —> W из линейного пространства V = R1 в линейное же пространство W = R1 (оба пространства над полем P = R), который каждому вещественному

176

числу h Е V = R1 ставит в соответствие вещественное число —h Е W = R1, где A = f '(x) Е R1: Ah = f '(x) • h. Напомним: в пункте 3 настоящей статьи было установлено, что для всякого линейного оператора на одномерном пространстве действие на векторах сводится к их умножению на некоторое (зависящее только от данного оператора) число.

Возможно, на данном этапе упоминание о линейном операторе в связи с дифференциалом вещественнозначной функции одной вещественной переменной и равенствами (19) или (21) смотрится излишним, надуманным и даже искусственным. Однако именно понимание дифференциала как линейного оператора позволило дать определение дифференцируемости функции в многомерном случае и экстраполировать его на другие ситуации. При этом в различных обобщениях понятия дифференцируемости равенство (19) остаётся практически неизменным (по крайней мере внешне), в то время как равенство (20) приходится переписывать в виде

lim lf(x + h) — f(x) — Ahl =o, a = f'(x). (22)

h^0 |h|

8.2. Векторнозначные функции одной

вещественной переменной

Рассмотрим функцию f, определённую на некотором интервале числовой оси R, содержащем точку х, и принимающую значения в Rm, где m = 2; 3; ...

Для векторнозначных функций одного вещественного аргумента понятие дифференцируемости (производной) можно ввести как с помощью равенства (19) или (21), так и с помощью равенства (20).

Поскольку значения функции f принадлежат пространству Rm, а приращение h аргумента является вещественным числом, то приращение функции /(x + h) — /(x) и отношение (f(x + h) — f(x))/h представляют собой элементы Rm. Но тогда

177

и из (21), и из (20) следует, что производная /'(x), если она существует, — это точка пространства Rm.

Таким образом, функция / дифференцируема (имеет производную) в точке x Е R, если существует вектор f(x) Е Rm такой, что

f(x + h) — f(x) = f(x) • h + /(h) при h ^ 0 (23)

или

lim f(x + h) — f(x) = fix)

h

h—» 0

^ lim

h0

x) ^

f(x + h) - f(x)

h

- f(x) m = 0 (24)

Rm

(последнее равенство подчеркивает, что соответствующий предел вычисляется в смысле сходимости по норме пространства

Rm).

Пусть /1, ..., fm — компоненты функции /, то есть такие вещественнозначные функции вещественного аргумента х, для которых

f(x) = (/l(x), ..., fm(x)).

Тогда, переходя в (23) или (24) к координатам, легко видеть, что функция / дифференцируема (имеет производную) в точке х тогда и только тогда, когда каждая из функций /1, ..., fm дифференцируема (имеет производную) в точке х и

f'(x) = (/(x), ..., fm(x)). (25)

Дифференциал d/(x) = f(x) • h в (23) вычисляется посредством умножения меняющегося числа h Е R на фиксированный вектор f(x) Е Rm. Поэтому (см. пункт 3) дифференциал можно рассматривать как линейный оператор A : V —> W, определенный на одномерном векторном пространстве V = R1 и принимающий значения в m-мерном векторном пространстве W = Rm (оба пространства над полем P = R); этот оператор каждому вектору /h Е R1 ставит в соответствие вектор Ah = f(x) • h Е Rm.

Матрица оператора A имеет размер m х 1 ив стандарт-

178

ных базисах — {1} в R1 и {е1, ..., em} в Rm — совпадает с f (x). С этой точки зрения вектор f(x) следует записывать в виде вектора-столбца (а не вектором-строкой как в (25)) и определение дифференцируемости (23) при переходе к координатам

— в виде

fi(x+h)-fi(x) \ ( /1(x) \ / Oi(h) \

............ I = I......I h + I.....I при h ^ 0, (26)

fm(x+h)-/m(xV \/m(xV \Om(h)J

где o1(h), ..., om(h) — вещественнозначные функции (в (23) o(h)

— векторнозначная функция со значениями в Rm).

Наконец, необходимо сказать, что в рассматриваемом случае векторнозначных функций одного вещественного аргумента при введении понятий дифференцируемости и производной о линейных операторах можно вовсе не упоминать.

8.3. Вещественнозначные функции нескольких вещественных переменных

Рассмотрим теперь вещественнозначную функцию f определённую в некоторой окрестности точки x Е Rn, где n =2; 3; 4; 5; ... В такой ситуации нельзя непосредственно применить определение (20) производной, так как тогда пришлось бы число (приращение / (x + h) — /(x) функции) делить на вектор h Е Rn (h — приращение аргумента), что невозможно. (В (24) подобной проблемы не возникало, ибо деление вектора f(x + h) — f(x) Е Rm на отличное от нуля число h Е R — операция всегда выполнимая в линейном пространстве.)

Попытка «модифицировать» (20) и рассматривать, скажем,

lim /(x + h) — /(x) = lim /(x + h) — /(x) я^° IIh IIr« я^° д/hf +... + hn

ничего не даёт, поскольку указанный предел, вообще говоря, не существует: так, в частном случае h = (h1; 0; ...; 0) ^ 0

получаем

179

lim f (x + h) - f (f) = lim f (x + h) - f (x)

h—» 0

h

|hi

sgn hi ■ ix;(x)'

= lim _h^.f (f+h) -f (f)

hi^0 |h1| h1

Итак, при введении понятия дифференцируемости для вещественнозначных функций нескольких вещественных переменных следует отталкиваться от равенства (19). В основе этого понятия лежит линейная аппроксимация приращения функции. Пусть приращение аргумента равно h = (h1; ...; hn) Е Rn. Всякая линейная функция от n переменных h1, ..., hn имеет

вид

+ ... + anhn

с некоторыми числами a1, ..., an из R. Поэтому вещественнозначную функцию f нескольких переменных следует считать дифференцируемой в точке x Е Rn, если

f (x + h) — f (x) = a1h1 + ... + anhn + o(h) при h ^ 0. (27) В (27) вещественнозначная функция o(h) такова, что

lim |о(Я)|/|Я|к„ = °

h^0

Из равенства (27) числа a1, ..., an находятся однозначно — это частные производные функции f в точке X:

f(x),

an = dT(x)'

n

Таким образом, если функция f дифференцируема в точке x (в смысле равенства (27)), то f имеет в данной точке частные производные по каждой переменной и её дифференциал (главная линейная часть приращения) имеет вид

df (x) = ix;(x) ■ h1 +... + f(x)' hn'

Правая часть в последнем равенстве равна скалярному произведению вектора градиента

gradf(x)= (x); ...; f(x))

и приращения аргумента h:

df (x) = grad f (x) ■ h.

h1^0

К

n

a

1

180

Полагая теперь производную f'(x) вещественнозначной функции нескольких переменных равной градиенту:

f,(x) =grad f (x) = (x); ...; f(f^, (28)

приходим к (внешне похожему на (21) и (23)) равенству

f (x + h) — f (x) = f'(x) ■ h + o(h) при h ^ 0. (29)

Здесь дифференциал df (x) = f'(ж) ■ h задаёт, очевидно, линейный оператор A : V —> W из n-мерного пространства V = Rn в одномерное пространство W = R1 (оба пространства над полем P = R), сопоставляющий каждому вектору h Е Rn число Ah = f'(x) ■ h Е R. (Линейность отображения A следует также из того факта, что скалярное произведение в любом евклидовом пространстве представляет собой пример билинейного функционала, то есть функции двух векторных аргументов, линейной по каждому из аргументов при фиксированном значении другого.)

Матрица такого линейного оператора A имеет размер 1 х n (это матрица-строка) и в стандартных базисах пространств Rn и R совпадает с градиентом (28). В частности, равенство (29) при переходе к координатам приобретает вид (ср. с (9))

f (ж + h) — f (x)

(!£<f);f (x)

h1

hn

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

+ o(h) при h ^ 0. (30)

В терминах линейных операторов можно дать определение дифференцируемости с помощью предела, аналогичное равенствам (20) и (24). А именно, вещественнозначная функция f нескольких вещественных переменных называется дифференцируемой в точке x Е Rn, если существует такой линейный оператор A : Rn —> R1, называемый производной и обозначаемый через f '(x), что

lim

h^Q

|f (x + h) — f (x) — f'(x)h|

0.

(31)

181

Замечание 9. При изучении функций нескольких переменных нельзя обойти вниманием вопрос о связи дифференцируемости и существования частных производных.

Если функция f дифференцируема в некоторой внутренней точке x G Rn области определения, то в этой точке существуют все (по каждой переменной) частные производные (и это уже отмечалось выше). Однако обратное утверждение, вообще говоря, неверно. Вот ставшие уже «хрестоматийными» примеры функций двух переменных, имеющих в начале координат обе частные производные, но не дифференцируемые в этой точке:

УаО^ Х) = x2) = fв{xl, x2) =

1, если 0, если

ГУ» ГУ»

x 1Х2

fv{Xi x2) =

/,(xb x2) = sj|xi x2l.

x2 x1 + x2

0,

x3 x1

x2 x1 + x2

0,

x 2x 1x2

x2 x1 + x2

0,

x1x2 = 0, x1x2 = 0;

если x2 + x2 = 0, если x1 + x2 = 0;

если x2 + x2 = 0, если x1 + x2 = 0;

если x2 + x2 = 0, если x1 + x2 = 0;

Здесь функции fa, /б разрывны в точке (0; 0), причём /б имеет обе частные производные во всех точках плоскости, в то время как /а в точках координатных осей, отличных от (0; 0), имеет только одну из частных производных. Функции /в, /г в каждой точке плоскости непрерывны и имеют обе частные производные. Функция /д также непрерывна на всей плоскости и имеет обе частные производные и в начале отсчёта, и во всех остальных точках плоскости, за исключением осей координат (в точках которых существует ровно одна из двух частных производных).

В курсах математического анализа доказывается следующее утверждение: если в некоторой окрестности точки x G Rn существуют все частные производные /х , /'х , то из их непрерывности в

182

точке x следует дифференцируемость функции f в этой точке. Это достаточное условие дифференцируемости функции нескольких переменных, но не необходимое, в чём легко убедиться на примере функции

{(x— + x—) ■ sin — 1——, если x— + x— = 0, x— + x—

0, если x— + x— = 0,

которая дифференцируема в любой точке плоскости, но её частные производные разрывны в начале координат.

8.4. Векторнозначные функции нескольких вещественных переменных

Рассмотрим максимально общую ситуацию для отображений вещественных пространств.

Пусть функция / определена в окрестности точки X Е Rn и принимает значения в Rm, где n и m — натуральные числа. Поскольку теперь приращение /(X + h) — /(x) функции / принадлежит пространству Rm, а приращение аргумента h — пространству Rn, то линейное (относительно h) приближение для приращения функции можно задать как значение Ah линейного оператора A : Rn —> Rm на векторе h:

/(X + h) — /(X) « Ah. (32)

Приведённое рассуждение и лежит в основе понятия дифференцируемости векторнозначной функции векторного аргумента.

Итак, функция /, отображающая некоторую окрестность точки X Е Rn в Rm, называется дифференцируемой в точке X, если существует линейный оператор A : Rn —> Rm такой, что

/(X + h) — /(X) = Ah + o(h) при h ^ 0, (33)

где lim ||o(h)||Rm/||h||Rn = 0. Соотношение (33) можно перепи-Zi^ о

сать в виде равносильного равенства

lim

h^0

ll/(X +h) — /(X) — Ah|R

h TUn

m

0.

(34)

183

Линейный оператор A называется (полной) производной функции f в точке X и обозначается через f'(X), а его значение Ah на векторах h £ Rn называется дифференциалом функции f в точке X (отвечающим приращению аргумента h) и обозначается через df (X).

Из определения (33) следует, что для дифференцируемой в точке X функции разность f(X+h) — f(x) при малых h приближённо равна f(X)h, то есть равна значению линейной функции на векторе fh:

f(x + h) — f(x) w df(x) = f(x)h

(ср. с (32)).

Очевидно, что соотношения (33) и (34) являются обобщением соотношений (19) и (22), (23) и (24), (27) и (31) соответственно.

Перейдём в равенстве (33) к координатам, считая базисы в Rn и Rm стандартными. Пусть

x = (xi; ...; xra) £ h = (hi; ...; hj £

f(x) = (fi(x);...; fm(x)) £ Rm

Матрица оператора A : Rn —> Rm, как мы знаем, имеет размер m х n; будем считать, что она имеет вид (5). Тогда, учитывая (4), из (33) получим

fi(x+h) — fi(x)

Jm(X+h) — fm(X)

а11 • • •а.

ni

°1 m

hi

h

Oi(h)

Om(f)

+ I........I при h ^ 0, (35)

или

fi(x+h) —fi(x) = anhi+...+anihn + Ol (h),

..................................... при h ^ 0. (36)

fm(X+h) —fm(X) = aimhi + ...+anmhn + Om(h)

Равенства (36) означают, что вещественнозначные функции fi , ..., fm нескольких переменных (компоненты координатного представления отображения f) дифференцируемы в точ-

nm

184

ке x Е Rn (см. (27)) и матрицы их производных (размером 1 х п) совпадают (в стандартных базисах) с соответствующими градиентами (см. (28)).

Итак, если функция f, отображающая окрестность точки X Е Rn в Rm, дифференцируема в X, то в этой точке существуют все частные производные координатных компонент f,, ..., fm функции и в стандартных базисах пространств Rn и Rm матрица производной f'(x) (матрица линейного оператора A : Rn —> Rm из (33)) имеет вид

f/(X)

( 3fu^ dfi(^\

тА-1 (x) ■ ■ ■ тФ1 (x)

ox, w ox„ 4 '

(37)

dfm (x) . . . dfm (x)

V Ox,(x) dxn(x) /

Матрица (37) называется матрицей Якоби отображения f в точке x.

Понятно, что равенство (35) с учётом (37) обобщает соотношения (21), (26), (30).

В общем случае для векторнозначной функции f нескольких переменных, то есть функции с областью определения в Rn и значениями в Rm, справедливы следующие фундаментальные утверждения, связанные с дифференцируемостью:

1 (единственность производной)

Функция f не может иметь более двух производных, то есть производная f (x), когда она существует, единственна.

2 (дифференцируемость и непрерывность)

Если функция f дифференцируема в точке, то она непрерывна в этой точке. Обратное утверждение, разумеется, неверно (оно неверно уже в одномерном случае).

3 (достаточное условие дифференцируемости)

Если функция ff дифференцируема во внутренней точке fx области определения, то в этой точке существуют все производные, образующие матрицу (37). Обратное утверждение верно при п =1 и, вообще говоря, неверно при п > 1. В последнем

185

случае для дифференцируемости функции в точке достаточно (но не необходимо) непрерывности в этой точке всех частных производных из (37).

4 (линейность операции дифференцирования)

Если отображения / и g со значениями в Rm дифференцируемы в точке X Е Rn, то их линейная комбинация Л/ + цд при любых вещественных числах Л и ц также дифференцируема в этой точке, причём

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

(Л/ + цд),(х) = Л/(X) + цд'(х).

5 (дифференцирование сложной функции)

Если отображение / со значениями в Rm дифференцируемо в точке x Е Rn, а отображение д со значениями в R.1 дифференцируемо в точке у = /(X) Е Rm, то композиция этих отображений F = /о/, то есть сложная функция F(■) = д(/(-)), определённая на элементах Rn и принимающая значения в R1, дифференцируема в точке /x, причём

F'(X) = g,(f(x)) ■ f(x). (38)

В правой части равенства (38) стоит произведение (композиция) линейных преобразований.

Перепишем соотношение (38) в координатной форме, считая базисы в пространствах Rn, Rm, R.1 стандартными. Пусть

X (xl; •••; Xn), f (y1; •••; Vm) координаты векторов X Е Rn и y = f (X) Е Rm, а

F = (Fi; •••; F), g = (^; • ••; д), f = (fi; •••; fm) координатные представления векторнозначных функций F, д, f (здесь Fi(■) = gi(f (■)), i = 1; ...; I). Если X и y — внутренние точки областей определения функций / ид соответственно, то, зная структуру (37) матрицы производной, из (38) получаем

(X) ■■

к <X)

186

■ i (X) \

§n <X> /

%(y)

яг1 ® \

dgL(y) ■■■ dt(y)

V dy-i

( f

7

dfi

^■/1 (X) ... WJ1 (X)

dx1 (x) <9xn(x)

\

9f„

wJm[X\ w J m (X\

\ Ox, (x) dx (X) 7

Отсюда, в частности, вытекает (совсем не тривиальное!) правило вычисления частных производных сложной функции:

д Fi(^ d(gi о f

(x) = —^-----— (x)

/' j ry-- \ / /' j ry-- \ /

Г\ \ »Xj I r\

oxk oxk

x) =

dgi (y(x)) ■f (x) +... + (/(x)) ■dfm (x)

d%1

9y

0xb

j=1 igi </<x» ■ dj

где i =1; ...; l, к =1; ...; n.

6 (дифференцирование обратной функции)

Пусть для отображения / существуют окрестности точек x £ Rn и y = /(x) £ Rn, в которых оно имеет обратное отображение /-1. Если при этом / дифференцируемо в точке x, а /-1 непрерывно в точке /, то отображение /-1 дифференцируемо в точке y = /(x) и справедливо равенство

(Г1)'® = [f,(x)]"1.

Таким образом, взаимно обратные дифференцируемые отображения имеют в соответствующих точках взаимно обратные производные.

Из курса линейной алгебры известен следующий факт: если линейный оператор A на векторном пространстве V обратим, то в фиксированном базисе пространства V матрица обратного оператора A-1

является обратной к матрице исходного оператора A. Кроме того, имеется алгоритм построения обратной матрицы к любой невырожденной квадратной матрице. Следовательно, зная матрицу линейного оператора (производной) /'(x) (в стандартном базисе пространства — это (37) при m = n), можно построить матрицу оператора (/-1)'(/).

187

9. Дифференцирование функций

комплексной переменной

В настоящем разделе статьи будут рассматриваться комплекснозначные функции одного комплексного аргумента. Более того, мы будем иметь дело лишь с однозначными функциями.

Всякая такая функция f каждому значению независимой комплексной переменной z из области определения ставит в соответствие одно вполне определённое комплексное число w. Символически описанная зависимость обозначается w = f (z).

Комплексное число z = x + iy определяется двумя вещественными числами x и у, которые называются действительной и мнимой частями числа z соответственно: x = Re z, y = Im z. Аналогично, комплексное число w = u + iv определяется вещественными числами u и v. Поскольку величина w зависит от z, то каждая из величин u и v также зависит от z, а значит, зависит от двух вещественных чисел x и у. Следовательно, задание комплекснозначной функции w = f (z) от комплексной переменной z равносильно заданию упорядоченной пары вещественнозначных функций u и v от двух вещественных переменных x и у:

Функции u и v называются соответственно вещественной и мнимой частями функции f:

9.1. Дифференцируемость (производная) по комплексному аргументу

Пусть функция f определена в некоторой окрестности точки z Е C. Определения дифференцируемости, дифференциала и производной по комплексной переменной с формальной стороны повторяют соответствующие определения (19)-

w=f (z), где z=x+iy, w=u+iv, ^

(39)

u(x,y) = Re f (z^ v(x,y) = Im f (z).

188

(21) для вещественнозначных функций одной вещественной переменной.

Так, функция f называется дифференцируемой (или моногенной) в точке z, если приращение f в окрестности z может быть представлено в виде

/(z + С) - /(z) = A ■ С + о(С) при С ^ 0, (40)

где Z ^ C, A — фиксированное (не зависящее от Z, но связанное с z и f) комплексное число.

Производной функции f в точке z называется комплексное число /'(z), равное пределу (если он существует) отношения приращения функции к приращению аргумента, когда последнее стремится к нулю:

f(z) = lim f (z + Z> - f (z>. (41)

J w c^o ( v 7

Легко видеть, что в данной точке дифференцируемость функции равносильна существованию производной и A = /'(z), то есть число A в равенстве (40) определяется однозначно:

/(z + С) - /(z) = f'(z) ■ С + °(С) при С ^ о. (42)

Определение (40) дифференцируемости имеет ту же мотивировку, что и в классическом математическом анализе; в её основе лежит возможность локального приближения приращения данной функции посредством функции линейной. Эта линейная функция (когда она существует) называется дифференциалом f в точке z (отвечающим приращению аргумента

Z):

d/(z) = /'(z) ■ С. (43)

Дифференциал (43) порождает (как и в вещественном случае) линейный оператор A : C —> C на одномерном линейном пространстве V = C — множестве комплексных чисел над полем P = C: AZ = /'(z) ■ ( при любом ( Е C. Как и у каждого линейного оператора на одномерном пространстве (см. (12), (14)), действие A на векторах сводится к их умножению на фиксированное комплексное число /'(z) Е P = C.

189

Что касается определения (41) производной по комплексной переменной, то его содержательная (вытекающая из каких-либо приложений) мотивировка затруднительна: оно просто-напросто копирует определение (20) производной функции вещественного аргумента, которое возникло в связи с часто встречающимся пределом отношения приращения функции к соответствующему бесконечно малому приращению аргумента в различных областях естествознания (вычисление скорости изменения величины, построение касательной к кривой и т. д.).

Кстати, (41) — не единственный пример механического переноса в комплексную область формул математического анализа. Так, определение экспоненты exp z = ez при любых z Е C даётся с помощью ряда, полученного формальной заменой в известном тейлоровском разложении функции ex вещественной переменной x на комплексную z.

Поскольку определения производной функции в комплексном и вещественном случаях идентичны, а арифметические свойства полей C и R одинаковы, то основные правила дифференцирования справедливы и в теории функций комплексной переменной (ТФКП). Сказанное в полной мере относится к правилам дифференцирования суммы, разности, произведения и частного функций, сложной и обратной функций. Имеет место следующее утверждение: всякая дифференцируемая в точке функция f (z) непрерывна в этой точке.

Требование дифференцируемости (существования производной) в точке накладывает на функцию комплексного аргумента значительно более сильные ограничения, чем на функцию вещественного аргумента. В самом деле, предел в (20) и (41) не должен зависеть от способа (и в частности, от направления) стремления приращения аргумента к нулю. Но таких направлений на вещественной прямой всего два — слева и справа от точки, а на комплексной плоскости — бесконечное множество.

190

Приведённые рассуждения объясняют, почему довольно легко привести примеры функций комплексного аргумента, которые определены на всей комплексной плоскости, всюду непрерывны (это необходимое условие дифференцируемости) и не имеют производной ни в одной точке.

Таким примером может служить функция w = f (z), сопоставляющая каждому комплексному числу z = x + iy ему сопряжённое число z = x — iy, то есть f (z) = z. Пусть Z = hx + ihy — приращение аргумента (hx G R, hy G R). Тогда

f (z + C) — f (z) = z + Z - z = Z = hx — ihy

Z ( ( hx + ihy

Но последняя дробь предела при Z ^ 0 не имеет: она стремится к 1, когда Z изменяется на оси абсцисс (то есть Z = hx ^ 0, hy = 0), и стремится к —1, когда Z принадлежит оси ординат (то есть Z = ihy ^ 0, hx = 0). Добавим, что вещественная и мнимая части рассматриваемой функции u(x, y) = x и v(x, у) = —у (см. (39)) имеют частные производные всех порядков и дифференцируемы как вещественнозначные функции двух вещественных переменных (см. (27), (29), (30)):

Au = u(x + hx, у + hy) — u(x, у) = hx = (1; 0)

Av = v(x+hx, у+hy) — v(x, y) = —hy = (0; —1)

hx

hy

hx

h

+ 0;

+0.

Кроме того, дифференцируемо и порождаемое функцией w = f (z) отображение (x; у) —> (u; v) из R2 в R2 (см. (35)):

0

u(x + hx, у + hy) — u(x, y)

v(x + ^ у + hy) — v(x, y)

10

01

hx

hy

+

0

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Как отмечалось ранее, требование дифференцируемости функции в точке по комплексной переменной гораздо более сильное, чем по вещественной переменной. По этой причине многие факты ТФКП (теории функций комплексной переменной) не имеют аналогов в классическом математическом анализе. Так, если функция комплексного аргумента дифферен-

191

цируема (имеет одну производную) в окрестности точки (такая функция называется голоморфной), то она бесконечно дифференцируема (имеет производные всех порядков) в этой окрестности и, более того, аналитична, то есть равна сумме некоторого степенного ряда с центром в этой точке (причём указанный степенной ряд есть её ряд Тейлора).

9.2. Условия Коши—Римана

В приведённом выше примере функции z —> z, непрерывной на всей комплексной плоскости и не дифференцируемой ни в одной точке, и вещественная, и мнимая части — гладкие (бесконечно дифференцируемы). Это говорит о том, что у дифференцируемой функции f вещественная и и мнимая v части (см. (39)) не произвольны, а между ними существует определённая связь. Попытки выявления такой связи привели к условиям Коши—Римана.

Возьмём сначала в качестве отправной точки определение (41) производной функции по комплексному аргументу. Если указанный в (41) предел существует, то он не зависит от способа стремления к нулю приращения Z аргумента функции. В частности, при изменении Z в одном случае только на вещественной оси (то есть при Im Z = 0), а в другом — только на мнимой (то есть при Re Z = 0), получим из (41) две формулы для вычисления производной f '(z) дифференцируемой функции через вещественную и мнимую части:

f '(z) = UX + iVX = Vy - iUy. (44)

Отсюда следует, что при наличии в точке производной функции f в этой точке существуют частные производные вещественной и и мнимой v частей, причём

U'x = V'y, U'y = -V'X. (45)

Соотношения (45) носят название условий Коши—Римана. Как показывают приведённые рассуждения, эти условия являются необходимыми для того, чтобы функция f была диф-

192

f (z)

ференцируемой в данной точке. Но достаточными они, увы, не будут. В последнем легко убедиться на (опять-таки «хрестоматийном») примере функции

e-1/z при z = 0,

0 при z = 0,

для которой условия Коши—Римана выполнены в каждой точке комплексной плоскости и которая в начале координат не только не дифференцируема, но даже разрывна (при z, стремящемся к нулю по прямой y = x, функция f (z) неограниченно возрастает).

Напомним, что условия Коши—Римана (45) были получены из определения (41) производной. Но извлечь из него иные ограничения на и и v, выбирая различные направления стремления приращения аргумента Z к нулю, крайне затруднительно. Поэтому попробуем теперь обратиться к соотношению (40) или (42), определяющему дифференцируемость функции в точке (и этот подход, как будет видно из дальнейшего, окажется более продуктивным).

Итак, предположим, что функция f дифференцируема в точке z, то есть справедливо соотношение (42). Пусть

f'(z) = а + ip, С = К + ihy,

где а, в, hx и hy — вещественные числа; как и выше, u(x,y) = Re f (z) v(x y) = Im f (z)

(см. (39)), z = x + iy. Перейдём от равенства (42) комплексных величин к равенствам их вещественных и мнимых частей. Получим при Z ^ 0

Au = u(x + hx, y + hy) — u(x, y) = ahx — phy + Reo((),

Av = v(x + hx, y + hy) — v(x, y) = phx + ahy + Imo(Z). Отсюда моментально следует (см. пункт 8.3), что, во-первых, вещественнозначные функции и, v двух вещественных переменных дифференцируемы в точке (x; y) и, во-вторых, в этой точке а = u'x, —в = u'y, в = v'x, а = vy,

то есть справедливы условия (45) Коши—Римана.

193

(46)

Следовательно, отталкиваясь от равенства (42), получены два необходимых условия дифференцируемости функции f по комплексному аргументу — это дифференцируемость (в смысле классического анализа) функций u(x, у) и v(x, у) и (уже известные) условия Коши—Римана. Более того, указанные условия в совокупности достаточны для дифференцируемости f в точке z: если в точке (x; у) вещественная и мнимая части и и v функции f дифференцируемы и удовлетворяют условиям Коши—Римана, то имеют место равенства (46), которые немедленно влекут (42).

Другими словами, справедливо следующее утверждение: функция f = u + iv дифференцируема в точке z = x + iy тогда и только тогда, когда в точке (x; у) её вещественная и мнимая части и и v 1) дифференцируемы и 2) удовлетворяют условиям (45) Коши—Римана.

Замечание 10. Разумеется, вещественная и мнимая части u и v (см. (39)) дифференцируемой комплекснозначной функции f комплексного аргумента z = x + iy обладают и другими (помимо перечисленных выше дифференцируемости и условий Коши—Римана) свойствами.

Так, если функция f дифференцируема в каждой точке некоторой области (то есть голоморфна), то u и v являются гармоническими функциями в этой области, то есть являются решениями уравнения Лапласа

Аи = и'Хх + = 0, Av = v'Xx + v’yy = 0.

Причём голоморфная функция однозначно (с точностью до постоянного слагаемого) восстанавливается и по известной своей вещественной части, и по известной своей мнимой части.

Кроме того, вычисленные в одной точке градиенты функций u и v взаимно перпендикулярны:

grad и ■ grad v = u!xv'x + u'yv'y = 0,

то есть вещественная и мнимая части голоморфной функции имеют взаимно ортогональные семейства линий уровня.

194

9.3. Ещё один подход к определению

дифференцируемости по комплексному аргументу

К понятию дифференцируемости по комплексному аргументу можно прийти с помощью своего рода «комплексифика-ции» понятия дифференцируемости в двухмерном вещественном случае («перенос дифференцируемости из R2 на C»).

Как уже упоминалось (см. (39) в пункте 9), задание комплекснозначной функции w = f (z) комплексного аргумента, где z = x+iy, w = u+iv, равносильно заданию векторнозначной функции двух вещественных аргументов, сопоставляющей вектору (x; y) Е R2 вектор (u; v) Е R2, где u = u(x, y), v = v(x, y)

— вещественная и мнимая части функции f.

Действующая в R2 функция (x; y) —> (u; v) дифференцируема в точке (x; y), если для приращения (Au, Av) функции, отвечающего приращению аргумента h = (hx; hy) Е R2, справедливо при h ^ 0 равенство (см. пункт 8.4)

Au

Av

u(x + hx, y + hy) — u(x, y) v(x + hx, y + hy) — v(x, y)

uX uy vX vy

hx

h

+

°i(h)

o2(h)

Здесь матрица Якоби

A

u

(47)

(48)

является матрицей линейного оператора A : R2 —> R2 (A — производная) в стандартном базисе {i = (1; 0), j = (0; 1)} пространства R2; o1(h) и o2(h) — вещественнозначные функции двух переменных, являющиеся бесконечно малыми при h ^ 0 по сравнению с величиной ||h||R2.

Попробуем теперь «комплексифицировать» соотношение (47), то есть перейти от равенства векторов в R2 к равенству комплексных чисел. С встречающимися в (47) двухмерными векторами проблем нет:

v

195

(ж; y) --» ж + iy = z — комплексный аргумент;

h

hx

h

--» hx + ihy = Z — приращение аргумента;

--» Au + iAv = f (z + Z) — f (z) — приращение 0 --» o1(h) + io2(h) = o(Z) при Z ^ 0.

A u Av

функции;

o^(h) ) при h ^ 0 --" oi(h) + i02(

Что же касается линейного оператора A : R2 —> R2, который в (47) представлен матрицей Якоби (48), то он, вообще говоря, не порождает линейного оператора на C. Но, как установлено в пункте 6, такое возможно тогда и только тогда, когда матрица оператора A в стандартном базисе пространства R2 имеет вид

A ( в а), (49)

причём действие линейного оператора с матрицей (49) на векторах из C сводится к их умножению на комплексное число а + ift (при этом в линейных пространствах C должен быть выбран один и тот же базис Z0 = 0, например, Z0 = 1 + i0).

В итоге попытка «переноса» понятия дифференцируемости из R2 в C привела к следующим (известным из ТФКП и изложенным ранее в настоящей статье) результатам:

1. Сравнение матриц (48) и (49) даёт условия (45) Коши— Римана: u'x. = v'y, u'y = — v'x.

2. Равенство (47) трансформируется в общепринятое определение (40) дифференцируемости комплекснозначной функции комплексного аргумента:

f (z + Z) — f (z) = (а + ie) ■ Z + o(Z) при Z ^ °.

3. Для производной f'(z) = a + ift по комплексному аргументу получаем вычислительные формулы с использованием вещественной и и мнимой v частей функции:

f'(z) = uX + ivX = uX— iu'y = v'y + ivX = < — iu'y.

196

4. Дифференцируемость функции w = f (z) по комплексному аргументу можно изначально определить как дифференцируемость двух вещественнозначных функций u(x, у) = Re f и v(x, у) = Im f двух вещественных переменных при выполнении для их частных производных условий Коши—Римана.

В заключение опишем ещё один способ «скомплексифика-ции» дифференцируемости в вещественном двухмерном арифметическом пространстве R2.

Дифференцируемость в точке (x; у) плоскости функции (x; у) —> (u; v), действующей в R2 и порождённой комплекснозначной функцией w = f (z) комплексного аргумента (см. (39)), означает, что при h ^ 0 (см. (47))

{Au = u(x + hx, у + hy) - u(x, у) = u'xhx + u’yhy + o1(h),

Av = v(x + hx, у + hy) — v(x, y) = v'xhx + v'yhy + o2(h).

От этой системы легко перейти (сложив первое уравнение со вторым, умноженным на i Е C) к равносильному ей одному равенству, но уже в области комплексных чисел:

Au + iAv = (u'x + iv'x)hx + (u'y + ivy)hy + o(h) при h ^ 0, или

f (z + C) — f (z) = fx ■ hx + fy ■ hy + o(C) при C ^ 0,

где

f = lim f (z + Ю — f (z)

h^^ 0

h

ux +ivx,

f

Jv

lim f (z + ^) — f(z) = Ц, + ivX

hy ^0 h y y

(fx, fy — это своего рода частные производные по x и по у комплекснозначной функции f которые существуют в силу дифференцируемости функций и и v).

Далее, вещественные числа hx и hy удастся «собрать» в одно комплексное число hx + ihy = Z, если, например, потребовать, чтобы выполнялось соотношение fy = ifx. Тогда мы придём к равенству

197

f(z + С) - f(z) = f ■ ( + °(C) пРи C ^ 0

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

и к сделанным чуть выше выводам 1-4 (в частности, /'(z) = f, а условия Коши—Римана равносильны соотношению f = if).

10. Дифференцирование

в нормированных пространствах

10.1. Нормированные пространства и непрерывные линейные операторы

Развитие ряда областей функционального анализа показало, что во многих случаях приходится рассматривать линейные пространства с заданными на них нормами (или, более общо, топологиями).

Пусть L — произвольное (не обязательно конечномерное) линейное пространство над полем P вещественных или комплексных чисел (то есть P = R или P = C). На L задана норма, если каждому вектору a Е L поставлено в соответствие вещественное число, называемое нормой этого вектора и обозначаемое, как правило, через ||а||, причём выполнены следующие условия:

1 (положительность).

||а|| ^ 0 при любом а Е L.

2 (невырожденность).

||а|| = 0 ^ а = 0.

3 (однородность).

|| А а|| = |А| ■ ||а|| при любых а Е L и А Е P.

4 (полуаддитивность, или неравенство треугольника). ||а + b|| ф ||а|| + ||6|| при любых а и b из L.

Отметим, что условие 1 — неотрицательность нормы любого вектора а — вытекает из условий 2-4 и аксиом векторного пространства:

0 = ||0|| = ||а + (—а)|| ф ||а| + || — а|| =

198

= ||a|| + ||(—1) ■ a|| = ||a|| + | — 1| ■ ||a|| = 2 ||a||. Линейное пространство, в котором задана некоторая норма, называется (линейным) нормированным пространством.

Всякое нормированное пространство L становится метрическим, если расстояние р (a, b) между любыми двумя его векторами а и b определить по формуле

р (a, b) = | a — b|

(так называемая естественная метрика, или метрика, индуцированная нормой). Справедливость аксиом метрического пространства в этом случае немедленно следует из свойств нормы: р (a, b) ^ 0 (аксиома положительности); р (a, b) = 0 ^ a = b (аксиома невырожденности); р (a, b) = р (b, а) (аксиома симметрии); р (a, b) ф р (a, c) + р (c, b) (аксиома треугольника), где a, b, c — произвольные элементы L. (Аксиома положительности легко выводится из трёх других аксиом метрического пространства.)

Сверх того, благодаря наличию в L линейной структуры, индуцированная нормой метрика р обладает ещё двумя свойствами:

р (a + c, b + c) = р (a, b) и р (Aa, Ab) = |A| р (a, b), при любых a £ L, b £ L, c £ L, A £ P; первое из перечисленных свойств означает инвариантность метрики относительно переносов, а второе — её однородность.

Замечание 11. Каждое нормированное или метрическое пространство может быть наделено структурой топологического пространства. Топологическое пространство — это множество T, в котором указана топология, то есть система подмножеств, называемых открытыми множествами в T, причём само T и пустое множество 0 являются открытыми, объединение произвольного (конечного или бесконечного) и пересечение конечного количества открытых множеств вновь будет открытым множеством. Дополнения в T к открытым множествам называются замкнутыми множествами в

199

топологическом пространстве T.

Если L — нормированное или метрическое (и не обязательно линейное) пространство, то базу соответствующего ему топологического пространства образует совокупность всех (открытых) шаров Br(a) = {x е L : р (x, a) < r}

с произвольными центрами a е L и радиусами r > 0 (причём значения r достаточно брать только рациональными). Тогда, согласно определению базы топологии, любое открытое множество в L представимо в виде объединения некоторого (конечного или бесконечного) количества элементов базы.

Топологическое пространство является тем математическим объектом, на котором операция предельного перехода и непрерывность (свойства непрерывности) отображения изучаются в наиболее общем виде, поскольку для определения предела функции нужно нужно знать лишь что такое окрестность точки (при этом само пространство вполне может быть и не нормированным, и не метрическим). В топологическом пространстве окрестностью точки называется всякое открытое множество, содержащее эту точку.

Например, отображение f из топологического пространства X в топологическое пространство Y называется непрерывным в точке x е X, если для любой окрестности V точки y = f (x) е Y найдётся окрестность U точки x, образ f (U) которой содержится в V, то есть

f (U) С V.

Теперь скажем несколько слов о линейных операторах в нормированых пространствах.

Пусть X и Y — нормированные пространства над одним и тем же полем P, где P = R или P = C. Поскольку в каждом их них имеется линейная структура, то точно так же, как и в случае произвольных векторных пространств, определяется понятие линейного оператора A : X —> Y, действующего из одного нормированного пространства в другое.

Важный класс линейных операторов в нормированных (и вообще, в линейных топологических) пространствах представляют собой непрерывные операторы, которые определены

200

на всём X и непрерывны в каждой точке х Е X. (Именно непрерывные линейные операторы используются при определении дифференцируемости функции в нормированных пространствах.)

Кроме того, рассматриваются также ограниченные операторы, которые определены на всём X и каждое ограниченное множество переводят снова в ограниченное. В нормированных пространствах требование ограниченности оператора эквивалентно существованию такой постоянной C Е R, что

II^Ax||y ^ C • ||х||х

при всех х Е X (доказательство этого факта — лёгкое упражнение). Наименьшее их чисел C, удовлетворяющих последнему неравенству, называется нормой оператора A и обозначается через || A||.

Для линейных операторов в нормированных (но не в линейных топологических) пространствах непрерывность равносильна ограниченности.

Нетрудно доказать, что любой действующий в конечномерных нормированных пространствах линейный оператор всегда непрерывен (ограничен). В случае же пространств с бесконечной размерностью это, вообще говоря, неверно.

Замечание 12. В более общей ситуации линейных топологических пространств также имеет смысл говорить о непрерывности и ограниченности линейных операторов. Напомним, в линейном топологическом пространстве над полем P, где P = R или P = C (и это пространство может не быть нормированным или метрическим), множество называется ограниченным, если для каждой окрестности U нуля существует такое число R > 0, что ЛU содержит данное множество при всех |Л| ^ R, Л Е P.

Однако в этом случае понятия непрерывности и ограниченности линейного оператора не равносильны, а именно, всякий непрерывный оператор ограничен, но ограниченный оператор не обязан быть непрерывным. Можно доказать, что ограниченный линейный оператор будет непрерывен, если в линейном топологическом про-

201

странстве, являющимся областью определения оператора, выполнена первая аксиома счётности. Напомним, топологическое пространство называется пространством с первой аксиомой счётности, если каждая его точка обладает счётной определяющей системой окрестностей (последнее означает следующее: каковы бы ни были открытое множество и точка в нём, найдётся окрестность из определяющей системы окрестностей этой точки, которая целиком лежит в данном открытом множестве).

10.2. Дифференцирование по Фреше

Как известно, дифференцирование связано с отысканием наилучшего локального линейного приближения функции. Поэтому в любой сколько-нибудь общей теории дифференцирования приходится опираться на понятие линейного оператора, с помощью которого описывают указанное линейное приближение.

Приведём определение дифференцируемости функции, которая действует в нормированных пространствах. Это определение обобщает понятие дифференцируемости функций в вещественном и комплексном случаях.

Пусть X и Y — линейные нормированные пространства над одним и тем же полем P, где P = R или P = C, а функция f определена в окрестности точки x Е X и принимает значения в Y. Указанная функция f называется дифференцируемой в точке х, если существует такой непрерывный линейный оператор A : X —> Y, что

f (x + h) — f (x) = Ah + o(h) при h ^ 0, (50)

где h Е X, lim ||o(h)||Y/||h||X = 0.

h^ 0

Линейное относительно приращения аргумента h выражение Ah называется (сильным) дифференциалом или дифференциалом Фреше, а сам линейный оператор A называется (сильной) производной или производной в смысле Фреше отображения f в точке х. Указанные дифференциал и производную

202

обозначают через df (x) и f'(x) соответственно: df (x) = Ah, f'(x) = A.

Из (50) следует, что дифференцируемое в точке x отображение f непрерывно в этой точке; для обоснования данного факта существенным оказывается требование непрерывности оператора A в определении дифференцируемости функции. Обратное утверждение, разумеется, неверно: непрерывная функция может не иметь производной, что мы знаем на примере числовых функций.

Нетрудно доказать, что производная f' (x) в точке x (если она существует) определена однозначно.

Пусть отображение f дифференцируемо во всех точках некоторого открытого множества U в X. Тогда, в силу единственности производной, сопоставление каждой точке x Е U производной f1 (x) порождает функцию, определённую на множестве U С X со значениями в множестве непрерывных линейных операторов из X в Y, которое является линейным нормированным (нормой оператора) пространством. Это позволяет, в частности, говорить о непрерывности функции x —> f '(x), а также о непрерывной дифференцируемости отображения f.

Для отображений, действующих в нормированных пространствах, справедлив ряд общих законов дифференцирования. К таким законам относятся:

1. Линейность операции дифференцирования:

(Af + ^g)'(x) = Af'(x)+ цд'(x), A e F, ц e F.

2. Дифференцирование сложной функции:

(g ◦ f )'(x) = g'(f (x)) ◦ f'(x),

то есть производная композиции отображений равна композиции производных.

3. Дифференцирование обратной функции:

(f-‘)'(f (x))) = (f'(*))"\

то есть производная обратного отображения есть линейный

203

оператор, обратный к производной исходного отображения в соответствующей точке.

10.3. Дифференцирование по Гато

Пусть функция f действующая в нормированных пространствах X и Y на полем P = R, определена в некоторой окрестности точки x Е X. Производная функции f в точке x по вектору h Е X обозначается через Dhf (x) и определяется как предел

Dhf (x) = lim f (x + th) - f (x) , (51)

^ ' t-o, teR t • J

если этот предел в Y существует. Величина Dhf (x) Е Y называется также слабым дифференциалом или дифференциалом Гато отображения f в точке x (при приращении аргумента h). Непосредственно проверяется, что

Dof (x) = 0; DXhf (x) = ADhf (x), А Е R.

Однако линейным по h слабый дифференциал Dhf (x), вообще говоря, не будет. Если же указанная линейность имеет место и существует непрерывный линейный оператор L : X —> Y такой, что Dhf (x) = Lh, то этот оператор называется слабой производной или производной Гато и обозначается через fW (x) (здесь индекс w происходит от английского weak — слабый).

В заключение опишем связь между сильной и слабой дифференцируемостью.

Очень просто доказывается следующий факт: если у отображения f существует сильная производная f '(x), то оно имеет и слабую производную f4 (x), причём эти производные совпадают. Действительно, для дифференцируемой функции f при любом допустимом h Е X имеем

lim f (x + th) - f (x) = lim f/(x)(th) + o(th) =

t-m t t-o t

= l--o(f /(x)(h) + = f /(x)h,

так как при h = 0 и o(th) = 0, а при h = 0

204

IX

0.

limioithUr =Um .||h||.

1-0 |t| 1-0 UtkJx '

Обратное утверждение неверно: при наличии слабой производной fW (х) сильная производная может вообще не существовать. Подтверждает сказанное пример функции

f (хъ Х2)

3

ry ‘ J гу>

при (х!; х2) = (0; 0), (52)

0 при (xi; х2) = 0,

определённой на всём пространстве X = R2 и принимающей значения в пространстве Y = R (оба пространства X и Y рассматриваются, естественно, над полем P = R вещественных чисел).

Функция (52) непрерывна всюду на плоскости, включая начало координат. Непрерывность в нуле усматривается, например, из следующих оценок:

х1 + х2 ^ 2у/Х1Х| = 2x1 |х2| при любых (х1; х2) G R2;

lf (xl, х2)| ^ 2х12 Iх2,1 = при х1 х2 = 0;

2х2|х2| 2

f (х1, х2) = 0 при х1 х2 = 0.

У функции (52) слабый дифференциал в точке х = (0; 0) существует и равен нулю.

В самом деле, при любом h = (h1; h2) G R2 и h = 0

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

t t-o t(t4h4 + t2h2) t-o t2h1 + h2

lim f (0+th) -f (0) = lim ^h1h2

t—0 ' A~ “ "

так как

th1h2 ^ thfh2

t2h^ + ^ h2 h2 ,

th1h2 lim-----

th1

1

если h2 = 0,

th1 h.

2

t2frj + h2

= 0, если h2 = 0 (а h1 = 0, t = 0).

0,

Равенство нулю слабого дифференциала в точке х = (0; 0) означает существование и равенство нулю слабой производной в этой же точке, то есть fW(0) = 0.

Предположим теперь, что функция (52) имеет в начале координат сильную производную. Тогда, по доказанному выше,

205

эта производная совпадает со слабой производной и, значит, равна нулю. Последнее означало бы справедливость при h ^ 0 равенства (см. (50))

f (0 + h) — f (0) = Oh + o(h) ^ f (h) = o(h) при h ^ 0, которое неверно, поскольку, например, при h2 = hf

lim -LfM- = lim--------КУ----------=

h-° llhllR2 (h4 + h2) ■ л/h? + h2

= lim ------|hf| = lim ------|hl|S ; = 1 = 0.

hi-° 2h4 Vhi+hf hl^° 2h4 ■ |hf| V1 + h? 2

Можно указать требования к слабой производной, которые обеспечивают существование сильной производной, а именно, доказывается следующее утверждение: если слабая производная f^ отображения f существует в некоторой окрестности точки x и является непрерывной (как операторная функция) в самой точке х, то в точке x сильная производная f'(ж) существует и, как мы знаем, совпадает со слабой производной.

Библиографический список

1. Араманович И.Г., Лунц Г.Л., Эльсгольц Л.Э. Функции комплексного переменного. Операционное исчисление. Теория устойчивости. — М.: Наука, 1968.

2. Бугров Я. С., Никольский С.М. Высшая математика. Элементы линейной алгебры и аналитической геометрии. — М.: Наука, 1980.

3. Зорич В. А. Математический анализ. Часть I. — М.: Наука, 1981.

4. Зорич В. А. Математический анализ. Часть II. — М.: Наука, 1984.

206

5. Колмогоров А.Н., Фомин С. В. Элементы теории функций и функционального анализа. — М.: Наука, 1976.

6. Погорелое А. В. Аналитическая геометрия. — М.: Наука, 1978.

7. Постников М. М. Лекции по геометрии. Семестр I. Аналитическая геометрия. — М.: Наука, 1979.

8. Постников М. М. Лекции по геометрии. Семестр II. Линейная алгебра и дифференциальная геометрия. — М.: Наука, 1979.

9. Привалов И. И. Введение в теорию функций комплексного переменного. — М.: Наука, 1977.

10. Рудин У. Основы математического анализа. — М.: Мир, 1976.

i Надоели баннеры? Вы всегда можете отключить рекламу.