Научная статья на тему 'Рецензия на книгу И. В. Прангишвили, Ф. Ф. Пащенко и Б. П. Бусыгина «Системные законы и закономерности в электродинамике, природе и обществе»'

Рецензия на книгу И. В. Прангишвили, Ф. Ф. Пащенко и Б. П. Бусыгина «Системные законы и закономерности в электродинамике, природе и обществе» Текст научной статьи по специальности «Математика»

CC BY
277
48
i Надоели баннеры? Вы всегда можете отключить рекламу.
Область наук
i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Рецензия на книгу И. В. Прангишвили, Ф. Ф. Пащенко и Б. П. Бусыгина «Системные законы и закономерности в электродинамике, природе и обществе»»

РЕЦЕНЗИИ

РЕЦЕНЗИЯ НА КНИГУ И. В. ПРАНГИШВИЛИ, Ф. Ф. ПАЩЕНКО И Б. П. БУСЫГИНА «СИСТЕМНЫЕ ЗАКОНЫ И ЗАКОНОМЕРНОСТИ В ЭЛЕКТРОДИНАМИКЕ, ПРИРОДЕ И ОБЩЕСТВЕ»

Проанализировать полностью в небольшой работе содержание книги, очевидно, не представляется возможным, поскольку более полутысячи страниц ее посвящены вопросам, которые находятся в «интервале», определяемом такими терминами, как «минеральная вода “Боржоми”» (с одной «стороны») и «производная Радона-Никодима» (с другой «стороны»), с одновременным упоминанием статистического анализа «творчества великих и талантливых» людей, к которым среди многих отнесены В. И. Ульянов-Ленин (именно так!), И. В. Сталин, а также такие таинственные персонажи, как «Наполеон-Бонапарт» „.1

Однако можно предположить, что общим, «книгообразующим» элементом этого труда является понятие «корреляции», которое, особенно в главах 3 и 7, возводится в своего рода абсолют: вводятся новые определения и положения, связанные с понятием «корреляция», и делаются попытки его обобщения.

При всем (относительном) разнообразии описания понятия «корреляция» в различных толковых словарях, общим элементом таких толкований является понятие «связь». В начале книги можно предположить, что слово «корреляция» употребляется авторами исключительно как синоним слова «связь», когда, например, мы читаем: «Некоторые мысли в книге мы повторяем несколько раз, но в разных главах они приобретают разное значение, отличаются своим звучанием и контекстом, несут новые нюансы. Вместе с тем между ними существует корреляция, иногда очень сильная, иногда слабая, еле заметная читателю. Например, мы не всегда точно обосновываем перенос знаний из естественных наук в общественные и социальные сферы»2. Не обсуждая здесь различие между «общественными» и «социальными» сферами, необходимо отметить, что буквально в следующем абзаце возникают удивительные термины «корреляционная закономерность» и «корреляционный эффект»:

«Корреляционные закономерности имеют достаточно всеобщий характер. Многие законы в природе (законы гравитации, взаимодействие

1 Прангишвили И. В., Пащенко Ф. Ф., Бусыгин Б. П. Системные законы и закономерности в электродинамике, природе и обществе. М.: Наука, 2001. 335 с.

2 Там же. С. 4.

электрических зарядов, термодинамические закономерности и др.) по форме удивительно совпадают с рассмотренной в данной книге обобщенной корреляцией. По всей видимости, наиболее сильные закономерности в различных средах подчинены этому корреляционному эффекту. Аналогично более слабые закономерности или взаимодействия более высоких порядков малости подчиняются или близки по форме корреляционным эффектам более высокого порядка»3.

Для того чтобы понять тавтологичность процитированного абзаца, достаточно обратиться (с учетом имеющихся толкований термина «корреляция») к толкованию термина «закономерность». В соответствующей литературе имеется лишь толкование частного понятия - «общественная закономерность»: «Закономерность общественная - повторяющаяся, существенная связь явлений общественной жизни или этапов исторического процесса. Закономерность общественная присуща деятельности людей, а не есть нечто внешнее по отношению к ней. Действие закономерности общественной проявляется в виде тенденций, определяющих основную линию развития общества»4. Однако, пользуясь таким толкованием, нетрудно построить соответствующее толкование понятия «системная закономерность»: Закономерность системная - повторяющаяся, существенная связь явлений жизни (развития во времени) системы. Закономерность системная присуща самой системе, а не есть нечто внешнее по отношению к ней. Действие закономерности системной проявляется в виде тенденций, определяющих основную линию развития системы.

Следовательно, понятие «корреляционная закономерность» идентично понятию «связанной связи», хотя было бы крайне интересно обнаружить пример «некорреляционной» закономерности, опровергающий следующее утверждение 1.

Любую закономерность можно количественно охарактеризовать с помощью максимального коэффициента корреляции, то есть любая закономерность является корреляционной.

Учитывая шенноновское определение взаимной информации, можно также сформулировать утверждение 2.

3 Там же. С. 4.

4 (http://ogegov.academic.ru/misc/enc3p.nsf/ByID/ МТ000^Е72)

Любую закономерность можно количественно охарактеризовать с помощью взаимной информации, то есть любая закономерность является информационной.

Принимая во внимание связь между шенноновской информацией и энтропией, утверждение 2 можно сформулировать в терминах энтропии, то есть всякая закономерность является энтропийной.

Авторы книги отмечают удивительное, по их мнению, совпадение многих законов «в природе (законы гравитации, взаимодействие электрических зарядов, термодинамические закономерности и др.) с рассмотренной в данной книге обобщенной корреляцией»1. В качестве «обоснования» этого положения изложена методология, которая «рассматривает систему вместе с окружающей средой. При этом знания о системе, входных - X, и выходных - У сигналах можно представить в виде

К = Ф(А(£), В(У ),С(Х)),

где Ф - отображение, преобразующее знания пред-фильтров А, В, С в общие знания о системе и ее взаимодействии с окружающей средой.

Обобщенная корреляция между входными и выходными сигналами, наведенная системой, имеет вид

' Эу (В(УЩПх (Х(«>)

В зависимости от вида исследуемой системы оператор Ф может быть оператором скалярного произведения, безусловного или условного математического ожидания и т. д. Оператор Б() может представлять собой оператор вычисления дисперсии случайного процесса, оператор вычисления расстояния между элементами системы или меж-2

ду системами и т. д.» .

Другими словами, под выражением (1) можно подразумевать все, что угодно, хотя в общепринятой трактовке под количественным выражением понятия «корреляция» подразумевается, по крайней мере, некоторая нормированная величина. В контексте книги совершенно не ясно, в чем преимущество выражения (1) по сравнению, например, с выражением F(У(t), Х(в)), где преобразование F(•> может определяться в соответствии с любыми потребностями «исследователя» в области интерпретации тех или иных процессов (объектов, понятий, явлений и т. п.)3. Таким образом, в книге, во-первых, перепутаны причинно-следственные связи (закон природы вытекает как частный случай абстрактного математического выражения(?!)), во-вторых,

1 Прангишвили И. В., Пащенко Ф. Ф., Бусыгин Б. П. Указ. соч. С. 4.

2 Там же. С 511.

3 Чернышев К. Р. Эссе о некоторых заблуждениях в идентификации систем // II Междунар. конф. «Идентификация систем и задачи управления» SICPRO '03. Москва, 29-31 января 2003 г.: Тр. / Ин-т проблем управления им. В. А. Трапезникова РАН. М., 2003. С. 2660-2698.

произведена подмена действительного обобщения общепринятых конкретных математических выражений введением лишь новых обозначений. Последнее можно проиллюстрировать так: студента попросили написать формулу Эйнштейна. Он написал: «Е = та2 ». Ему сказали: «Неверно!». Тогда он написал: «Е = тЬ2». Опять неверно! И, наконец, студент написал: «Е = та2».

С точки зрения теории управления, наибольший интерес представляет глава 7 «Определение и моделирование закономерностей по экспериментальным данным», тем более что уровень научных результатов, представленных в ней, целым рядом видных ученых, чей авторитет говорит сам за себя (В. Н. Афанасьев, С. Д. Земляков, В. Ю. Рутков-ский, И. Б. Ядыкин и др.), отмечен как высокий, однако многие из таких результатов имеют, по-существу, статус научных гипотез, требующих всестороннего рассмотрения и анализа. С другой стороны, справедливость и научная ценность многих из представленных в книге результатов (зачастую никак не обосновываемых) не могут не вызывать серьезных сомнений и требуют специального анализа, который и предпринят в настоящей рецензии. Главное внимание уделено вопросам применения в задачах идентификации состоятельных, по терминологии А. Н. Колмогорова, мер зависимости случайных величин (процессов), то есть таких мер, которые обращаются в нуль тогда и только тогда, когда данные случайные величины (процессы) стохастически независимы. Важность такого анализа обусловлена тем, что решение задачи идентификации систем всегда основано на применении тех или иных мер зависимости случайных величин (процессов), идет ли речь о представлении моделей исследуемых систем с помощью входо-выходного отображения, или в пространстве состояний. Наиболее часто в качестве такой меры выступают традиционные линейные ковариационные или корреляционные характеристики зависимости, использование которых непосредственно вытекает из самой постановки задачи идентификации на основе среднеквадратического критерия. Их основным достоинством является удобство использования, включая как возможность построения явных аналитических выражений для определения искомых характеристик, так и относительную простоту построения их оценок, в том числе и на основе наблюдения зависимых данных. Однако главным недостатком мер зависимости, основанных на линейной корреляции, является, как известно, возможность их обращения в нуль даже в случае существования детерминированной зависимости между парой исследуемых переменных. С другой стороны, применение состоятельных мер зависимости имеет свои ограничения и особенности, не допускающие пренебрежение ими.

Нами рассматриваются именно те положения книги, которые связаны с использованием таких

нелинейных мер зависимости, как максимальная корреляция и шенноновская взаимная информация: «состоятельный» метод наименьших квадратов, «обобщение» методов статистической линеаризации, применение теоретико-информационных критериев, «обобщение» классического (как дивергенции Кульбака-Лайблера) понятия энтропии и некоторые другие.

Так, авторами рассмотрена задача идентификации стохастических объектов на основе критерия величины взаимной информации выхода объекта и выхода модели. Такой подход неконструктивен, поскольку в него изначально закладываются либо необходимость знания совместной плотности распределения выхода объекта и выхода модели, либо возможность наблюдения этих выходов. Но последний вариант является заведомо невыполнимым, поскольку задача идентификации как раз и состоит в построении модели и, естественно, ее выход наблюдаться не может. (Имеется в виду, конечно, выход модели, оптимальный в смысле заданного критерия. «Просто» выход модели, безусловно, может наблюдаться, поскольку в качестве выхода модели может (формально) быть принят результат любого априори выбранного преобразования входа.) Первый вариант также неприемлем, поскольку предполагает наличие такого объема априорной информации, при котором собственно задача идентификации уже теряет свой изначальный смысл. С содержательной точки зрения, предположение о нормальности совместного распределения выходов объекта и модели, сделанное в книге, эквивалентно тому, что, например, заявив некий новый метод обращения матриц, для его применения сделать предположение о том, что обращаемая матрица является диагональной1. Необходимо отметить среди прочего «странность» моделей, рассматриваемых авторами, а именно - включение в них ненаблюдаемого шума, что исключает возможность вычислений значений выходной переменной модели на основе наблюдения входных переменных при тех или иных значениях коэффициентов. Кроме того, в работе введен целый ряд определений (динамическая энтропия, обобщенная динамическая энтропия, общая энтропия, максимальная энтропия). При этом отмечается, что максимальная энтропия не превосходит обобщенную динамическую и общую энтропии и что приводимые результаты (в том числе и проанализированные выше) справедливы и для обобщенной энтропии. Но простые при-меры2 показывают, что введенные авторами динамическая и соответственно максимальная энтропии обращаются в бесконечность, и, следовательно, такой «обобщенный» информационно-энтропийный подход ошибочен. Легко показать, что и в

1 Чернышев К. Р. Эссе о некоторых заблуждениях в идентификации систем; Чернышев К. Р. Об одной статье по идентификации стохастических объектов // АиТ. 2002. № 4. С. 184-185.

общем случае максимальная энтропия не существует. Действительно, согласно книге3:

динамическая энтропия

H ф {Y} = -jjp(B(y)) )log {lYp(B(y)) )dy, (2)

максимальная энтропия

H Фтах^} = max H Ф^}. (3)

B

В выражении (2) lY «обусловливает начало отсчета по шкале энтропий»4; B - некоторое нелинейное преобразование; p(y) - плотность случайной величины Y. «Элементы {By} образуют множество всех состояний {BY}, которое получается в результате действия произвольных преобразований B на исходную случайную величину Y»5. Если так, то сузим область поиска максимума в уравнении (3) до преобразований вида BY = aY, ae R. Тогда на основании формул (2), (3)

Нф тах {Y} = тах Нф {Y} >

B

“ таХ(p(ay))log(lYP(ay))dy

Quod erat demonstrandum.

Кроме того, авторы рассматривают одно «обобщение» метода статистической линеаризации. Кавычки в данном случае использованы постольку, поскольку задача собственно линеаризации не решается, а заменяется аппроксимацией исходного объекта некоторой нелинейной моделью из заданного класса. Модели такого класса названы в книге полулинейными. Исходя из этого и сам метод естественнее было бы называть «статистическая полу-линеаризация» Здесь необходимо отметить, что определение компонент модели носит сугубо декларативный характер и не вытекает собственно из представленных критериев «линеаризации» (первый критерий - совпадение математических ожиданий выхода объекта и выхода модели и совпадение функциональных автокорреляционных функций выхода объекта и выхода модели; второй критерий - минимум среднеквадратической ошибки). Следует отметить неопределенность формулировки первого критерия линеаризации (поскольку не указаны условия выбора собственно функциональных преобразований). Доказательства соответствующих утверждений отсутствуют.

Авторами также приводятся теоремы, определяющие идентифицируемость исследуемого нелинейного объекта по имеющимся данным. При этом рассматривается случай, «когда объем знаний о выбо-

2 Чернышев К. Р. Эссе о некоторых заблуждениях в идентификации систем.

3 Прангишвили И. В., Пащенко Ф. Ф., Бусыгин Б. П. Указ. соч. С. 511.

4 Там же.

5 Там же.

рочных значениях входного сигнала существенно превышал объем знаний о выборочных значениях выходного сигнала», а под идентифицируемостью понимается положительность максимальной корреляционной функции выхода и входа объекта. Однако, как известно, задача оценивания максимальной корреляции по выборочным данным является весьма сложной даже в условиях «достаточной полноты наблюдений», но возможность определения максимальной корреляции в условиях, «когда объем знаний о выборочных значениях входного сигнала существенно превышал объем знаний о выборочных значениях выходного сигнала», не представлена. Изложен также подход к идентификации стохастических систем на основе «“сложного” статистического критерия». Под «’’сложным” статистическим критерием» в книге подразумевается выражение вида

'т = тЕ +Х ^Ке (Т1) ^ ех^, ^ ^2 Ф 0,

1-1 1-1

где тЕ и Ке(т), т = t-в - соответственно математическое ожидание и обычная автокорреляционная функция «обобщенной» ошибки идентификации Е= Ву(Ь) - АСх(Ь). В то же время не конкретизируется сам смысл поиска экстремума функционала J: минимума (инфимума) или максимума (супремума). Здесь В, С - некоторые нелинейные преобразования соответственно выходного у(^ и входного х(в) случайных процессов исследуемой системы, А - линейный динамический оператор. При этом делается предположение о так называемой ф-стационарной связанности у(^ и х(в), то есть о существовании такой пары преобразований В, С, что пара случайные процессы г(1) = Ву(Ь) и и(£) = Сх(в) стационарно связаны в широком смысле, хотя существование подобных преобразований В и С в книге не обосновано и не продемонстрировано1. В рамках такой постановки преобразования В, С либо «назначаются» (безотносительно критерия J), исходя из условия нетождественности нулю Ке (т) на интервале наблюдения (хотя Ке (т) всегда отлична от нуля, по крайней мере, при т = 0, за исключением, естественно, вырожденного случая), либо выбираются из условия

ооу(Ву(£), Сх(в))

(B, C) = arg sup

{B},{C} ^/D{By(t)}D{Cx(S)}

где ооу - символ ковариации, Б - символ дисперсии. В обоих случаях выбор В, С носит сугубо декларативный характер, никак не связанный с критерием J. При заданных В, С оператор А определяется на основе соответствующего стандартного

1 Прангишвили И. В., Пащенко Ф. Ф., Бусыгин Б. П. Указ. соч. С. 433-439. Введен целый набор «уникальных» определений 7.2.24-7.2.45, сводимых к следующему. Пусть для некоторого случайного процесса (функции) имеет место свойство «А». Случайный процесс (функция) X(t) обладает свойством ф-«А», если существует такое преобразование C, что случайный процесс (функция) CX(t) обладает свойством «А».

линейного уравнения. Таким образом, авторский подход в части определения линейного оператора повторяет известные результаты линейной корреляционной теории, а в части использования ф-ста-ционарной связанности случайных процессов у(^ и х(в) является необоснованным.

В рамках энтропийного подхода к описанию процессов познания в работе констатируется, «что энтропия замкнутых и некоторых других систем со временем возрастает и, в конечном счете, может перекрыть всю область возможных состояний и движений системы». При этом там же отмечается, что в определении энтропии в неэнтропийном принципе в статистической физике и теории информации «никак не учитываются ни скорость изменения состояния, ни ускорение движения, ни скорость обмена информацией и энтропией между элементами системы и внешней средой и многое другое, что могло бы объяснить нам скорость распространения и возрастания неопределенности, избыточность информации и многое другое» 2. На основе формализма Бриллюэ-на3 предложена концепция разрешения «парадокса неэнтропийного принципа», согласно которой «исследователь стремится построить мысленный, математический или физический фильтр, с помощью которого он хочет извлечь максимум информации об исследуемой системе, содержащейся в экспериментальных данных и/или теоретических знаниях о системе». Такая концепция основана на максимизации «обобщенной» энтропии (по Больцману). Она, по мысли авторов, призвана отражать стремление исследователя «извлечь максимум информации об исследуемой системе, содержащейся в экспериментальных данных и/или теоретических знаниях о системе», но максимизация энтропии как раз наоборот отражает увеличение степени неопределенности, то есть минимизацию количества информации, а не извлечение ее максимума. Поэтому такая концепция противоречит здравому смыслу как с формально-теоретической, так и с содержательной точек зрения4.

И так далее, и тому подобное. Таким образом, все вышеизложенное позволяет с уверенностью утверждать, что результаты книги представляют собой заблуждение и не имеют содержательного научного смысла.

К. Р. Чернышев

2 Там же. С. 455.

3 Бриллюэн Л. Наука и теория информации. М.: Физ-матлит, 1960. С. 392; Бриллюэн Л. Научная неопределенность и информация. М.: Мир, 1966. С. 272.

4 Чернышев К. Р. Эссе о некоторых заблуждениях в идентификации систем С. 2660-2698.

i Надоели баннеры? Вы всегда можете отключить рекламу.