Научная статья на тему 'К проблеме ’’мыслящего” компьютера'

К проблеме ’’мыслящего” компьютера Текст научной статьи по специальности «СМИ (медиа) и массовые коммуникации»

CC BY
54
15
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по СМИ (медиа) и массовым коммуникациям, автор научной работы — Л. А. Шелепин

Обсуждается возможное направление создания компьютеров, способных вырабатывать обобщенные понятия, не содержащиеся в исходной информации. Показано, что адекватным методом анализа проблемы служит теория немарковских процессов.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «К проблеме ’’мыслящего” компьютера»

УДК 530.1+681.3

К ПРОБЛЕМЕ "МЫСЛЯЩЕГО" КОМПЬЮТЕРА

Л. А. Шелепин

Обсуждается возможное направление создания компьютеров, способных вырабатывать обобщенные понятия, не содержащиеся в исходной информации. Показано, что адекватным методом анализа проблемы служит теория немарковских процессов.

1. Введение. В наше время компьютерные технологии стремительно развиваются и входят в повседневную жизнь. Но несмотря на имеющиеся достижения, не удается преодолеть пропасть, разделяющую работу мозга и действие самых совершенных компьютеров. Одна из объективных причин лежит в основах существующей теории. Физика XX века базируется на марковской парадигме (процессах без последствия), в рамках которой информации фактически нет места. Информация возникает в немарковской парадигме (процессах с памятью), которая в принципе может адекватно описывать биологические, экономические и социальные процессы, хотя соответствующая теория только начинает развиваться.

В настоящей работе на основе немарковского подхода рассмотрены структурные свойства информации, а также качественные особенности процессов переработки информации и возникновения новых понятий, не содержащихся в поступающей информации. Последнее служит отличительной особенностью работы мозга. Вначале, с использованием некоторых данных работ [1-3], кратко обсуждается ряд соотношений теории немарковских процессов.

2. Информация и немарковские процессы. В рамках марковской парадигмы - основы современного научного знания - записываются стандартные уравнения классической и квантовой физики. Марковские процессы характеризуются тем, что, зная состояние системы в какой-либо момент времени ¿о> можно в принципе определить вероятностную картину поведения системы в будущем, причем эта картина не изменяется от дополнительных сведений о событиях при £ < В случае дискретного марковского

процесса (цепи Маркова) вероятность РП+1(Л,) осуществиться событию Л,- в (7г + 1)-м испытании зависит только от события в п-м испытании и не зависит от предыдущих. При этом для последовательных значений некоторой величины ип, г<п+х можно записать

Ип+1 = Д«п)- (1)

Вероятности изменений при переходе от одного результата испытания Л, к другому результату испытания А3 задаются матрицей перехода р =|| р^ ||, где > 0, YliPiJ = 1-Дискретные матрицы перехода удовлетворяют условию марковости рп = РтРп~т, а непрерывные - условию

= (2)

Марковские процессы не зависят от предыстории, от нашего знания о прошлом. Они описывают бесструктурные (точечные) частицы и их движение. Все определяется начальными условиями. В таких условиях, когда знания о прошлом ничего не дают и не могут оказать влияния на будущее, понятия информации не возникает. В рамках марковской парадигмы оно попросту не имеет смысла.

Последовательное построение теории информации, включая ее структурные свойства и динамику, оказывается возможным в рамках немарковского подхода. Для немарковских процессов характерна зависимость от предыстории

Мп+1 = /(«п, «п-1, ип-2, •••)• (3)

Здесь величина и зависит не только от предыдущего состояния, как в (1), но и от событий при I < ¿о- Зависимость от предыстории, память о прошлом играет существенную роль в биологических, экономических, социальных процессах, и их нужно рассматривать в рамках немарковского подхода. Сигналы из прошлого могут идти разными путями с разной скоростью. Получая и преобразуя эти сигналы, можно изменять спонтанный ход событий, что символически отображается оператором (5 [4]

(Я)—(4)

у ' IV '

Если при спонтанном ходе событий система с вероятностью и> переходит от исходной ситуации Я в ситуацию то оператор Ц (механизм, получающий и преобразующий

информацию) приводит к возрастанию вероятности достижения Z до значения ИЛ Информационные процессы возникают в рамках немарковского подхода и являются его составной частью.

Описание немарковских процессов качественно отличается от марковских. Из уело вия марковости процесса для переходных вероятностей (2) следуют уравнения для динамики вероятностей Р(¿) нахождения системы в некотором состоянии,

с/Р(*)М = (5)

где Л(£) - некоторый оператор. Характерно, что в правой части стоит единое время и решение зависит лишь от начальных условий. Для немарковскнх процессов, где необходимо учитывать зависимость от прошлого, аналог уравнения (5) можно записать в форме

¿Р/сН = У Л(т)Р(г - т)с?т. (6)

Т.е. процессы с памятью в принципе должны описываться интегродифференциальнымп уравнениями, в правой части которых стоит свертка. В общем случае уравнения типа (6) нелинейны. Решения подобных уравнений нелокальны во времени, т.е., образно говоря, немарковская система живет в прошлом, настоящем и будущем.

Переходя в уравнении (6) к дискретному описанию, непосредственно получаем конечно-разностное немарковское уравнение типа (3)

Р1 = Г(Рг.1,Р1.2,...Р1.п,г). (7)

Наиболее простое уравнение этого типа, сохраняющее немарковские свойства, имеет вид

Р, = а1Р<_1 + а2Рг_ 2 +/(*). (8)

В работе [3] показано, что на решениях этого уравнения основывается ряд моделей экономической теории Кейнса и, прежде всего, моделей, связанных с поведением людей.

3. Структурные свойства. В отличие от теории марковских процессов, играющей определяющую роль в физике и описывающей движение точечных частиц, теория немарковских процессов имеет дело с изменением и преобразованием структур. Последние характеризуются значениями негэнтропии 5, являющейся мерой их сложности, подобно

тому как в марковских процессах энергия Е служит мерой движения. Равновесное распределение по энергии для определенного набора N объектов, например, числа частиц, задается в физике соотношением

N = N0exp(-E/T), (9)

где Т - температура (в единицах энергии), характеризующая состоянием системы. Равновесные распределения в теории немарковских процессов по форме аналогичны боль и мановскому (9)

= Яоехр(-5'/0). (10)

Аналог температуры 0 характеризует систему в целом и соответствует некоторому показателю сложности для отдельного объекта. Зависимость негэнтропии 5" от параметра т, играющего роль статистического веса, может быть представлена в виде ¿■(т) = к 1п т. Тогда равновесное распределение (10) может быть представлено в гиперболической форме

N = Атп~а, Л,а> 0. (11)

Гиперболические равновесные распределения были эмпирически установлены для большой совокупности явлений в биологии, экономике, социальной сфере [5]. Типичные примеры - распределение семей по доходам, ученых по числу написанных ими статей, биологических видов по числу особей. Равновесные немарковские распределения характерны для биоценозов [5, 6]. Существенно, что анализ информационных процессов, являющихся составной частью немарковского подхода, может опираться на соответствующий математический формализм. Уже давно обращалось внимание на сходство выражения для количества информации /,-, определяемого через частоту (вероятность Рг) появления того или иного символа г в сообщении,

/,• = -к\оёаРг (12)

с аналогичным по форме выражением для негэнтропии 5. Бриллюэн [8] ввел негэнтро-пийный принцип информации

А(5 + /)<0. (13)

Сумма негэнтропии 5' и информации I будет оставаться неизменной при обратимом преобразовании, в противном случае она будет убывать. Применяя негэнтропийный принцип к процессам измерения в физике, Бриллюэн дал детальный анализ известного парадокса демона Максвелла, который не основе имеющейся у него информации мог сортировать молекулы таким образом, что тепло переходило от более холодного газа к более горячему. Как показали непосредственные расчеты, действия демона, как преобразователя информации в негэнтропию, подчиняются негэнтропийному принципу. Вместе с тем, этот принцип подвергался жесткой критике [8], связанной с тем, что отождествлялись объекты различной природы: частота появления символов в (1) и физические структуры. Принципиальный момент здесь заключается в том, что принцип (13) должен применяться для однотипных структур (например, структура механического устройства и информация именно об этой структуре, а не вероятность появления в соответствующем сообщении тех или иных символов). Поэтому с точки зрения немарковского подхода в качестве определения информации может служить соотношение

Из (14) следует, что информация / дает возможность перехода от одного уровня негэнтропии (структуры 5*1) к другому уровню негэнтропии (структуре 52). Наглядный пример: уровень - набор деревянных деталей и крепежных изделий для шкафа, 5'г готовый шкаф, / - набор правил для построения шкафа из деталей. В рамках определе ния (14) равновесные распределения (10) - (11) могут быть использованы для анализа информационных массивов. Ряд из них, например, наборы документации по изготовлению тех или иных изделий, по аналогии с биоценозами называют информценозами

Для конкретного изучения информационных процессов существенен учет особенностей немарковского подхода. К ним относится эффект концентрации - резкая асимметрия равновесных распределений (11). Например, в распределении ученых по числу написанных ими статей: 10% авторов пишут половину статей. Т.е. сравнительно малое число ученых несет основную информационную нагрузку, а большая часть малопродуктивна. И в общем случае разные части распределений существенно различны по своим свойствам. С одной стороны, достаточно эффективным для системы в целом оказывается регулирование той ее части, которая соответствует большим значениям 5 (в экономике - сложных производств), с другой, не следует подвергать чрезмерной

(14)

[9].

регламентации основную массу объектов с малым 5\ Например, с увеличением детализации информационной документации (инструкций, предписаний, проектов) происходит быстрый количественный рост информационного массива при весьма незначительном приросте структурной информации.

Весьма существенен также учет иерархической структуры информации. Например, она может быть использована в информационном воздействии. Среди понятий имеются высшие по иерархии (с большим ,5'). Поэтому успех воздействия средств массовой информации обусловлен правильным выбором таких понятий и концентрацией усилий именно на них. Эффективность восприятия материала также в значительной степени определяется иерархически - структурированной подачей материала (включая заголовки, резюме, немонотонность изложения).

Стохастические процессы формирования равновесных распределений тесно связаны с наличием положительной обратной связи [2]. Именно на основе ветвящихся процессов, возникновения нелинейных вероятностей и становится возможным установление равновесия в немарковских системах, с формированием в распределениях высоких значений 5\

Все это - неотъемлемая часть информационных процессов.

4. Преобразования информационных структур. Качественное отличие мышления от работы компьютеров заключается в том, что в основе его функционирования лежит стохастический немарковский процесс, а не заданный алгоритм. Поэтому для анализа возможностей создания компьютеров нового типа необходимо проведение детальных исследований немарковских процессов. Отметим некоторые исходные направления.

Первое направление связано с изучением динамических свойств информационных процессов для немарковских систем. На основе большого эмпирического материала было показано, что гиперболические равновесные распределения распространяются на многие виды человеческой деятельности [6, 10]. В естественных информационных системах равновесие по £ устанавливается за счет стохастических процессов. Возникают переходы на более высокие негэнтропийные уровни, информация структуризируется, создаются новые общие понятия. Примером здесь служит поризм, характерный для работы мозга [4], когда утверждения, полученные из решения частной задачи, оказываются применимыми к целой совокупности явлений, казалось бы не относящихся к ней первоначально. В этом плане любая немарковская модель должна включать в себя процесс структурирования информации с переходами на более высокий уровень

по Б. К динамическим особенностям немарковских систем относится также наличие структурных ритмов и циклов, например, биологических ритмов, периодических колебаний общественного мнения, колебаний биржевых курсов. Для их анализа могут быть использованы динамические немарковские уравнения типа (6) - (8).

Второе направление связано с изучением специфики структур информационных массивов. Как известно, живая ткань организмов обладает высокой степенью специфичности. При пересадке тканей одна из основных проблем - несовместимость структур. Для информационных структур ситуация во многом аналогична. Между тем, длительное время господствовало убеждение, что свойства любой информации примерно одинаковы. Это нашло свое отражение в концепции универсальности научно-технической информации (НТИ). Фактически информация считалась бесструктурной и ее можно было группировать независимо от ее сути. Неучет специфики информационных структур управления и их организация по структуре НТИ обусловил ряд негативных явлений при внедрении информационных систем [10]. В глобальном плане можно выделить три типа информационных структур, в соответствии с нелокальностью времени в немарковских процессах. Одна из них, связанная с прошлым, - информация о внешнем мире ("картина мира" в мозгу [11]), другая - внутрисистемная (управленческая) информация, регулирующая процессы в настоящем, и третья - прогностическая (плановая), направленная в будущее. Для построения информационных структур разного типа необходима предварительная обработка поступающей информации с разбиением ее на некоторые структурные единицы. Примерами подобных единиц служат в случае биоло гической информации - основания ДНК, аминокислоты, составляющие белок, особи в популяции, в случае социальной информации - слова в литературных текстах, статьи по определенной тематике в журналах. Должен существовать и механизм формирования определенных единиц в мозгу, куда поступает непрерывный поток информации. Его можно уподобить своего рода процессу "разрезания файлов", имеющему определенную функциональную аналогию с пищеварением, в результате которого происходит разделение белков, жиров и углеводов на составные части, поступающие в организм и служащие не только источником энергии, но и строительными блоками, несущими с собой негэнтропию. В этом плане тезис Шредингера о том, что организм "питается" негэнтропией, относится и к работе мозга. Практическая оптимизация структур информационных массивов связана с дальнейшим развитием немарковского подхода.

Третье направление связано с анализом немарковской системы как целого. Процессы с пямятью включают информацию из прошлого. Т.е. немарковские структуры носяч

смешанный характер, они содержат и материальную, и иноформационную составляющие. Так, в понятие экономики как системы должны входить и процессы управления. В отличие от марковских структур, немарковская система - саморегулирующаяся. Она включает совокупность обратных связей: отрицательные обеспечивают устойчивость, положительные - переход в равновесные состояния типа (10). С ростом сложности немарковской системы возрастает и степень регулирования. При конкретном моделировании таких систем возможен эмпирический подход с организацией немарковской зависимости результата от совокупности сигналов на входе, идущих не только из настоящего, но и из прошлого, как в (3), а также соответствующего стохастического процесса. Кроме того, при моделировании необходимо учитывать аналогии с работой мозга, включая формирование исходных сигналов, иерархию их обработки, изучение конкретных проявлений немарковости. Например, в [11, 12] отмечалась область в таламусе обезьян, нейроны которой, не отвечая на впервые появившийся зрительный объект, возбуждались при вторичном его показе.

Отмеченные выше особенности немарковских процессов еще не дают возможностей непосредственного построения моделей немарковских компьютеров, но, вытекая из пер вых принципов, в том или ином виде они должны проявляться в любой адекватной модели.

В заключение выражаю признательность Б. Д. Лазебнику за обсуждение и РФФИ (грант 97-06-80045) за поддержку.

ЛИТЕРАТУРА

[1] Л а з е б н и к Б. Д., Ш е л е и и н Л. А. Краткие сообщения по физике ФИАН, N 9 - 10, 35 (1997).

[2] X а р и т о н о в А. С., Ш е л е п и н Л. А. Краткие сообщения по физике ФИАН, N 1 - 2, 40 (1998).

[3] Б а к ш е е в а О. Л., Ш е л е и и н Л. А. Краткие сообщения по физике ФИАН, N 1 - 2, 49 (1998).

[4] К о р о г о д и н В. И. Информация и феномен жизни. Пущино, 1991.

[5] П е т р о в В.М.,Яблонский А. И. Математика и социальные процессы. М., Знание, 1980.

[6] Б ы с т р о в а Т. В., Шелепин Л. А. Труды ФИАН, 218, 60 (1994).

[7] Б р и л л ю э н Л. Наука и теория информации. М., Физматгиз, 1960.

[8] К у д р и н Б. И. Введение в технетику. Томск, Изд. ТГУ, 1993.

[9] Z i р f G. К. Human Behavior and the Principle of Least Effort. Cambrige: Addison-Wesley, 1949.

[10] J1 а з e б н и к Б. Д. Научно-техническая информация, N 6, 1 (1993).

[11] Глезер В. Д. Зрение и мышление. J1., Наука, 1985.

[12] Rolls Е., Р е г г е t D. I., С a a n A. W., and W i 1 s о n F. A. W. Brain, 105, N 3, 611.

Поступила в редакцию 20 февраля 199S г.

i Надоели баннеры? Вы всегда можете отключить рекламу.