Научная статья на тему 'Когнитивистские аспекты искусственного интеллекта'

Когнитивистские аспекты искусственного интеллекта Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
65
24
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
искусственный интеллект / нейронные сети / гибридные сети / экстраполяция / аппроксимация / адаптивное прогнозирование / Artificial Intelligence / Neural Networks / Hybrid Networks / Extrapolation / Approximation / Adaptive Forecast

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — В.Н. Толстых

Рассматриваются когнитивистские аспекты развития искусственного интеллекта, как его нынешнее состояние, так и перспективы на будущее. Указывается, что в настоящее время развитие искусственного интеллекта сосредоточено в большей степени на распознавании образов, в то время как естественный интеллект, существующий в конкурентной среде, обладает эволюционной способностью к прогнозированию и оперативному реагированию на объекты и события. Выдвигается тезис о возможности создания гибридных сетей, обладающих свойствами аппроксимации, кратковременного и долговременного прогноза, подобно носителям естественного интеллекта. В качестве основы для этого указываются методы искусственных нейронных сетей, группового учёта аргументов и математической регрессии многопараметрических семейств алгебраических функций. Обсуждается вопрос об адаптивном прогнозе, которым обладают все живые существа. А также о возможностях его реализации в технологии искусственного интеллекта.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

The Cognitivist Aspects of Artificial Intelligence

The cognitivist aspects of artificial intelligence, present and prospect its states, are considered. It’s pointed out that at present the development of artificial intelligence is focused on pattern recognition, while natural intelligence existing in a competitive environment has an ability to recognize and predict situations in dynamics or events series, given by the long evolution. It’s based on the artificial neural networks methods, as well as the group data handling method and mathematical regression analysis using multiple parameter families of algebraic functions. It allows to create hybrid networks with the approximation properties for a short-term and long-term forecast, which are valuable parts of the natural intelligence. The question of adaptive forecasting, possessed for all living beings, as well as ways to implement it in artificial intelligence technology, is discussed.

Текст научной работы на тему «Когнитивистские аспекты искусственного интеллекта»

ТОЧКА ЗРЕНИЯ

Когнитивистские аспекты искусственного интеллекта

В.Н. Толстых

Рассматриваются когнитивистские аспекты развития искусственного интеллекта, как его нынешнее состояние, так и перспективы на будущее. Указывается, что в настоящее время развитие искусственного интеллекта сосредоточено в большей степени на распознавании образов, в то время как естественный интеллект, существующий в конкурентной среде, обладает эволюционной способностью к прогнозированию и оперативному реагированию на объекты и события. Выдвигается тезис о возможности создания гибридных сетей, обладающих свойствами аппроксимации, кратковременного и долговременного прогноза, подобно носителям естественного интеллекта. В качестве основы для этого указываются методы искусственных нейронных сетей, группового учёта аргументов и математической регрессии многопараметрических семейств алгебраических функций. Обсуждается вопрос об адаптивном прогнозе, которым обладают все живые существа. А также о возможностях его реализации в технологии искусственного интеллекта.

Ключевые слова, искусственный интеллект, нейронные сети, гибридные сети, экстраполяция, аппроксимация, адаптивное прогнозирование

The Cognitivist Aspects of Artificial Intelligence

Victor N. Tolstykh

The cognitivist aspects of artificial intelligence, present and prospect its states, are considered. It's pointed

172

out that at present the development of artificial intelligence is focused on pattern recognition, while natural intelligence existing in a competitive environment has an ability to recognize and predict situations in dynamics or events series, given by the long evolution. It's based on the artificial neural networks methods, as well as the group data handling method and mathematical regression analysis using multiple parameter families of algebraic functions. It allows to create hybrid networks with the approximation properties for a short-term and long-term forecast, which are valuable parts of the natural intelligence. The question of adaptive forecasting, possessed for all living beings, as well as ways to implement it in artificial intelligence technology, is discussed.

Keywords: Artificial Intelligence; Neural Networks; Hybrid Networks; Extrapolation; Approximation; Adaptive Forecast

Введение

Прогнозирование - это одна из составных частей естественного интеллекта, свойственного всему живому. Что бы мы ни делали, всегда исходим из прогноза о том, что может произойти с нами, с нашими близкими и с окружающим миром в ближайшем, а то и в отдалённом будущем. Это - прогноз, которым мы постоянно пользуемся, и о котором мы, живя будничной жизнью, не очень-то задумываемся. Если прогноз не сбывается, то лишь потому, что-либо мы не всё знаем, либо приняли упреждающие действия для изменения прогноза в более благоприятную для нас сторону. Будущее зависит и от нас тоже.

Другой важнейшей частью естественного интеллекта является распознавание образов. Распознавание вместе с прогнозированием - это важнейшие части естественного интеллекта. И это то, что необходимо качественно моделировать при создании интеллекта искусственного: способность распознавать и прогнозиро-

173

вать. Дополняет эти части действие. Если не вдаваться в детали, то эти три части составляют основу интеллекта, как естественного, так и искусственного. В настоящее время искусственный интеллект, основанный на коннекционистских алгоритмах имитации работы нейронных сетей головного мозга, успешно справляется с задачей распознавания всё большего количества разнородных объектов. Также эти алгоритмы уже успешно справляются с некоторыми задачами прогнозирования. Но, прогноз прогнозу рознь. Одно дело распознать модель поведения на основании имеющегося опыта, то есть, обученности нейросети. Другое дело - распознать и спрогнозировать поведение чего-то неизвестного. Люди с этим успешно справляются: наблюдают за поведением выбранного объекта или за развитием ситуации1, а затем формируют в своём представлении прогностическую модель - это то, что в нас заложено с рождения. Иначе бы мы не выжили и не развились как разумные существа. Куда хуже с этим справляются искусственные нейронные сети. Во-первых, они для этого исторически не предназначены. Во-вторых, прогнозирование реакций объекта отличается от распознавания самого объекта тем, что результат прогноза часто не с чем сравнить. Такой прогноз нужен скорее для ранней корректировки поведения живого суще ства или алгоритма, а не для ожидания сбудется прогноз или не сбудется. Ожидание прогноза ведёт к действию, а дальше к новому распознаванию и новому прогнозу.

Хорошей площадкой для понимания и моделирования такого прогноза является технический анализ2 финансовых рынков [5]. Это довольно сложная полуэмпирическая система знаний о поведении финансовых

1 Любое событие, которое происходит с нами или с окружающими объектами.

2 Технический анализ предполагает, что поведение стоимости акций целиком определяется её графиком, что позволяет делать краткосрочный прогноз.

174

рынков, со множеством приёмов, помогающих трейдеру получать прибыль и минимизировать убытки. Для понимания идей прогноза её содержание можно условно разбить на два крупных раздела: «¡тренды» и «фигуры».

Тренд - это поведение рынка в целом: растёт он или падает, «бычий» он или «медвежий». Как правило, тренд задаётся прямой линией, максимально плотно проходящий через нижние или верхние точки графика цен на акции на коротком интервале прошедших торгов. Проводя эту прямую за пределы интервала обучения, то есть за пределы известного, мы получаем прогностическую модель. Её ещё называют экстраполяцией - то есть, продолжением за границу известного. Доверительная длина такого прогноза обычно не превышает пять процентов от длины известного (иначе - интервала обучения) поведения.

Фигура - это узнаваемое локальное поведение цен, во многом определяемое массовым поведением трейдеров. То есть, субъективным и плохо прогнозируемым фактором. У этих фигур имеются названия: «чашка с ручкой», «голова и плечи», «треугольники», «прямоугольники», «шипы» и др. Раннее распознавание этих фигур позволяет сделать прогноз на ценовое поведение. Сложность такого прогноза заключается в том, что чаще его удаётся сделать постфактум, когда формирование фигуры уже завершилось: время для реакции на фигуру потеряно, другие трейдеры предприняли действия и прогнозируемая фигура изменилась. Этот прогноз прямо связан с распознаванием образов, и он тем точнее, чем больше опыт трейдера. С этой задачей, к слову, уже неплохо справляются нейронные сети, лишая трейдеров работы.

Математические методы в техническом анализе долгое время считались самыми ненадёжными, пока не появились искусственные нейронные сети [7]. Попытка воспользоваться ими для экстраполяции, то есть для текущего прогноза, проваливалась отчасти потому, что

175

трейдеры делали прогноз не хуже программы и тут же вмешивались в процесс, продавая или покупая акции, тем самым радикально меняя первоначальный прогноз. Можно было бы из этого сделать вывод, что ценовые рынки акций вместе с техническим анализом - не лучшая площадка для разработки алгоритмов прогноза. Однако, описанная ситуация довольно типична для поведения живых существ: нам свойственно прогнозировать и тут же вмешиваться в прогноз. Такая стратегия выживания свойственна всему живому миру. К примеру, пауки-прыгуны для достижения цели выбирают не самый короткий маршрут, но самый быстрый - как им это удаётся? Ведь для такого выбора надо чтобы в их крохотных головах держалась картина окружающего мира. Они должны предвидеть, какое действие приведёт к лучшему результату, прежде чем начинать движение. В то же время люди, с их развитым мозгом, с подобной задачей не всегда справляются. Например, нам не очевидно, что спуск с горы по прямой может быть дольше, чем спуск по более длинной кривой - циклоиде. Почему? Всего лишь потому, что мы в жизни не так часто сталкиваемся с циклоидой.

Поскольку люди делают интуитивный прогноз, неосознанно учитывая множество факторов, при оценке качества прогнозирующей модели следует учитывать наше субъективное представление о том «как должно быть». Так, если на интервале обучения испытуемого имеется набор точек, явно образующих прямую линию, идущую вверх, то испытуемый, скорее всего, продолжит прямую, идущую вверх и на интервал прогноза. Но, он также может решить, что это перебор, «бумага кончается», и плавно выведет её в горизонт. Почему? Да потому, что он так решил! Тут много субъективного, опирающегося на индивидуальный опыт и конкретную ситуацию. Резюмируя сказанное, согласимся с тем, что человек склонен считать хорошим прогнозом зависимость полиномиального типа: первой, второй, максимум тре-

176

тьей степени. Это если нет дополнительной информации.

Метод группового учёта аргументов

Математический метод, используемый для прогноза, это метод математической регрессии или аппроксимации, позволяющий найти в семействе функций со свободными параметрами такую функцию, при которой критерии отклонения от экспериментальных данных будет иметь минимальное значение. Для полиномов3 задача нахождения такой зависимости решается нахождением точки минимума среднеквадратичного отклонения в пространстве параметров. Однако, как и в случае с техническим анализом, разумно использовать полиномы младших степеней: более высокие степени делают результат нестабильным. Известно, что этот метод плохо работает на зависимостях с высокой изменчивостью значений, поэтому люди всегда искали ему замену либо разбиением основного интервала на более мелкие интервалы, либо пробовали разбивать полиномы большой степени на суперпозицию полиномов младших степеней. Среди алгоритмов, которые используют последний подход, выделяется метод группового учёта аргументов4 [1; 2]. Метод использует полиномы от многих переменных (от входного вектора) для аппроксимации обучающего интервала методом наименьших квадратов. Причём, ищется не один, а много частных полиномов младших степеней. Полиномы тестируются на проверочных выборках и лучшие отбираются в аппроксимирующий ряд. Их значения формируют новый входной вектор для следующей генерации полиномов. Повторяя этот процесс несколько раз, методом суперпозиции формируется аппроксимирующая модель нужной степени изменчивости. При этом она экстраполирует дис-

3 Полиномы - то же, что алгебраические многочлены. Этот синоним удобнее в использовании.

4 МГУА - метод группового учёта аргументов, созданный Алексеем Григорьевичем Ивахненко [1; 2].

177

кретные числовые зависимости реальных физических процессов с куда лучшей точностью и стабильностью, чем метод регрессии на базе полиномов.

Искусственные нейронные сети

Искусственные нейронные сети (иначе нейросети) развивались параллельно с методом группового учёта аргументов, долго не пересекаясь. Их развитие стимулировалось потребностью в автоматическом чтении рукописных текстов, и такая потребность неплохо финансировалась. Поэтому, основное их развитие шло и идёт в направлении распознавания образов. Задачи экстраполяции были менее востребованы. В основе концепции нейросетейлежит математическая модель нейрона как сумматора импульсов от вектора входных данных с некоторыми коэффициентами-весами. Такая модель называется свёрточной, а искусственный нейрон называется перцептроном. Развитие вычислительных мощностей привело к появлению сетей из таких, связанных друг с другом, нейронов. Нейросети научились распознавать не только рукописный текст, но и всё, что в принципе поддаётся распознаванию. В том числе человеческую речь, лица людей и многое другое. С прогнозом нейросети справляются тем же способом, что и с распознаванием - узнают знакомое, то есть ранее встречавшееся и на этой основе делают прогноз на будущее. Концептуально, групповой учёт аргументов и нейросети близки между собой. И там, и там используется набор параметров, который требует долгой настройки - обучения (training) сети. Чем проще модель элементарной вычислительной ячейки - нейрона или частной модели, тем больше их требуется для решения конкретной задачи. Чем больше коэффициентов -параметров модели, тем больше требуется выделенной памяти компьютера. И тем больше требуется времени на их вычисление. В перцептроне используется линейная функция, а в частных моделях метода группового

178

учёта аргументов используются полиномы. Что можно использовать ещё?

Аппроксимирующие функции

И свёртки, и полиномы - это алгебраические функции, образованные тремя арифметическими операциями над переменными (+,-,х). Нейронная сеть из таких функций - это естественный способ расширить их возможности. Более сложные алгебраические функции - дробно-рациональные, или прюсто рациональные функции получаются делением двух полиномов. То есть, добавляется четвертая арифметическая операция деления (+,-,*,-=-). Многопараметрические модели, основанные на таких функциях, куда лучше аппрхжсимируют зависимости как на интержале известного, так и за его границы. Нейронные сети на их основе, вместо свёрток, могли бы дать новые интересные результаты.

Экстраполяция - это не то же самое, что реальный прогноз, а только его математическая часть. Для прогноза математические методы, в том числе и рациональные функции, не очень подходят - все они дают не более чем краткосрочный прогноз. Есть ещё семейство рядов тригонометрических функций. Точнее, их подмножество - ряды Фурье, которые с успехом используются для аппроксимации периодических зависимостей. Однако, если периодичность зависимости неочевидна, то с эстетической точки зрения, лучше всего задачу краткосрочного прогноза выполняют именно алгебраические функции общего вида. Для конкретных задач существуют и другие варианты параметрических моделей, но практически все они обладают параметрами, которые входят в модель нелинейно, что мешает использовать детерминистские методы5 решения. Перспектива регрессионных методов состоит в использовании пошаговых методов оптимизации, которые в тех-

5 Под детерминистским методом прогноза обычно понимают метод линейной регрессии Ф. Гаусса.

179

нологии машинного обучения применяются для тренировки нейронных сетей [3; 8].

Распознавание, прогноз, действие

Всё живое на планете стремится выжить. Для этого требуется распознать ситуацию (еду или опасность), спрогнозировать её развитие и произвести действие (нападать или спасаться). Такова простейшая схема. В реальности для качественного распознавания и анализа ситуации требуется время, которое может дорого стоить. В том же техническом анализе, фигура может быть угадана сначала на 5%, затем на 10%, 15%... Когда она угадана, наконец, на все сто процентов, прогноз теряет смысл - мы не успели совершить действие. В какой-то поздний момент трейдер может предположить, что на 25% это одна фигура, раньше на 15% другая, ещё раньше на 5% третья - на этом основании он уже может совершить какие-то действия, рискуя не угадать и проиграть. Либо подождать, чтобы действовать наверняка, но тогда он рискует упустить выгоду. Жизнь примерно также устроена: перед нами каждый раз раскрывается множество вариантов действий, из которых следует выбрать оптимальное одно. Кроме того, что надо построить прогноз развития ситуации в целом, ещё следует построить промежуточные прогнозы развития ситуации после каждого предполагаемого действия. У высокоразвитых организмов это происходит буквально «са-мо-собой», Способность прогнозировать заложена в нас эволюцией. Но, как такой эффективный алгоритм прогноза вложить в искусственный интеллект, в программу? Предобучение нейронных сетей6 можно сравнить с формированием комплекса «умений и знаний», свой-

6 Предобучение - предварительное обучение нейронных сетей на представительном наборе объектов, которое выполняется на мощных графических ускорителях и занимает много времени. В дальнейшем, такие сети могут быть «дообучены» на персональных компьютерах, применительно к местным объектам.

180

ственных нашей памяти. В реальной жизни времени на длительную настройку или перенастройку нейронной сети нет: решение надо принимать быстро, исходя из ситуации. В том числе с учётом «эмоций». Под «эмоциями» в смысле искусственного интеллекта подразумевается пороговое значение того или иного ответного действия «условиях неопределённости»7. Готовые решения на знакомые ситуации - это во власти «эмоций». Предполагается, что развитие нейронных сетей будет идти в направлении их адаптивного использования: «распознавание, прогноз, выбор решения, действие», применительно к тому, как это делают живые существа. От нейронных сетей также требуется быстрое распознавание в условиях неопределённости, оптимальный выбор одного действия и эффективное принятие решения. Не совсем так, как это происходит сейчас в нейронных сетях- там долгое обучение и потом быстрое однократное распознавание без многократного использования последовательности «распознавание, прогноз, действие». Принятие решения у человека часто сопровождается чрезмерными эмоциями, нерешительностью, плохим настроением. У нейронной сети всё должно быть быстро и надёжно -этого мы ждем от искусственного интеллекта [4].

В заключение скажем, что искусственные нейронные сети, как бы хорошо они ни были развиты, значительно отстают от сложного устройства человеческого интеллекта [6]. Пока что они являются лишь небольшой составной частью того «сильного»8 искусственного интеллекта, над созданием которого сегодня работают учёные. Интеллекта в техническом смысле, который позволит осваивать космос без космонавтов, исследовать глубины океанов без водолазов, пустоты Земли без

7 Даниилом Бернулли в 1738 году была разработана «Теория принятия решений в условиях неопределённости», в которой он определил понятие ожидаемой полезности, включив фактор риска.

8 Интеллект, наделённый разумом, сознанием. В отличие от «слабого», технического интеллекта.

181

спелеологов, а также принимать быстрые и взвешенные решения в острых ситуациях при управлении беспилотным транспортом. Сегодня речь идёт скорее о технических и эвристических возможностях этих перспектив, чем о создании человекоподобного интеллекта. Однако человечеству предстоит оценить и другие их аспекты, например, этические, социальные, культурные.

Литература

1. Ивахненко А.Г. Самообучающиеся системы распознавания и автоматического упоавления. К.: «Техшка», 1969.

2. Ивахненко А.Г. Лапа В.Г. Кибепнетические предсказывающие устгюйства. К.: «Наукова думка». 1965.

3. Кан Майкл.Н. Технический анализ. «ПИТЕР», 2003.

4. Толстых В.Н., Толстых И.В, Ульянова Н.С. Исследование методов аппроксимации с нелинейными параметрами // Proc. of the Int. Workshop "Soft Computing and the Measurements". 2002. C. 133-136.

5. Толстых B.H. Пешеттон, нейгаонная сеть. Что дальше? // ПАРАДИГМА, философско-культурологический альманах. Вып.37. / Гл. редакторы. X. Орлова. СПб., 2022. С. 152-169.

6. Фон Баргельд К.С., Бани Дж., Эркулано-Хоузел С. Поиск истинного количества нейронов и глиальных клеток в человеческом мозге: обзоп 150-летнего подсчёта клеток // Журнал сравнительной неврологии. 2016. 524 (18): 3865-3895.

7. Что такое нейронные сети, что они могут, и как написать нейронную сеть на Python? // URL: https://neural-university.ru/neural-networks-basics (11.04.2023).

8. Tolstykh Victor, Tolstykh Irina. Generalization of Artificial Neuron // URL: http://inftech.webservis.ru/it/conference/ scm /2000/se ssi on6/tolctykh.htm (04.06.2023).

182

i Надоели баннеры? Вы всегда можете отключить рекламу.