Научная статья на тему 'Проблемы и методы нейрокомьютинга'

Проблемы и методы нейрокомьютинга Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
91
34
i Надоели баннеры? Вы всегда можете отключить рекламу.
i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Проблемы и методы нейрокомьютинга»

экспертами разбиваются на темы. Таким образом, тема является минимальной составляющей при построении учебного процесса.

Любые операции с составляющими учебного процесса возможны при условии четко определенных критериев. Здесь возникает наибольшее количество вопросов по поводу того, какими свойствами наделить темы, чтобы затем компьютер смог их логически грамотно выстроил, в иерархическую последовательность.

Тема, взятая сама по себе, представляет «черный ящик», допускающий лишь интуитивное описание, не отражающее в полной мере его содержательную составляющую. Поэтому назрела необходимость пересмотреть структуру темы в пользу ее дробления на более мелкие составляющие.

Практически любая тема учебного курса включает набор терминов, определений, аксиом, формул, методов и т. п., несущих основную смысловую нагрузку и необходимых для ее раскрытия. По аналогии с энциклопедической терминологией, назовем данные составляющие статьями. Статьи объективны и независимы от личного мнения автора темы или курса Необходимая совокупность статей помещена в среду авторских представлений и умозаключений, логично связывающих самостоятельные статьи в законченную форму называемую темой. Полный набор статей, используемых при построении учебного курса, можно назвать тезаурусом данного курса. Качество курса напрямую зависит от качества тезауруса, поэтому требования к формированию тезауруса должны бьпь чрезвычайно высоки. В нем не должно быть, например, терминов, выражающих одно и то же понятие, т. е. синонимов -это привело бы к пропускам и потерям информации при построении курса. Кроме этого, должны быть за-

фиксированы некоторые отношения между' терминами (род - вид, часть - целое и другие), служащие целям повышения точности и полноты наполнения темы и курса в целом.

Для автоматизированного формирования обучающей последовательности, каждая статья должна быть описана на формальном языке, понятном машине. То есть, каждая статья должна иметь набор дескрипторов, уникально и полностью описывающих статью. Совокупность дескрипторов, включенных в тему, образует поисковый образ темы.

Тема должна включать не только дескрипторы понятий на выходе (результат изучения темы) - {В}, но также, насколько это возможно, должны быть определены дескрипторы, отражающие понятия на входе {А}, составляющие базовый минимум знаний для данной теN0,1. Этот шаг совершенно необходим, так как он определяет направление движения в поле знаний - от А к В. Определетше понятий 1и входе имеет свои особенности. Так, они должны вноситься только после того, как все выходные понятия {В} для всех тем курса уже указаны, и только из этого списка.

После этого формирование последовательности уже можно поручит!, машине. ЭВМ с присущей ей быстротой просматривает массивы {А} и сравнивает их с {В}. Цель такого сравнения - выявил, дескрипторы, принадлежащие одновременно {А} и {В}, т. е. найти пересечение множеств дескрипторов {А} и {В}. Чем больше зона пересечения, тем прочнее связь между темами. Минимальная величина зоны пересечения оговаривается принятым критерием смыслового соответствия Изменяя его, можно варьирова л, степень конкретизации и информационную полноту курса в зависимости от нужд учебног о процесса

ПРОБЛЕМЫ И МЕТОДЫ НЕЙРОКОМПЫОТИНГА

© А. П. Зубакок

Большой объем, разнообразие и противоречивость информации, подлежащей обработке, приводят к необходимости поиска физических систем, способных эту обработку выполнить. Решение пой задачи непосредственно связано с новыми информационными технологиями, важное место среди которых занимают методы распознавания и классификации образов. Нейронные сети - эффективный и. видимо, наилучший метод для решения задач распознавания образов в ситуациях, когда в экспериментальных данных отсутствуют некоторые информационные фрагменты, а имеющаяся информация существенно зашумлена. Аппаратный параллелизм, допускаемый при реализации нейросистем, обеспечивает обработку недоступных традиционными методами объемов информации в реальном масштабе времени.

Нейрокомпьютинг в современный момент переживает период бурного роста. Развитие теории и приложений нейронных сетей идет в разных направлениях предлагаются новые архитектуры нейронных сетей, идут поиски новых нелинейных элементов, которые могли бы реализовывать коллективное поведение в

ансамбле нейронов, находятся новые области приложения нейронных сетей в системах обрабо тки изображений, распознавания образов и речи, робототехники и др. Значительное место в данных исследованиях традиционно занимает математическое моделирование.

Исторически первой работой, заложившей теоретический фундамент для создания искусственных моделей нейронов и нейронных сетей, принято считать опубликованную в 1943 г. статью Уоррена С Мак-Каллока и Вальтера Питтса «Логическое исчисление идей, относящихся к нервной активности». Главный принцип теории Маккалока и Питтса заключается в гам, что произвольные явления, относящиеся к высшей нервной деятельности, могут быть проішализированьї и поняты, как некоторая актнвноеть в сети, состоящей из логических элементов, принимающих только два состояния (0 или 1). При этом для всякого логического выражения, удовлетворяющего указанным авторами условиям, может бы л. найдена сел. логических элементов, имеющая описываемое этим выражением поведение

В модели формального нейрона Маккалока и Питтса не предполагаются временные задержки вход-

ных сигналов, поэтому значение взвешенной суммы входов net определяет полное внешненее возбуждение, воспринятое нейроном. Отклик нейрона далее описы-вается но принципу «все или ничего», т. е. переменная подвергается нелинейному пороговому преобразованию. при котором выход (состояние активации нейрона) }' устанавливается равным единице, если net > Е, и Y = 0 в обратном случае. Значение порога Е также хранится в локальной памяти. Формальные нейроны могут быть объединены в сети путем замыкания выходов одних нейронов на входы других, и, по мысли авторов модели, такая кибернетическая система с надлежаще выбранными весами может представлять произвольную логическую функцию. Для теоретического описания получаемых нейронных сетей предлагался математический язык исчисления логических предикатов.

Следует отметить, что сегодня, спустя почти 60 лет после работы Маккалока и Питтса, исчерпывающей теории синтеза логических нейронных сетей с произвольной функцией, по-видимому, нег. Наиболее продвинутыми оказались исследования в области многослойных систем и сетей с симметричны ми связями. Большинство моделей опираются в своей основе на различные мо;щфикации формального нейрона. Важным развитием теории формального нейрона является переход к аналоговым сигналам, а также к различным типам нелинейных переходных функций.

Широкий интерес к нейронным сетям был инициирован после появления работы Хопфилда (1982), который показал, что работа нейронной сети состоит в ре-лаксации начального «спинового портрета» матрицы двоичных кодон к одному из стационарных состояний, определяемых правилом обучения Хебба. Таким образом, данная сеть может применяться для задач распознавания. В 1986 году появилась работа Румельхарта, Хинтона и Вильямса (1986), содержавшая ответ на вопрос, долгое время сдерживавший развитие нейроинформатики - как обучаются иерархические слоистые нейронные сети, для которых «классиками» еще в 40-50 годах была доказана универсальнось для широкого класса задач. В последующие годы предложенный Хинтоном алгоритм обратного распространения ошибок претерпел множество вариаций и модификаций.

Одной из первых искусственных нейронных сетей был однослойный perceptron Розенблаггта. Позднее М. Минским и С. Пейпёртом быт выявлены принципиальные неустранимые ограничения однослойных сетей. В современной практике рассматривактгся в основном многослойные варианты нейронных сетей. Широкое применение находят также сети feed-forward, в которых имеют-

ся связи между несмежными слоями нейронов, например, между нейронами входного и выходного слоев

Так называемая сеть прямого распространения (feed-forward) является одной из самых популярных современных нейросетевых архитектур. Нейронные сети этого типа широко применяются в задачах аппроксимации функций, классификации данных, сжатия информации и для моделирования сложных динамических систем.

ИНС прямого распространения состоит из некоторого количества нейронов, соединенных связями, каждой из которых приписан определенный вес W,y В сети нейрон / имеет вход х, и характеризуется неким состоянием (степенью активности) у,. Нейроны образуют несколько слоев - входной, несколько скрытых и выходной. Слоям соответствуют переходные функции / посредством которых по вектору входов слоя х вычисляется вектор активностей у нейронов этого слоя. Входные и выходные нейроны обычно выполняют тождествешюе преобразование/*) =х. На скрытых слоях используется какая-либо нелинейная функция, например, «сигма».

Для обучения нейронных сетей успешно применяются разнообразные итерационные алгоритмы, использующие градиент оптимизируемой функции по весам сети.

Проблема познаваемости. Общее число нейронов в центральной нервной системе человека достигает Ю10 - 10м, при лом каждая нервная клетка связана в среднем с 10* - 10'1 других нейронов. Установлено, что в головном мозге совокупность нейронов в объеме 1 шг формирует относительно независимую локальную сеть, несущую определенную функциональную нагрузку. Структура основных типов нейронных сетей генетически предопределена. При этом исследования в области сравнительной нейроанатомии говорят о том, что но фундаментальному плану строения мозг очень мало изменился в процессе эволюции. Однако детерминированные нейронные структуры демонстрируют свойства изменчивости, обуславливающие их адаптацию к конкретным условиям функционирования. Специфическая изменчивость нейронных сетей и свойств отдельных нейронов лежит в основе их способное™ к обучению -адаптации к условиям функционирования - при неиз-мешюсти в целом их морфологической структуры. Следует заметил., однако, что рассмотрение изменчивости и обучаемости малых групп нейронов не позволяет в целом ответить на вопросы об обучаемости на уровне высших форм психической деятельности, связанных е интеллектом, абстрактным мышлением, речью. Здесь, вероятно, исследования сталкиваются с фундаментальными проблемами познаваемости, обнаруженными Гвдепем, Клиии, Черчем.

МАТЕМАТИЧЕСКИЕ МЕТОДЫ В ЭКОНОМИЧЕСКОЙ ТЕОРИИ

© С.Е. Жуликов

В экономической теории действуют устойчивые количественные закономерности для описания изучаемых процессов, поэтому возможно их строгое формализованное математическое описание. Экономическая

теория как объект моделирования имеет ряд специфических особенностей, среди которых присутствует не-возможность применения метода подобия, подобно физическим или техническим исследованиям. Кроме

i Надоели баннеры? Вы всегда можете отключить рекламу.