Научная статья на тему 'Нейронные сети, формализация смысла и будущее искусственного интеллекта'

Нейронные сети, формализация смысла и будущее искусственного интеллекта Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
538
189
i Надоели баннеры? Вы всегда можете отключить рекламу.
i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Нейронные сети, формализация смысла и будущее искусственного интеллекта»

Н.В. Добычина

(Пятигорск, Россия)

НЕЙРОННЫЕ СЕТИ, ФОРМАЛИЗАЦИЯ СМЫСЛА И БУДУЩЕЕ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА

Современная философия сознания отталкивается от различных мнений по вопросу о границах и возможностях искусственного интеллекта заменять мышление человека. Ученые, которые считают, что искусственный интеллект является слабой системой, придерживаются мнения о том, что специально запрограммированный компьютер может моделировать мыслительные акты человека. Ученые, придерживающиеся мнения о том, что искусственный интеллект и компьютеры действительно могут мыслить и в связи с этим могут находиться в соответствующих когнитивных состояниях, рассматривают мышление как сугубо функциональное свойство формальных систем, не зависящее от физического воплощения, т.е. от конкретного типа «железа». Именно эта точка зрения нашла отражение в создание новых компьютерных систем и программного обеспечения, реализующая два стандартных вычислительных подхода к моделированию мышления: символицизм и коннекционизм. В основу символицизма лежит предположение о том, что человеческое мышление

функционально эквивалентно мышлению компьютерного интеллекта, состоящего из центрального процессора, последовательно обрабатывающего единицы символьной информации. Коннекционизм основываются на представлении о том, что идея работы цифрового процессора несовместима с работой человеческого мозга в силу ее несовместимости с соответствующими нейробиологическими данными, и

информация, подлежащая обработке- не обязательно символьная. Наиболее адекватная имитация мыслительных процессов может быть осуществлена искусственными

нейронными сетями, которые по сущности являются системами взаимосвязанных вычислительных элементов.

Функционирование компьютерных устройств, которые состоят из искусственных нейронных сетей, во многих отношениях

действительно напоминает работу нашего правополушарного, пространственно- образного мышления, ведь благодаря «встроенной», генетически запрограммированной

холистической стратегии это мышление способно параллельно перерабатывать значительное число одновременно поступающих на «вход» единиц когнитивной информации. Благодаря имеющемуся опыту компьютерного симулирования и имитирования компьютерных процессов стало ясно, что мышление обязательно предполагает внутреннюю ментальную репрезентацию информации в когнитивной системе1.

Коннекционистские модели и методы обучения сетей определяют репрезентацию когнитивной информации в мозгу не локализованной в отдельных нейронах или нейронных узлах, а распределенной в системе. Процессы обучения искусственных нейронных сетей показали, что все распределенные репрезентации являются паттерном, который работает через все модули, так как граница между простыми и сложными репрезентациями отсутствует. Ни один индивидуальный модуль не кодирует какой- либо символ, а распределенные репрезентации являются подсимвольными. Если моделировать действия каждого нейрона как числа, то функциональная деятельность мозга в целом может быть представлена как гигантский вектор (или список) чисел. И вход в мозг из сенсорных систем, и его выход к индивидуальным мышечным нейронам также могут быть обработаны как векторы того же самого типа2.

Развитие моделей искусственных нейронных сетей невозможно без кодирования символьной информации. В наиболее актуальных моделях информация представляется как двоичный вектор. В процессе использования этих моделей решаются проблемы кодирования входного и декодирования выходного вектора. А.В. Гаврилов считает, что если кодировать символьную информацию на входе искусственных нейронных

1 Меркулов И.П. Когнитивная модель сознания. // Эволюция. Мышление. Сознание. (Когнитивный подход и эпистемология) - М.: Канон +, 2004.- С. 35-64.

2 Меркулов И.П. Мышление как информационный процесс. // Эволюция. Мышление. Сознание. (Когнитивный подход и эпистемология) - М.: Канон +, 2004. - С. 228-260.

сетей «беспорядочно», т.е. не заботиться о корреляции между значениями двоичных векторов и соответствующими им символьными значениями, то близкие по семантическому символьные значения могут кодироваться совершенно разными двоичными векторами, отстоящими друг от друга на очень большое расстояние в пространстве состояний нейронной сети. Это затрудняет обучение нейронной сети и может приводить к ошибкам при функционировании обученной искусственной нейронной сети. Чтобы исключить эти недостатки в использовании нейронных сетей для обработки символьной информации А.В. Гаврилов предлагает использовать

следующие принципы:

- разбиение входного вектора на подвекторы, кодирующие разные компоненты символьной информации, поступающей на нейронную сеть (например, разные поля реляционной базы данных или разные аспекты контекста обрабатываемого нейронной сетью текста), при этом для кодирования подвекторов необходимо использовать тезаурусы с фиксированным количеством слов в каждом из них;

- использование представления лингвистической переменной для кодирования семантически близких значений, которые могут быть связаны с метрической шкалой;

- использование классификации понятий и определение семантических шкал для них (задание отношений частичного порядка на множестве понятий, семантически близких в определенном контексте, задаваемом классом и признаком классификации).

Кодирование символьной информации на входе искусственных нейронных

сетей предполагает использование фиксированного тезауруса, индивидуального для каждого подвектора входного вектора искусственной нейронной сети. При использовании в качестве входной информации только произвольные символьные значения, которые нельзя представить в виде значений лингвистической переменной, возникает

необходимость применять разбиение на классы и применение для каждого класса своей семантической шкалы, исходя из контекста признака классификации. Так же возможно

определение признака, оценивающего семантическую близость между представителями заданного класса. Семантическая шкала определяет отношение частичного порядка между значениями, принадлежащими данному классу и семантическое расстояние между двумя значения, равное количеству значений, находящихся между ними на шкале, увеличенному на единицу. Наименование класса и признака классификации кодируются отдельно. В этом случае классификация может производиться другой нейронной сетью1.

Современное состояние формализации смысла и возможного развития искусственного интеллекта на примере новой модели информационного пространства Semantic Web, его базовых концепций и архитектуры.

Компьютерная обработка различных видов и форм интеллектуальной деятельности человека нуждается в экспликации лингвистической способности пользователя. Это способствует созданию банка данных и компьютерных программ. Возможность оптимального использования знаний, содержащихся в текстах, требует новых подходов к обработке, отличающихся от традиционных логических подходов, учитывающих семантические законы естественного языка.

Лингвистический аспект является важной составляющей для всех направлений компьютерной обработки человеческих знаний. Однако, по числу внутренних противоречий, нечеткости значения языковых выражений, естественный язык, - один из самых сложных объектов моделирования.

Моделирование языков вписывается в идею моделирования интеллектуальных способностей человека. При осуществлении компьютеризации этих объектов необходимо опираться на языковой фактор и на многоаспектность, многоуровневость языковых механизмов. Методология прикладного исследования должна предусматривать повышение эффективности создаваемых моделей, основанных на учете всех свойств языка. Основные качества языка, необходимые для

1 Гаврилов А.В. Проблемы обработки символьной информации в нейронных сетях. Междунар. конф. «8СМ-98», С.-Петербург, 1998.

создания моделей: нечеткость значений языковых выражений, динамичность систем языка, метафоричность номинации.

Стратегии преодоления коммуникативных неудач организуют инструментарий для создания легко воспроизводимых компьютерных методов обработки экстраграмматических выражений естественного языка в специализированной предметной области.

Развитие современных Web- технологий привело к необходимости перехода от документов «читаемых» к документам «понимаемым» компьютером. Создание

консорциумов, использующих семантические метаданные, вебресурсы, основанные на сущностях мироздания, процессах сознания, рассматриваются как формальные

машинообрабатываемые утверждения. В задачи проекта Semantic Web входит возможность использования

интеллектуальных агентов для поиска и обработки соответствующей информации.

Для свободного применения автоматизированной инфраструктуры Semantic Web необходимо обеспечение этого концепта достаточной гибкостью. Трансформация обработки информации сводится к общим принципам, согласно которым, данные могут быть собраны, обработаны, связаны. Распределение, возможность обмена базами данных, взаимодействие с другими приложениями для выполнения более сложных задач должно обеспечить доступ не только к статичным документам, но и к различным полезным сервисам, освобождая человека от рутинных задач по поиску, учету и индексации информации.

Основную проблему и задачу развития Semantic Web составляет разработка и поддержка метаданных. В реальной жизни человек обладает способностью мгновенно анализировать слова и составлять лексические и семантические поля.

Воспроизвести эту возможность с помощью программ на уровне компьютерного оборудования практически невозможно, поэтому возникает необходимость логического построения семантических полей, на которых будет основываться тезаурусная сфера семантических словарей. Эти словари, в свою

очередь, могут стать коннекторами между семантическими хранилищами и редакторами онтологий.

Используемые онтологии определяются как совместно используемые формальные модели точных предметных областей, они дают представление о понятиях. Информацией из этих областей могут обмениваться люди и компьютеры. Основанием онтологии являются математические аппараты формальной логики, которые положены в основу онтологических языков DAML+OIL и OWL. Два этих языка используют в своей архитектуре RDF и RDF Schema. Целью онтологических языков является обеспечение ресурсов машинно-обрабатываемой семантикой, семантическими алгоритмами и семантическими метаязыками, то есть модели процессов извлечения информации из текста. И на обеспечение машинного представления ресурсов в форме, которая наиболее соответствует их оригиналу из реального мира.

Все документы Semantic Web размечаются с помощью онтологических терминов, что позволит производить автоматическую выработку их информационного ресурса. Онтологии определяются как ключевая технология развития Semantic Web. Сущность онтологии составляет иерархия понятий предметной области и обозначает свойства каждого понятия, используя механизм «атрибут- значение». Содержит понятийные связи, которые описываются при помощи дополнительных логических утверждений. Онтологии вмещают информацию о классах, свойствах и частных случаях, которые могут иметь самостоятельный идентификатор ID, являющийся ссылкой URI. В задачи Semantic Web входит не только интерфейсное расширение пользовательских возможностей, но и построение мощного выразительного логического языка, поддерживающего логический вывод, который способен помогать в решении самых разнообразных ситуаций. Semantic Web представляет собой развивающуюся концепцию, идею хранения данных в Web- пространстве так, чтобы они были определены и связаны для дальнейшей возможности машинной обработки, интеграции и повторного использования их в различных приложениях, это видение следующего поколения Интернет, который позволит веб-приложениям автоматически

собирать веб-документы из различных источников, учитывать и обрабатывать информацию, а также взаимодействовать с другими предложениями для выполнения сложных задач1.

Выполнение запроса в Semantic Web базируется на принципе логического вывода, это способность получать новые данные из тех данных, которые уже существуют. Необходимо также подчеркнуть критически важную роль создания единого языка семантической разметки для Web- ресурсов. Это язык, который сможет обеспечивать примитивы моделирования и расширять возможности моделирования. Также необходимо определение формата обмена правилами, который смог бы транслировать правила между разными языками правил и обеспечить обмен правилами между системами, основанными на правилах. Важнейшее требование к создаваемому стандарту

- это возможности его реализации не только при текущем состоянии технологий, которые основываются на правилах, но и возможности его трансформации в процессе их эволюционного развития.

Список литературы

1. Гаврилов А. В. Проблемы обработки символьной информации в нейронных сетях. Междунар. конф. <^См-98»/А.В. Гаврилов- С.-Петербург, июнь,1998.

2. Меркулов И.П. Когнитивная модель сознания. // Эволюция. Мышление. Сознание. (Когнитивный подход и эпистемология)/ И.П. Меркулов - М.: Канон +, 2004.

С.35-64.

3. Меркулов И.П. Мышление как информационный

процесс. // Эволюция. Мышление. Сознание.

(Когнитивный подход и эпистемология)/

И.П. Меркулов - М.: Канон +, 2004. С. 228-260.

4. Guarino N. Formai ontology in information systems// Proceedings of FOIS 98, / N. Guarino -Trento, Italy, IOS Press, 1998. p. 3-15.

1 Guarino N. Formal ontology in information systems// Proceedings of FOIS'98, Trento, Italy, IOS Press, 1998. p. 3-15

i Надоели баннеры? Вы всегда можете отключить рекламу.