Перспективы развития и применения нейронных сетей

Абрагин Артур Викторович

Абрагин А. В.

Абрагин Артур Викторович /Abragin Artur Viktorovich - старший преподаватель, кафедра вычислительной математики и математической физики, ФН-11, Федеральное государственное бюджетное образовательное учреждение Высшего образования Московский государственный технический университет им. Н. Э. Баумана, г. Москва

Аннотация: в настоящей статье рассматриваются: сущность нейронных сетей, их особенности способности к обучению (настройки архитектуры и синаптических связей). Также автор выявляет и перспективы развития применения и использования искусственных нейронных сетей.

Abstract: this article discusses the nature of neural networks, especially their ability to training (setting of architecture and synaptic connections). The author also reveals the development prospects of application and use artificial neural networks.

Ключевые слова: нейрон, синапс, нейронная сеть, синаптические связи. Keywords: neuron, synapse, neural network, synaptic communications.

Нейронные сети и нейрокомпьютеры - отрасль знаний, весьма популярная в настоящее время. Это проявляется, в частности, в большом числе публикаций, конференций и различных применений.

Одно из оснований такой популярности - их замечательные способности к обучению по наблюдаемым примерам и формированию приемлемых выводов на базе неполной, зашумленной и неточной входной информации. Работы по нейронным сетям первоначально были начаты биологами. С помощью нейросетей исследователи стремились изучить свойства и особенности работы головного мозга.

Первая обучаемая искусственная нейронная сеть - перцептрон - была предложена Ф. Розенблаттом в 1958 г. Однако после того, как в 60-х годах было установлено, что перцептрон не способен классифицировать линейно неразделимые классы образов, область исследований по нейронным сетям существенно сузилась [3, с. 192].

Интерес к нейронным сетям заметно возрос в 80-х годах после открытия новых и мощных алгоритмов обучения (в частности, алгоритма обучения с обратным распространением ошибки с различными модификациями) и новых архитектур нейросетей. Нейросети оказались в состоянии классифицировать и линейно неразделимые классы образов (например, решение известной проблемы моделирования схемы исключающего ИЛИ, XOR-Problem) [6, с. 504].

В настоящее время все больший интерес к искусственным нейронным сетям проявляют различные отрасли промышленности и непромышленной сферы. Искусственные нейронные сети эффективно используются для распознавания видеоизображений, письменного текста и речи, решения разнообразных задач прогнозирования и во многих других областях.

В настоящее время известно большое число коммерческих программных систем моделирования, позволяющих исследовать и разрабатывать искусственные нейронные сети для различных приложений, а также разработано значительное число нейрокомпьютерных систем.

Человека всегда интересовало устройство мозга, принципы его работы и организации. Первая математическая модель нейрона (базового элемента мозга) была создана в 1943 году, когда американский ученый Уоррен Маккаллок (McCulloch W.) и его ученик У. Питтс (Pitts W.) сформулировали основные положения теории деятельности головного мозга. Ими было сделано следующее:

• разработана модель нейрона как простейшего процессорного элемента, выполнявшего вычисление переходной функции от скалярного произведения вектора входных сигналов и вектора весовых коэффициентов;

• предложена конструкция сети таких элементов для выполнения логических и арифметических операций;

• сделано основополагающее предположение о том, что такая сеть способна обучаться, распознавать образы, обобщать полученную информацию. За прошедшие десятилетия теория нейронных сетей ушла достаточно далеко вперед, однако многие утверждения У. Маккаллока остаются актуальными и по сей день [1, с. 103-107].

Потенциал у нейронных технологий огромен, но их эффективное использование требует определенного уровня знаний и понимания принципов их действия.

Нейронные сети, в отличие от статистических методов многомерного классификационного анализа, базируются на параллельной обработке информации и обладают способностью к самообучению, то есть получать обоснованный результат на основании данных, которые не встречались в процессе обучения. Эти свойства позволяют нейронным сетям решать сложные (масштабные) задачи, которые на сегодняшний день считаются трудноразрешимыми. Основными достоинствами нейронных сетей перед традиционными вычислительными методами являются:

1. Процесс создания нейронной сети больше относится к процессу обучения, нежели к программированию.

2. Нейрокомпьютеры особенно эффективны там, где нужно подобие человеческой интуиции, в частности к таким задачам относятся принятие решений в процессе оценки финансового состояния некоторого экономического объекта [5].

3. Гибкость структуры нейронных сетей позволяет различными способами комбинировать простые составляющие нейрокомпьютеров - нейроны и связи между ними. За счет этого один нейрокомпьютер можно применять для решения различных задач, зачастую никак не связанных между собой.

4. Нейронные сети позволяют создать эффективное программное обеспечение для высокопараллельных компьютеров. Создавая математическое обеспечение на базе нейронных сетей, можно для широкого класса задач решить проблему эффективности одновременного решения параллельных задач. Кроме того, параллельная обработка информации обеспечивает высокую скорость решения задач.

5. Решение задач в условиях неопределенности - способность обучения нейронной сети позволяет решать задачи с неизвестными закономерностями и зависимостями между входными и выходными данными, что позволяет работать с неполными данными. Кроме того, взаимоотношения между величинами заранее не устанавливаются, поскольку метод предусматривает изучение существующих взаимосвязей на готовых моделях.

6. Устойчивость к шумам во входных параметрах - нейронная сеть может самостоятельно определять неинформативные для анализа параметры и производить их отсев, в связи с чем пропадает необходимость дополнительного анализа информационного вклада входных данных.

7. Адаптирование к изменениям окружающей среды - нейронные сети могут быть переучены в новых условиях окружающей среды, описываемых незначительными колебаниями параметров этой среды. То есть можно производить переобучение нейронных сетей на основе незначительных колебаний параметров среды. Если задача решается в условиях нестационарной среды (где статистика изменяется с течением времени), то могут быть созданы нейронные сети, переучивающиеся в реальном времени. Чем выше адаптивные способности системы, тем более устойчивой будет ее работа в нестационарной среде [2, с. 88].

8. Потенциальная отказоустойчивость нейронных сетей обоснована незначительным снижением их производительности при неблагоприятных условиях. Эта особенность объясняется распределенным характером хранения информации в нейронной сети,

благодаря чему можно утверждать, что только серьезные повреждения структуры нейронной сети существенно повлияют на ее работоспособность. Имеется определенное сходство в использовании нейронных сетей и методов многомерного статистического анализа при оценке финансово-экономического состояния предприятия.

Преимущество использования нейронных сетей, как инструмента оценки финансово-экономического состояния предприятия, состоит в том, что взаимоотношения между величинами заранее не устанавливаются, поскольку метод предусматривает изучение существующих взаимосвязей на готовых моделях. Для нейронных сетей также не требуется никаких предположений относительно основного распределения совокупности, а также, в отличие от многих традиционных статистических методов, они могут работать с неполными данными.

Нейронные сети представляют собой новую и весьма перспективную вычислительную технологию, дающую новые подходы к исследованию динамических задач в финансовой области. Способность к моделированию нелинейных процессов, работе с зашумленными данными и адаптивность дают возможность применять нейронные сети для решения широкого класса финансовых задач.

Нейронная сеть - параллельно распределенная структура обработки информации, состоящая из нейронов, которые соединены между собой связями [4, с. 76].

Нейронные сети - мощный метод моделирования, позволяющий воспроизводить сложные нелинейные зависимости. Способность к моделированию нелинейных процессов, работе с зашумленными данными и адаптивность дают возможность применять нейронные сети для решения широкого класса экономических задач.

В последние несколько лет на основе нейронных сетей было разработано много программных систем для применения в таких вопросах, как прогнозирование и оценка экономических параметров, например, состояния предприятия, кредитоспособности заёмщика, вероятности банкротства предприятия, контроль за инвестициями, размещение займов и т. д. Нейронные сети обучают на примерах.

Процесс обучения в нейронных сетях стимулирует желательные образцы активации и блокирует нежелательные, основываясь на доступных данных. Для достижения определенного обобщения знаний в нейронной сети разрабатывается алгоритм обучения. Функция ошибки, определенная на выходе нейронной сети, или энергетическая функция, определенная при активации элементов сети, характеризует качество нейронной сети в обобщении знаний. Обучающий набор данных в этом случае должен состоять из образцов представления знаний, которым предполагается обучить нейронную сеть. Алгоритм обучения действует методом изменения либо весов (т. е. силы связей между узлами), либо выходов нейронной сети, либо структуры нейронной сети, стремясь к минимальным ошибкам или энергии, основываясь на обучающих данных.

В системах нейронных сетей большое количество парадигм обучения. Обучение с учителем (контролируемое обучение) и обучение без учителя (неконтролируемое обучение) — вот две главные парадигмы, обычно используемые в проектировании обучающих алгоритмов. В парадигме обучения с учителем желаемый выход определяется обучающими образцами данных для каждого образца входа [5].

Процесс обучения пытается минимизировать «дистанцию» между фактическими и желаемыми выходами нейронной сети. Противоположностью обучения с учителем является обучение без учителя. Когда используется такая парадигма, подразумевается несколько образцов входа. Предполагается, что в процессе обучения нейронная сеть обнаруживает существенные особенности входов. В отличие от обучения с учителем, здесь не существует априорного набора желаемых значений выхода. Нейронная сеть должна развить собственное представление стимулов входа без помощи учителя.

Это открывает новые перспективы для систематизации многочисленной экспериментальной информации в таких областях знаний, где традиционно трудно приживается математический формализм, например, в медицине, психологии и истории.

Литература

1. Джеффри Е. Хинтон. Как обучаются нейронные сети. // В мире науки - 2012. -№11 - С. 103-107.

2. Лазарев В. М., Свиридов А. П. Нейросети и нейрокомпьютеры. Монография. - М.: Академия, 2011. - 131 с.

3. Нейроматематика / Под ред. Галушкина А. И. - М.: ИПРЖР, 2013. - 307 с.

4. Нечаев В. В., Свиридов А. П., Слесарев Д. А., Симонов В. Л. Слесарева Н. А., Алкадарский С. А. и др. Нечёткие и нейро-нечёткие системы. Учебное пособие и лабораторный практикум на основе Fuzzy Logic Toolbox. Научный редактор -проф. Свиридов А. П. -М.: МИРЭА, 2010. - 111 с.

5. Садовой А. В., Сотник С. Л. Алгоритмы обучения нейронных сетей будущего. [Электронный ресурс]. Режим доступа: http://www.alicetele.com/~sergei/articles/algo/algo.htm.

6. Хайкин Саймон. Нейронные сети: Полный курс: Пер. с англ. / С. Хайкин. — М.: Вильямс, 2008. — 1103 с.

Времена Вселенной Романенко В. А.

Романенко Владимир Алексеевич /Romanenko Vladimir Alekseevich - ведущий инженер-

конструктор,

Нижнесергинский метизно-металлургический завод, г. Ревда

Аннотация: рассматриваются времена во Вселенной, и устанавливается связь между ними на основе плотности пространственного вакуума. Анализируются параметры модели Эйнштейна-де Ситера при максимальном радиусе 3-мерного пространства.

Abstract: the relevant time in the universe, and a connection is established between them on the basis of the density of the space vacuum. Analyzes the parameters of the model of Einstein-de Seater with a maximum radius of 3-dimensional space.

Ключевые слова: энергия, плотности вакуума, вещества, излучения, гравитационное время и время существования излучения, космологический член.

Keywords: the energy density of the vacuum, matter, radiation, gravity and time the existence of radiation, the cosmological term.

1. Введение

Статья основывается на предыдущей работе автора [5] и исследует возникновение времён во Вселенной. Подход основан на двух вопросах, возникающих при рассмотрении Начала, а именно: из холодного или горячего состояния начался процесс расширения? Автор считает, что оба состояния имели место, но происходили они в разных временах.

Эти времена удалось связать через плотности вакуума, материи и излучения. В результате выяснилась связь времени излучения с другим временем - временем длительности и его временной проекцией. Само время излучения оказалось эквивалентно времени Хаббла. Оба всём этом подробно рассказано в последующих разделах.

2. Полная энергия плоской Вселенной

В работе [5, ф. (5.5 ж)] была получена формула полной энергии Вселенной, имеющая вид:

Перспективы развития и применения нейронных сетей Текст научной статьи по специальности «Компьютерные и информационные науки»

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Абрагин Артур Викторович

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Абрагин Артур Викторович

Текст научной работы на тему «Перспективы развития и применения нейронных сетей»