Научная статья на тему 'ПРИМЕНЕНИЕ НЕЙРОННЫХ СЕТЕЙ'

ПРИМЕНЕНИЕ НЕЙРОННЫХ СЕТЕЙ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
65
13
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ДАННЫЕ / НЕЙРОННАЯ СЕТЬ / НАБЛЮДЕНИЕ / СТАТИСТИЧЕСКИЙ АНАЛИЗ / DATA / NEURAL NETWORK / OBSERVATION / STATISTICAL ANALYSIS

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Макаров Д.А., Шибанова А.Д.

В данной статье рассмотрена технология применения нейронных сетей. Проведен анализ процессов сбора данных для обучения нейронной сети, включая случай, когда данные недостоверны. Указана область применения каждого из них. Сделан вывод об актуальности технологии нейронных сетей, описаны плюсы ее применения.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Макаров Д.А., Шибанова А.Д.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

APPLICATION OFNEURAL NETWORKS

This article describes the technology of the use of neural networks. The analysis of data collection processes for neural network training was conducted, including the case when the data is unreliable. The scope of each of them is indicated. The conclusion is made about the relevance of the technology of neural networks, the advantages of its application are described.

Текст научной работы на тему «ПРИМЕНЕНИЕ НЕЙРОННЫХ СЕТЕЙ»

МАТЕМАТИКА, ИНФОРМАТИКА И ИНЖЕНЕРИЯ

УДК 004.85

Макаров Д.А. студент

факультет «Информатика и системы управления»

Шибанова А.Д. студент

факультет «Робототехника и комплексная автоматизация»

Московский государственный технический университет имени Н.Э. Баумана Россия, г. Москва ПРИМЕНЕНИЕ НЕЙРОННЫХ СЕТЕЙ Аннотация: в данной статье рассмотрена технология применения нейронных сетей. Проведен анализ процессов сбора данных для обучения нейронной сети, включая случай, когда данные недостоверны. Указана область применения каждого из них. Сделан вывод об актуальности технологии нейронных сетей, описаны плюсы ее применения.

Ключевые слова: данные, нейронная сеть, наблюдение, статистический анализ.

Makarov D.A. student

Faculty of Informatics and Management Systems Moscow State Technical University named after N.E.

Bauman Russia, Moscow Shibanova A.D. student

Faculty of Robotics and complex automation Moscow State Technical University named after N.E.

Bauman Russia, Moscow APPLICATION OFNEURAL NETWORKS Annotation: this article describes the technology of the use of neural networks. The analysis of data collection processes for neural network training was conducted, including the case when the data is unreliable. The scope of each of them is indicated. The conclusion is made about the relevance of the technology of neural networks, the advantages of its application are described.

Keywords: data, neural network, observation, statistical analysis.

Процесс работы и обучения нейронной сети влияет на то, для решения каких задач она может применяться. Сеть можно применять в ситуации, когда на основе каких-то исходных данных необходимо получить нужную

информацию. Вот некоторые примеры таких задач: прогноз ситуации на фондовом рынке, оценивание кредитной истории, управление роботом по изображению с камер и т.д. Обычно нейронная сеть используется в случае, когда связь между входными и выходными сигнала неочевидна, эту связь нейросеть будет обнаруживать в ходе процесса обучения. Для обучения нейронных сетей используются 2 алгоритма: обучение с учителем и без него. Чаще всего применяется первая разновидность обучения [1].

Для обучения с учителем необходимы готовые данные, которые представляют собой примеры входных данных и выходов, которые им соответствуют. Благодаря им сеть учится находить связь между входным и выходным сигналом. Обычно обучающие данные берутся из исторических сведений. Это могут быть стоимости акций, значения фондового рынка, правильные реакции робота на ситуации и т.д. Обучение нейросети происходит за счет использования алгоритма обучения (наиболее известным из них является метод обратного распространения), при котором веса нейронов изменяются в зависимости от размера ошибки, то есть отклонения выходного сигнала от истинных значений. После обучения сеть получает способность прогнозировать результат, основываясь на имеющихся данных. Возможности нейронных сетей ограничиваются диапазоном данных. Если у данных нестандартный масштаб, есть пропущенные значения или данные нечисловые. В таких случаях данные необходимо масштабировать, пропущенные значения заменять на средние значения [2].

Если данные имеют нечисловой характер, то они обычно бывают представлены в виде номинальных переменных типа Пол = {Муж , Жен } и т.д. Такие переменные реально представить в числовом виде, однако, нейронные сети не дают хороших результатов при работе с номинальными переменными, которые могут принимать много разных значений.

Пусть перед нами стоит задача оценивания стоимости недвижимости. В первую очередь стоимость недвижимости зависит от района города, в котором она расположена. Районов в городе может быть более десяти, и кажется разумным использовать для их обозначения номинальные значения. Однако, это негативно скажется на обучении нейронной сети, и лучше, и лучше использовать рейтинг районов, основанный на экспертных оценках. Таким образом, нечисловые данные иных типов необходимо преобразовать в числовой вид, либо отбросить.

Проблема определения количества данных для обучения сети достаточно сложна. Известно правило, которое связывает количество данных с размером сети, в простейшем случае число наблюдений должно быть в десять раз больше числа связей в сети. Так же количество наблюдений для обучения зависит от сложности данных, подаваемых на вход (например, распознавание цифр требует меньше данных для обучения, чем распознавание предметов) [3]. Однако с ростом количества переменных возникает "проклятие размерности": количество требуемых наблюдений

растет нелинейно, так что уже при довольно небольшом (например, пятьдесят) числе переменных может потребоваться огромное число наблюдений.

Обычно, для реальных задач достаточно нескольких сотен или тысяч наблюдений. Для сложных задач количество обучающих данных увеличивается, однако, даже для простых задач необходимо более чем сто наблюдений. Если данных меньше, чем здесь сказано, то на самом деле у Вас недостаточно информации для обучения сети, и лучшее, что Вы можете сделать - это попробовать подогнать к данным некоторую линейную модель.

В реальных задачах данные не всегда достоверны. Значения некоторых переменных могут быть искажены, или даже отсутствовать. Однако, нейронные сети в целом устойчивы к шумам [4]. Но у этой устойчивости есть предел. К примеру, значения, которые сильно превышают средние значения для данного набора данных (выбросы), могут исказить результат обучения. В таких случаях лучше всего постараться обнаружить и удалить эти выбросы (либо удалив соответствующие наблюдения, либо преобразовав их). После этого исправленные данные можно подавать на вход нейронной сети для ее обучения.

Нейронные сети используются независимо или в качестве дополнения к традиционным методам статистического анализа. Данный способ одинаково подходит как для линейных, так и для сложных нелинейных зависимостей. Его эффективность особенно проявляется в ситуации, когда необходимо выяснить, имеются ли зависимость между данными. При этом они могут быть разного качества (неполными, противоречивыми и т.д.). Если между данными есть какая-то зависимость, которую не обнаружили корреляционные методы, то нейронная сеть способна ее обнаружить. Современные возможности нейронных сетей позволяют: оценивать сравнительную важность различных видов входной информации, уменьшать ее объем без потери существенных данных, распознавать симптомы приближения критических ситуаций и т.д. Применение нейронных сетей возможно в любых областях деятельности человека. Они обеспечивают значительное повышение уровня автоматизации, и тем самым обеспечивается их растущая популярность.

Использованные источники:

1. С. Николенко, А. Кадурин, Е. В. Архангельская. Глубокое обучение. Погружение в мир нейронных сетей - Санкт-Петербург: Питер, 2018. - 481 с.

2. С. Хайкин. Нейронные сети. Полный курс. - Москва: Вильямс, 2018. -1104 с.

3. Основы ИНС. [Электронный ресурс]. Режим доступа: https://neuralnet.info/chapter/основы-инс/ (дата обращения 03.01.2019).

4. Нейронные сети — математический аппарат. [Электронный ресурс]. Режим доступа: https://basegroup.ru/community/articles/math (дата обращения 03.01.2019).

i Надоели баннеры? Вы всегда можете отключить рекламу.