Научная статья на тему 'АЛГОРИТМЫ И ПРИЛОЖЕНИЯ МАШИННОГО ОБУЧЕНИЯ: ОБЗОР МАТЕМАТИЧЕСКОЙ МОДЕЛИ'

АЛГОРИТМЫ И ПРИЛОЖЕНИЯ МАШИННОГО ОБУЧЕНИЯ: ОБЗОР МАТЕМАТИЧЕСКОЙ МОДЕЛИ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
0
0
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
машинное обучение / анализ данных / математическая модель / machine learning / data analysis / mathematical model

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Федотов Р.Р., Белозеров В.С.

В статье рассматривается математическая модель машинного обучения, которая представляет собой алгоритм, способный обучаться на основе данных и делать прогнозы. Модель описывает процесс анализа данных, выбора признаков и определения оптимальных параметров модели. Статья будет интересна специалистам в области математики и информатики, а также всем, кто интересуется применением машинного обучения в различных областях науки и техники.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

ALGORITHMS AND APPLICATIONS MACHINE LEARNING: OVERVIEW OF THE MATHEMATICAL MODEL

The article discusses a mathematical model of machine learning, which is an algorithm capable of learning from data and making predictions. The model describes the process of analyzing data, selecting features, and determining optimal model parameters. The article will be of interest to specialists in the field of mathematics and computer science, as well as anyone interested in the application of machine learning in various fields of science and technology.

Текст научной работы на тему «АЛГОРИТМЫ И ПРИЛОЖЕНИЯ МАШИННОГО ОБУЧЕНИЯ: ОБЗОР МАТЕМАТИЧЕСКОЙ МОДЕЛИ»

УДК 004 Федотов Р.Р., Белозеров В. С.

Федотов Р.Р.

магистрант

Уральский государственный экономический университет (г. Екатеринбург, Россия)

Белозеров В.С.

магистрант

Уральский государственный экономический университет (г. Екатеринбург, Россия)

АЛГОРИТМЫ И ПРИЛОЖЕНИЯ МАШИННОГО ОБУЧЕНИЯ: ОБЗОР МАТЕМАТИЧЕСКОЙ МОДЕЛИ

Аннотация: в статье рассматривается математическая модель машинного обучения, которая представляет собой алгоритм, способный обучаться на основе данных и делать прогнозы. Модель описывает процесс анализа данных, выбора признаков и определения оптимальных параметров модели. Статья будет интересна специалистам в области математики и информатики, а также всем, кто интересуется применением машинного обучения в различных областях науки и техники.

Ключевые слова: машинное обучение, анализ данных, математическая модель.

В настоящее время область искусственного интеллекта (ИИ) активно развивается, и машинное обучение играет в этом ключевую роль. Оно позволяет компьютерам учиться на основе данных без явного программирования, что делает его особенно полезным для решения сложных задач, таких как распознавание образов, обработка естественного языка и рекомендательные системы. Однако создание эффективной модели машинного обучения требует глубоких знаний в области математики и статистики. В

данной статье мы рассмотрим математическую модель машинного обучения, которая может быть использована для создания интеллектуальных систем.

Современные нейросети активно применяются в процессе обработки информации, включая классификацию текстовых документов. Их работа схожа с деятельностью нейронов человеческого мозга. При получении внешнего сигнала нейрон способен генерировать ответный импульс, который передаётся по аксону к другим нейронам. Скорость реакции нейрона составляет около одной миллисекунды, что значительно медленнее, чем у компьютеров, где подобные операции занимают всего несколько наносекунд.

Высокая "вычислительная эффективность" мозга обусловлена одновременной работой его нейронов, в то время как в компьютере все эти процессы происходят последовательно, что является ключевым препятствием для использования нейронных сетей.

Представим себе задачу создания и обучения искусственной нейронной сети, которая представляет собой довольно распространенную топологию, описываемую системой дифференциальных уравнений с задержками, вызванными конечным временем передачи сигналов от входных сигналов к синаптическим выходам (от одного нейрона к другому). Для решения этой задачи оптимальные весовые коэффициенты нейронной сети определяются с использованием математического аппарата теории оптимального управления, а также применяется теория решения дискретных задач с использованием методов нелинейного программирования.

Динамическое поведение нейронной сети определяется такими факторами, как входные данные, структура сети и физические характеристики отдельных элементов. Учитывается задержка при передаче сигналов от одного нейрона к другому. Взаимодействие нейронов описывается весовыми коэффициентами которые отражают степень влияния нейронов друг на друга: является ли связь возбуждающей, подавляющей, нейтральной или полностью отсутствует. Рассмотрим строение нейрона на рисунке 1.

Нейроны действуют как относительно простые элементы, которые имитируют работу нейронов в мозге. Искусственно созданные нейроны и их естественные прототипы представляют собой группу синапсов (входов), соединенных с выходом других нейронов (х1 ... хп), а выходные соединения этого нейрона — аксоны (у), из которых сигналы возбуждения или торможения поступают в синапсы других нейронов.

Искусственные нейроны состоят из двух элементов: взвешенного сумматора (Г) и нелинейного преобразователя (1^)). На вход искусственного нейрона поступает определенный набор сигналов, каждый из которых является выходным другого нейрона. Каждый входной сигнал умножается на соответствующий вес ... шп), аналогичный синоптической силе, и все выходные данные суммируются для определения уровня активации нейрона

[8][15].

Взвешенный сумматор производит суммирование по формуле:

п

где, п - номер входа нейрона, I - номер входа нейрона, ] - номер нейрона в слое, I - номер слоя,

- входные сигналы, совокупность входных сигналов образуют входной вектор X,

wi - весовые коэффициенты, совокупность коэффициентов весов образует вектор весов Ш,

w0 - вес, моделирующий пороговый уровень нейрона, часто равен 1. Другой вариант записи:

5 = ХТШ (2)

где, Хт - транспонированный вектор входных сигналов нейрона, подающихся на вход,

Ш - вектор весов.

Выход сумматора преобразуется нелинейным элементом по формуле:

УЦ = ГЫ (3)

где, - функция активации.

Функция активации подбирается под специфику решаемой задачи. В случае данной работы будет использован сигмоида:

1

БЬдтоЬ й(х) = ——— (4)

1 + е х

График функции представлен на рисунке 2.

1,2

о,е 0,6 ол

0,2 0

№ ® ^ й 1Й ч ЛУГ ГЧГЧ ЧН СЗ О"1 ГЧ ГП 1Л Г-? ЕС ф

и I I I I I ! г ■ » 1 Г Т «н

Рисунок 2. График сигмоиды.

Эта функция реализована в библиотеке PyTorch в качестве метода sigmoid(), что позволяет не описывать её вручную. Данный метод небинарен и нелинеен. Сигмоида является очень популярной функцией в данное время, так как не приводит к ошибкам в случае больших значений, а также за качественное сглаживание значений взвешенного сумматора [15][21].

СПИСОК ЛИТЕРАТУРЫ:

1. Барский. А.Б. Нейронные сети: распознавание, управление, принятие решений. М.: Финансы и статистика, 2007. 174 с;

2. Васильев А.Н., Тархов Д.А. Принципы и техника нейросетевого моделирования Москва: Гостехиздат, 2015. 334 с;

3. Вороновский Г.К., Махотило К.В., Петрашев С.Н., Сергеев С.А. Генетические алгоритмы, искусственные нейронные сети и проблемы виртуальной реальности. Х.: ОСНОВА, 1997. 112 с;

4. Галушкин А.И. Нейрокомпьютеры. Учебное пособие. М.: Альянс, 2014. 528 с;

5. Гелиг А.Х., Матвеев А.С. Введение в математическую теорию обучаемых распознающих систем и нейронных сетей. Учебное пособие: моногр. М.: Издательство СПбГУ, 2014. 224 с;

6. Заенцев И.В. Нейронные сети: основные модели. Воронеж: Изд-во Воронежского госуд. ун-та, 1999. 76 c;

7. Редько В.Г. Эволюция, нейронные сети, интеллект: Модели и концепции эволюционной кибернетики. Москва: Наука, 2017. 224 с;

8. Редько В.Г. Эволюция, нейронные сети, интеллект: Модели и концепции эволюционной кибернетики. Москва: Наука, 2017. 224 c;

9. Haykin S. Neural networks: a comprehensive foundation. Upper Saddle River, N.J.: Prentice Hall, 1999. 842 с

Fedotov R.R., Belozerov V.S.

Fedotov R.R.

Ural State Economic University (Ekaterinburg, Russia)

Belozerov V.S.

Ural State Economic University (Ekaterinburg, Russia)

ALGORITHMS AND APPLICATIONS MACHINE LEARNING: OVERVIEW OF THE MATHEMATICAL MODEL

Abstract: the article discusses a mathematical model of machine learning, which is an algorithm capable of learning from data and making predictions. The model describes the process of analyzing data, selecting features, and determining optimal model parameters. The article will be of interest to specialists in the field of mathematics and computer science, as well as anyone interested in the application of machine learning in various fields of science and technology.

Keywords: machine learning, data analysis, mathematical model.

i Надоели баннеры? Вы всегда можете отключить рекламу.