Научная статья на тему 'ПЕРЦЕПТРОН В ЗАДАЧАХ БИНАРНОЙ КЛАССИФИКАЦИИ'

ПЕРЦЕПТРОН В ЗАДАЧАХ БИНАРНОЙ КЛАССИФИКАЦИИ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
272
28
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ПЕРЦЕПТРОН / ЗАДАЧИ БИНАРНОЙ КЛАССИФИКАЦИИ / НЕЙРОННЫЕ СЕТИ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Митина Ольга Алексеевна, Ломовцев Павел Павлович

В настоящее время в России растет объем продукции, производимой предприятиями. Одной из серьезных проблем для российских предприятий является создание системы автоматического определения категории товара, позволяющей обеспечить безошибочную сортировку различных объектов. Очередной товар необходимо отнести к верному классу в зависимости от его характеристик. Перцептрон - один из наиболее популярных методов решения задачи классификации. Автоматизация процесса разделения товаров по их свойствам облегчит работу сотрудникам сортировочного центра и исключит возможность ошибки вследствие человеческого фактора.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

PERCEPTRON IN BINARY CLASSIFICATION PROBLEMS

Currently, the volume of products manufactured by enterprises is growing in Russia. One of the serious problems for Russian enterprises is the creation of a system for automatic determination of the category of goods, which makes it possible to ensure error-free sorting of various objects. The next product must be attributed to the correct class, depending on its characteristics. The perceptron is one of the most popular methods for solving the classification problem. Automation of the process of separating goods by their properties will facilitate the work of the employees of the sorting center and eliminate the possibility of errors due to human factors.

Текст научной работы на тему «ПЕРЦЕПТРОН В ЗАДАЧАХ БИНАРНОЙ КЛАССИФИКАЦИИ»

Список литературы

1. Савельев С.Н. Поверхностное упрочнение деталей, восстановленных

нитроцементацией и борированием: диссертация ... кандидата технических наук : 05.16.01. - Курск, 2003. - 138 с.: ил. РГБ ОД, 61 03-5/1827-5.

2. Чудина О.В. Комбинированные методы поверхностного упрочнения сталей с применением лазерного нагрева: теория и технология. М.: МАДИ (ГТУ), 2003. 248 с.

3. Чудина О.В. Моделирование процессов азотирования железной матрицы, дискретно легированной при лазерном нагреве/Упрочняющие технологии и покрытия. 2007. № 4. - С. 24-28.

4. Крукович М.Г., Бирюков В.П., Сизов И.Г. Изменение морфологии боридных слоев путем лазерной и электронно-лучевой обработки// Техника и технологии XXI века. В сб. статей международного научного е-симпозиума. Россия, г. Москва, 29-30 марта 2016 г. - Киров: МЦНИП, 2016. - С. 10 - 20.

5. Крукович М.Г. Расчет эвтектической температуры и концентраций в многокомпонентных системах. МиТОМ, -№10, 2005. - С. 9-17.

6. Крукович М.Г. Построение части поверхности солидус схемы многокомпонентной диаграммы Fe-Cr-Mn-C-Б./Новые материалы и технологии. 2019, № 30. С. 50 - 54.

7. Krukovich M.G., Prusakov B.A., Sizov I.G. Plasticity of Boronized Layrs/ Springer Series in Materials Science, V. 237. - Springer International Publishing Switzerland 2016. - 364 pp.

8. Крукович М.Г., Прусаков Б.А., Сизов И.Г. Пластичность борированных слоев. -М.: ФИЗМАТЛИТ, 2010. - 384 с.

9. Krukovich M.G. Technology to Improve the Performance Properties of Heterogeneous Boronized Layers. Materials Performance and Characterization 9. Published ahead of print, 15 May 2020, https://doi.org/10.1520/MPC20190091.

10. Jiang P.F., Zhang C.H., Zhang S., Zhang J.B., Chen J., Liu Y. Fabrication and wear behavior of TiC reinforced FeCoCrAlCu-based high entropy alloy coatings by laser surface alloying //Materials Chemistry and Physics. 2020 DOI:10.1016/j.matchemphys.2020.123571.

11. Yanzhou Li et al. Phase assemblage and wear resistance of laser-cladding Al0,8FeCoNiCrCu0,5 Siх high-entropy alloys on aluminum // Materials Research Express. 2020.DOI:10.1088/2053-1591/aba9f7.

ПЕРЦЕПТРОН В ЗАДАЧАХ БИНАРНОЙ КЛАССИФИКАЦИИ

Митина Ольга Алексеевна

кандидат пед. наук., МИРЭА - Российский технологический университет,

г. Москва Ломовцев Павел Павлович студент 2 курса,

МИРЭА - Российский технологический университет,

г. Москва

PERCEPTRON IN BINARY CLASSIFICATION PROBLEMS

Mitina Olga Alekseevna

Candidate of Science MIREA - Russian Technological University

Moscow

Lomovtsev Pavel Pavlovich

2nd year student MIREA - Russian Technological University

Moscow

АННОТАЦИЯ

В настоящее время в России растет объем продукции, производимой предприятиями. Одной из серьезных проблем для российских предприятий является создание системы автоматического определения категории товара, позволяющей обеспечить безошибочную сортировку различных объектов. Очередной товар необходимо отнести к верному классу в зависимости от его характеристик.

Перцептрон - один из наиболее популярных методов решения задачи классификации. Автоматизация процесса разделения товаров по их свойствам облегчит работу сотрудникам сортировочного центра и исключит возможность ошибки вследствие человеческого фактора.

ANNOTATION

Currently, the volume of products manufactured by enterprises is growing in Russia. One of the serious problems for Russian enterprises is the creation of a system for automatic determination of the category of goods, which makes it possible to ensure error-free sorting of various objects. The next product must be attributed to the correct class, depending on its characteristics.

The perceptron is one of the most popular methods for solving the classification problem. Automation of the process of separating goods by their properties will facilitate the work of the employees of the sorting center and eliminate the possibility of errors due to human factors.

Ключевые слова: перцептрон; задачи бинарной классификации; нейронные сети. Keywords: perceptron; binary classification tasks; neural networks.

Классификация - один из разделов машинного обучения, посвященный решению задачи на множестве объектов (ситуаций), разделённых некоторым образом на классы. Задано конечное множество объектов, для которых известно, к каким классам они относятся. Классовая принадлежность остальных объектов не известна.

Бинарная классификация - разбиение исходного множества объекта на два различных подмножества таким образом, чтобы характеристики объектов отличались друг от друга, но внутри каждого из подмножеств свойства были схожи [1].

Задача бинарной классификации - одна из задач обучения с учителем (англ. Supervised learning). Это означает, что для того, чтобы алгоритм работал правильно, ему нужны объективные данные. На каждом шаге результат работы алгоритма будет сравниваться с уже

существующим единственно верным результатом и если он окажется неверным, необходимо корректировать параметры классификатора до тех пор, пока не получится верный результат.

Задача бинарной классификация требует внимательного подхода к выбору алгоритма, а также к его обучению (корректировки параметров).

Мы будем использовать один из алгоритмов бинарной классификации - перцептрон, который моделирует работу человеческого мозга.

По определению перцептрон - математическая модель восприятия информации головным мозгом, предложенная Фрэнком Розенблаттом в 1957 году. Данный алгоритм стал одной из первых нейросетей в мире [2].

Перцептрон состоит из трёх типов элементов, а именно: поступающие от датчиков сигналы передаются ассоциативным элементам, а затем реагирующим элементам [2].

Рисунок 1 Логическое представление перцептрона с тремя уровнями

На рисунке 1 показана логическая схема перцептрона с тремя выходами, которая показывает, каким образом входные данные преобразуются в выходные, проходя обучение через один А-слой.

Алгоритм широко применяется в различных сферах: в медицине, в информационной безопасности, классификации товаров по качеству, в криминальном деле, в задачах распознавания изображений.

Перцептроны позволяют создать набор «ассоциаций» между входными стимулами и необходимой реакцией на выходе. В биологическом плане это соответствует преобразованию, например, зрительной информации в физиологический ответ от двигательных нейронов.

Для оценки качества классификации необходимо рассчитать все необходимые метрики, которые позволят определить, насколько хорошо модель предсказывает класс очередного объекта.

Под метрикой в задачах машинного обучения понимают количественный показатель (в долях),

который показывает ту или иную характеристику классификатора [6].

Метод оценки качества классификации -инструментарий для количественной оценки результатов классификации [3].

Принято выделять две группы методов оценки качества классификации:

• внешние (англ. External) меры основаны на сравнении результата классификации с априори известным разделением на классы;

• внутренние (англ. Internal) меры отображают качество кластеризации только по информации в данных [5].

Мы будем использовать внешнюю меру оценки качества классификации, т. е. по данным с априори известным реальным распределением данных.

В настоящее время специалисты по машинному обучению используют следующие метрики для оценки качества классификации: accuracy, precision, recall, F-мера [6].

Принято считать, что модель должна быть сбалансированной, то есть данные метрики должны

быть не менее 0.7 на тестовом наборе данных -наборе, который модель видит впервые, иначе модель будет плохо классифицировать новые объекты.

Итак, классификация по двум классам, или бинарная классификация, является едва ли не самой распространенной задачей машинного обучения. Рассмотрим пример бинарной классификации на наборе данных, в которых присутствует бинарный признак.

В нашем случае такой столбец описывает наименование цитруса:

• «1» - апельсин;

• «-1» - грейпфрут.

На рисунке 2 представлены данные, на которых будет производится тестирование, где:

• name - целевой столбец факторного типа данных;

• diameter - диаметр фрукта, числового типа данных;

• weight - вес фрукта, числового типа данных;

• red - оттенок красного у фрукта, числового типа данных;

• green - оттенок зеленого у фрукта, числового типа данных;

• blue - оттенок синего у фрукта, числового типа данных [8].

Ж. name diameter weight red green blue

1 1 2.96 86.76 172 &5 2

2 J 3.91 88.05 166 78 3

3 J 95.17 156 81 2

4 1 ¿47 95.60 163 &' 4

5 J 448 95.76 16J 72 9

б J 4.59 95.86 142 100 2

7 1 4,64 97.94 156 &5 2

8 J 4.65 98.50 142 74 2

9 J 4.68 100.20 159 90 16

10 1 4.69 100.31 16' 76 6

Рисунок 2 Описание тренировочных данных

Для реализации перцептрона будем использовать язык программирования высокого уровня R для статистической обработки данных и работы с графикой, а также свободную программную среду вычислений с открытым исходным кодом в рамках проекта GNU [6].

В настоящее время язык R используется в крупных компаниях для анализа, визуализации данных, а также для сложных математических операций. Преимуществом этого языка программирования является то, что все операции векторизованы, что исключает явное использование циклов в программном коде [7].

Импортировав данные в рабочую среду R, разделим исходные данные на обучающую и валидационную выборку. Обучающая выборка используется собственно для «обучения» той или иной модели, т.е. для построения математических отношений между некоторой переменной-откликом и предикторами, тогда как валидационная выборка служит для получения оценки прогнозных свойств модели на новых данных, т.е. данных, которые не были использованы для обучения модели.

На вход подается матрица признаков объекта и целевой столбец, в котором отражено достоверное распределение предсказываемой переменной. Далее производятся шаги инициализации атрибутов класса «Перцептрон»:

1. Инициализируем вектор весов нулями.

2. Инициализируем bias параметр b = 0.

3. В начальный момент времени номер итерации t = 0.

4. Задаем шаг обучения learning rate = 0.1

5. Пока t меньше лимита итераций, выполнять:

5.1 Случайно выбираем объект (x[i], y[i]) из тренировочной выборки, где x[i] - вектор признаков объекта, y[i] - объективный класс объекта (1 или -1).

5.2 Если знаки результата предсказания перцептрона и y[i] различны, то это означает, что перцептрон дал неверный ответ, а значит необходимо изменить значения весов:

w[i] = w[i] + learningRate * y[i] * x[i] (1)

5.3 Обновляем счетчик итераций t = t + 1.

Таким образом, финальное значение вектора

весов позволяют классифицировать новый объект

х. Если (¿3, х) > 0, то мы относим объект к классу Класс будет иметь два метода - fit (обучение)

+1, в противном случае мы относим объект и predict (предсказание). к классу -1.

fit = functionCx, у){ while (selfSt < self$t_rrax:'{ selfjt <- selfit + 1 idx. <- sarrpl e(c(l: (length 'y))), 1)

if CCyiidx] - (X[idx, ] %-% self Speights + selfib)) <= OH selfib <- selfib - self$learning_rate * y[idx]

selfiweights <- selfiweights - self$learning_rate * у "idx] * X[idx, ]

}

}

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

pri nt(sel f) return (self)

},

Рисунок 3 Реализация алгоритма обучения перцептрона

После того, как перцептрон обучится, его необходимо протестировать, поскольку основное предназначение перцептрона - предсказывать класс очередного объекта по его характеристикам. Реализуем метод предсказания с учетом условия

отнесения объекта к классу: если скалярное произведение признаков на веса больше нуля, то объект относится к классу +1, в противном случае -1.

Рисунок 4 Реализация метода предсказания перцептрона

Итак, реализован класс «Перцептрон», который можно использовать для решения задачи классификации данных.

Создадим экземпляр класса и обучим его на обучающей выборке для тестирования работы

алгоритма. Подадим в качестве входных данных Х_таш (матрица признаков) и у_таш (объективные значения целевого столбца).

#_

.FITTING MODEL AND TEST IT_

moc:el <- Perceptron$new(nuin_features=ncol (X_train) , learni ng_cate=0.1, t_max = 4000) moc;el îfit(X_train, y_train)

Рисунок 5 Создание экземпляра класса и обучение

Предскажем классы объектов из валидационной выборки.

predictions <- as.factor(modelipredict(X_test))

Проверим результаты тестирования, выразив метрики в процентах.

> print (paste С'Аккуратность вашей модели составила: '. cei ling(score_test 100), 'Ж')) [1] "Аккуратность вашей модели составила: 90 %"

> print (paste ('Точность вашей модели составила: ', ceil i ngCprecisioiv'-'lOO) , '%')')

[1] ''Точность вайей модели составила: 97 Ж™

> print(paste('Полнота вашей модели составила:', cei ling(recall-100) , '%')) [1] ''Полнота вайей модели составила: S3 %"

> print(pa.ste(' F-мера вашей модели составила: 1, cei 1 ing(Fl_score~--100) , '%')) [1] "F-мера вашей модели составила: 90 %"

Рисунок 6 Вывод метрик качества классификации

Все необходимые метрики более 70%, следовательно, модель работает правильно.

Далее проверим, соответствует ли предсказанное распределение объективному. Для этого результат необходимо визуализировать.

Создадим датафрейм с двумя признаками: предсказанные значения (predictions) и реальные значения (y_test). Построим гистограмму распределений каждого из признаков и убедимся в том, что они действительно схожи.

Рисунок 7 Предсказанное распределение объектов по классам

Перцептрон определил грейпфрутов больше, чем апельсинов. Сравним результат с реальным.

Рисунок 8 Реальное распределение объектов по классам

Таким образом, классификационный анализ цитрусов показал, что перцептрон справляется с задачей бинарной классификации.

Существует большое количество примеров применения алгоритмов классификации, такие как: задачи медицинской диагностики, предсказание месторождений полезных ископаемых, оценка кредитоспособности заемщиков, то есть случаи, где решения принимаются на основании

принадлежности данных к одному из выделенных классов.

Перцептрон - один из наиболее популярных подходов для решения задач бинарной или мульти-классовой классификации.

Благодаря таким технологиям жизнь может стать проще, а принимаемые решения - точнее и дешевле.

Список литературы

1. Горяинова, Е.И. Методы бинарной классификации объектов с номинальными показателями / Е.И. Горяинова // Журнал Новой экономической ассоциации № 2 (14), C. 27-49. -2017. - С. 35

2. Warren S. McCulloch and Walter Pitts. Логическое исчисление идей, относящихся к нервной активности = A logical calculus of the ideas immanent in nervous activity // Bulletin of Mathematical Biology. - New York: Springer New York, 1943. - Т. 5, № 4. - С. 115—133.

3. Жуков, Д.А. Анализ критериев классификации при диагностике функционирования технического объекта / Д.А. Жуков // Mathematical modelling. - 2018. - С. 13

4. Роберт Кабаков. R в действии. - ДМК-Пресс, 2018. - 588 с.

5. Айвазян С. А., Бухштабер В. М., Енюков И. С., Мешалкин Л. Д. Прикладная статистика: Классификация и снижение размерности. - Москва: Финансы и статистика, 2019 - 571 с.

6. НаЬг. сот [Электронный ресурс]. - Режим доступа:

https://habr.com/ru/company/ods/blog/328372/ - Дата доступа: 17.04.2021.

7. Мастицкий, С.Э. Статистическй анализ и визуализация данных с помощью R / С.Э. Мастицкий. - Москва: 2017. - 172 с.

8. Kaggle.com [Электронный ресурс]. -Режим доступа: https://www.kaggle.com/joshmcadams/oranges-vs-grapefruit?select=citrus.csv. - Дата доступа: 17.04.2021.

КАТАЛИЗИРУЕМАЯ ДЕЛИГНИФИКАЦИЯ ПШЕНИЧНОЙ СОЛОМЫ ПЕРУКСУСНОЙ КИСЛОТОЙ

Пен Роберт Зусьевич

доктор технических наук, профессор Сибирский государственный университет науки и технологий имени М. Ф. Решетнева

г. Красноярск Шапиро Ида Львовна кандидат технических наук Сибирский государственный университет науки и технологий имени М. Ф. Решетнева

г. Красноярск Коркина Милия Александровна Старший лаборант Сибирский государственный университет науки и технологий имени М. Ф. Решетнева

г. Красноярск

DELIGNIFICATION OF THE WHEAT STRAW BY PERACETIC ACID WITH CATALYTIC AGENTS USE

Pen Robert

Doctor of Technical Sciences, Professor Reshetnev Siberian State of Science and Technology,

Krasnoyarsk Shapiro Ida Candidate of Technical Sciences Reshetnev Siberian State of Science and Technology,

Krasnoyarsk Korkina Miliya

Reshetnev Siberian State of Science and Technology,

Krasnoyarsk

АННОТАЦИЯ

Изучено влияние небольших количеств серной кислоты, диоксида кремния и сульфата натрия на образование перуксусной кислоты в среде «CH3COOH - H2O2 - H2O» и на последующую делигнификацию пшеничной соломы полученным раствором окислителей при температуре 90оС. Разбавленная серная кислота эффективно катализирует оба процесса, но снижает выход технической целлюлозы из-за гидролиза легкогидролизуемых полисахаридов. Эффективность гетерогенного катализатора SiO2 и промотора Na2SO4 низкая.

ABSTRACT

Influence of the small quantities by chamois of the sulfuric acid, dioxide silicon and sulfuric sodium on the formation peracetic acids in medium «CH3COOH - H2O2 - H2O» and on the following delignification wheat straw

i Надоели баннеры? Вы всегда можете отключить рекламу.