Научная статья на тему 'Нейронные сети, как инструмент классификации биотехнологических систем (на примере мукомольного производства)'

Нейронные сети, как инструмент классификации биотехнологических систем (на примере мукомольного производства) Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
374
96
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
МНОГОСЛОЙНЫЙ ПЕРЦЕПТРОН / СПЕЦИФИЧЕСКИЙ ПРИЗНАК / ТОЧНОСТЬ КЛАССИФИКАЦИИ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Битюков В. К., Балашова Е. А., Саввина Е. А.

На сегодняшний день системы искусственного интеллекта являются наиболее распространенным видом для классификации объектов разного качества. Предлагаемая технология моделирования прогнозирования качества мукомольной продукции с использованием аппарата искусственных нейронных сетей позволяет объективно решать задачи анализа факторов, определяющих качество продукции. Интерес к искусственным нейронным сетям вырос за счет того, что они могут менять свое поведение в зависимости от внешней среды. Этот фактор в большей степени, чем любой другой, ответствен за тот интерес, который они вызывают. После предъявления входных сигналов (возможно, вместе с требуемыми выходами) они самонастраиваются, чтобы обеспечивать требуемую реакцию. Было разработано множество обучающих алгоритмов, каждый со своими сильными и слабыми сторонами. Решение задачи классификации является одним из важнейших применений нейронных сетей, которая представляет собой задачу отнесения образца к одному из нескольких непересекающихся множеств. Для решения поставленной задачи разработаны алгоритмы синтеза НС с использованием нелинейной функции активации, разработаны алгоритмы обучения сети. Обучение НС подразумевает определение весовых коэффициентов слоев нейронов. Обучение НС происходит с учителем, то есть сети предъявляются значения как входных, так и желательных выходных сигналов, и она по некоторому внутреннему алгоритму подстраивает веса своих синаптических связей. В работе была построена искусственная нейронная сеть, на примере многослойного перцептрона. С помощью корреляционного анализа в общей выборке было установлено, что признаки коррелируют на уровне значимости 0,01 с классом качества хлеба. Точность классификации превышает 90 %.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Битюков В. К., Балашова Е. А., Саввина Е. А.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Neural networks as a classification tool biotechnological systems (for example flour production)

To date, artificial intelligence systems are the most common type to classify objects of different quality. The proposed modeling technology to predict the quality of flour products by using artificial neural networks allows to solve problems of analysis of the factors determining the quality of the products. Interest in artificial neural networks has grown due to the fact that they can change their behavior depending on external environment. This factor more than any other responsible for the interest that they cause. After the presentation of input signals (possibly together with the desired outputs), they self-configurable to provide the desired reaction. We developed a set of training algorithms, each with their own strengths and weaknesses. The solution to the problem of classification is one of the most important applications of neural networks, which represents a problem of attributing the sample to one of several non-intersecting sets. To solve this problem developed algorithms for synthesis of NA with the use of nonlinear activation functions, the algorithms for training the network. Training the NS involves determining the weights of layers of neurons. Training the NA occurs with the teacher, that is, the network must meet the values of both input and desired output signals, and it is according to some internal algorithm adjusts the weights of their synaptic connections. The work was built an artificial neural network, multilayer perceptron example. With the help of correlation analysis in total sample revealed that the traits are correlated at the significance level of 0.01 with grade quality bread. The classification accuracy exceeds 90%.

Текст научной работы на тему «Нейронные сети, как инструмент классификации биотехнологических систем (на примере мукомольного производства)»

УДК. 675.03.031.81:577.15

Профессор В.К. Битюков, доцент Е.А. Балашова,

(Воронеж. гос. ун-т инж. технол.)

кафедра информационных и управляющих систем. тел. (473) 255-37-51. старший преподаватель Е.А. Саввина

(Воронеж. гос. ун-т инж. технол.)

кафедра бухгалтерского учета и бюджетирования. тел. (473) 255-37-51 E-mail: elsida@yandex.ru

Professor V.K. Bitykov, associate professor E.A. Balashova,

(Voronezh state university of engineering technologies) Department of information and control systems. phone (473) 255-37-51

senior lecturer E.A. Savvina

(Voronezh state university of engineering technologies)

Department of the accountant. accounting and budgeter. phone (473) 255-37-51

E-mail: elsida@yandex.ru

Нейронные сети как инструмент классификации биотехнологических систем (на примере мукомольного производства)

Neural networks as a classification tool biotechnological systems (for example flour production)

Реферат. На сегодняшний день системы искусственного интеллекта являются наиболее распространенным видом для классификации объектов разного качества. Предлагаемая технология моделирования прогнозирования качества мукомольной продукции с использованием аппарата искусственных нейронных сетей позволяет объективно решать задачи анализа факторов, определяющих качество продукции. Интерес к искусственным нейронным сетям вырос за счет того, что они могут менять свое поведение в зависимости от внешней среды. Этот фактор в большей степени, чем любой другой, ответствен за тот интерес, который они вызывают. После предъявления входных сигналов (возможно, вместе с требуемыми выходами) они самонастраиваются, чтобы обеспечивать требуемую реакцию. Было разработано множество обучающих алгоритмов, каждый со своими сильными и слабыми сторонами. Решение задачи классификации является одним из важнейших применений нейронных сетей, которая представляет собой задачу отнесения образца к одному из нескольких непересекающихся множеств. Для решения поставленной задачи разработаны алгоритмы синтеза НС с использованием нелинейной функции активации, разработаны алгоритмы обучения сети. Обучение НС подразумевает определение весовых коэффициентов слоев нейронов. Обучение НС происходит с учителем, то есть сети предъявляются значения как входных, так и желательных выходных сигналов, и она по некоторому внутреннему алгоритму подстраивает веса своих синаптических связей. В работе была построена искусственная нейронная сеть, на примере многослойного перцептрона. С помощью корреляционного анализа в общей выборке было установлено, что признаки коррелируют на уровне значимости 0,01 с классом качества хлеба. Точность классификации превышает 90 %.

Summary. To date, artificial intelligence systems are the most common type to classify objects of different quality. The proposed modeling technology to predict the quality of flour products by using artificial neural networks allows to solve problems of analysis of the factors determining the quality of the products. Interest in artificial neural networks has grown due to the fact that they can change their behavior depending on external environment. This factor more than any other responsible for the interest that they cause. After the presentation of input signals (possibly together with the desired outputs), they self-configurable to provide the desired reaction. We developed a set of training algorithms, each with their own strengths and weaknesses. The solution to the problem of classification is one of the most important applications of neural networks, which represents a problem of attributing the sample to one of several non-intersecting sets. To solve this problem developed algorithms for synthesis of NA with the use of nonlinear activation functions, the algorithms for training the network. Training the NS involves determining the weights of layers of neurons. Training the NA occurs with the teacher, that is, the network must meet the values of both input and desired output signals, and it is according to some internal algorithm adjusts the weights of their synaptic connections. The work was built an artificial neural network, multilayer perceptron example. With the help of correlation analysis in total sample revealed that the traits are correlated at the significance level of 0.01 with grade quality bread. The classification accuracy exceeds 90%.

Ключевые слова: многослойный перцептрон, специфический признак, точность классификации.

Keywords: multilayer perceptron, the specific symptom, the accuracy of classification.

© Битюков В.К., Балашова Е.А., Саввина Е.А., 2015

В последнее время интерес к нейронным сетям сильно вырос в связи с тем, что специалисты мукомольной промышленности ищут применение им при определении качества получаемого хлеба.

Интерес к искусственным нейронным сетям вырос за счет того, что они могут менять свое поведение в зависимости от внешней среды. Этот фактор в большей степени, чем любой другой, ответствен за тот интерес, который они вызывают. После предъявления входных сигналов (возможно, вместе с требуемыми выходами) они самонастраиваются, чтобы обеспечивать требуемую реакцию. Было разработано множество обучающих алгоритмов, каждый со своими сильными и слабыми сторонами.

Решение задачи классификации является одним из важнейших применений нейронных сетей, которая представляет собой задачу

отнесения образца к одному из нескольких не пересекающихся множеств.

На вход искусственного нейрона поступает некоторое множество сигналов, каждый из которых является выходом другого нейрона. Каждый вход умножается на соответствующий вес, аналогичный синаптической силе, и все произведения суммируются, определяя уровень активации нейрона.

Множество входных сигналов, обозначенных x1, x2,...,xn, поступает на искусственный нейрон. Каждый сигнал умножается на соответствующий вес w1, w2,..., wn, и поступает на суммирующий блок, обозначенный £. Каждый вес соответствует «силе» одной биологической синаптической связи. Суммирующий блок, складывает взвешенные входы алгебраически, создавая выход (NET):

NET = XW (1)

x1

Jj n

Рисунок 1. Внешний вид искусственного нейрона

Сигнал NET преобразуется активацион-ной функцией F и дает выходной нейронный сигнал OUT. Активационная функция может быть записана следующим образом:

OUT = K(NET), (2)

где К - постоянная пороговая функция.

OUT = 1, если NET > T, OUT = 0,

где Т -постоянная пороговая величина, более точно моделирующая нелинейную передаточную характеристику биологического нейрона и представляющей нейронной сети большие возможности.

Wi

t2-

I

NET

■ У ■

Искусственный неиррн

*0VT=Fl№T}

Рисунок 2. Искусственный нейрон с активационной функцией

Качество продукции - это совокупность свойств продукции, обусловливающих ее способность удовлетворять установленные или предполагаемые потребности. На практике конкретные потребности переводятся в набор количественных и качественных установленных требований к характеристикам продукции.

Оценка ее качества состоит в проверке соответствия продукции требованиям к качеству - перечню количественных характеристик (показателей качества) и качественных признаков.

Применительно к качеству мукомольной продукции можно выделить ряд нормативных документов (ГОСТ, ТУ и т.д.).

Качество объекта мукомольной промышленности достаточно полно определяют два критерия - определяющий показатель качества, по которому принимается решение оценивать его качество и уровень качества, то есть относительная характеристика качества объекта, основанная на сравнении значений показателей качества объекта с базовыми (эталонными) значениями соответствующих показателей.

На основе предварительного анализа различных моделей нейронной, в соответствие с характером решаемых задач, количеством входных и выходных данных, структурой связей между единичными и групповыми показателями качества была выбрана нейронная сеть в виде трехслойного персептрона (рисунок 3) со следующими характеристиками:

- первый слой - 27 входных нейронов, соответствует числу входных данных - единичных показателей качества;

- второй слой (скрытый) - 10 нейронов, соответствует структуре связей между единичными и групповыми показателями качества;

- третий слой - 1 выходной нейрон, так как требуется один выходной параметр - показатель уровня качества К;

- нелинейная функция активации - сиг-моидальная функция.

Структура нейронной сети представлена на рисунке 4.

Для решения поставленной задачи разработаны алгоритмы синтеза НС с использованием нелинейной функции активации, разработаны алгоритмы обучения сети. Обучение НС подразумевает определение весовых коэффициентов слоев нейронов. Обучение НС происходит с учителем, то есть сети предъявляются значения как входных, так и желательных выходных сигналов, и она по некоторому внутреннему алгоритму подстраивает веса своих синаптических связей.

С помощью корреляционного анализа в с классом качества хлеба. В качестве наиболее

общей выборке было установлено, что при- информативных были отобраны признаки с ко-

знаки коррелируют на уровне значимости 0,01 эффициентом корреляции превышающем 0,7.

Т а б л и ц а 1

Таблица информативных признаков

Показатели 1 класс 2 класс 3 класс 4 класс

Массовая доля клейковины 32-33 (Х7) 0,814** -0,075 -0,323** -0,367**

Качество клейковины 66-75 (Х11) 0,788** -0,302** -0,163 -0,315**

Качество клейковины 35-50 (Х12) -0,279* -0,230* 0,721** -0,289**

Газообразующая способность 1400-1500 (Х17) 0,742** -0,249* -0,425** -0,031

Кислотность мякиша 3 (Х29) 0,764** -0,441* 0,238* 0,389*

Пористость мякиша 67-68 (Х34) -0,218 0,806** 0,230* -0,300**

Пористость мякиша 69-70 (Х35) 0,965** -0,248* -0,374** -0,311**

Для класса 1 было выявлено 5 информативных признаков (массовая доля клейковины 32-33, качество клейковины 66-75, газообразующая способность 1400-1500, кислотность мякиша 3, пористость мякиша 69-70), для которых коэффициент корреляции превышает 0,7. Для 2 признаков г находится в диапазоне 0,624 до 0,684 по модулю, и имеет среднюю тесноту связи с классом качества. Во второй группе специфических признаков не обнаружено, значение г находится в диапазоне от 0,485 до 0,689. В группе 3 обнаружено 2 специфических признака с теснотой связи от 0,721 до 0,806. Для 6 признаков коэффициент корреляции находится в диапазоне от 0,586 до 0,664 с средней теснотой связи. Класс 4 имеет один специфический признак (пористость мякиша) со значением коэффициента корреляции более 0,7; теснота связи сильная. Для 4 признаков в данной группе коэффициент корреляции г находится в диапазоне от 0,525 до 0,656, теснота связи средняя (больше 0,5).

Уровень качества будет равен: 0,7337. Полученные значения определяющего показателя качества (0,637) и уровня качества (0,7337)

ЛИТЕРАТУРА

1 Балашова Е.А., Битюков В.К., Саввина Е.А. Сравнительный анализ методов классификации при прогнозировании качества хлеба //Вестник Воронежского государственного университета инженерных технологий. 2013. № 1 (55). С. 57-62

2 Битюков В.К., Моторин М.Л., Саввина Е.А. Формирование классов объектов методом дискриминантного анализа // Вестник Воронежского государственного университета инженерных технологий. 2014. № 1 (59). С. 73-78.

3 Анил Д.К., Жианчанг Мао, Моиуддин К.М. Введение в искуственные нейронные сети. 2010. 243 с.

4 Царегородцев В.Г. Конструктивный алгоритм синтеза структуры многослойного пер-септрона // Вычислительные технологии. 2008. Т. 13 // Вестник КазНУ им. Аль-Фараби, серия "математика, механика, информатика". 2008. №4 (59). (Совм. выпуск). Ч. 3. С. 308-315.

5 Жуков Л.А. Использование нейросете-вых технологий для проведения учебно-исследовательских работ. 2011. 191 с.

свидетельствуют о высоком качестве мукомольной продукции.

Выводы:

1. Была предложена категориальная структура. Показано, что структура базы данных влияет на классификацию.

2. Выполнена классификация качества хлеба. Методом двухэтапного кластерного анализа было допущено 11 ошибок (13,75%): 4 ошибки первого рода (5%), класс плохого качества был ошибочно отнесен к классу хорошего качества. 2 ошибки второго рода (2,5%). 5 ошибок попадания наблюдений плохого качества в очень плохое (6,25%), не являются существенными для классификации, так как классы (3 и 4) не должны использоваться в хлебопечении. Метод дискриминантного анализа классифицирует с точностью 91,3%. Было допущено 7 ошибок: 5 наблюдений были ошибочно отнесены к плохому качеству (6,25%), 2 наблюдения (2,5%) классифицированные в базе данных как хорошее качество были неправильно распознаны как очень плохое качество.

REFERENCES

1 Balashova E.A., Bityukov V.K., Savvina E.A. Comparative analysis of classification methods in generowanie quality of bread. Vestnik VGUIT. [Bulletin of Voronezh state University of engineering technology], 2013, no. 1 (55), pp. 57-62. (In Russ.).

2 Bityukov V. K., Motorin M. L., Savvina E.A. Formation of classes objects by the method of discriminant analysis Vestnik VGUIT. [Bulletin of Voronezh state University of engineering technology], 2014. No. 1 (59). P. 73-78. (In Russ.).

3 Anil J.K., Jianchang Mao, Moiuddin K. M. Introduction to artificial neural network, 2010. 243 p.

4 Tsaregorodtsev V. G. Constructive synthesis algorithm structure in multi-layer perceptron. Vychis-litel'nye tekhnologii [Computational technologies, 2008. Vol. 13 - the Bulletin of KazNU. Al-Farabi Kazakh national University, series "mathematics, fur-Nika Informatics"(Collab. edition)], 2008, no. 4 (59), part 3, pp. 308-315. (In Russ.).

5 Zhukov L. A. Ispol'zovanie neirosetevykh tekhnologii dlya provedeniya uchebno-issle-dovatel'skikh rabot [Use of neural network technologies for educational research]. 2011, 191 p. (In Russ.).

i Надоели баннеры? Вы всегда можете отключить рекламу.