Научная статья на тему 'ПЕРСПЕКТИВА ИСПОЛЬЗОВАНИЯ НЕЙРОННЫХ СЕТЕЙ НА РЫНКЕ АПК'

ПЕРСПЕКТИВА ИСПОЛЬЗОВАНИЯ НЕЙРОННЫХ СЕТЕЙ НА РЫНКЕ АПК Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
100
20
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
МАШИННОЕ ОБУЧЕНИЕ / СЕЛЬСКОЕ ХОЗЯЙСТВО / НЕЙРОННЫЕ СЕТИ / СТАТИСТИКА / BIGDATA

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Рогов Матвей Александрович, Дубовицкий Александр Алексеевич

В статье рассматривается преимущество нейросетей для использования в АПК с целью обработки больших массивов данных. Однако имеются значительные стоп-факторы, которые заключаются в том, что перед реализацией моделей машинного обучения необходимо пройти несколько этапов: сбор, анализ, компоновка, предобработка, кодирование. На практике, данный цикл может повторяться десятки раз, до момента, получения действительно валидной для использования модели машинного обучения. Этапы могут реализовываться двумя путями: первый - нанять команду компетентных специалистов, предоставить им доступ к информации на основе чего они смогут развернуть платформу сбора и обработки данных, второй - самостоятельно аккумулировать и анализировать данные, и, передать их для построения моделей машинного обучения. Первый вариант - подразумевает большие финансовые затраты на поддержание команды. Второй вариант - подразумевает наличие необходимых навыков сбора и обработки информации у сотрудников агропроизводства.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Рогов Матвей Александрович, Дубовицкий Александр Алексеевич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

THE PROSPECT OF USING NEURAL NETWORKS IN THE AGRO-INDUSRIAL COMPLEX MARKET

The article discusses the advantage of neural networks for use in agriculture. The ability of neural network technologies to process large amounts of data, in the future, can significantly accelerate the development of the country's agricultural industry. However, there are significant stop factors, which lie in the fact that before the implementation of machine learning models, it is necessary to go through several stages, namely: collection, analysis, layout, preprocessing, coding, and other stages of data processing. In practice, this cycle can be repeated dozens of times, until the moment when it turns out to implement a really valid machine learning model for use. All these stages can be implemented in two ways: the first is to hire a team of competent specialists, provide them with access to agricultural production, on the basis of which they can deploy a platform for collecting and processing data, the second is to independently accumulate and analyze data, and, subsequently, transfer it to build models machine learning. The first option implies large financial costs for maintaining the team. The second option implies the availability of the necessary skills for collecting and processing information from employees of agricultural production.

Текст научной работы на тему «ПЕРСПЕКТИВА ИСПОЛЬЗОВАНИЯ НЕЙРОННЫХ СЕТЕЙ НА РЫНКЕ АПК»

УДК 004.032.22

ПЕРСПЕКТИВА ИСПОЛЬЗОВАНИЯ НЕЙРОННЫХ СЕТЕЙ НА

РЫНКЕ АПК

Матвей Александрович Рогов

студент

Rogovmatvej 1@gmail. com Александр Алексеевич Дубовицкий

кандидат экономических наук, доцент Daa1-408@yandex.ru Мичуринский государственный аграрный университет

г. Мичуринск, Россия

Аннотация. В статье рассматривается преимущество нейросетей для использования в АПК с целью обработки больших массивов данных. Однако имеются значительные стоп-факторы, которые заключаются в том, что перед реализацией моделей машинного обучения необходимо пройти несколько этапов: сбор, анализ, компоновка, предобработка, кодирование. На практике, данный цикл может повторяться десятки раз, до момента, получения действительно валидной для использования модели машинного обучения. Этапы могут реализовываться двумя путями: первый - нанять команду компетентных специалистов, предоставить им доступ к информации на основе чего они смогут развернуть платформу сбора и обработки данных, второй -самостоятельно аккумулировать и анализировать данные, и, передать их для построения моделей машинного обучения. Первый вариант - подразумевает большие финансовые затраты на поддержание команды. Второй вариант -подразумевает наличие необходимых навыков сбора и обработки информации у сотрудников агропроизводства.

Ключевые слова: машинное обучение, сельское хозяйство, нейронные сети, статистика, BigData.

Использование нейросетей в АПК обуславливается наличием больших объемов данных, генерируемых в данной направлении деятельности. Путей использования моделей машинного обучения достаточно много. Областью применения и экспериментирования может стать растениеводство (оценка урожайности на основе природных и агроклиматических факторов), животноводство, оптимизация машинно-тракторного парка [7].

Однако наиболее перспективным направлением применения моделей машинного обучения, а, в частности нейронных сетей - рынок сельскохозяйственной продукции и продовольствия.

В данной статье предпринята попытка реализации модели машинного обучения на основе множественных данных о рынке сельскохозяйственной продукции. В качестве методики предсказания была выбрана коробочная рекуррентная нейронная сеть.

Сначала хотелось бы кратко дать определение одному нейрону. Родоначальником первой модели с одним нейроном является Ф. Розенблатт. В 1958 ему удалось разработать и представить первую модель однослойного перцептрона, способного решать примитивные задачи классификации. Данная модель была основана на фундаментальных понятиях, описанных в работах У. Питтса и У. Маккалока [1]. Именно он предложил концепцию перцептрона, основной идеей которой являлось представление выхода нейрона в виде линейной комбинации признаков и весов. Результатом операции являлось число, которое впоследствии сравнивалось с пороговым значением, и, в зависимости от этого определялся результат. Понятно, что такие нейронные были пригодны только для задач классификации.

Нейрон - базовая единица нейронной сети. У каждого нейрона есть определённое количество входов, куда поступают сигналы, которые суммируются с учётом значимости (веса) каждого входа. Результат вычисляет по условия:

Результат

0, если Wj Xj < порог

1, если Wy Ху > порог

В 1973 - 1990 годах группе ученых удалось разработать методы, способных как раз находить веса модели. При этом, модель уже не представляла собой один единственный нейрон, а была уже сеть таких нейронов, на вход которым поступали признаки, после этого, выходы входного слоя передавали сигналы в скрытые слои, те в свою очередь агрегировали результаты и выдавили результат. Помимо этого, большим скачком стало замены функции активации на так называемый "sigmoid" или сигмоидальную функцию a(z).

x

Рисунок 2 - Однослойная нейронная сеть со скрытым слоем

В этот же момент, в 1973 году Пол Дж. Вербос и Галушкин А.И. изобретают алгоритм обратного распространения ошибки для обучения

многослойных перцептронов (MLP). В этот момент, MLP используются в медицине, геологии, экологии, экономике и других отраслях [6].

В нашей работе мы использовали данные за 2020-2021 года, отражающие характеристики, которые могут быть на прямую или косвенно связаны с ценой на молочную продукцию в каждом из 3200 городов. Для каждой характеристики имелось 63 значения. Специальными методами пред.-обучения моделей, нам удалось снизить размерность входного вектора до 10 признаков, которые, считались наиболее явно интерпретируемые. Они представлены в таблице 1.

Таблица 1

Срез данных, используемые при обучении и валидации нейронной сети

№ Наименование фактора Ссылка на фактор Ед. изм.

1 Продуктовые магазины GROCPTH12 На 1000 жителей

2 Супер-центры и клубные магазины SUPERCPTH12 На 1000 жителей

3 Круглосуточные магазины CONVSPTH12 На 1000 жителей

4 Рестораны быстрого питания FFRPTH12 На 1000 жителей

5 Студенты, имеющие право на обед по сниженной цене PCT_REDUCED_LUNCH10 %

6 Участники программы школьных завтраков PCT_SBP14 %

7 Участники летней программы общественного питания PCT_SFSP14 %

8 Фермерские рынки, которые сообщили о принятии SNAP FMRKT_SNAP 13 Кол.-во

9 Фермерские рынки, которые сообщили о принятии WIC FMRKT_WIC 13 Кол.-во

10 Уровень бедности POVRATE10 %

Технологии, используемые для предобработки данных, поиска аномалий, снижения размерности: soft-ensemble по методике стогования из следующих моделей: AdaBoost, Logistic Regression, SVM.

Архитектура нейронной сети, используемая для предсказания цены: две реккурентных нейронных сетей. Первая: 3 слояс Bidirectional GRU+Dropout. Вторая: 3 слоя LSTM+Dropout + Attention со skip-layers. Предполагалось

последующее усреднение двух результатов и передачу в третью модель с Dense и Activation. Тюнились модели на Bayesian GridSearch. Акцент делался на предотвращение переобучения, поэтому использовалась elastic-net регуляризация, повышенный Dropout. Функция активации для первых двух моделей - selu, метод инициализации веса - lecun_normal. Метод инициализации весов - Adam. Количество эпох - 80.

Рисунок 3 - График log-loss в зависимости от количества эпох

Результаты проходили валидацию по методу Cross-validation. Объем тестовой выборки - 30% от всей выборки. Качество полученной модели на валидационной выборке - R2 = 0,87. Данный результат может рассматриваться как достаточно удовлетворительный, учитываю количество и качество представленных данных.

В данной работе была представлена только одна ветка использования нейронных сетей. На практике, применение моделей машинного обучения не является конечной точкой анализа данных. В дальнейшем, предсказанные данные, поступают в специальные конвейеры, преобразующие их в понятный для обычного пользователя формат. В отделениях анализа или маркетинга используются специальные Dash-борды, отображающие актуальную ситуацию на рынке, где в дальнейшем и используются результаты модели, как дополнительные сигналы для принятия решений на уровне отдельного отдела или всей компании.

Список литературы:

1. Мак-Каллок У. С., Питтс В. Логическое исчисление идей, относящихся к нервной активности, Архивная копия от 27 ноября 2007 на Wayback Machine // Автоматы / Под ред. К. Э. Шеннона и Дж. Маккарти. М.: Изд-во иностр. лит., 1956. С. 363—384.

2. Ян Лекун. Как учится машина. Революция в области нейронных сетей и глубокого обучения. (Библиотека Сбера: Искусственный интеллект). М.: Альпина нон-фикшн, 2021. — ISBN 978-5-907394-29-2.

3. Rumelhart D.E., Hinton G.E., Williams R.J., Learning Internal Representations by Error Propagation. In: Parallel Distributed Processing, vol. 1, pp. 318—362. Cambridge, MA, MIT Press. 1986.

4. Ильин В.А., Позняк Э.Г. Аналитическая геометрия: Учеб. для вузов - 7у изд., стер. М.: ФИЗМАТЛИТ, 2004. - 224 с.

5. Вьюгин В.В. «Математические основы теории машинного обучения и прогнозирования» М.: 2013. - 387 с.

6. Виды нейронных сетей и их применение / Н. В. Картечина, А. М. Дорохова, Р. Н. Абалуев [и др.] // Наука и Образование. 2021. Т. 4. № 3. -EDN HMFMXV.

7. Тимофеев М. Г., Бабайцев А.В., Никонорова Л.И. Искусственный интеллект в сельском хозяйстве // Наука и Образование. 2020. Т. 3. № 4. С. 71. -EDN HGGVDR.

UDC 004.032.22

THE PROSPECT OF USING NEURAL NETWORKS IN THE AGRO-INDUSRIAL COMPLEX MARKET

Matvey A. Rogov

student

Rogovmatvej 1@gmail. com

Aleksandr A. Dubovickiy

PHD in Economics Daa1-408@yandex.ru Michurinsk state agrarian university Michurinsk, Russia

Annotation. The article discusses the advantage of neural networks for use in agriculture. The ability of neural network technologies to process large amounts of data, in the future, can significantly accelerate the development of the country's agricultural industry. However, there are significant stop factors, which lie in the fact that before the implementation of machine learning models, it is necessary to go through several stages, namely: collection, analysis, layout, preprocessing, coding, and other stages of data processing. In practice, this cycle can be repeated dozens of times, until the moment when it turns out to implement a really valid machine learning model for use. All these stages can be implemented in two ways: the first is to hire a team of competent specialists, provide them with access to agricultural production, on the basis of which they can deploy a platform for collecting and processing data, the second is to independently accumulate and analyze data, and, subsequently, transfer it to build models machine learning. The first option implies large financial costs for maintaining the team. The second option implies the availability of the necessary skills for collecting and processing information from employees of agricultural production.

Keywords: machine learning, agriculture, neural networks, statistics, Big Data.

Статья поступила в редакцию 29.04.2022; одобрена после рецензирования 30.05.2022; принята к публикации 13.06.2022.

The article was submitted 29.04.2022; approved after reviewing 30.05.2022; accepted for publication 13.06.2022.

i Надоели баннеры? Вы всегда можете отключить рекламу.