УДК 004
Информационные технологии
Свищёв Андрей Владимирович, старший преподаватель кафедры практической и прикладной информатики, МИРЭА-Российский технологический университет (РТУ МИРЭА), Россия, г.
Москва, Институт информационных технологий, Россия, г. Москва
Гейкер Анна Михайловна, студент бакалавриата, 3 курс, МИРЭА-Российский технологический университет (РТУ МИРЭА), Россия, г. Москва, Институт информационных технологий, Россия, г. Москва
ПРИМЕНЕНИЕ БОЛЬШИХ ОБЪЕМОВ ДАННЫХ И МАШИННОГО ОБУЧЕНИЯ В СЕЛЬСКОМ ХОЗЯЙСТВЕ
Аннотация: Статья посвящена изучению Больших данных и Машинного обучения. Рассмотрены варианты их применения в сельскохозяйственном производстве. На конкретных примерах показано то, как работают методы машинного обучения, где их можно использовать, а также в каких странах лучше всего внедрены.
Ключевые слова: Большие данные, Big Data, машинное обучение, Machine Learning, технологии в сельскохозяйственном секторе.
Annotation: The article is devoted to the study of Big Data and Machine Learning. The variants of their application in agricultural production are considered. Concrete examples show how machine learning methods work, where they can be used, and in which countries they are best implemented.
Keywords: Big Data, Machine learning, technologies in the agricultural sector.
В современном мире вслед за развитием общества и появлением цифровых продуктов появилась цифровая экономика. Этот термин подразумевает экономическую деятельность, которая реализуются с помощью
цифровых технологий. Основной вопрос заключается в проблеме внедрения этих цифровых продуктов в какое-либо производство. Беря во внимание тот факт, что сельское производство отличается трудоёмкостью и многообразием производственных процессов, рассмотрим применение информационных технологий на примере сельскохозяйственной отрасли. Зачастую, аргументом внедрения новых технологий в сельское хозяйство служит увеличение населения планеты, для которого необходимо продовольствие. Стоит учесть тот факт, что использование технологий требует обработки данных огромного объема, что является немного затруднительной задачей. Поэтому, использование технологий Больших данных и машинного обучения может помочь в решении сложившейся ситуации. Для начала стоит установить, что собой подразумевают большие данные и машинное обучение, как и где они могут быть использованы в России, а также в каких странах мира лучше всего используют данный стек технологий и какое место среди них занимает Россия.
Точного определения Больших данных, или же Big Data по-английски, нет. Однако сам по себе термин может означать, как и просто какой-либо набор данных большого объема, пригодных для анализа, так и набор методов или инструментов их обработки в условиях непрерывного прироста. Примером источника данных, которые требуют действий с большим объемом информации, могут служить данные с датчиков на большом поле или других производственных площадках. Характеризуются данные такими параметрами, как объем, скорость и многообразие. При использовании big data выделяют три принципа работы:
1. Расширяемость системы или горизонтальная масштабируемость: увеличение мощностей аппаратного обеспечения и количества выделяемой памяти на серверах следует за увеличением объема обрабатываемых данных.
2. Устойчивость к отказам и сбоям в вычислительных машинах: стабильная работа должна быть обеспечена с учетом того, что рано или поздно некоторые цифровые носители могут выйти из строя. Таким образом,
отказоустойчивость серверов должна поддерживать работоспособность всей системы без серьезных последствий.
3. Локализация: в виду нерациональности обработки информации на разных машинах предлагается использовать принцип локальности данных, которые подразумевает анализ информации на тех же вычислительных устройствах, где происходит хранение.
Особенностью использования Big Data, в отличии от других способов хранения и обработки информации, является скорость анализа и величина объемов данных. В промышленности, Большие данные используются для таких задач, как: выявление и устранение потерь, повышение стабильности процессов, оптимизация, прогнозирование [1].
Из методов использования больших данных можно выделить машинное обучение. Благодаря нему автоматизируется обработка исходных данных больших размеров: с помощью алгоритмов самостоятельного нахождения решений выводятся различные закономерности. Machine Learning (ML) является подгруппой Искусственного интеллекта и, говоря об использовании AI (Artificial Intelligence) чаще всего подразумевается именно машинное обучение, нейронные сети, машинное зрение. Искусственный интеллект подразумевает собой математическую функцию, отображающую модель нейронов, нейронной сети. Она должна иметь способность обучаться, принимать решения и выполнять действия по подобии человеческого интеллекта. Системы искусственного интеллекта делятся на два класса: сильный (общий, универсальный) и слабый (прикладной) [2]. И, к сожалению, по существующим технологиям, сильный искусственный интеллект пока недоступен.
Алгоритмы ML работают по принципу обучающейся математической модели и делится на: обучение с учителем, которое подразумевает вмешательство человека в процесс обработки информации, без учителя, с частичным привлечением учителя или обучение с подкреплением.
Одно из направлений МЬ связано с задачами следующего вида: имеются множества X и Y - объектов и ответов соответственно. Допустим, что существует некая функциональная зависимость между X и Y такая, что:
f : X ^ Y (1)
однако какая именно неизвестно. Известна лишь совокупность 5 (X, Y), называемая обучающей выборкой:
5 = {(х;, у*г = /(*)) е X х Y| I = 1, . . . , I}. (2)
Задача заключается в нахождении приближенного вида функции f путем построения аппроксимирующей функции
аБ : X ^ Y (3)
, такой что
V х е X as (х) ~ /(х). (4)
Модель обучения включает в себя функцию a так, что
а : X х Ш ^ Y (5)
, где W - множество параметров, и, таким образом, функция а по обучающей выборке Б принимает вид
as (х) = а(х, w) (6)
, где w - некий фиксированный параметр. Если х и w равны 1, то функция имеет название предсказательной модели [3]. Зачастую, для решения задач построения функции (3) по обучающей выборке, подбирается некая модель обучения, которая включает в себя функцию а8 (6) и алгоритм обучения, где цель - поиск значения w, для которого функция а8 обладает свойствами оптимальности.
Один из примеров алгоритмов машинного обучения - нейронные сети. В нем базовый элемент - искусственный нейрон. Пример устройства нейронной сети показан на Рисунке 1.
Рисунок 1 - Пример устройства нейронной сети
Совокупность методов машинного обучения называют глубоким обучением, или Deep Learning. Метод глубокого машинного обучения имеет большее распространение среди всего машинного обучения, так как скорость обработки данных почти приближена к реальному времени и имеется возможность работы с постоянно прибывающим потоком данных. Однако текущий уровень развития все равно не дает полностью автоматизировать управление всеми процессами, особенно в нестандартных ситуациях, которые не заложены в алгоритмах. Можно сказать, что, несмотря на существенный прогресс в данной отрасли, мы все еще стоим на начале пути освоения этого спектра технологий.
Машинное обучение можно применить в сельскохозяйственном отраслевом секторе. Это позволит реализовать масштабные решения с более высокой точностью, нежели обычные методы, применяемые ранее. К примеру, находить ту или иную последовательность генов, позволяющих приобрести культурам полезные для человека свойства, или контролировать те или иные изменения в поведении скота.
Рассмотрим пример использования больших данных и машинного обучения на примере вендора Cognitive Technologies - Российской компании, занимающейся разработкой программного обеспечения, в том числе и на основе искусственного интеллекта. Их продукт - COGNITIVE AGRO PILOT
представляет собой ПО для комбайнов, основанное на беспилотной системе. Используется преимущественно в городе Томск. С помощью дополнительного оборудования оно может решать такие задачи, как вождение и контроль уборочных агрегатов, анализ карт урожайности, режимов уборки и так далее. По данным Cognitive Technologies использование Cognitive Agro Pilot позволяет сократить прямые потери урожая от 8 до 13%, снизить расход топлива до 5%, уменьшить влияние человеческого фактора на результат уборки и сэкономить до 3,06 миллионов рублей в год при использовании 10 машин. При разработке был использован метод глубокого обучения нейронных сетей на GPU NVidia. В частности, на основе технологии свёрточной нейронной сети. Именно она отвечает за распознавание образов. Распознавая и классифицируя поле, система способна выстраивать траекторию движения, вести по ней машину и, в случае помех, совершить объезд или попросить человека вмешаться в процесс. Пример работы cognitive agro pilot представлен на Рисунке 2 [4].
Рисунок 2 - Пример работы Cognitive agro pilot
Введение в сельское хозяйство автоматизации и цифровизации может сократить затраты на более чем 20%. Поэтому в 2019 году Министерство сельского хозяйства Российской Федерации предложило ведомственный проект «Цифровое сельское хозяйство». Срок реализации до 2024 года. Согласно
проекту, планируется ввести умное отраслевое планирование, умные контракты, массово внедрить комплексные цифровые агрорешения и увеличить количество специалистов в данном направлении [5]. На сегодняшний день на российском рынке уже присутствуют компании, занимающееся этой отраслью. Например, Cognitive Technologies, МТС, Мегафон, Ростелеком, Россельхозбанк и так далее. Принцип механики работы сервисов представляет собой сбор данных, их передачу, анализ и результат (см. Рисунок 3).
Рисунок 3 - Вариации типов оборудования, каналов связи и принципов обработки
По данным Saas Scount крупнейшим рынком больших данных признаны США, за ними Япония, потом Великобритания. Однако самый высокий уровень внедрения больших данных в таких странах, как Аргентине - 20,8%, Вьетнам -19,8%, Филиппины - 19,5% и Индонезия - 19,4% [6]. Данные распределения уровня внедрения больших данных отображены на Диаграмме 1.
Диаграмма 1 - Данные распределения уровня внедрения больших данных
На 2019 год Россия составляет 4% от общего количества проектов и 3% от общего количества научных публикаций и патентов в области машинного обучения. Данные о распределении процентного соотношения стран, лидирующих по количеству проектов и научных публикаций в области машинного обучения показаны на Диаграмме 2 и 3 соответственно [7].
Диаграмма 2 - Страны, лидирующие по количеству проектов в области машинного обучения
Диаграмма 2 - Страны, лидирующие по количеству научных публикаций и патентов в
области машинного обучения
Таким образом, можно заметить, что, хоть Россия и применяет машинное обучение, однако зарубежом опыта чуть побольше. Не смотря на неплохие
показатели, отставание в использовании новых технологий в России заметно. Это неудивительно, учитывая, что на переход к их применению нужны не только идеи, но и возможности, деньги, время и общее понимание для чего и зачем это нужно. На сегодняшний день внедрение в производство затруднено ослажненной эпидемиологической угрозой в мире. Однако, благодаря этому, появляется возможность популяризизации информации об применении Больших данных среди большего количества людей.
Библиографический список:
1. Александр С. Работа с BigData в облаках. Обработка и хранение данных с примерами из Microsoft Azure. - СПб.: Питер, 2019. - 448(Офсет) с.
2. Пройдаков Э. М. Современное состояние искусственного интеллекта // Науковедческие исследования. - 2018. - №-. - С. 129-153.
3. Миронов А. М. Машинное обучение: учебное пособие. - Москва: МАКС Пресс, 2018. - 83 с.
4. Cognitive Agro Pilot // Cognitive Agro Pilot URL: https://promo.cognitivepilot.com/ (дата обращения: 15.10.2021).
5. А.В. Гордеев, Д.Н. Патрушев, И.В. Лебедев, А.Г. Архипов, К.А. Буланов, Д.В. Гребеньков, С.Н. Косогор ведомственный проект «Цифровое сельское хозяйство». - Москва: ФГБНУ «Росинформагротех», 2019. - 48 с.
6. Big Data Statistics, Growth & Facts 2021 // SaaS Scout - URL: https://saasscout.com/statistics/big-data-statistics/ (дата обращения: 20.10.2021).
7. Подходит ли опыт западных стран в области машинного обучения для российского рынка? // Anti-Malware - URL: https://www.anti-malware.ru/analytics/Technology_Analysis/foreign-machine-learning-experience (дата обращения: 23.10.2021).