Научная статья на тему 'Информационные технологии нейросетевого моделирования урожайности в условиях рискованного земледелия'

Информационные технологии нейросетевого моделирования урожайности в условиях рискованного земледелия Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
163
39
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ЭКОНОМИКО-МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ / ПРОГНОЗ УРОЖАЙНОСТИ / ИСКУССТВЕННЫЕ НЕЙРОННЫЕ СЕТИ / ОБУЧЕНИЯ СЕТИ / ПРОЕКЦИЯ / УРОЖАЙНОСТЬ СЕЛЬСКОХОЗЯЙСТВЕННЫХ КУЛЬТУР

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Шубнов Михаил Геннадьевич, Рогачев Алексей Фруминович

В статье описаны теоретические основы и процедуры построения эко-номико-математических моделей урожайности сельскохозяйственных культур на основе технологий искусственных нейронных сетей. Приведены основы построения проекций вре-менных рядов с различным лагом. Проанализированы варианты архитектуры и особенности информационной технологии построения, обучения и тестирования, предварительные ре-зультаты верификации построенных нейронных сетей для моделирования динамики уро-жайности в условиях рискованного земледелия.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Информационные технологии нейросетевого моделирования урожайности в условиях рискованного земледелия»

обрабатывающей промышленности. Агломерационный эффект и технологическое комбинирование относятся к экономическим факторам размещения, более того, являются основной формой их влияния на размещение промышленности.

Пространство или взаимное расположение в пространстве всех экономических и природных условий играет особую роль в качестве фактора размещения. Пространство преодолевается с помощью транспорта и воздействует на размещение производительных сил через соответствующий уровень транспортных издержек. Особую роль при размещении производительных сил на современном этапе экономического развития играет группа экологических факторов, так как она непосредственно связана с бережным использованием природных ресурсов и обеспечением необходимых жизненных условий для населения.

Таким образом, рассмотрение каждого фактора размещения производительных сил сопровождается анализом его воздействия на процесс размещения производства, рост городов, решение социальных, национальных и других проблем. Однако изолированное рассмотрение роли отдельных факторов размещения не дает общей картины, так как необходим одновременный учет влияния (зачастую противоречивого) всей суммы факторов размещения. Это означает необходимость учета всех условий, при соблюдении которых может быть реализован критерий эффективности.

Библиографический список

1. Керашев М.А. Экономика промышленного производства: учебю - Краснодар: Печатный двор Кубани, 1998. - 173 с.

2. Экономическая география России: учеб. / Под общей ред. акад. В.И. Видяпина. - М.: ИНФРА-М, Российская экономическая академия. 1999. - 533 с.

3. Экономическая и социальная география России: учеб. / Под ред. проф. А.Т. Хрущева. - М.: Дрофа, 2001. - 672 с.

4. Экономика пищевой промышленности: учеб. / М.Д. Магомедов, А.В. Заздравных, Г.А. Афанасьева. - М.: Дашков и Ко, 2010. - 232 с.

5. Экономика предприятия: учеб. / Под ред. проф. Н.А. Сафронова. - М.: «Юристъ», 1998. - 584 с.

М.Г. Шубнов А.Ф. Рогачев

ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ НЕЙРОСЕТЕВОГО МОДЕЛИРОВАНИЯ УРОЖАЙНОСТИ В УСЛОВИЯХ РИСКОВАННОГО

ЗЕМЛЕДЕЛИЯ

Аннотация: в статье описаны теоретические основы и процедуры построения экономико-математических моделей урожайности сельскохозяйственных культур на основе технологий искусственных нейронных сетей. Приведены основы построения проекций временных рядов с различным лагом. Проанализированы варианты архитектуры и особенности информационной технологии построения, обучения и тестирования, предварительные результаты верификации построенных нейронных сетей для моделирования динамики урожайности в условиях рискованного земледелия.

Ключевые слова: экономико-математическое моделирование, прогноз урожайности,

© Шубнов М.Г., Рогачев А.Ф., 2013

искусственные нейронные сети, обучения сети, проекция, урожайность сельскохозяйственных культур.

Внимание к методам моделирования, использующим в качестве базового инструментария искусственные нейронные сети, обусловлено результативным применением во многих областях для решения не только задач классификации, но и прогнозирования и управления. Такие специфические возможности упомянутых методов, как возможность моделирования нелинейностей прогнозируемых процессов, относительная простота компьютерной реализации и адаптируемость делают их эффективными для решения различных многопараметрических проблем, в том числе в аграрном производстве. Экономико-математическое моделирование с целью надежного прогнозирования урожайности сельскохозяйственных культур является важной предпосылкой для планирования аграрного производства и обоснования его ключевых технико-экономических показателей, как модернизируемого производства, так и планируемых инвестиционных решений. В то же время, влияние различных групп факторов (природно-климатических, био- и технико-технологических и организационно-экономических), влияющих на эффективность производства в условиях рискованного земледелия, приводят к значительной, более 15-20%, погрешности [1; 5].

Применение традиционных методов экономико-математического моделирования, таких, как многофакторное моделирование, построение систем структурных эконометрических уравнений, адаптивное линейное и нелинейное моделирование, а также современных методов нелинейной экономической динамики [1; 6], не всегда приводит к желаемым результатам, особенно в условиях рискованного земледелия Нижнего Поволжья. Этим обусловлена необходимость отыскания и исследования новых классов экономико-математических моделей. Анализ публикаций в области нелинейного моделирования различных систем, в том числе экономических, позволяет считать одним из таких перспективных направлений искусственные нейронные сети, формируемые на ЭВМ. Традиционные технологии построения и использования искусственных нейронных сетей (ИНС) базируются не предварительном подборе репрезентативной выборки, обосновании алгоритма обучения, адекватного проблеме, который в автоматизированном режиме воспроизводит структуру исходных данных. Пользователь программы нейросетевого моделирования должен располагать априорным набором эвристических знаний о структуре и особенностях моделируемых данных, обосновании вариантов архитектуры ИНС и обладать навыками интерпретации получаемых результатов, но уровень предварительной подготовки для успешного применения таких методов существенно уже, чем при использовании классических методов математической статистики.

Специфическим вопросом применения ИНС является проблема количества наблюдений, которые необходимо использовать для процедуры обучения формируемой сети. Известен ряд эвристических правил, увязывающих число необходимых наблюдений с характеристиками сети. В частности, есть рекомендации, что число наблюдений должно быть на порядок больше числа связей в сети. Это количество должно зависеть и от априори неизвестной сложности того отображения, для воспроизведения которого создается нейронная сеть. С ростом числа переменных количество требуемых наблюдений нелинейно возрастает. Уже при 30-50 переменных может потребоваться колоссальное число наблюдений, что известно под названием «проклятия размерности».

Ввиду сложности и многовариантности структуры ИНС практическая реализации ее возможна только на основе специализированной программной оболочки, в качестве которой нами были проанализированы коммерческие ПС (пакет статистического анализа БТАТКТГСА с модулем БММ V. 4.0, аналитическая платформа ЭЕВиСТОЯ и др.). По мак-

симальному количеству функциональных возможностей, удобству интеграции с другими ПС и доступности для дальнейших исследований может быть рекомендован пакет БТЛТКТХСЛ с модулем БММ V. 4.0. В краткосрочном прогнозировании очередное значение ВР прогнозируется по некоторому количеству предыдущих, при этом в пакете можно выполнять прогноз на произвольное количество шагов (временной лаг). После вычисления очередного прогнозного значения оно также подставляется в ряд, после чего получают следующий прогноз, что принято называть проекцией ВР. В пакете можно осуществлять проекцию временного ряда и при пошаговом прогнозировании, однако надежность такой проекции уменьшается с ростом величины прогнозного лага. При необходимости иметь определенную дальность прогноза, рекомендуется строить алгоритм обучения ИНС именно на такую конкретную дальность.

Решение задачи прогноза ВР может осуществляться с помощью ИНС различных типов. Для прогноза ВР урожайности ИНС в конфигурируется установкой параметров Окно прогноза и Прогноз вперед (количество шагов). Параметр Окно прогноза задаст число предыдущих значении, которые следует подавать на вход, а параметр Прогноз вперед (количество шагов) указывает, с каким временным лагом требуется строить прогноз. Отметим, что при использовании Мастера решений пользователем устанавливается только интервал для значений окна прогноза.

При моделировании и анализе экономических ВР отдельной проблемой является формирование обучающего, контрольного и тестового множеств, а также неучитываемых данных. В рассматриваемой задаче моделирования ВР каждый входной или выходной набор получают из данных, относящихся к нескольким наблюдениям, число которых задается инструментами Окно прогноза и Прогноз вперед (количество шагов). Отсюда следуют две специфические особенности. Категория, к которой будет отнесен набор, определяется категорией выходного наблюдения. Предположим, что если в исходных данных два начальных наблюдения не учитываются, а третье принято в качестве тестового (значения параметров Окно прогноза и Прогноз вперед равны 2 и 1 соответственно), то первый используемый набор будет тестовым, его входы будут браться из первых двух наблюдений, а выход - из третьего. Отсюда следует, что первые два наблюдения, хотя и помечены как неучитываемые, используются в тестовом множестве. Таким образом, чтобы полностью разделить эти множества, пришлось бы сформировать отдельные блоки обучающих, контрольных и тестовых наблюдений, отделенные друг от друга достаточным числом неучитываемых наблюдений. Несколько первых наблюдений можно использовать только в качестве входных данных. При выборе наблюдений в ВР номер наблюдения всегда соответствует выходному значению, отсюда первые несколько наблюдений вообще невозможно выбрать и они автоматически помечаются программой как неучитываемые.

Для возможности применения в рамках обучения ИНС метода обратного распространения ошибки накладываются определенные условия на передаточную функцию, в частности, дифференцируемость. В качестве типичной передаточной функции нейронов ряд исследователей [7; 8] рекомендуют сигмоидальную. Благодаря характерной нелинейности данной функции активации нейроны обладают достаточно хорошей обучаемостью. Использование сигмоида ограничивает пределы изменения выходного сигнала между 0 и 1, что обеспечивает устойчивость формируемой нейронной сети.

На этапе обучения нейронная сеть моделирует целевую функцию по множеству наборов обучающей выборки, т.е. решает задачу интерполяции [2; 3; 9]. На этапе использования обученной нейронной сети (получении прогноза) она будет использовать восстановленную зависимость для получения прогнозируемой величины, т.е. решать задачу экстраполяции.

Процесс обучения нейронной сети требует набора примеров для ее желаемого поведения -целевых выходов и входов [8]. В процессе «обучения» веса должны настраиваться на минимизацию некоторого функционала ошибки, в качестве которого для нейронных сетей с прямой передачей сигналов рекомендуется среднеквадратичная ошибка между векторами выхода и входа. При обучении нейронной сети рассчитывается функционал, который характеризует качество обучения исследуемой сети.

Сходимость метода обратного распространения часто является достаточно медленным процессом. Подстройка весов осуществляется независимо для каждой пары образов обучающей выборки, при этом улучшение функционирования некоторой заданной пары может привести к ухудшению работы на предыдущих образах. Отработка описанной методики обучения ИНС проводилась на ВР урожайности зерновых культур, которые характеризуются выраженной изменчивостью, характеризующейся, например по коэффициенту вариации.

Алгоритм применения ИНС для решения задачи прогнозирования ВР включает этапы предпрогнозного анализа, обоснования и формирования структуры, обучения сети, оценки погрешности и качества прогноза, проведения непосредственно прогнозирования. В процессе численных поисковых экспериментов анализировались возможности краткосрочного прогнозирования урожайности на примере ВР зерновых культур, в частности подсолнечника. В качестве информационного источника использовались многолетние данные Федеральной службы государственной статистики по Волгоградской области (Волгоградстат). За базовую структуру ИНС принимался реализованный в среде БММ V. 4.0 трехслойный персептрон [10], который часто используется при решении задачи прогнозирования в различных отраслях экономики.

Предварительный анализ исследуемых ВР урожайности выполнился с помощью методов описательной статистики. При этом определялись основные статистические параметры с использованием процедуры описательной статистики: среднее, стандартная ошибка, стандартное отклонение, дисперсия выборки, эксцесс, ассиметричность, интервал (размах отклонения), сумма вариант. Основной задачей ставилась статистическая проверка нулевой гипотезы Н0 о соответствии эмпирического распределения урожайности нормальному закону по статистическим критериям Пирсона и Колмогорова-Смирнова. Расчеты показали, что исследуемый ВР урожайности характеризуется выраженным несоответствием распределения исследуемых урожайностей нормальному закону распределения.

Особенностью проведенного исследования явилось использование результатов предварительно выполненного автокорелляционного анализа для уточнения параметров формируемой ИНС. Проведенные поисковые численные эксперименты подтвердили эффективность процесса обучения сети в ручном и автоматизированном режимах при числе итераций свыше 100-200, что позволяет на 30-50% повышать начально складывающуюся точность прогнозов как по интегральной, так и индивидуальной относительной погрешностям, обеспечивая ее величину для трехслойной ИНС в пределах 15-25%.

Таким образом, для создания экономико-математической модели ВР с использованием нейросетевой технологии, дополненной предпрогнозным анализом статистических характеристик многолетних рядов урожайности подсолнечника, была обоснована структура ИНС в форме трехслойного перцептрона, выполнено ее «обучение» и доказана возможность получения краткосрочных прогнозов урожайности в условиях рискованного земледелия, характерных для Нижнего Поволжья, с погрешностью в пределах 15-25%.

Библиографический список

1. Ильченко А.Н. Экономико-математические методы. - М.: Финансы и статистика, 2009. - 288 с.

2. Крисилов В.А., Чумичкин К.В., Кондратюк А.В. Представление исходных данных в задачах нейросетевого прогнозирования // Конференция «Нейроинформатика 2003». - М.: Научная сессия МИФИ, 2003. С. 184-191.

3. Лозовой Я.С., Секирин А.И. Решение задачи прогнозирования с помощью нейронных сетей [Электронный ресурс]. - Режим доступа: http://www.rusnauka.com/1_NI0_2011/ Informatica/78176.doc.htm

4. Нейронные сети. STATISTICA Neural Networks: Методология и технологии современного анализа данных / Под редакцией В. П. Боровикова. - М: Горячая линия - Телеком, 2008. - 392 с.

5. Рогачев А.Ф. Параметризация эконометрических зависимостей методом наименьших модулей // Управление экономическими системами: электронный научный журнал, 2011. - № 3 (27). -№ гос. рег. статьи 0421100034/. - Режим доступа: http://www.uecs.mcnip.ru/

6. Рогачев А.Ф. Алгоритмическое моделирование урожайности зерновых культур с использованием лингвистических переменных // Известия Нижневолжского агропромышленного университетского комплекса», Волгоград, ВГСХА. - 2009. № 1. - С. 136-143.

7. Суменков М.С. Прогнозирование динамики экономических параметров предприятия на основе нейронных сетей // Экономические науки. - 2012. - № 2. - С. 90-94.

8. Хайкин С. Нейронные сети: полный курс / С. Хайкин. 2-е изд., испр.; пер. с англ. - М. : ООО «И.Д. Вильямс», 2006. - 1104 с.

i Надоели баннеры? Вы всегда можете отключить рекламу.