Научная статья на тему 'КОМПЛЕКСНАЯ ОЦЕНКА ИНФОРМАТИВНОСТИ ФИЗИКО-ХИМИЧЕСКИХ ПОКАЗАТЕЛЕЙ СЕЛЬСКОХОЗЯЙСТВЕННЫХ УГОДИЙ'

КОМПЛЕКСНАЯ ОЦЕНКА ИНФОРМАТИВНОСТИ ФИЗИКО-ХИМИЧЕСКИХ ПОКАЗАТЕЛЕЙ СЕЛЬСКОХОЗЯЙСТВЕННЫХ УГОДИЙ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
75
15
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ИНТЕЛЛЕКТУАЛЬНЫЙ АНАЛИЗ ДАННЫХ / СЕЛЬСКОХОЗЯЙСТВЕННЫЕ УГОДЬЯ / СИСТЕМЫ ПОДДЕРЖКИ ПРИНЯТИЯ РЕШЕНИЙ / МАШИННОЕ ОБУЧЕНИЕ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Котов Ярослав Сергеевич, Греченева Анастасия Владимировна, Голбан Андрей Николаевич, Макеев Константин Алексеевич, Смыслов Дмитрий Максимович

Рассмотрена методология оценки информативности и значимости признаков метеорологических и физико-химических параметров сельскохозяйственных угодий для задач прогнозирования с помощью методов машинного обучения и построения базы знаний для интеллектуальной системы поддержки принятия решений. Выделены наиболее информативные показатели, согласно знаниям, накопленным специалистами в профильной области и результатам проведения корреляционно-регрессионный анализ на основе открытых данных.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Котов Ярослав Сергеевич, Греченева Анастасия Владимировна, Голбан Андрей Николаевич, Макеев Константин Алексеевич, Смыслов Дмитрий Максимович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

INTEGRATED ASSESSMENT OF THE INFORMA TIVITY OF PHYSICAL AND CHEMICAL INDICA TORS OF AGRICULTURAL LAND

The methodology for assessing the information content and significance of signs of meteorological and physico-chemical parameters of agricultural land for forecasting problems using machine learning methods and building a knowledge base for an intelligent decision support system is considered. The most informative indicators have been identified, according to the knowledge accumulated by specialists in the relevant field and the results of a correlation-regression analysis based on open data.

Текст научной работы на тему «КОМПЛЕКСНАЯ ОЦЕНКА ИНФОРМАТИВНОСТИ ФИЗИКО-ХИМИЧЕСКИХ ПОКАЗАТЕЛЕЙ СЕЛЬСКОХОЗЯЙСТВЕННЫХ УГОДИЙ»

Зобнин Константин Александрович, соискатель, Z_o@mail.ru, Россия, Санкт-Петербург, Научно-исследовательский институт РУБИН "Рубин",

Лаута Олег Сергеевич, д-р техн. наук, профессор, laos-82@yandex. ru, Россия, Санкт-Петербург, Государственный университет морского и речного флота им. адмирала С. О. Макарова

A MODEL FOR ASSESSING THE RELIABILITY OF A REGIONAL DATA TRANSMISSION, PROCESSING

AND STORAGE NETWORK

S.A. Bagretsov, S.S. Sokolov, K.A. Zobnin, O.S. Lauta

The article considers a complex model of the functioning of the central core of the regional data transmission, processing and storage network - the administrative center for information processing, and their interaction model, on the basis of which it is possible to control flows between all levels of the regional data transmission, processing and storage network, and also assesses the reliability of the regional data transmission, processing and storage network, as a complex system.

Key words: regional data transmission, processing and storage network, administrative information processing center, Poisson information flow, Markov graphs.

Bagretsov Sergey Alekseevich, doctor of technical sciences, professor, bogrecoVV@mail.ru, Russia, St. Petersburg, Military Academy of Communications named after Marshal of the Soviet Union S.M. Budyonny,

Sokolov Sergey Sergeevich, doctor of technical sciences, vice-rector for educational activities, sokolo Vv_S_S@yandex.ru, Russia, St. Petersburg, Admiral S.O. Makarov State University of the Sea and River Fleet,

Zobnin Konstantin Alexandrovich, applicant, Z_o@mail.ru, Russia, Saint Petersburg, RUBIN Research Institute "Rubin",

Lauta Oleg Sergeevich, doctor of technical sciences, professor, laos-82@yandex.ru, Russia, St. Petersburg, Admiral S.O. Makarov State University of Marine and River Fleet

УДК 004.6

DOI: 10.24412/2071-6168-2023-1-363-369

КОМПЛЕКСНАЯ ОЦЕНКА ИНФОРМАТИВНОСТИ ФИЗИКО-ХИМИЧЕСКИХ ПОКАЗАТЕЛЕЙ

СЕЛЬСКОХОЗЯЙСТВЕННЫХ УГОДИЙ

Я.С. Котов, А.В. Греченева, А.Н. Голбан, К.А. Макеев, Д.М. Смыслов

Рассмотрена методология оценки информативности и значимости признаков метеорологических и физико-химических параметров сельскохозяйственных угодий для задач прогнозирования с помощью методов машинного обучения и построения базы знаний для интеллектуальной системы поддержки принятия решений. Выделены наиболее информативные показатели, согласно знаниям, накопленным специалистами в профильной области и результатам проведения корреляционно-регрессионный анализ на основе открытых данных.

Ключевые слова: интеллектуальный анализ данных, сельскохозяйственные угодья, системы поддержки принятия решений, машинное обучение.

Высокая энтропия экосистем земель сельскохозяйственного назначения снижает точность бизнес-планирования аграрных предприятий разных масштабов, что, в свою очередь, может влиять не только на получаемую прибыль, но и на продовольственную безопасность как отдельных районов, так и регионов или стран [1, 2]. Помимо этого, антропогенный фактор негативно влияет на своевременность и качество принятия управленческих решений. Математическое моделирование позволяет совершать кратко- и долгосрочное прогнозирование динамики различных сельскохозяйственных показателей. Построение математической модели требует выделения наиболее информативных признаков, имеющих влияние на состояние экосистемы [3, 4].

Целью работы является проведение комплексной оценки информативности физико-химических показателей сельскохозяйственных угодий для построения интеллектуальных систем поддержки принятия решений в задачах растениеводства.

Описание методологии оценки информативности показателей. Для оценки информативности различных показателей с целью решения поставленной задачи были использованы 3 методологии:

1. Выделение наиболее информативных показателей на основе знаний, накопленных специалистами в профильной области. Информация содержится в базе знаний. Недостатками данной методологии являются низкая адаптивность для различных условий и низкая точность (либо невозможность) математических расчетов.

2. Проведение корреляционно-регрессионного анализа показателей на основе открытых наборов данных или данных, полученных от заказчика. Позволяет получить наиболее адаптивные и точные численные показатели, позволяющие интерпретировать те или иные показатели, как имеющие большую или меньшую информативность. Недостатком является необходимость наличия данных и необходимость повторного проведения анализа при изменении системы сбора данных, а также в случае изменения условий.

3. Проведение оценки важности признаков. Позволяет оценить влияние тех или иных признаков конкретного набора данных на качество прогнозы. Недостатком является необходимость проведения прогноза для оценки важности, т.е. вычленить и удалить данные, имеющие низкое или отрицательное влияние на качество прогноза возможно только после обучения модели, что может негативно сказаться на использовании вычислительных мощностей. Помимо этого, оценивается влияние различных признаков на одну, выбранную целевую функцию (прогнозируемый показатель).

Использование всех трех методик в комплексе позволяет компенсировать недостатки каждой методики в отдельности

При проведении корреляционно-регрессионного анализа использовался набор погодных данных, записанный институтом биогеохимии Макса Планка, собранный за период с 2009 по 2016 годы [5].

Проведение предварительной обработки и преобразования данных. Для проведения корреляционно-регрессионного анализа необходимо провести разведочный анализ и отчистку данных, а также произвести инжиниринг признаков [6]. Методология процесса интеллектуального анализа данных состоит из следующих этапов:

1. Поиск аномальных отклонений в значениях и их удаление.

2. Поиск пустых значений, их удаление или замена средними арифметическими, либо средними гармоническими значениями.

3. Проведение визуального анализа данных на основе построения графиков распределения

данных.

4. Преобразование признаков для более корректного отображения взаимосвязей между данными.

После удаление признаков, информация о которых не содержится в базе знаний, поскольку они не являются информативными, описательная статистика набора данных приведена в таблице:

Описательная статистика набора данных

Признак Атмосферное давление Температура воздуха Точка росы Влажность воздуха Давления водяного пара Концентрация водяного пара Скорость ветра Направление ветра

Число значений 420551 420551 420551 420551 420551 420551 420551 420551

Среднее значение 989,212 9,45 4,955 76,008 9,53 9,64 1,7 174,74

Стандартное отклонение 8,35 8,42 6,73 16,47 4,18 4,23 65,44 86,68

Минимальное значение 913,6 -23,01 -25,01 12,95 0,79 0,8 0 0

25ый процен-тиль 984,2 3,36 0,24 65,21 6,21 6,29 0,99 124,9

Медиана 989,58 9,42 5,22 79,3 8,86 8,96 1,76 198,1

75ый процен-тиль 994,72 15,47 10,07 89,4 12,35 12,49 2,86 234,1

Максимальное значение 1015,35 37,28 23,11 100 28,32 28,82 28,49 360

На данном этапе возможна примерная визуальная оценка функциональных зависимостей между данными с помощью парных графиков (рис. 1).

Набор данных содержит 420551 запись о климатических условиях, не содержит пустых значений. Признак «Скорость ветра» содержит аномальные значения - минимальное значение скорости ветра равна -9999 м/с, что не является возможным. Направление ветра не является информативным в представленном виде (в градусной мере) - 360° и 0° будут рассматриваться как противоположные значения, тогда как в действительности они совпадают. Для решения этой проблемы используется преобразование скорости и направления ветра в вектора ветра.

После проведения преобразований тепловая карта вектора ветра имеет следующий вид

(рис. 2).

Поскольку набор данных имеет вид временного ряда, в нем представлена последовательность отметок времени. Так как сезонность имеет значительное влияние на состояние экосистемы и имеет цикличный характер, время имеет высокую значимость при решении задачи прогнозирования временных

рядов [7]. Но в таком формате, в котором оно представлено в наборе данных, математической модели будут проблематично отследить зависимость между временем и динамикой в других показателях, что затруднит дальнейшую аппроксимацию целевой функции [8]. Поэтому признак отметок времени необходимо преобразовать в 2 синусоидальных сигнала, отображающих цикличность смены времени суток и смены сезона соответственно. Подобные преобразования создают высокую функциональную зависимость между временем и признаками, что повышает качество прогнозирования временного ряда.

Рис. 1. Парные графики набора данных до обработки

-400

После проведения всех преобразований парные графики для набора данных выглядят следующим образом (рис. 3).

А

Л

Щщ

зй ?

I

! в 1 \

Н

I- S

г»

а

; в о

I

о за « -» о зз ГвЧП «Ш Том росы

Рис. 3. Парные графики для набора данных после проведения предобработки

У

/

Дивп й|Ш пара

Рис. 4. График распределения давления водяных паров и концентрации водяных паров

366

у

/

I

дпл на подо

Рис. 5. График распределения точки росы и давления водяного пара

Ати дли Темпжча Тснларкы Влажицп Длдл вод адрл Кони на пора Свдгость ветра вксррет*. ветра у

Рис. 6. Диаграмма размаха, отображающая распределение данных

Аил дав 1 -0.045 -0 067 -0.018 -0054 -0.07 022 014

Тейп вош -0 045 1 09 087 087 -0048 -0.036

Тем« росы -0.067 09 1 097 0,97 -0.024 -0 043

Влаж кпд -0.018 1

Даел подпара -0,054 067 097 -0.15 1 1 0.011 -0 00036

Кони на парю -007 007 097 -0.15 1 1 00074 -00027

Скорость ветра х 022 <046 -0 024 0085 0011 00074 1

Скорость ветра у 014 <036 -0043 0032 -0 00036 -00027 06 1

1 ! I I

Рис. 7. Тепловая карта корреляционной матрицы

Проведение корреляционно-регрессионного анализа. Можно заметить, что концентрация водяных паров и давление водяных паров имеют прямую линейную зависимость друг с другом и экспоненциальную зависимость с точкой росы. Это можно проверить с помощью графиков распределения (рис. 4, рис. 5).

Помимо этого, парные графики вектора ветра с остальными признаками приобрели более сгруппированный вид.

Кроме того, распределение некоторых переменных (например, температуры воздуха и вектора скорости ветра у) близко к нормальному, что подтверждает диаграмма размаха (рис. 6).

Результаты проведения корреляционно-регрессионного анализа имеют следующий вид:

1. Точка росы, температура воздуха, давление водяных паров и концентрация водяных паров имеют высокую связность согласно шкале Чеддока. Это означает наличие линейной зависимости (рис. 7).

2. Точка росы, давление водяных паров и концентрация водяных паров имеют приближенную к экспоненциальной зависимости.

Заключение. Таким образом, для данного набора данных наиболее информативными показателями будут следующие: температура воздуха, точка росы, давление водяных паров, концентрация водяных паров. Стоит отметить, что перечень вышеперечисленных показателей не является применимым для любого набора данных, расчет показателей и выбор наиболее информативных признаков осуществляется индивидуально для каждого нового набора данных [9]. Помимо этого, классические методы корреляционно-регрессионного анализа позволяют отслеживать лишь линейные зависимости, то есть полученные выводы нельзя интерпретировать, как невозможность использования показателей с низким коэффициентом корреляции для аппроксимации функции и восстановления регрессии. В данном случае, высокая информативность показателей означает низкую степень энтропии выбранных показателей в рамках заданной системы, что облегчает их применение для задач прогнозирования.

Работа выполнена при поддержке Фонда содействия инновациям договор № 17215ГУ/2021.

Список литературы

1. Гавриловская Н.В. Система информационной поддержки программных комплексов прогнозирования урожайности сельскохозяйственных культур / Н.В. Гавриловская, А.В. Абрамова // Фундаментальные и прикладные исследования в математической экологии и агроэкологии: материалы международной школы-семинара, Барнаул, 22-24 июня 2012 года / Главный редактор: О.Н.Гончарова. Барнаул: Алтайский государственный университет, 2012. С. 58-61.

2. Клочков А.В., Соломко О.Б., Клочкова О.С. Влияние погодных условий на урожайность сельскохозяйственных культур. [Электронный ресурс] URL: https://cyberleninka.ru/article/nMiyanie-pogodnyh-usloviy-na-urozhaynost-selskohozyaystvennyh-kultur/viewer (дата обращения: 12.12.2022).

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

3. Software complex "forecasting of production and economic indicators for agricultural production" / Ya. M. Ivano, A. Romme, Zh. Varanitsa-Gorodovskaya, M. N. Barsukova // Critical Infrastructures in the Digital World (IWCI-2021) : Proceeding of International Workshop, Baykalsk,Irkutsk, 26 марта - 02 2021 года / ИСЭМ СО РАН. Baykalsk, Irkutsk: Изд-во ИСЭМ СО РАН, 2021. P. 32.

4. Голбан А.Н., Котов Я.С., Макеев К.А. Исследование и выбор ключевых параметров прогнозирования урожайности сельскохозяйственных культур // Современные инструментальные системы, информационные технологии и инновации: Сборник научных трудов XVII Международной научно-практической конференции, Курск, 17-18 марта 2022 года / Редколлегия: Разумов М.С. (отв. ред.). Курск: Юго-Западный государственный университет, 2022. С. 148-151.

5. Max Planck Institute for Biogeochemistry. [Электронный ресурс]. URL: https://www.bgc-jena.mpg.de/wetter (дата обращения: 18.12.2022).

6. Корреляционно-регрессионный анализ. [Электронный ресурс]. URL: https://koi.tspu.ru/koi books/fedotov5/rasdel8.hto#:~:text=%D0%94%D0%BB%D1%8F%20%D0%BE%D1% 86%D0%B5%D0%BD%D0%BA%D0%B8%20%D1%81%D0%B8%D0%BB%D1%8B%20%D1%81%D0%B 2%D1%8F%D0%B7%D0%B8%20%D0%B2,%2C9%20%D0%B4%D0%BE%201%2C0 (дата обращения: 18.12.2022).

7. Кремер Н.Ш. Теория вероятностей и математическая статистика М.: ЮНИТИ-ДАНА, 2018.

551 с.

8. Курс математического анализа: учебное издание для вузов / А.М. Тер-Крикоров, М.И. Ша-бунин. 7-е изд. М.: Лаборатория знаний, 2017. 672 с.

9. Balance and Correlation Analysis of Oilfield Injection-Production System Based on Data Mining / D. Kangxing, Z. Xinrui, L. Qiuyu [et al.] // Frontiers in Earth Science. 2022. Vol. 10. P. 876944. DOI: 10.3389/feart.2022.876944.

Котов Ярослав Сергеевич, студент, yaroslav.kotov. 01@mail.ru, Россия, Москва, Российский государственный аграрный университет - МСХА имени К. А. Тимирязева,

Греченева Анастасия Владимировна, канд. техн. наук, доцент, A. Grecheneva@rgau-msha.ru, Россия, Москва, Российский государственный аграрный университет - МСХА имени К. А. Тимирязева,

Голбан Андрей Николаевич, студент, andrey_golban17@mail.ru, Россия, Москва, Российский государственный аграрный университет - МСХА имени К. А . Тимирязева,

Макеев Константин Алексеевич, студент, kostia1500@smail.com, Россия, Москва, Российский государственный аграрный университет - МСХА имени К. А. Тимирязева,

Смыслов Дмитрий Максимович, студент, dimasmyslovv1234@smail.com, Россия, Москва, Российский государственный аграрный университет - МСХА имени К. А. Тимирязева

INTEGRATED ASSESSMENT OF THE INFORMA TIVITY OF PHYSICAL AND CHEMICAL INDICA TORS OF

AGRICULTURAL LAND

Ya.S. Kotov, A.V. Grecheneva, A.N. Golban, K.A. Makeev, D.M. Smyslov

The methodology for assessing the information content and significance of signs of meteorological and physico-chemical parameters of agricultural land for forecasting problems using machine learning methods and building a knowledge base for an intelligent decision support system is considered. The most informative indicators have been identified, according to the knowledge accumulated by specialists in the relevant field and the results of a correlation-regression analysis based on open data.

Key words: data mining, agricultural land, decision support systems, machine learning.

Kotov Yaroslav Sergeevich, student, yaroslav.kotov.01@mail.ru, Russia, Moscow, Russian State Agrarian University -Moscow Timiryazev Agricultural Academy,

Grecheneva Anastasia Vladimirovna, candidate of technical sciences, docent, A. Grecheneva@rgau-msha.ru, Russia, Moscow, Russian State Agrarian University - Moscow Timiryazev Agricultural Academy,

Golban Andrey Nikolaevich, student, andrey_golban17@mail.ru, Russia, Moscow, Russian State Agrarian University - Moscow Timiryazev Agricultural Academy,

Makeev Konstantin Alekseevich, student, kostia1500@gmail.com, Russia, Moscow, Russian State Agrarian University - Moscow Timiryazev Agricultural Academy,

Smyslov Dmitry Maksimovich, student, dimasmyslovv1234@gmail. com, Russia, Moscow, Russian State Agrarian University - Moscow Timiryazev Agricultural Academy

УДК 674.02

DOI: 10.24412/2071-6168-2023-1-369-375

АНАЛИЗ РЕСУРСОСБЕРЕГАЮЩИХ ТЕХНОЛОГИЙ, ПРИМЕНЯЕМЫХ ДЛЯ ИЗГОТОВЛЕНИЯ ШТУЧНОГО ПАРКЕТА

А.Р. Бирман, В.А. Соколова, С.А. Войнаш, Р.Р. Загидуллин

В статье предложена новая технология изготовления штучного паркета. Рассмотрена конструкция планки штучного паркета из древесины твердых лиственных пород. Проведен анализ норм расхода пиломатериалов. Представлена технологическая трудоемкость изготовления штучного паркета. Внедрение предлагаемой технологии позволит вдвое уменьшить припуск на строжку нижней пла-сти паркетных планок, который составляет 2 мм, что снизит расход древесины при изготовлении паркетных планок приблизительно на 6 %. Новая технология позволяет осуществить совместные изготовление и сортировку по видам равного количества «правых» и «левых» планок с использованием одного производственного потока.

Ключевые слова: паркет, технология изготовления паркета, пиломатериал, паз, планка, фрезерование, кромка.

Не стоит думать, что паркет выходит из моды, уступая место дорогому ламинату или более экономичному линолеуму. Те, кто хотят украсить свой дом в классическом стиле, где сочетаются элегантность, строгость и солидность, предпочитают паркет другим видам обустройства пола. При этом, штучный паркет всегда считался наиболее престижным и долговечным покрытием для пола, но при условии его изготовления из высококачественной и эстетичной древесины твердых лиственных пород, которая всегда была дефицитной и дорогой. Именно затраты на древесину составляют 35% от всех затрат на устройстве полов для многоэтажных зданий. Поэтому внедрение ресурсосберегающих технологий изготовления штучного паркета без снижения его достоинств является актуальной задачей.

Известен штучный паркет, выпускавшийся по ГОСТ 862.1-85 [1], рис.1.

Форма, размеры планок и предельные отклонения от них должны соответствовать данным, указанным в табл.1.

i Надоели баннеры? Вы всегда можете отключить рекламу.