Научная статья на тему 'ПРОГНОЗИРОВАНИЕ НАЛОГОВЫХ ОБЯЗАТЕЛЬСТВ СЕЛЬСКОХОЗЯЙСТВЕННЫЙ ПРЕДПРИЯТИЙ С ИСПОЛЬЗОВАНИЕМ МЕТОДОВ МАШИННОГО ОБУЧЕНИЯ'

ПРОГНОЗИРОВАНИЕ НАЛОГОВЫХ ОБЯЗАТЕЛЬСТВ СЕЛЬСКОХОЗЯЙСТВЕННЫЙ ПРЕДПРИЯТИЙ С ИСПОЛЬЗОВАНИЕМ МЕТОДОВ МАШИННОГО ОБУЧЕНИЯ Текст научной статьи по специальности «Гуманитарные науки»

CC BY
0
0
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
налоговая нагрузка / налоговое планирование / налоговое прогнозирование / налоговый менеджмент / финансовый менеджмент / методы машинного обучения / дерево решений / случайный лес / градиентный бустинг / модели регрессии. / tax burden / tax planning / tax forecasting / tax management / financial management / machine learning methods / decision tree / random forest / gradient boosting / regression models.

Аннотация научной статьи по Гуманитарные науки, автор научной работы — Зарипова С.З.

В статье проведен анализ данных совокупности сельскохозяйственных предприятий и разработаны модели машинного обучения для прогнозирования налоговых обязательств. Объектом данного исследования является система статистических показателей сельскохозяйственных предприятий, отражающих уровень налоговой нагрузки. Цель исследования предсказание налоговой нагрузки с помощью методов машинного обучения. Применение современных средств искусственного интеллекта является неотъемлемым и неизбежным процессом во всех областях, включая налоговую сферу. Для построения моделей были использованы методы машинного обучения: регрессионный анализ, дерево решений, случайный лес и градиентный бустинг. Были разработаны модели для прогнозирования налоговой нагрузки на основе комплекса факторов. Высокое качество этих моделей позволит более точно оценивать финансовое состояние предприятий, выполнять расчеты рентабельности, прогнозировать доходность и принимать обоснованные инвестиционные решения.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по Гуманитарные науки , автор научной работы — Зарипова С.З.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

FORECASTING TAX LIABILITIES OF AGRICULTURAL ENTERPRISES USING MACHINE LEARNING METHODS

The article analyzes data from a set of agricultural enterprises and develops machine learning models for predicting tax liabilities. The object of this study is a system of statistical indicators of agricultural enterprises that reflect the level of tax burden. The purpose of the study is to predict the tax burden using machine learning methods. The use of modern artificial intelligence tools is an integral and inevitable process in all areas, including the tax sphere. Machine learning methods were used to build the models: regression analysis, decision tree, random forest and gradient boosting. Models have been developed to predict the tax burden based on a set of factors. The high quality of these models will make it possible to more accurately assess the financial condition of enterprises, perform profitability calculations, predict profitability and make informed investment decisions.

Текст научной работы на тему «ПРОГНОЗИРОВАНИЕ НАЛОГОВЫХ ОБЯЗАТЕЛЬСТВ СЕЛЬСКОХОЗЯЙСТВЕННЫЙ ПРЕДПРИЯТИЙ С ИСПОЛЬЗОВАНИЕМ МЕТОДОВ МАШИННОГО ОБУЧЕНИЯ»

Зарипова С.З. ассистент

кафедра «Бухгалтерский учет в других отраслях и аудит» Самаркандский институт экономики и сервиса

ПРОГНОЗИРОВАНИЕ НАЛОГОВЫХ ОБЯЗАТЕЛЬСТВ СЕЛЬСКОХОЗЯЙСТВЕННЫЙ ПРЕДПРИЯТИЙ С ИСПОЛЬЗОВАНИЕМ МЕТОДОВ МАШИННОГО ОБУЧЕНИЯ

Аннотация. В статье проведен анализ данных совокупности сельскохозяйственных предприятий и разработаны модели машинного обучения для прогнозирования налоговых обязательств. Объектом данного исследования является система статистических показателей сельскохозяйственных предприятий, отражающих уровень налоговой нагрузки. Цель исследования - предсказание налоговой нагрузки с помощью методов машинного обучения. Применение современных средств искусственного интеллекта является неотъемлемым и неизбежным процессом во всех областях, включая налоговую сферу. Для построения моделей были использованы методы машинного обучения: регрессионный анализ, дерево решений, случайный лес и градиентный бустинг. Были разработаны модели для прогнозирования налоговой нагрузки на основе комплекса факторов. Высокое качество этих моделей позволит более точно оценивать финансовое состояние предприятий, выполнять расчеты рентабельности, прогнозировать доходность и принимать обоснованные инвестиционные решения.

Ключевые слова: налоговая нагрузка, налоговое планирование, налоговое прогнозирование, налоговый менеджмент, финансовый менеджмент, методы машинного обучения, дерево решений, случайный лес, градиентный бустинг, модели регрессии.

Zaripova S.Z.

Department of "Accounting in other industries and auditing" Samarkand Institute of Economics and Service

FORECASTING TAX LIABILITIES OF AGRICULTURAL

ENTERPRISES USING MACHINE LEARNING METHODS

Annotation. The article analyzes data from a set of agricultural enterprises and develops machine learning models for predicting tax liabilities. The object of this study is a system of statistical indicators of agricultural enterprises that reflect the level of tax burden. The purpose of the study is to predict the tax burden using machine learning methods. The use of modern artificial intelligence tools is an integral and inevitable process in all areas, including the tax sphere. Machine

learning methods were used to build the models: regression analysis, decision tree, random forest and gradient boosting. Models have been developed to predict the tax burden based on a set of factors. The high quality of these models will make it possible to more accurately assess the financial condition of enterprises, perform profitability calculations, predict profitability and make informed investment decisions.

Key words: tax burden, tax planning, tax forecasting, tax management, financial management, machine learning methods, decision tree, random forest, gradient boosting, regression models.

Введение. Сегодня, мы можем наблюдать, как между налоговыми органами и налогоплательщиками возникает конфликт интересов. Конфликт интересов между налоговыми органами и налогоплательщиками часто обусловлен тем, что первые стремятся максимизировать поступления в бюджет всех уровней за счет налогов, в то время как вторые стараются минимизировать свои налоговые обязательства для увеличения доходов. Поэтому установление оптимальной налоговой нагрузки для организаций способствует их развитию и улучшению налоговой дисциплины. В то же время налоговая нагрузка является важным показателем состояния экономики. Высокий уровень налоговой нагрузки может негативно сказываться на экономической активности и инвестициях, тогда как слишком низкая налоговая нагрузка может привести к недофинансированию государственного бюджета. Размер налоговой нагрузки определяется конкретной налоговой системой, а также политикой и приоритетами государственного регулирования. В этом контексте задача любого государства - определить оптимальный уровень налоговой нагрузки, который обеспечит баланс интересов бюджета и бизнеса.

В целом, прогнозирование налоговой нагрузки представляет собой важный инструмент для государства, бизнеса и общества. Оно помогает выявлять потенциальные проблемы, предотвращать злоупотребления и оптимизировать налоговую систему для обеспечения устойчивого экономического роста и социального благополучия. Использование современных инструментов и программного обеспечения для прогнозирования налоговой нагрузки улучшит качество получаемых данных, сократит время на обработку информации и построение моделей, а также повысит эффективность экономической деятельности предприятий.

Анализ литературы. Современная экономическая ситуация требует улучшения качества прогнозирования как на макроуровне, так и на уровне отдельных предприятий. В постковидный период важно уметь точно и быстро прогнозировать риски для эффективного управления в условиях сложных обстоятельств и неопределенности в экономической деятельности. В условиях неопределенности и недостатка информации многие исследователи прибегают к использованию экспертного метода в своих

работах. Например, Трещевский Ю.И., Кособуцкая А.Ю. и Опойкова Е.А. применяли экспертный метод для прогнозирования влияния экономических мер на экономику региона. В работе Зуевой Т.И. этот метод был использован для прогнозирования параметров инновационного развития предприятий. Однако адаптация экспертных методов к изменяющимся условиям и обновлению данных (что особенно важно в налоговой сфере) представляется сложной задачей, поэтому требуется применение новых инструментов и методов анализа. Для построения прогнозных моделей традиционно используются статистические методы. Например, Храмцова Т.Г. и Храмцова О.О. применяют статистические методы для прогнозирования финансовых результатов предприятий. Однако, как указывается в проведенном обзоре литературы, применение методов машинного обучения в прогнозировании налоговой нагрузки пока недостаточно изучено. Также отсутствует сравнение результатов этих методов с результатами классического корреляционно-регрессионного анализа. Именно этому вопросу посвящена практическая часть проведенного исследования.

Методология. Для анализа были использованы данные бухгалтерской отчетности 20000 сельскохозяйственных предприятий Узбекистана за 2021 год. Исходная таблица содержала 20000 строк и 138 столбцов. В данных были выявлены пропущенные значения, качественные переменные и выбросы. Для начальной обработки данных была проведена работа с пропусками. Для некоторых показателей, указанных в форме №1 и №2 бухгалтерской отчетности, отсутствие данных означало, что значение этого показателя равно 0. Для остальных столбцов были удалены показатели с более чем 5% пропусками, а затем были удалены все строки, содержащие хотя бы один пропуск. В результате этой предварительной обработки данных из исследования были исключены 2179 предприятий.

После удаления пропущенных значений и выбросов в общей выборке осталось 15015 предприятий. В исследовании применялись модели машинного обучения для решения задач регрессии. Использовались следующие алгоритмы:

• Деревья решений;

• Случайный лес;

• Градиентный бустинг;

• Нейронные сети.

Анализ и результаты. Для возможности прогнозирования и выявления нелинейных взаимосвязей между признаками будет построены модели машинного обучения.

Модель "Дерево решений" строит граф с узлами, в которых задаются условия, и листьями, содержащими возможные решения. Для создания модели с оптимальными характеристиками был проведен подбор параметров с использованием функции GridSearchCV. Однако полученная

модель не обладает достаточно высоким качеством. Коэффициент детерминации показывает, что лишь 27, 4% вариации налоговой нагрузки могут быть объяснены влиянием включенных в модель факторов. Кроме того, в качестве метрик качества моделей рассматривались средняя ошибка и средняя абсолютная ошибка. Средняя ошибка прогноза составила 0, 04 при среднем значении признака 0, 075. Средняя абсолютная ошибка между предсказанными моделью значениями налоговой нагрузки и фактическими данными составляет 1, 1%. Исходя из низкого коэффициента детерминации и высоких значений ошибок, данная модель не пригодна для прогнозирования. Модель "Случайный лес" основана на использовании ансамбля деревьев решений и обычно демонстрирует более высокое качество прогнозирования. Для создания модели с наилучшим качеством также проводился подбор параметров. Полученный коэффициент детерминации составил 43, 4%, что свидетельствует о том, что 43, 4% вариации налоговой нагрузки объясняется влиянием включенных в модель факторов. Средняя ошибка составила 0, 03 при среднем значении признака 0, 075, а средняя абсолютная ошибка между предсказанными моделью значениями налоговой нагрузки и фактическими данными составила 0, 95%. В целом, качество модели оказалось выше, чем у модели, построенной с использованием алгоритма «Дерево решений». Для сравнения моделей мы построили модель с использованием алгоритма градиентного бустинга, основанного на дереве решений. Путем подбора параметров мы добились коэффициента детерминации на уровне 46, 2%, что означает, что 46, 2% изменчивости переменной (налоговой нагрузки) объясняется включенными в модель факторами.

Проанализируем прогнозные значения налоговой нагрузки, полученные наилучшей моделью из всех построенных, для трех случайно отобранных предприятий из выборки. Для первого предприятия прогнозируемый уровень налоговой нагрузки составил 7, 6%, что на 4, 1% превышает фактическое значение, что говорит о достаточно высокой погрешности. Для второго предприятия прогнозируемая налоговая нагрузка составила 5, 7%, в то время как фактический уровень составляет 3, 9%, разница составила 1, 8%. Для третьего предприятия прогноз показал 3, 1% налоговой нагрузки, тогда как на самом деле она составляет 6, 7%, разность между прогнозом и фактом составила 3, 1%. В общем, использование методов машинного обучения представляет перспективное направление для налогового прогнозирования и разработки налоговой стратегии компании.

Заключение. В ходе исследования была выполнена обработка данных о 20 000 сельскохозяйственных предприятиях с использованием языка программирования Python, после чего были построены модели прогнозирования налоговой нагрузки с использованием множественной линейной регрессии, дерева решений, случайного леса и градиентного бустинга. Сравнительный анализ моделей показал, что методы

градиентного бустинга и случайного леса значительно превосходят модели линейной регрессии и дерева решений по качеству прогнозирования при одинаковом наборе входных данных. Это свидетельствует о том, что применение методов машинного обучения способствует улучшению качества прогнозов и может быть успешно внедрено в практику предприятий. Важно отметить, что методический подход, представленный в данном исследовании, может быть использован не только экономическими субъектами для налогового планирования и прогнозирования, но также налоговыми органами для определения критериев выявления объектов пристального налогового контроля. Построение моделей с использованием методов машинного обучения позволяет выявить зависимые индикаторы, которые могут быть рассмотрены налоговыми органами вместе с низким уровнем налоговой нагрузки при выборе организаций для проведения выездного налогового контроля.

Использованные источники:

1. НАЛОГОВЫЙ КОДЕКС РЕСПУБЛИКИ УЗБЕКИСТАН (новая редакция) от 1 января 2020 года.

2. Тихонова, А. В. Налоговая нагрузка и иные мотивы законопослушного поведения физических лиц // Экономика. Налоги. Право. - 2021. - Т. 14, №

2. - С. 169-178.

3. Медюха, Е. В. Влияние налоговой нагрузки на финансово-хозяйственную деятельность предприятия / Е. В. Медюха, Е. В. Артюшенко // Вектор экономики. - 2019. - № 10(40). - С. 14.

4. Сравнение классических регрессионных моделей с моделями, построенными с помощью продвинутых методов машинного обучения / Шатров А.В., Пащенко Д.Э. //Advanced Science. 2019. № 1 (12). С. 24-28.

5. Модели машинного обучения в задаче прогнозирования природно-ресурсного потенциала пермского края / Копотева А.В., Максимов А.А., Сиротина Н.А. // Вестник Южно-Уральского государственного университета. Серия: Компьютерные технологии, управление, радиоэлектроника. - 2021. - Т. 21. - № 4. - С. 126-136.

6. Полухина И.В. Анализ рисков и внутрихозяйственных резервов устойчивого развития организаций в условиях беспрецедентных экономических ограничений и новых реалиях конкуренции // Современная экономика: проблемы и решения. - 2022. - № 5 (149). - C. 125-142.

7. Статистические методы налогового прогнозирования в условиях неопределенности внешней среды / Яблоков Д.Ю. // Проблемы экономики и управления в торговле и промышленности. - 2015. - № 2 (10). - С. 42-47.

8. Использование машинного обучения в финансовом прогнозировании в банках / Виноградов А.С. // Актуальные вопросы современной экономики. - 2022. - № 5. - С. 705-710.

9. Forecasting the production of gross output in agricultural sector of the ryazan oblast / Khudyakova E., Nikanorov M., Bystrenina I., Cherevatova T., Sycheva I. // Estudios de Economía Aplicada. - 2021. - T. 39. - № 6.

i Надоели баннеры? Вы всегда можете отключить рекламу.