Научная статья на тему 'Прогнозная нейросетевая модель наполнения доходной части бюджета муниципальных образований'

Прогнозная нейросетевая модель наполнения доходной части бюджета муниципальных образований Текст научной статьи по специальности «Математика»

CC BY
215
28
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
НЕЙРОСЕТЕВАЯ МОДЕЛЬ / МЕТОД НАИМЕНЬШИХ КВАДРАТОВ / СЛУЧАЙНЫЕ ВЕЛИЧИНЫ / МУНИЦИПАЛЬНОЕ ОБРАЗОВАНИЕ / НОРМАЛЬНЫЙ ЗАКОН РАСПРЕДЕЛЕНИЯ / БАЗА ДАННЫХ / МЕТОД ОБОБЩЕННОГО ПЕРЕКРЕСТНОГО ПОДТВЕРЖДЕНИЯ

Аннотация научной статьи по математике, автор научной работы — Бирюков Александр Николаевич

Для оптимального бюджетирования нужны адекватные количественные математические модели. Прежде всего, необходима прогнозная модель доходной и расходной частей бюджета. Построение таких моделей является непростым делом, поскольку условия моделирования очень сложны, к примеру, моделируемая система характеризуется наличием в базе данных (БД) сильного зашумления и даже сознательных искажений (приписок) в силу субъективных тенденций планирования и отчетности и ряда других сложностей. Перечисленные в статье условия моделирования потребовали разработки методологии построения прогнозной нелинейной многофакторной гибридной модели наполнения муниципального бюджета, которая могла бы стать основой управления процессом бюджетирования.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Бирюков Александр Николаевич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Прогнозная нейросетевая модель наполнения доходной части бюджета муниципальных образований»

Вестник Челябинского государственного университета. 2011. № 16 (231).

Экономика. Вып. 32. С. 74-81.

РЕГИОНАЛЬНАЯ ЭКОНОМИКА

А. Н. Бирюков

ПРОГНОЗНАЯ НЕЙРОСЕТЕВАЯ МОДЕЛЬ НАПОЛНЕНИЯ ДОХОДНОЙ ЧАСТИ БЮДЖЕТА МУНИЦИПАЛЬНЫХ ОБРАЗОВАНИЙ

Для оптимального бюджетирования нужны адекватные количественные математические модели. Прежде всего, необходима прогнозная модель доходной и расходной частей бюджета. Построение таких моделей является непростым делом, поскольку условия моделирования очень сложны, к примеру, моделируемая система характеризуется наличием в базе данных (БД) сильного зашумления и даже сознательных искажений (приписок) в силу субъективных тенденций планирования и отчетности и ряда других сложностей.

Перечисленные в статье условия моделирования потребовали разработки методологии построения прогнозной нелинейной многофакторной гибридной модели наполнения муниципального бюджета, которая могла бы стать основой управления процессом бюджетирования.

Ключевые слова: нейросетевая модель, метод наименьших квадратов, случайные величины, муниципальное образование, нормальный закон распределения, база данных, метод обобщенного перекрестного подтверждения.

Федеральная налоговая служба (ФНС) является частью финансовой системы РФ (рис. 1), а налоговое администрирование — составной частью государственного администрирования (рис. 2) [1]. Налоговое администрирование призвано решать разнообразный круг задач налогового планирования, налогового регулирования, налогового контроля (рис. 3) [2].

Среди задач планирования в блоке I важнейшей является задача прогноза налоговых поступлений в консолидированный бюджет, которой посвящена данная статья. Для построения прогнозной многофакторной нелинейной модели использованы инструментарии: нейросетевой — для восстановления динамических многомерных зависимостей, «зашитых» в исходных данных; вероятностный — для оценки риска выхода доверительного интервала прогноза за назначенные границы. В пользу такого выбора инстру-ментариев моделирования говорят следующие соображения.

Условия моделирования в рассматриваемой задаче являются тяжелыми: данные сильно зашум-лены в отчетной документации, и вектор входных факторов X имеет большую размерность, а число наблюдений относительно небольшое.

Нейросетевые методы моделирования [3] являются универсальным инструментом исследования широкого круга задач: восстановления нелинейных многомерных зависимостей, скрытых в исходных данных, кластеризации, прогнозирования, оптимизации, дискриминантного анализа и др. Причем нейросети способны сохранять работоспособность в сложных условиях моделирования с высоким уровнем неопределенности (защемления и искажения данных, их неполнота, дефицит наблюдений, большая размерность пространства зависимых и независимых переменных до нескольких десятков), нарушение практически всех предпосылок метода наименьших квадратов (МНК), на фундаменте которого покоится классический регрессионный анализ.

МИНИСТЕРСТВО ФИНАНСОВ РФ

Рис. 1. Подведомственные Министерству финансов РФ федеральные службы

Рис. 2. Налоговое администрирование во взаимодействии с налоговой системой страны

Рис. 3. Задачи налогового администрирования

Платой за эффективность и универсальность нейросетевых эмуляторов в сложных условиях моделирования является необходимость настройки модели: предобработки данных в аспекте повышения ее информативности, регуляри-

зации алгоритма обучения сети [3], проверки адекватности модели и др. Тем не менее, как показывает опыт применения нейросетей [4; 5; 6], эти проблемы вполне преодолимы, если использовать системный подход к построению моделей.

Особенности использования коэффициента риска [7] как числовой меры риска прогнозных оценок обсуждаются ниже.

1. Построение нейросетевой модели. В качестве моделируемого показателя выбран объем собственных доходов Г, формируемый в соответствии с [8] за счет:

- налоговых доходов, зачисляемых в бюджет муниципального образования (городского округа и муниципальных районов, состоящих из бюджетов поселений (сельских и городских)) в соответствии с бюджетным законодательством РФ и законодательством о налогах и сборах субъекта РФ;

- неналоговых доходов, зачисляемых в бюджет муниципального образования в соответствии с законодательством РФ;

- безвозмездных и безвозвратных перечислений.

Нейросетевая математическая модель строится в виде

М [ГX, г] = F(Х,ж,г) + е,

(1)

где М [Г X, г ] — условное математическое ожидание моделируемой случайной величины (СВ) — суммы дохода бюджета при условии, что случайный вектор независимых переменных принял фиксированное значение (X = X) в фиксированный момент времени г; Ж — матрица параметров модели (синоптических весовых множителей); е — случайная ошибка аппроксимации; F () — оператор нейросетевого отображения, задающий алгоритм вычисления Г по заданным значениям X и г; стрелка означает статистическую оценку случайной величины; большими латинскими буквами X и Г обозначают сами СВ, а малыми буквами у, х — их конкретные (числовые) реализации; Х1, ..., X . ., Хп — компоненты вектора X ; крышкой сверху «€» обозначаются рассчитанные (оцененные) значения величин.

Поскольку строится динамическая модель, то в качестве носителя информации о «быстром времени» (с интервалом один месяц) выбрана независимая переменная Х1 — относительное время:

X

Л / Т,

(2)

где ^ — текущее время отсчета, измеряемое в месяцах; Т — период наблюдений, равный 48 месяцам (2006... 2009 гг.). Таким образом, диапазон изменения объясняющей переменной X1 составляет Х1 е [0,0208; 1].

В качестве управляющих воздействий, формирующих поступление финансовых средств

в бюджет муниципального образования, в модель введены две объясняющие переменные:

X2 — норматив налога на доходы физических лиц, отчисляемого в местный бюджет НДФЛ, %;

X3 — норматив единого налога на вмененный доход для отдельных видов деятельности, отчисляемого в местный бюджет ЕНВД, %.

Указанные нормативы устанавливаются местными органами самоуправления и прямо влияют на наполнение бюджета, а также являются обратной связью, косвенно влияющей на доходную часть бюджета МО через формирование микроклимата для мелкого бизнеса на территории МО.

Объясняющие переменные X X5 характеризуют соотношения налоговых и неналоговых доходов:

X4 — сумма налоговых доходов, которая представляет собой агрегированный показатель, который включает 11 составляющих: налог на прибыль организаций; налог на доходы физических лиц; акцизы на алкогольную продукцию; акцизы на пиво; единый налог, взимаемый в связи с применением упрощенной системы налогообложения; единый налог на вмененный доход для отдельных видов деятельности; налог на имущество физических лиц; налог на имущество организаций; налог на добычу полезных ископаемых; земельный налог; госпошлина; прочие налоги;

X5 — сумма неналоговых доходов, которая тоже является агрегированным показателем, включающим 7 компонентов: арендную плату за земли МО; доходы от сдачи в аренду имущества, находящегося в муниципальной собственности; доходы от перечисления части прибыли муниципальных унитарных предприятий; платежи за негативное воздействие на окружающую среду; доходы от оказания платных услуг.

Для учета предыстории экономического процесса, т. е. «медленного времени», при формировании «русла» предложено ввести в модель лаго-вые переменные. Для выявления значимых лагов была построена автокорреляционная функция временного ряда У(X1) , которая показала, что наиболее значимыми являются лаги т1 = 1 месяц и т2 = 3 месяца (или в относительных единицах т1 = 0,0208 и т2 = 0,0624). С указанными лагами введены переменные:

X = Г • X = Г

б,г г - 0,0208' 7,г г - 0,0624'

То есть значения объясняющей лаговой переменной X6 в момент времени г равно значению выходной (зависимой переменной Г), сдвинуто-

му назад на 1 временной интервал. Лаговая переменная Х1 ( равна значению У, сдвинутому назад на 3 временных интервала.

Теория и практика нейросетевого моделирования [6] показывает, что введение лаговых переменных значительно улучшает прогностические свойства модели. Поскольку наблюдения охватывают достаточно длительный период (3 года), в течение которого изменяется внешняя экономическая среда, введен фактор:

Х8 — средний индекс инфляции, вычисляемый по формуле

х8 = (ИПЦ + ИЦП) / 2, (3)

где ИПЦ — индекс потребительских цен; ИЦП — индекс цен на промышленную продукцию.

Объясняющая переменная Х9 несет информацию об управленческих расходах по обслуживанию бюджета. Х9 — фонд оплаты труда госслужащих муниципального образования.

Таким образом, сформирована база данных для построения нейро-сетевой прогнозной модели, фрагмент которой показан в табл. 1. Все переменные нормированы стандартным способом:

сь =

С - с

& =

N

I (с - с)2

г=1

(4)

где с — нормированная величина; а. — текущее значение а в / -м наблюдении; а — среднее значение; Ба — среднеквадратичное отклонение (СКО) величины а по столбцу.

В [6] показано, что такая нормировка делает распределение наблюдений У. по области эксперимента [хут1п; хутах], у = 1, п более равномерным, а значит, более информативным.

Задача выбора архитектуры сети, активацион-ных функций и параметров обучения решалась как задача оптимизации по специально построенному векторному критерию качества модели Ф (см. ниже).

2. Вероятностная модель оценки риска выхода за назначенный доверительный интервал

случайной величины У. Пусть с помощью обученной, протестированной и проэкзаменованной нейросетевой модели (НСМ) (1) в каждой точке базы данных к = 1, N вычислены случайные относительные ошибки расчета

5 г =

У - У г / У

(5)

Оговорим ряд допущений для получения расчетных формул оценки риска в нашей задаче. Случайная ошибка (5) обусловлена множеством причин: зашумлением базы данных, а также неучтенными входными факторами. Следовательно, опираясь на центральную предельную теорему теории вероятности [4], можно постулировать нормальный закон распределения (НЗР) плотности вероятности ошибки / (5).

Считаем, что закон распределения 5 не зависит от времени отчета к Если расчетная величина Уке определена по (1) корректно в аспекте качества аппроксимации, то математическое ожидание случайной величины 5к близко к нулю. Поэтому случайную величину 5к будем считать несмещенной.

При этих предложениях, считая, что неблагоприятным событием прогноза величины У является превышение относительной ошибки 5 некоторого наперед заданного значения 2, а благоприятным событием является событие 5 < 2, можно вычислить коэффициент риска прогноза [7]:

К2 = |(5- %) /(5)^5 / | (5 - %) /(5);

(6)

/ (5) =

1

ехр

(5 - т) 2о2

где / (5) — функция Гаусса, аппроксимирующая плотность вероятности СВ 5; т, о — математическое ожидание и дисперсия СВ 5.

На рис. 4 коэффициент риска, определяемый по (6), соответствует отношению площадей под кривой / (5) справа и слева от точки 2 на оси абсцисс.

Приведем расчетную формулу для коэффициента риска [7]:

Таблица 1

Нормированная база данных (2003 г.)

Номер наблюдения 1 Месяц XX1 XX 2 XX 3 XX 4 XX 5 XX 6 XX 7 XX 8 XX 9 У

4 Апрель -0,6751 0,9832 -1,0571 1,7555 -0,9224 -0,3149 -1,0773 1,5932 -1,6394 1,7711

5 Май -1,5989 0,9832 -1,0571 0,6676 -1,1547 1,7722 -1,2767 1,5932 -1,6394 0,3159

6 Июнь 1,5228 0,9832 -1,0571 0,4862 -1,1259 0,3179 -0,2829 1,5932 -1,6394 0,1053

7 Июль -1,4466 0,9832 -1,0571 1,0690 -0,3418 0,1074 1,7565 1,5932 -1,6394 1,1972

Kz =

ßz + (m - Z)[0,5 - 0,5 Ф(уz)] . ßz + (m - Z)[-0,5 - 0,5Ф(уz)];

ßz =

л/2П

exp

(Z - m2) 2g2

Y z =

Z - m

где Ф (у 2) — функция Лапласа.

В практических расчетах величины m и о заменяются своими выборочными оценками:

- 1 N т = N Х5^;

'=' (7)

k=1

G ^ G =

N-:

1 N

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

ЧI (8k -

- 1 k=i

g)2 .

Замечание. На практике может оказаться, что критерий согласия, например %2 — критерий Пирсона о НЗР СВ 5, не выполняется для заданной выборки и принятой доверительной вероятности P*. Тогда отношение площадей в (6) можно оценить по экспериментальной гистограмме, используя инструмент Excel.

3. Алгоритм оценки адекватности НСМ. Здесь использован байесовский подход из [9], согласно которому выбирались различные априорные гипотезы (Prior) об архитектуре НСМ в рамках одной метагипотезы (парадигмы сети).

В качестве Prior строилось 6 НСМ:

- HCM1-MLP с одним скрытым слоем, акти-вационной функцией сигмоида в нем (mlpl_sigm);

- HCM2-MLP с двумя скрытыми слоями, активационной функцией сигмоида в нем (mlp2_sigm);

- HCM3-MLP с двумя скрытыми слоями, активационной функцией в первом скрытом слое — сигмоида, во втором — гиперболический тангенс (mlp2_sigm tg);

- HCM4-MLP с одним скрытым слоем, активационной функцией гиперболический тангенс (mlpl_th);

- HCM5-MLP с двумя скрытыми слоями, активационной функцией гиперболический тангенс в них (mlp2_th_th);

- HCM6-MLP с двумя скрытыми слоями, активационной функцией в первом скрытом слое — гиперболический тангенс, во втором — сигмоид (mlp2_th_sigm).

Кроме того, для каждого типа сети проводились широкие серии вычислительных экспериментов по вариации числа нейронов в скрытых слоях и параметров обучения.

Результаты моделирования оценивались как средние арифметические на множестве Prior, т. е. по шести указанным HCM с различной ар-

хитектурой, что можно рассматривать как один из способов регуляризации сети.

4. Результаты вычислительных экспериментов по обучению сети, оптимизации архитектуры и оценке адекватности НСМ. При оценке качества НСМ использованы следующие числовые меры, выводимые на печать автоматически: MSE — среднеквадратическая ошибка нейросети (ненормализованная); NMSE — нормированная среднеквадратическая ошибка (MSE, деленная на разброс выходных значений Y); MAE — средняя абсолютная ошибка; Max Abs Error — максимальная абсолютная ошибка; rYf — коэффициент корреляции расчетных и экспериментальных значений выходной величины.

Указанные числовые меры выводятся на печать автоматически. Здесь операторы Min () и Max () берутся по числу итераций (эпох) обучения, а оператор усреднения MSE берется по множеству точек в базе данных соответственно для множества обучения Qtrain, кросс-валидации qcv и тестового Q.test.

Заметим, что коэффициент Гу^ характеризует тесноту корреляционной связи (согласованность) между двумя случайными величинами — экспериментальными Y и расчетными значениями моделируемой выходной величины.

Введем следующие числовые меры (частные критерии качества сети):

1) Ф1 — это MSE на Qlearn и Qtest, которые вычисляются по формуле

NMSEi =

Ntest I (yi i=1 У,)2

Ntest -1

(8)

2) Ф2 — это ошибка обобщения, которая равна М8Е на тестовом множестве т. е. вычисляется в точках БД, которые сеть не «знала» при обучении и перекрестном подтверждении; Ф2 вычисляется:

MAE =

Ntest ( А Л

I 1 у, - у,

i=1 V )

/ N

test.

i е Q

(9)

3) Ф3 — это максимальная относительная ошибка Ф3 на тестовом множестве, которая вычисляется по формуле

Ф3 = тах|5; / еП'е5', (10)

где Г, Г — фактическое (экспериментальное) и рассчитанное в нейросети значение выходной величины Г в 7-й точке базы данных.

4) Ф4 — это коэффициент риска выхода интервала прогноза за назначенные пределы, т. е. Ф4 = К2 по (6).

5) Показатель Ф5 = 1

где г2

ко-

эффициент детерминации между расчетным У и экспериментальным У значениями входной величины.

6) Показатель Ф6 вычисляется по формуле (ДФ1/ Фlmax ) 100 %_

(11)

Ф6 =

Дп

ДФ1 =

max

[Ф1 (п)]- min [Ф (п)]

где Ф6 — числовая мера чувствительности сети к вариации нейронов в скрытом слое по критерию М8Е.

По результатам вычислительных экспериментов для шести нейросетевых архитектур были рассчитаны шесть указанных выше частных критериев качества сети и вычислен обобщенный критерий качества Ф в виде мультипликативной свертки частных критериев

Ф = 106ПФу ^ min.

(12)

У=1

Данные расчета сведены в табл. 2, которая дает наглядную картину формирования оптимальной архитектуры сети.

По табл. 2 и другим результатам вычислительных экспериментов можно сделать обобщающие выводы:

1. Процедуры обучения сетей и множество перекрестного подтверждения (СУ), как следует из рис. 5, вполне устойчивы. Ошибка М8Е асимптотически снижается с ростом итераций (эпох) обучения до некоторого минимального значения. Процесс обучения и перекрестного подтверждения практически заканчивается при числе эпох 5000. Явления переобучения, т. е. роста М8Е, начиная с некоторого номера итераций, не наблюдается.

2. Все варианты сетей, представленых в табл. 2, можно считать приемлемыми по показателям ошибки обобщения и максимальной ошибке прогноза на тестовом множестве, который изменяется от 4 до 8 % по модулю.

3. Как видно из табл. 2, при варьировании числа нейронов в первом и втором скрытых слоях сеть вполне управляема по качеству: чувствительность к этой вариации, измеренная показателем Ф6, изменяется от 4 до 33,2 %. Наименьшая чувствительность к указанной вариации проявляется в первом скрытом слое (сети НСМ1, НСМ3) с активационной функцией типа сигмо-ида в этом слое. Наибольшая чувствительность 33,2 % проявляется в двухслойной архитектуре с активационными функциями гиперболических

тангенса в первом слое и сигмоида во втором слое (НСМ6).

4. Для табл. 2 среднее значение коэффициента риска к = Ф4 выхода прогнозной оценки за 30 %-й уровень относительной ошибки, т. е. 5 > 2 = 1,3 5, составляет 0,535, что является неприемлемым для проекта рабочей НСМ: риск слишком велик. Однако здесь есть резервы улучшения качества модели по показателю Ф4:

а) поскольку при прочих равных условиях НСМ чувствительна к вариации архитектуры и виду активационных функций (Ф4 в табл. 2 изменяется от 0,4062 до 0,76, т. е. в 1,836 раза), то, формируя оптимальное русло, можно снизить Ф4 до приемлемого уровня — ниже 0,4;

б) если, по мнению экспертов, в предметной области возможно загрубить прогнозную оценку в смысле расширения доверительного интервала, например принять 2 = 1,4 5, то коэффициент риска к = Ф4 автоматически снизится.

5. По обобщенному показателю качества Ф, учитывающему показатели точности и достоверности прогноза, в табл. 2 они изменяются от 0,00421 до 0,16, т. е. в 38 раз; модель хорошо управляема при вариации архитектуры сети, вида активационных функций и числа нейронов в скрытых слоях. Здесь кроются очень большие резервы формирования оптимальной архитектуры.

Решение задачи линейного программирования для оптимизации архитектуры НСМ

В качестве управляющих параметров сети были выбраны:

и — число скрытых слоев сети; и2 — число нейронов в первом скрытом слое; и3 — число нейронов во втором скрытом слое; и4 — тип ак-тивационной функции (бинарная переменная):

1, если/($) — сигмоидная функция; 0, если /($) — гиперболический тангенс.

и4 =

На основе вычислительных экспериментов, для мультипликативного показателя Ф было получено линейное уравнение регрессии, аппроксимирующее зависимость Ф от управляющих факторов и :

Ф€ = -0,52 • и0 - 0,02674 • и1 + 0,141- и2 + + 0,157 • и3 + 0,143 • и4; и0 = 1. (13) Задача целочисленного программирования для оптимизации архитектуры НСМ и актива-ционных функций имеет вид

2 €

г

Таблица 2

Сравнительная оценка НСМ с различной архитектурой и видами активационных функций

Показатели качества НСМ Виды нейросетей

НСМ1 НСМ2 НСМ3 НСМ4 НСМ5 НСМ6

Ф! — финальная среднеквадратическая ошибка обучения для нормированной величины У (М8Б на О'8*') Ф2 — ошибка обобщения (М8Б на О.'8*') Ф3 — максимальная относительная ошибка |5 |на тестовом множестве Ф4 — коэффициент риска выхода относительной ошибки прогнозной оценки за пределы 5 > 2; 2 = 1,3 5, 2 > 0 Ф5 = 1 - (Г у/)2 0,001588 0,01287 0,05 0,66 0,0233 0,00266 0,007339 0,04 0,4516 0,01196 0,0008523 0,08077 0,08 0,4062 0,07186 0,004093 0,01473 0,05 0,461 0,01037 0,00385 0,01138 0,05 0,646 0,01792 0,00227 0,01465 0,04 0,487 0,01099

Ф6 — чувствительность ошибки обучения (М8Б на О.'""™) к вариации числа нейронов в первом и втором скрытых слоях, % 4 Z////// 11,3 / / 12,05 4,5 X 7,9 22,5 / 17,2 33,2 / 18,75

Ф — обобщенный показатель качества сети ( 5 Л Ф = 106 П Ф* V V=1 у 0,0157 0,00421 0,161 0,0144 0,0292 0,00712

Ф = -0,52 - 0,02674 • u1 + 0,141-u2 + 0,157 • u3 + + 0,143 • u4 ^ m int(u);

u eD

D : 1 < u1 < 2; 1 < u2 < 5; 1 < u3 < 5; u1, u2, u3 — целые; (14)

u4 — двоичная; Ф < 0,00421;

u1, u2, u3 > 0.

Задача решалась стандартным способом в программной среде Excel методом ветвей и границ.

Результаты оптимизации (рабочий проект сети): парадигма — MLP; число скрытых слоев — 1; число нейронов в первом слое — 5; число нейронов во втором слое — 0; вид активаци-онной функции — сигмоидная; алгоритм обучения — обратное распространение ошибки (Back Propagation); алгоритм обработки сигналов — пакетный.

Оценка адекватности НСМ. Если числовую меру близости результатов расчета по независимым НСМ построить по вероятностному принципу, то можно оценить количественно как степень достоверности прогнозных оценок, так и их доверительный интервал.

В наших оценках мы использовали 6 независимых нейросетей (НСМ1-НСМ6) из табл. 2 и исследовали остатки 11 = yt - y€, где y , y€ — экспериментальные и рассчитанные в НСМ значения Y на всем доступном множестве примеров из БД (45 точек).

Алгоритм оценки адекватности следующий.

1. В каждой точке БД г е(Ои0.°У и) вычисляются относительные остатки 5..

г

2. Вычисляется мера уклонения 5г расчетных значений Yf друг от друга для независимых нейросетей. При этом за центр рассеяния принимается среднее значение относительной ошибки по 6 независимым нейросетям НСМ1-НСМ6:

5,- = (§,е -§,)/5,; i = 4,45, g = 1,6,

5, =

15,

V g=1

/ G,

(15)

где g — номер независимой нейросети; О — число независимых нейросетей.

Другими словами, ускорение 5,- исчисляется в долях от среднего 5г в каждой г-й точке.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

«Плохими» считаются точки, в которых критерий близости результатов расчетов по числовой мере нарушен:

щ;: 5, < £ = 1...2, г = 4,45. (16)

Таких точек оказалось: для НСМ1-17; НСМ2-15; НСМ3-14; НСМ4-22; НСМ5-12; НСМ6-21.

3. Вычисляются вероятности Р обобщенного перекрестного подтверждения для каждой g-й независимости сети как отношения

5z=N; z=1Л

(17)

где щ — число точек, для которых критерий близости оценок по методу ОПП выполнен; N— общее число исходных точек в БД N = 45).

4. Вычисляется средняя вероятность взаимного подтверждения независимых НСМ согласно методу ОПП:

р = ^, (18)

где G — количество независимых сетей.

Число точек с относительными отклонениями 5. больше 5 % невелико: 2 точки для НСМ1; 4 точки для НСМ2; 5 точек для НСМ3; 2 точки для НСМ4; 3 точки для НСМ5; 5 точек для НСМ6.

Наличие малого числа «выпадающих» точек вполне допустимо, поскольку при обучении сетей использован среднеквадратичный критерий модификации синоптических весов ^ который гарантирует близость расчетных и экспериментальных значений (величину 5/.) только в среднем. Следовательно, можно считать все 6 нейросетей хорошо обученными. Отсюда следует, что целесообразно смягчить условие близости независимых сетей друг к другу, например приняв в условие £ = 2. Тогда получим значение вероятностей взаимного совпадения результатов оценок:

Р1 = 35 = 0,77; Р2 = — = 0,8; Р3 = — = 0,866;

1 45 2 45 3 45

34 35 33

Р4 = — = 0,755; Р5 = — = 0,77; Р6 = — = 0,733.

4 45 45 45

Отметим, что полученные значения вероятностей Р^ для 6 сетей очень близки друг к другу, что свидетельствует косвенно о рациональном экспертном выборе числа £ = 2 в (16). Среднее значение вероятности Р = 0,782 вполне приемлемо для решаемой прогнозной задачи с учетом возможного сильного зашумления БД в силу ее экономической природы и дефицита наблюдений.

Выводы:

1. Разработана методология построения прогнозной нелинейной многофакторной гибридной модели наполнения муниципального бюджета, которая может быть основой управления процессом бюджетирования.

2. Подробно изучены вопросы оптимизации архитектуры нейросетевой модели и обоснова-

ния ее адекватности в сложных условиях моделирования.

Список литературы

1. Бублик, Н. Д. Организация налогового контроля: состояния и пути развития : учеб. пособие / Н. Д. Бублик, И. И. Лукина, Т. Н. Шаликова. Уфа : ВЗФЭИ, 2008. 314 с.

2. Моделирование налогового контроля: модели и методы / под ред. А. Н. Романова : учеб. пособие. М. : Экзамен, 2010. 400 с.

3. Хайкин, С. Нейронные сети: полный курс : пер. с англ. / С. Хайкин. 2-е изд. М. : Вильямс, 2006. 1104 с.

4. Гатауллин, Р. Ф. Моделирование бюджетных процессов на муниципальном уровне на основе нейросетей / Р. Ф. Гатауллин, С. А. Горбат-ков, А. Н. Бирюков, О. И. Глущенко. Уфа : Изд-во Вост. ун-та, 2008. 216 с.

5. Горбатков, С. А. Методы нейроматематики в налоговом контроле / С. А. Горбатков, Д. В. Полупанов ; под ред. С. А. Горбаткова. Уфа : БашГУ, 2008. 136 с.

6. Ежов, А. А. Нейрокомпьютинг и его применение в экономике и бизнесе : учеб. пособие / А. А. Ежов, С. А. Шумский ; под ред. В. В. Харитонова. М. : Изд-во Моск. инж.-физ. ун-та, 1998. 221 с.

7. Бублик, Н. Д. Стохастическая оптимизация риска как ресурса в экономических системах / Н. Д. Бублик, И. И. Голичев, С. А. Горбатков. Уфа : Изд-во БГУ, 2000. 136 с.

8. Методические указания субъектам РФ и муниципальным образованиям по регулированию межбюджетных отношений : Приказ М-ва финансов РФ от 27.07.2004 г. № 243.

9. Бирюков, А. Н. Обобщение метода вложенных математических моделей на основе байесовского подхода к регуляризации задач нейросете-вого моделирования налогового и финансового контроля / А. Н. Бирюков // Экономика и упр. 2010. № 1. С. 85-89.

i Надоели баннеры? Вы всегда можете отключить рекламу.