РАЗДЕЛ 3 МОДЕЛИ, СИСТЕМЫ, СЕТИ В ПРИРОДЕ И ОБЩЕСТВЕ
УДК: 336.225.611
МЕРА УМЕНЬШЕНИЯ НЕОПРЕДЕЛЕННОСТИ И ХАОСА В ОЦЕНКЕ ОТКЛОНЕНИЙ ПОКАЗАТЕЛЕЙ НАЛОГОПЛАТЕЛЬЩИКОВ ОТ ЭТАЛОННОЙ ПОВЕРХНОСТИ
А. Н. Бирюков, О. И. Глущенко
Актуальной проблемой остается совершенствование технологии планирования налогового контроля. Современная деятельность налогоплательщиков в условиях кризиса мировой экономики характеризуется неопределенностью внешней и внутренней среды. Результатом этих тенденций является разброс выходных параметров экономической деятельности организаций, что во многих случаях предопределяет высокий риск неэффективности налоговых проверок. Поэтому переход к математической формализации этапов принятия решений наталкивается на ряд трудностей, связанных с проблемой моделирования плохо формализуемых систем. Одна из таких трудностей в обратных задачах восстановления зависимостей (интерпретации), которые относятся к классу некорректных (или плохо определенных), - это обеспечение устойчивости решений, отмеченных в статье, в сложных условиях моделирования.
1. Двойственная природа больших отклонений как результат неполного подавления дисфункций структурируемой математико-информационной системы.
Раскроем суть идей, заложенных в эту концепцию, и их связь с общесистемными законами. Главная идея состоит в том, что в отличие от существующих технологий налогового контроля камеральный анализ декларации отдельного налогоплательщика целесообразно проводить не изолированно, а в сравнении с показателями других налогоплательщиков, отраженных в эталонном фоне, т.е. в нейросетевой модели У(Х. IV) вида
При этом в соответствии с общесистемной фоновой закономерностью полезным сигналом, отраженным от фона, является относительное отклонение:
На основе этого отклонения от фона и строятся алгоритмы отбора налогоплательщиков с помощью вероятностных и фрактальных подходов.
(1)
8, = У У -100%.
У
(2)
При интерпретации отклонений экспериментальных значений моделируемого показателя У; от эталонных у в (2) могут возникать ошибки I и II рода («пропуск цели» или «ложная тревога»), т.е. неопределенность, которая вытекает как следствие из общесистемного закона о неполном подавлении дисфункций при структурировании математико-информационной системы.
Поясним это на конкретном примере задачи налогового контроля на стадии камеральных проверок. Пусть построена нейросетевая модель (НСМ)
и вычислено множество относительных отклонений {5;},! = 1, N . Как интерпретировать большие отклонения порядка сотен процентов? Природа таких отклонений двойственна.
В НСМ аппроксимации «производственной функции» объекта налогового контроля полезное взаимодействие (многоуровневое иерархическое структурирование, «эксплуатация» свойств нелинейной взаимосвязи компонент вектора входных факторов и обучения НСМ в условиях сильной зашумленности) порождает неоднозначную (вероятностную) оценку моделируемого показателя. Это практически приводит к неопределенности в интерпретации больших отклонений между расчетными («эталонными») и декларированными значениями моделируемого показателя У вида (2).
Действительно, в силу вероятностного характера оценки случайной величины У в нейросети даже хорошо обученная, адекватная и имеющая высокую точность НСМ «имеет право» на существование небольшого числа точек тестового множества, где имеются большие отклонения (2). Число этих точек задается пользователем при обучении НСМ и его нельзя сделать равным 0, ибо время обучения может стать недопустимым. Тогда становится неясным, чем вызваны большие отклонения в данных точках: ошибками расчета нейросети или это случай сознательного искажения деклараций на фоне условного математического ожидания (1)? Должен быть предусмотрен некоторый защитный (иммунный) механизм подавления указанных выше дисфункций математико-информационной модели. В качестве такого механизма может быть предложен вероятностный либо фрактальный критерий ранжирования.
Действительно, использование отклонения 5(2) как меры недостоверности отчетной документации имеет следующие недостатки [2]:
1. Специфика предметной области такова, что наиболее информативны в аспекте увеличения налоговых доначислений субъекты, у которых отклонения являются результатом сознательного систематического искажения информации. Отсюда следует, что необходимо учитывать предысторию каждого £-го объекта налогового контроля.
2. Возникают случайные искажения показателей декларации.
3. Имеется некоторая вероятность появления больших случайных ошибок обобщения, обусловленная самим алгоритмом нейросети (НС) (квадратичный критерий аппроксимации), так как квадратичный критерий обучения сети гарантирует малость ошибок только в среднем.
Устранить третий недостаток использования 5 как меры дискриминации налогоплательщиков по степени искажения ими налоговых деклараций позволяет метод оценки адекватности НСМ на основе байесовского подхода.
В отношении второй и третьей причин отметим, что возможны следующие случаи появления больших отклонений 5:
а) большое отклонение 5 вызвано кратковременными случайными дестабилизирующими факторами в момент прогнозных оценок ¿0;
б) большое отклонение 5 обусловлено систематическим сознательным искажением отчетной документации.
Для снижения чувствительности 5 к помехам, т.е. для подавления дисфункций, предлагается ввести меру риска, получаемую методами математической статистики, учитывающую предысторию конкретного объекта налогового контроля по следующему алгоритму (см. ниже пункт 2).
2. Вероятностный подход к оценке неопределенности в задаче ранжирования налогоплательщиков.
Идея вероятностного подхода (мера уменьшения неопределенности) при разработке критерия отбора налогоплательщиков для выездных проверок состоит в том, что этот критерий должен аккумулировать в себе как оценку величины отклонения (2), так и вероятность этого отклонения. Предлагается в качестве такого критерия мультипликативная свертка:
" ='о "о
где 8 ( = 8^ +11 - значение верхней границы доверительного интервала для отклонения 5(5^ = 5;), т.е. в записи отклонения фиксируется номер налогоплательщика я и момент наблюдения V, Р(5 > 5) - вероятность события,
* о
что ожидаемое значение отклонения 5Я моделируемой случайной величины У будет больше выборочного среднего 5 с учетом его смещения на полуширину доверительного интервала для {5Я}; ¿0 - момент времени, соответствующий последним данным декларации при ранжировании налогоплательщиков; М8 - экспертно задаваемый коэффициент масштаба £-го налогоплательщика.
Таким образом, задача ранжирования налогоплательщиков по критерию ^ требует решения как минимум трех взаимосвязанных задач:
1. Задачи аппроксимации базы данных с помощью стохастической математической модели (1) и вычисления по ней отклонений (2).
2. Вычисления доверительных интервалов для отклонений и.
3. Задачи ранжирования по вероятностному критерию (3).
3. Фрактальный подход к оценке неопределенности в задаче ранжирования налогоплательщиков.
Вероятностный подход в задаче ранжирования налогоплательщиков, изложенный в пункте 2, имеет существенное ограничение, влияющее на оценку риска ошибок I и II рода при отборе налогоплательщиков - постулируется нормальный закон распределения плотности вероятности, Д5), относительных случайных остатков {5^ моделируемой случайной величины У (выручки) по (2) (без взятия операции модуля для 5г).
В вычислительных экспериментах, приведенных в [1], было установлено, что закон распределения остатков {5^ для реальных данных зачастую существенно отличается от нормального в силу наличия «тяжелых хвостов»
функции _Д8). Поэтому при оценке риска ошибок I и II рода приходится вместо аналитических операций на основе функции Лапласа вводить вычислительные процедуры построения гистограмм. Точность расчетов по гистограммам при дефиците наблюдений снижается.
В [1] разработан другой подход к построению отбора основанный на теории фракталов (феномен хаоса). В качестве числовой меры оценки предыстории появления больших отклонений {8^ предлагается принципиально новая числовая мера риска - фрактальная размерность временного ряда относительных остатков {8^, которая измеряет степень валидности кривой этого ряда. Как известно, фрактальная размерность является весьма устойчивой статистической характеристикой степени колеблемости («изрезанности») временного ряда и, следовательно, может служить подходящей мерой риска для случаев отсутствия нормального (или логнормального) распределения. Чем меньше фрактальная размерность кривой, {8Я(0}, тем более устойчиво появление больших отклонений (2), тем меньше риска ошибок идентификации £-го налогоплательщика как нарушителя налоговой дисциплины. При
этом критерий отбора получит вид
^=) - ^ -м*; *=(4)
" =0
Здесь большим суммам ожидаемого доначисления налоговых выплат при документальных проверках соответствуют большие значения критерия
Для применения фрактального подхода, естественно, требуются данные панельного типа, в которых наблюдения упорядочены как по объектам (налогоплательщикам), так и по времени ( = 1, Т [1].
В пользу предлагаемого подхода к отбору налогоплательщиков для выездных проверок (4) говорят следующие соображения. Используем аналогию с рынком ценных бумаг [3]. Временной ряд {8^(0} доходностей ценных бумаг далек от «случайного блуждания», положенного в основу концепции «справедливого рынка ценных бумаг». В нашей задаче отклонения {8^(0} формируются прагматическими целями ухода от налогов, и, следовательно, вероятна долговременная корреляция влияния предшествующих значений уровней временного ряда на текущие и последующие. Такой временной ряд может содержать фрактальную структуру, т.е. долговременные корреляции порождают фракталы, и закон распределения плотности вероятности этого ряда будет далеким от нормального. В этих условиях информационная ценность использования вероятностного критерия Р{> 5) , основанного на
нормальном законе распределения, снижается.
Теперь остановимся на методах статистической оценки фрактальной размерности В в (4). По одному из определений Мандельброта [1] «фракталом называется структура, состоящая из частей, которые в каком-то смысле подобны целому», т.е. отдельные составленные части самоподобны. Фрактал есть аттрактор (предельное множество) правила, порождающего временной ряд (информационного процессора). Один из самых наглядных естественных фракталов - это дерево. Древесные ветви следуют фрактальному склейлингу. Каждое ответвление со своими собственными ветвями подобно дереву целиком, разумеется, в качественном смысле.
Одна из характеристик фрактальных объектов состоит в том, что они оставляют себе свою собственную размерность, будучи помещенными в пространство размерности, большей, чем их фрактальная размерность. Например, временной ряд, графиком которого является линия на плоскости, т.е. в двухмерном пространстве имеет собственную фрактальную размерность В < 2. Во фрактальном временном ряде положения точек определены корреляциями. Фрактальный объект заполняет пространство, куда он помещен неравномерно, поскольку его части коррелированны (взаимосвязаны). Фрактальная размерность - это число, которое количественно описывает то, как объект заполняет пространство.
Чтобы определить фрактальную размерность, необходимо выяснить, каким образом объект группируется в единое целое в своем пространстве. Существует много способов расчета фрактальной размерности. Все они включают в себя подсчет объема или площади фрактальной формы и того, как она изменяется в масштабах в том случае, если этот объем увеличивается.
4. Формулировка концепции синтеза оптимального плана отбора налогоплательщиков для выездных проверок.
Концепция. Критерий ранжирования налогоплательщиков при синтезе оптимального плана выездных проверок должен представлять собой агрегат (мультипликативную свертку, содержащую в себе числовые меры относительных отклонений 1 моделируемого показателя от эталонной поверхности «обобщенной производственной функции» кластера налогоплательщиков по (1); числовую меру вероятности отклонений и коэффициент
масштабаМ8 налогоплательщика). Причем здесь возможны два случая:
а) закон распределения отклонений /(5) близок к нормальному; здесь используется критерий ранжирования ^ по (3) с аналитической либо численной оценкой вероятности > 5) ;
б) закон распределения отклонений /(5) далек от нормального и характеризуется значительным «лептоэксцессом», здесь используется фрактальная размерность В для оценки волатильности временного ряда остатков {5Я(0}.
Приведенное выше утверждение показывает, что можно получить оценку искаженных данных при тестировании НС-отображения для группы сложных объектов.
Общим выводом из анализа вычислительных экспериментов в настоящем параграфе является требование ограничения на степень искажения БД, при которых НС-отображение (1) не теряет свойств устойчивости. Как показывает проведенный опыт, для этого должны быть выполнены следующие условия:
1. Построение НСМ должно быть возобновлено при поступлении новых данных от экономических объектов.
2. Общее число наблюдений в базе данных (БД), определяемое как произведение числа экономических объектов на число наблюдений каждого объекта, должно быть не менее чем в 5-10 раз больше числа входных факторов п.
3. Число искаженных строк в базе данных (наблюдений) должно быть не более чем 80-90 % от их общего числа N.
4. Число искаженных столбцов в БД (входных факторов) должно быть не более чем 70-80 % от их общего числа (п+1).
5. Меры интенсивности искажений ц(к) не должны превышать (40-50) % по отношению к невозмущенным данным. Перечисленные рекомендации 3, 4, 5 имеют эвристический характер, т.е. не дают практических рекомендаций, поскольку в реальных данных истинные значения (х^у^, / =1, N, неизвестны, а
- (к)
значит, нельзя вычислить и числовую меру интенсивности возмущений ц .
Однако для теоретического анализа полученные выводы позволяют причины неустойчивости НСМ «разложить по полочкам».
Список литературы
1. Бирюков, А. Н. Теоретические основы разработки нейросетевых моделей в системе налогового администрирования / А. Н. Бирюков. - Уфа : АН РБ, Гилем, 2011. - 380 с.
2. Горбатков, С. А. Методы нейроматематики в налоговом контроле / С. А. Гор-батков, Д. В. Полупанов. - Уфа : РИЦ БашГУ, 2008. - 136 с.
3. Гатауллин, Р. Ф. Моделирование бюджетных процессов на муниципальном уровне на основе нейросетей / Р. Ф. Гатауллин, С. А. Горбатков, А. Н. Бирюков, О. И. Глущенко. - Уфа : Восточный университет, 2008. - 216 с.
УДК 339.9
ДОЛГОВОЙ ВОПРОС ЕВРОПЫ
Д. А. Вакин
В статье представлен анализ европейской экономической ситуации. Даны графики погашения долгов, а также проанализирована сложившаяся ситуация с долгами стран PIIGS.
Последние месяцы Европа находится в тяжелой ситуации, ее положение осложняют страны PИGS (Португалия, Италия, Ирландия, Греция, Испания), которые в большей степени осуждаются за ведение свойственной им финансовой политики.
В соответствии со статистикой ЕС о задолженностях PIIGS, в общей сложности в 2010 г. было выплачено 370 млрд евро, в то время как по оптимистичному прогнозу 328 млрд евро было установлено к выплате на 2011 г. Однако стоит отметить, что расходы на пенсию уменьшаются до 96,5 млрд евро в 2016 г. Если Евросоюз может реализовать сроки погашения задолженности, где каждая из стран удержится в рамках собственного долга, можно предположить, что ЕС станет мощным финансовым союзом независимо от того, существует политический союз или нет.
После последней реорганизации долга по каждой из стран PIIGS были составлены графики.
По величине долга Греция демонстрирует самые высокие показатели в 120 млрд в ближайшие 4 года [1]. Такое положение безусловно осложняет ситуацию всего Евросоюза (рис. 1 ).