ВОПРОСЫ ТЕОРИИ
Оптимизация распределения ресурсов между раскрытием и наказанием уклонений от налогов
Закревский A.B., Токарев В.В.
Исследуется проблема оптимального распределения государством ограниченных ресурсов налоговой службы между двумя ее функциями: выявлением сокрытий доходов и их наказанием. Строится динамическая управляемая макромодель криминальной обстановки, характеризуемой тремя фазовыми координатами: объемом невы-явленных сокрытий, объемом выявленных, но еще не наказанных сокрытий и объемом средств, возвращенных в госбюджет. На основе умозрительных правдоподобных гипотез о склонности налогоплательщиков к сокрытию доходов и об эффективности работы налоговой службы выписывается система дифференциальных уравнений для фазовых координат.
Ставится задача минимизации суммарного объема невыявленных и ненаказанных сокрытий, которая аналитически решается на основе принципа максимума. Рассматриваются вопросы реализуемости решений, полученных в детерминированном приближении.
1. Введение
Острота проблемы уклонения от налогов для российской экономики очевидна. Так, согласно работе [3] число возбужденных уголовных дел по налогам составило 147 в 1992 г., 1242 в 1993 г., 3126 в 1994 г., 5670 в 1995 г., 5540 в 1996г., 4185 в 1997 г. и 3953 в 1998 г. Общее же число налоговых преступлений по оценкам экспертов во много раз больше - порядка 15-20 тыс. в год. В результате государство недополучает от 30 до 40% бюджетных средств [3].
В сочетании с экономическими мерами воздействия на предпринимателей посредством изменения ставок налогообложения государство всегда использует административно-судебные способы борьбы с нарушителями налогового законодательства. Содержание специального административного аппарата требует дополнительных расходов из госбюджета, которые должны с избытком компенсироваться штрафами, собранными с выявленных нарушителей.
Закревский A.B. - аспирант Московского физико-технического института.
Токарев В.В. - доктор физ.-мат. наук, профессор кафедры высшей математики ГУ ВШЭ.
Статья поступила в Редакцию в августе 2003 г.
Моделирование борьбы с уклонением от уплаты налогов достаточно широко освещено в литературе. Ранние результаты [5] были получены в предположении, что налогоплательщик нейтрален к риску и правительство знает тип каждого налогоплательщика. Для этого случая было показано, что оптимальной стратегией государства должно быть использование вмененного налога и необходимость в налоговых проверках отсутствует.
Другими интересными исследованиями являются работы на основе модели, впервые представленной в работе [7] и в дальнейшем развитой для случая коррупции в налоговых органах в [6, 8]. Данная модель предполагает только два вида доходов: высокий - 1Н и низкий - Iь , случайным образом распределенные среди налогоплательщиков. Таким образом, налогоплательщики, которые в действительности имеют доход 1Н, могут декларировать низкий доход Iь , но при этом рискуют быть пойманными при проверке и уплатить значительный штраф. В результате были найдены Нэш-равновесия для государства и налогоплательщика в виде вероятности сохранения высокого дохода и вероятности проверки (интенсивности поиска) налогоплательщика, декларировавшего низкий доход. При рассмотрении случая с коррупцией налоговый инспектор может брать взятки и подтверждать низкий доход при проверке налогоплательщиков, имеющих высокий доход. Однако инспектор также рискует быть пойманным и оштрафованным. Для данного случая также был найден ряд равновесных состояний. В работе [8] также показано, как оптимальные правила проведения проверки зависят от штрафа за уклонения от уплаты налога. Интересным результатом также является тот факт, что применение оптимальной стратегии принуждения к уплате налогов не исключает полностью взяточничество и уклонение от уплаты налогов.
По сравнению с этими и другими известными авторам работами предлагаемая и исследованная ими модель существенно динамическая (а не статическая или последовательность статических). Она учитывает реакцию налогоплательщиков не только на текущие воздействия налоговой службы, но и на накопленные результаты: объем нераскрытых преступлений, объем раскрытых, но не наказанных преступлений. Выбору подлежат со стороны государства программы распределения усилий административного аппарата между двумя его основными функциями: доказательное выявление налоговых нарушений и реализация штрафных санкций.
2. Модель динамики совершенных, раскрытых и наказанных преступлений
Рассмотрение ведется на макроуровне без дифференциации налоговых преступлений по видам. В дальнейшем под налоговыми преступлениями будут подразумеваться только незаконные действия по сокрытию дохода от налогообложения.
Криминогенная обстановка в экономике характеризуется тремя фазовыми координатами:
X - объем доходов, сокрытых от уплаты налогов, но еще не выявленных налоговой инспекцией (далее называется невыявленными сокрытиями, размерность [ X ] = руб.);
У - объем скрытых доходов, выявленных и документально обоснованных налоговой инспекцией, но пока не подвергнутых штрафным санкциям (далее называется выявленными сокрытиями, [ У ] = руб.);
X - объем денежных средств, возвращенных в госбюджет за счет реализации штрафных санкций по выявленным сокрытиям (далее называется наказанными сокрытиями, [ X ] = руб.).
Коэффициент штрафа и ставка налога со временем изменяться не будут, а срок давности преступлений полагается неограниченным, поэтому за «возрастом» сокрытий следить не нужно, и все фазовые координаты будут функциями одной независимой переменной - текущего времени те[0, Т ] с размерностью год. Объемы X, У, X исчисляются на текущий момент времени т , начиная с какого-то момента времени в прошлом т < 0 .
Динамика фазовых координат подчиняется законам сохранения
^=в+-в-, х(о)=Хо, хт)>о;
ат
(1) % = в;-в;, У(0) = г0, У(т)>0;
£=в;, х(0)=^
в+ (т) > 0, в; (т) ° в; (т) > 0, в; (т) ° (щ+щ) (т) > 0.
Здесь
в- - приток новых невыявленных сокрытий из экономики;
в- - отток невыявленных сокрытий, попадающих в категорию выявленных;
в+ = в- - приток выявленных сокрытий;
в;- - отток выявленных сокрытий, попадающих в категорию наказанных;
в+ =(Щ + Щ)в- - приток наказанных сокрытий;
2 > 0 - фиксированные постоянные ставки налога и штрафа, которые для простоты полагаются независящими от размера наказываемых сокрытий (параметры щ 2 безразмерные).
Все введенные интенсивности потоков в неотрицательные и имеют одинаковую размерность - руб./год. Они определяются поведенческими характеристиками налогоплательщиков и управляющими воздействиями государства.
К управляющим функциям государства отнесено распределение ограниченного фиксированного ресурса Ь численности сотрудников налоговых органов между:
и - численностью сотрудников, занятых выявлением сокрытий (называемой далее активностью розыска) и
V - численностью сотрудников, занятых реализацией наказаний (называемой далее активностью наказаний).
Сначала допускается возможность мгновенного переключения сотрудников с одной работы на другую. Тогда и и V могут быть произвольными функциями времени с неотрицательными значениями, не выходящими за пределы ресурсного ограничения
(2) и (/), V(/)> 0 , и (/) + V(/)< Ь.
Этот вариант обеспечивает государству самые большие возможности управления, а значит, доставляет наилучшую оценку показателя качества.
Будет рассмотрен и другой предельный вариант - узкая специализация сотрудников без перемены вида деятельности. В этом случае и и V становятся постоянными управляющими параметрами, по-прежнему подчиненными ограничениям (2).
Если проигрыш в критерии качества от такого перехода окажется значительным, то нужно будет рассматривать промежуточный вариант с постепенной переквалификацией сотрудников. Тогда и и V придется превращать в фазовые координаты с ограниченными скоростями изменения. Неравенства (2), бывшие ранее ограничениями на управления, превратятся в ограничения на фазовые координаты, что существенно осложнит исследование.
К неизбежному увеличению размерности фазового пространства приводит также желание рассматривать материально-технические основные фонды, специализированные для розыска и наказания сокрытий. Впрочем, если основные фонды в общем универсальны, такие как компьютеры, связь, транспорт и помещения, то учет материально-технических затрат просто добавит к (2) одно или несколько ресурсных ограничений на управления, что не привнесет в решение новых качественных особенностей.
Стремление получить как можно больше аналитических результатов заставляет пока отказаться от перечисленных выше реалистических деталей в надежде на их несущественность.
К ведению государства относятся еще управляющие решения о ставках м>12
налога и штрафа, о численности Ь налоговой службы и о ее материально-техническом обеспечении. Все это - долговременные управляющие воздействия, по крайней мере в стабильной экономике. Решения о них принимаются по априорной неполной информации.
В настоящей статье исследуется скорее оперативное управляющее воздействие, формируемое по более точной текущей информации. При этом все перечисленные выше долговременные воздействия считаются выбранными и относятся к разряду точно известных начальных данных задачи.
Наибольшие трудности в построении математических моделей возникают при формализованном описании поведенческих характеристик людей, в данном случае налогоплательщиков и сотрудников налоговой службы. Несмотря на кажущуюся правдоподобность словесно формулируемых поведенческих гипотез, от их реализации могут существенно зависеть рекомендации по управлению. Тогда нужно проводить скрупулезное исследование адекватности модели, если хватает реальной статистики.
По криминальной экономике статистика практически отсутствует, поэтому приходится надеяться на малую чувствительность управленческих рекомендаций к поведенческому блоку модели или на адаптационные возможности системы управления по текущим наблюдаемым параметрам процесса.
Далее приводится перечень гипотез, принимаемых относительно склонности налогоплательщиков к сокрытию доходов и эффективности работы налоговой службы. Гипотезы сопровождаются их формульной реализацией для интенсивностей потоков б , фигурирующих в правых частях дифференциальных уравнений из (1).
Поток новых сокрытий Q+ реагирует на объем X невыявленных сокрытий, на ставки w12 налога и штрафа и на результаты Y, Z деятельности налоговой службы следующим образом:
1) интенсивность потока новых сокрытий неограниченно увеличивается с ростом объема невыявленных сокрытий (безнаказанные дурные примеры действуют развращающе):
Q+ t X, Q+ при X ® +¥;
2) интенсивность потока новых сокрытий растет с увеличением ставки налога w1, так как успешное сокрытие доходов сулит большие выгоды, и убывает с ростом ставки штрафа w2 из-за боязни серьезного наказания в случае разоблачения:
Q+ t wj, Q++± W2;
3) интенсивность потока новых сокрытий падает до конечного предела с ростом суммарного объема выявленных и наказанных сокрытий из-за страха перед самим фактом разоблачения, но патологическая склонность к кри миналу, несмотря ни на что, у какой-то части предпринимателей все же может присутствовать:
Q+t(Y + Z), Q++® const > 0 при Y + Z ®+¥.
Все эти гипотезы высказаны на основании только здравого смысла, поскольку прямые измерения объема невыявленных сокрытий принципиально невозможны. Неприятия гипотезы 1-3 не вызывают, однако их недостаточно для установления вида функции Q+(X, Y, Z, w1, w2) . Его тоже приходится постулировать, согласуясь с качественными представлениями и предусматривая достаточное число параметрических свобод a0,a1,a2:
+X
(за) Q+= ao + aiwi (j- a2W2) Y+Z' ao > ai,2 > 0
В упрощенной задаче, названной канонической, патологическая склонность к сокрытию доходов даже при нулевой ставке налога w1 не учитывается, т.е. полагается a° = 0. Конкретизации зависимости Q+ от параметров w12 там не нужно, так как они пока фиксированны. По принципу гарантированного результата с позиции государства благоприятная для него реакция налогоплательщиков на объем Y + Z выявленных и наказанных преступлений исключается. Остается простейшая линейная зависимость:
(зб) Q+= IX, 1> 0,
где функцию l (w1, w2) пока можно не конкретизировать, поскольку ее аргументы здесь меняться не будут.
Наряду с линейной зависимостью (3б) было бы полезно исследовать и нелинейные, скажем степенные, с разным поведением на бесконечности, но эта нелинейность сузит возможности получения аналитических решений в последующей процедуре принципа максимума.
Обратимся теперь к гипотезам о раскрытии налоговых преступлений. Интенсивность в- = в+ потока выявленных скрытых доходов ставится в зависимость от активности розыска и , от налогов и штрафов щ 2, а также от текущего состояния преступности X,У,2 . Из качественных соображений постулируются следующие свойства этой зависимости (при их сквозной нумерации с предыдущими гипотезами 1-3 для упрощения ссылок):
4) интенсивность раскрытий увеличивается при усилении активности розыска, но с невозрастающей скоростью Лв- /ли из-за возможных эффектов насыщения:
в; Т и, лв;/ли 4 и;
5) увеличение суммарной ставки щ + щ2 налога и штрафа уменьшает интенсивность раскрытий, так как преступность усиливает конспирацию и коррупционную деятельность:
в- 4( щ + щ);
6) интенсивность раскрытий возрастает с увеличением объема X невыяв-ленных сокрытий, так как среди большего числа сокрытий есть много плохо законспирированных, а если общее число сокрытий невелико, то все они тщательно и квалифицированно конспирируются
в-Т X;
7) влияние объемов выявленных У и наказанных 2 сокрытий неоднозначно: с одной стороны, с их ростом налоговая служба набирается опыта, а с другой -налогоплательщики все больше узнают о методах работы налоговой службы и совершенствуют способы сокрытия доходов; по этой причине пока приходится постулировать независимость в- от У и 2 .
Гипотезы 4-7 реализуются в виде двухпараметрического семейства степенных функций:
(4а) в; = в+=—Ь-XUр, Ь > 0, 1 > Ь> 0,
Щ1 + Щ2
из которого для первоочередного исследования при фиксированных щ1 2 принимается вариант р = 1 :
(4б) в;= в;= XU
в предположении, что эффективность розыска далека от насыщения.
Последняя группа гипотез относится к реализации наказаний по уже выявленным сокрытиям:
8) интенсивность в- потока реализованных наказаний растет при усилении активности наказания V , но с насыщением:
в;Т V, Лв--^ЛV V;
9) наказания тем труднее реализовывать, чем выше суммарная ставка w1 + налога и штрафа:
б; ^ + ^);
10) чем меньше осталось ненаказанных сокрытий У, тем труднее их штрафовать, так как все «слабонервные» штрафуются в первую очередь, остаются «стойкие»:
е;? у ;
11) на объемы невыявленных сокрытий X и наказанных сокрытий 2 поток реализации наказаний не реагирует.
Формулы для бу повторяют (4а) и (4б) с заменой аргументов в соответствии с гипотезами 8—11:
(5а) б- =—й—У¥й > 0,1 > 8> 0;
w1 + w2
первоочередным принимается вариант без насыщения:
(5б) 1¥У, 1з > 0.
Дальнейшая работа будет проводится с первоочередными вариантами (3б)-(5б) поведенческих формул. Эти формулы подставляются в правые части дифференциальных уравнений (1).
В результате получается следующее описание управляемого процесса в размерных переменных:
¿Т = (11 - 1и), X (0) = X0, ау
(6) ай=12хи - , у(0)=у»,
= ( ^ + w2 )1УУ, г (0) =
и (г) + V(г)< I; и (г) ,у(т)> 0, ге[0, Т]
с восемью исходными данными 1,12,1, w1 + w2,Х0,У0, Т.
Из системы (6) исключены условия неотрицательности текущих значений фазовых координат X и У, присутствовавшие в (1), поскольку для принятой формализации потоков (3б)-(5б) эти условия соблюдаются автоматически. В самом деле, при любых допустимых управлениях и (г) и V (г) производные ¿XIйг и йУ/йг ® 0 , когда X и У ® 0 , поэтому никакая траектория не может выйти за пределы положительного ортанта.
Переход к безразмерным переменным
X у г - г и V
(7) X = —, у = —, г = --0—, / = —, и = —, V = —
^ У0 (^ + W2 )у Т I I
не меняет вида дифференциальных уравнений (6):
(8)
- = (1-ю1и ) -, - (0) = -0, у = юр- -ю^у, у (0) = -0, I = ю2vу, 2 (0) = 0, и (г)+ V (г)< 1; и (г), V (г)> 0, г е [0,1],
(в которых верхней точкой обозначены производные по безразмерному времени г), но уменьшает число необходимых исходных данных вдвое:
Все это положительные параметры. Величина -0 означает отношение начальных объемов невыявленных X,, и выявленных У0 сокрытий. В качестве характерного масштаба для объемов сокрытий принята величина У0, поскольку значение X0 непосредственно неизмеримо. В дальнейшем параметр -0 для краткости будет по-прежнему называться начальным объемом невыявленных сокрыПафаметр 1 - это темп несдерживаемого роста (при и = 0) объема невыявленных сокрытий в безразмерном времени (в дальнейшем - темп несдерживаемого роста невыявленных сокрытий).
Параметр ю1 означает максимальный темп выявления сокрытий с предельной активностью розыска и = 1, а ю2 - максимальный темп реализации наказаний с предельной активностью исполнения наказаний V = 1. Одновременно эти темпы изменений не реализуемы, поскольку и + V < 1.
Для иллюстративного численного примера принято
За текущими значениями безразмерных фазовых координат -, у, 2 , управлений и,V и времени г сохраняются старые названия (без добавления слова «безразмерные»):
- - невыявленные сокрытия, у - выявленные сокрытия, 2 - наказанные сокрытия, и - активность розыска, V - активность наказаний, г - текущее время.
3. Оптимизационная формулировка и принцип максимума
Сначала рассматривается детерминированное приближение, предполагающее точное априорное знание всех исходных данных (9а) и адекватность модели (8).
Для облегчения выкладок не отслеживается число наказанных сокрытий -фазовая координата 2 вместе со своим дифференциальным уравнением исключается из рассмотрения. Минимизируется суммарный объем - + у ненаказанных сокрытий в конечный момент времени при свободном соотношении между его составляющими - и у :
(9а)
-0 = X0/У0, 1 = \Т, ю1 = 12ЬТ, ю2 = 1ЬТ.
(9б)
-0 = 2, 1= 0,3, ю = ю2 = 1.
x = (l-wu)x, x(0) = x0,
1 Л x (1) + y (1)^ min
(10) y = wux-w2vy, y(0) = 1, w w
(u(t), v(t)) e D = {(u,v) : u,v > 0,u + v < l}.
по
В соответствии с процедурой принципа максимума Понтрягина [4] для системы (10) вводятся сопряженные переменные - импульсы р- и ру , которые указывают текущее направление наивыгоднейшего развития системы. Выписывается гамильтониан
(11)
H = px (1-w1u ) x + py (axux -w2vy) = j1u + j2v + px1x,
где j = (py - Px ) wix j = -Pyа2y,
и дифференциальные уравнения для импульсов с граничными условиями:
px =-lH = -px (1-wiu )- pywiu, px (1) = -1, (12) • ™ (1) 1
py = pyw2v, py (1) = -1.
Оптимальные управления ü (t) и v (t) в соответствии с необходимыми условиями из [4] должны обеспечить максимум гамильтониана (11)
(13а) (u, v) e Arg max H,
V ' (u,v )eD
т.е. они должны решать задачу линейного программирования
(13б) j1u + j2v ^ max по u, v > 0: u + v < 1,
что видно из второй формы записи гамильтониана в (11).
Соотношение между коэффициентами j и j2 в целевой функции (13б)
меняется в зависимости от положения траектории на фазовой плоскости (x, y) и
на плоскости импульсов (px, py). В соответствии с этим изменяется положение
максимума линейной функции на допустимом треугольнике из (13б):
u
(14) u
и = 1, V = 0, если <р1 > р2, рх > 0 - режим 1, й = 0, V = 1, если р1 < р2, р2 > 0 - режим 2, 0,1 , V = 1 - и, если р; = р2 > 0 - режим 3, 0,1 , V = 0, если = 0, р2 < 0 - режим 4, и = 0, V! е [0,1], если р1 < 0, р2 = 0 - режим 5, и, V! > 0, и + V! < 1, если рх = р2 = 0 - режим б, и = 0, V! = 0, если р; < 0, р2 < 0 - режим 7.
Решения в вершинах треугольника, названные режимами 1, 2 и 7, однозначно определяют управления и и V. Остальные режимы, занимающие ребра (режимы 3-5) или весь треугольник (режим 6), особые для принципа максимума, поскольку там остаются свободы в выборе управления.
Чтобы строить последовательность режимов управления вдоль оптимальных траекторий, нужно выразить условия на р1 и р2 из (14) через импульсы
рх, ру и фазовые координаты х, у при помощи определений коэффициентов р1 и р2, принятых в (11):
Р1 > 0 ^ ру > рх, Р1 = 0 ^ ру = рх, р1 < 0 ^ ру < рх, так как а>1 х > 0; р2 > 0 ^ ру < 0х, р2 = 0 ^ ру = 0, р2 < 0 ^ ру > 0, так как ю2х > 0; р1 > р2 ^ ру (а>1 х +ю2у) > рхсо1 х; р1 = р2 ^ ру (а>1 х + ю2у) = рха>1 х; р1 < р2 ^ ру (а>1 х + ю2у) < рха>1 х.
Отсюда получаются следующие области реализации режимов (14), представленные в виде, разрешенном относительно импульса ру (рис. 1):
режим 1 - при py > max i px; режим 2 - при py < min i 0;
w x
режим 3 - при py =
(15)
w, x + co2 y
w,x
-1-px
w, x + w2 y
px < 0,
а1 х + ю2 у
режим 4 - при ру = рх > 0, режим 5 - при 0 = ру < рх, режим б - при ру = рх = 0, режим 7 - при 0 < ру < рх.
py ' * py к py к
1 ^ 1 --— —
16 ^ 77 5> 6 Л jSV 5 / ' 6 1 £
0 / px '2 3 0 } px з \ ___2 / px s 2
а) 0 < y/x < +¥
б) y/x ® 0
в) y/x ® +¥
Рис. 1. Расположение режимов 1—7 оптимального управления на плоскости импульсов (рх, ру ) при различных отношениях фазовых координат у/х
Один из особых режимов - режим 3 в переменных рх, ру оказывается подвижным. При конечном отношении фазовых координат у/х луч, его изображающий, располагается в третьем квадранте между биссектрисой рх = ру и координатной осью ру = 0 (рис. 1а).
Когда выявленных сокрытий у оказывается мало по сравнению с невыявлен-ными х , то луч 3 стремится к биссектрисе, и область использования режима 1 «искать и не наказывать» расширяется за счет сужения области использования режима 2 «наказывать и не искать» (рис. 1б). В обратной ситуации луч 3 стремится к координатной оси ру = 0 , и расширяется область использования режима 2 за счет сужения области для режима 1 (рис. 1в).
На этом можно считать законченной стандартную часть процедуры принципа максимума - сведение проблемы оптимального управления (10) к краевой задаче для расширенной системы дифференциальных уравнений (10) и (12), из которых исключены управления по формулам (14), (15).
4. Поле экстремалей
При решении краевой задачи, к которой была приведена исходная система, прежде всего предстоит выяснить возможность присутствия особых режимов управления 3-6 в составе оптимальной траектории. Для этого нужно установить, могут ли сохраняться условия (15) использования таких режимов конечное время в силу дифференциальных уравнений (10), (12). При отрицательном ответе особых режимов нет, так как оптимальная траектория разве что пересекает осэ-бые многообразия, при положительном - они могут войти, а могут и не войти в состав оптимальной траектории.
На режиме 3 и (г) + V (г) = 1, и е [0,1] в силу (15) должно выполняться равенство:
(Р- - Ру Ю- + РуЮ2у = 0 при ру < 0.
Если оно сохраняется конечное время, то должна быть нулевой и полная производная по времени его левой части, вычисленная вдоль траектории системы (10), (12):
(Ру - Р- Ю- + (Ру - Р-Ю- + РуЮ2у + РуЮ2у = 0 ^ (в силу (10), (12))
0 = (Р-ЮтУ + Р-1- РЮи + РЮи - +(Ру - Р- (1 -ю1и ) - + + Р а 1\>а2у + Рую2 (ю1и- -ю2vу) = Рую1-(1 + ю2и + ю2v) ^
(в силу и + V = 1) Рую1-(1+ю2 ) = 0.
Но ю1, 1+ю2 > 0, Ру < 0 , поэтому равенство возможно только при - = 0 , что недостижимо для -0 > 0 . Таким образом, если начальный объем невыявленных сокрытий ненулевой, то особый режим 3 невозможен.
Особый режим 4 требует, согласно (15), Ру = Р- > 0 ^ Ру = Р- ^ (в силу (12))
^ РуЮ^ + Рх (1-ю1и) + Раи = 0 ^ (в силу Ру = Р-) Р- (ю^ +1) = 0 , что невозможно, поскольку оба сомножителя в заключительном равенстве положительны.
На режиме 5 должно быть Ру = 0, Р- > 0 ^ (в силу (12)) Ру = Рую2V = 0 ^ Ру ° 0,
что противоречит краевому условию из (12) Ру (1) = -1.
По тем же причинам невозможен и режим 6 для которого Р- = Ру = 0 ^ (в силу (12)) Р- ° Ру ° 0 .
Таким образом, оптимальная траектория не содержит ни одного из особых режимов управления 3-6.
Остались не отвергнутыми только три режима 1, 2 и 7, на которых управления и,V определены однозначно:
и = 1, V = 0 - режим 1 «искать и не наказывать», и = 0, V = 1 - режим 2 «наказывать и не искать», и = 0, V = 0 - режим 7 «не наказывать и не искать».
Схема дальнейшего исследования поля оптимальных траекторий такова. Сначала строятся три семейства траекторий системы дифференциальных уравнений (10), (12) с указанными управлениями во всем пространстве импульсов и фазовых координат. Это уравнения с линейными постоянными коэффициентами. Они интегрируются аналитически. Затем из всего пространства для каждого семейства вырезается подпространство оптимального использования соответствующего режима управления. После этого производится непрерывная стыковка траекторий соседних семейств на границах, заданных соотношениями (15).
Состыкованные экстремали изображены на плоскости импульсов сплошными тонкими линиями, а их куски, удовлетворяющие необходимому краевому условию рх (1) = ру (1) £ 0 из (12), выделены утолщенными линиями.
а) б)
Рис. 2. Поле экстремалей на плоскости импульсов (рх, ру ): а) у/х < 1а1/а2 (а1 -1), б) у/х > 1а1/а2 (а1 -1)
Границы смены режимов управления показаны штриховыми лучами. Номера режимов написаны на тонких дугах окружности. Штрих-пунктиром нанесена линия рх = ру £ 0 , где должны заканчиваться оптимальные траектории. Две границы:
рх > 0, ру = 0 между режимами 2 и 7, а также рх = ру > 0 между режимами 7 и 1
от фазовых координат х и у не зависят. Граница же между режимами 1 и 2 подвижная: а1 хрх =(а1 х + а2у) ру. В зависимости от величины отношения у/х она вращается вокруг начала координат, начиная от биссектрисы третьего координатного угла при у/х ® 0 (рис. 1б) до оси абсцисс в той же четверти при у/х ® +¥ (рис. 1в).
Пока отношение y/x невелико: y/x < 1а1/— — -1), положения равновесия px = py = 0 для режима 1, расположенные на луче px = — pyj— -1) , попадают в область оптимального использования этого режима, как показано жирными точками на рис. 2а. При больших величинах y/x подвижная граница 3 эти положения равновесия отсекает (рис. 2б), что сказывается на составе оптимальных траекторий.
Оптимальные траектории заведомо отсутствуют во втором и четвертом квадрантах плоскости (px, py), поскольку, попав туда, они не могут достичь
необходимого конечного многообразия px (l) = py (l) < 0 . Это видно из рис. 2 и подтверждается анализом формул.
Почти такая же ситуация имеет место в первом квадранте. Правда, там есть траектории, использующие режим управления 7 - «не искать и не наказывать» и попадающие на многообразие px (l) = py (l) > 0 . Но согласно теореме о необходимых условиях оптимальности это краевое условие отвечает задаче о поиске максимума суммарного объема невыявленных и ненаказанных сокрытий:
x (l) + y (l)^ max, px (l) = py (l)> 0,
(16) «opt (t) ° vopt (t) ° 0, x (t) = *e*, y (t) ° l, px (t) = e1(l-t>,
py (t1, (x, + y )max = x0^ + l-
Такое решение вполне соответствует качественным представлениям. Оно полезно как ориентир при оценке эффективности государственных мероприятий по противодействию налоговым преступлениям.
Необходимым условиям минимума xl + у, , как видно из рис. 2, могут удовлетворять только траектории, расположенные в третьем квадранте, а точнее - в его половине: 0 > py > px < 0 . В оставшейся части третьего квадранта интегральные кривые только удаляются от терминального многообразия px (l) = py (l) < 0 и
потому не могут присутствовать в составе оптимальных траекторий.
Если пренебречь пока подвижностью границы 3 между режимами 1 и 2, то в случае рис. 2а возможны двухрежимные траектории с программой управления:
(t) = l, v (t) = 0 при 0 < t < t„ u (t) = 0, v (t) = l при tl < t < l;
(17а) 0 >fl - p (0)> p (0)> wl x0 p (0), если x0 > w (wl - Я)
0 > il - Ц px (0) > py (0) > WW^+0—px (0)
^ — l J — ,x0 +— 2
1ю1
Для рис. 2б оптимальные траектории могут быть только однорежимными
u
(t) = 0, v (t) = l при 0 < t < l;
(17б) 0 > ^^Р- (0) > Ру (0) > Р- (0), если -0 < ю2(Ю' -11.
ю1 -0 +ю2 1ю1
Когда двухрежимная траектория на рис. 2а начинается с границы луча 3, т.е. когда Ю-0 +ю2)Ру (0) = юх-0Р- (0) , программа управления (17а) вырождается в однорежимную программу (17б), так как ^ = 0 .
Как показало проведенное исследование, подвижность луча переключений 3 не изменяет характера траекторий, показанных утолщенными линиями на рис. 2. Главное, что нужно для дальнейшего, сохраняются оптимальные программы управления (17) с неопределенным пока параметром и в (17а).
5. Программа оптимального распределения ресурсов
Анализ поля экстремалей, проведенный в предыдущем разделе, завершился построением двух вариантов оптимальных программ распределения усилий налоговых служб между раскрытием и наказанием налоговых преступлений.
Первая программа (17а) оптимальна, когда начальный объем выявленных сокрытий у0 = 1 оказывается ниже некоторой критической доли от объема х0 не-
выявленных сокрытий: у0/х0 < 1а1/(а1 -1) (в иллюстративном примере (9б) у0/х0 < 0,43). Тогда сначала все силы надо направить на выявление преступлений и = 1, V = 0 , и только через некоторое время и следует переключится на исполнение наказаний и = 0, V = 1.
Если же начальный объем выявленных сокрытий достаточно велик: у„/х0 > 1а1/(а1 -1) , надобность в раскрытии новых преступлений пропадает и все силы тратятся на исполнение наказаний. Это - однорежимная программа (17б). Формально она получается как частный случай из программы (17а) с и = 0.
Дальше уравнениями для импульсов рх и ру можно уже не заниматься.
Нужно только состыковать по непрерывности общие решения дифференциальных уравнений (10) для фазовых координат х и у , выполнив начальные условия х (0) = х0 и у (0) = у0 = 1:
при 0 £ ( < и
и (Г) = 1, V(/) = 0, х(/) = х0в-{а1, у (/) = у0 + ^-(1 -1);
а1 - 1 4 '
при t = t,
х{и) = х0= х., у(л) = у0 + 1 - 1 ) = у.;
а1 -14 '
при t, < t £ 1
и ^) = 0, V ^) = 1, х ^) = хе1), у ^) = у*еа (t-t•'
(в этой и дальнейших формулах для наглядности явно пишется начальная величина у0 , принятая по условиям обезразмеривания за 1).
Характер состыкованного решения (18) показан на рис. 3. Активные поиски (и = 1) на первом участке решения экспоненциально снижают объем х невыявлен-
ных сокрытий, но из-за отсутствия наказаний (V = 0) растет объем у ненаказанных сокрытий. На втором участке, после момента переключения и, поиски прекращаются (и = 0) , и все усилия направляются на исполнение наказаний выявленных сокрытий (V = 1) . От этого начинает экспоненциально расти объем х невы-
(18)
явленных сокрытий, но с меньшим темпом, чем его падение на первом участке. А объем у ненаказанных сокрытий экспоненциально уменьшается.
Рис. 3. Изменение во времени управлений и фазовых координат на двухрежимной траектории (18)
В результате такой программы действий налоговой службы суммарный объем - + у невыявленных и ненаказанных сокрытий меняется, вообще говоря, немонотонно, согласно (18):
- (г)+у (г) = -0 + у0 + -1-0-(1 - -1)') при 0 < г < /., (19) ю -1
- (г)+у (г) = -0е-ю ^ 1 > +
у0 + ^-(1 -
юх -1 '
е-Ю2 ('' при г* < г < 1.
На первом участке он возрастает, асимптотически стремясь к конечному уровню к " юх-01 (ю; -1) + у0 , если бы этот участок продолжался неограниченное
время. На втором участке суммарный объем сокрытий, как правило, убывает (см. рис. 4), достигая в конце движения, при г = 1, величины:
(20) X! + у " х(1)+ у (1) = х0е
- „-(®1 -Х)и+1(1-'*).
>0 +
а>1 -1
(1-Ь) - Х0 -«2 +(1-ч +®2 )<•
а0 -1
Если же продолжить второй участок за t = 1, то при t # 1 получится экспоненциальный рост с темпом 1. Продолжения первого участка за и и второго участка за t = 1 по формулам (19) показаны на рис. 4 утолщенными штриховыми линиями.
х+у
Х0 + >0
1
t
Рис. 4. Характер изменения во времени t суммарного объема х + у невыявленных
и ненаказанных сокрытий
Чтобы закончить построение программы оптимального управления, нужно еще найти минимум критерия (20) по моменту переключения ^ е [0,1], но это все
равно проще, чем решить до конца краевую задачу (10), (12), (14), (15) для расширенной системы дифференциальных уравнений, включающей в себя и уравнения для импульсов.
Как функция параметра ^ критерий (20) представляют собой линейную комбинацию трех экспонент с разными показателями:
(21)
Г (^)"
х1 + >1
+(а+Ь)е
- Ье
(1-»1 +»2 )/*
>0
где а = ^ е> 0, Ь =
Сйх -1
> 0 при со1 > 1
(в (21) минимизируемый критерий представлен в долях от максимально возможного объема невыявленных сокрытий из (16)).
Функция (21) нерезко реагирует на изменения аргумента t*. Так, в примере (9б) разность между ее максимальным и минимальным значениями составляет 20% от максимума (рис. 5).
п
0
-- + у-
-0 + у0 = 3
2,5
0 0,5
Рис. 5. Зависимость минимизируемого суммарного объема сокрытий -1 + у1 в конечный момент времени Г = 1 от параметра Г* - момента переключения управления
для примера (9б)
Ее минимум по Г* в зависимости от соотношения между параметрами а и Ь достигается или внутри, или на границах отрезка [0,1] допустимых значений Г*:
Г*ор4 е (0,1) ^ / = -юхею +ю2 (а + Ь)ею* -(1 -юх +ю2)Ье(л-а ю)Г* = 0 <=> а = юе-(а +Ю2)'* +| 1-ю1 +ю2 е(1-а)'* -1|Ь.
(21) Г*ор4 = 0 ^ /*'(0)-ю1 +ю2 (а + Ь)-(1-ю1 +ю2)Ь > 0 » а > — + ^^Ь;
ю2
Г*ор4 = 1 ^ /*' (1) = -ю1е"Ю1 +ю2 (а + Ь ) еЮ2 -(1-ю1 +ю2) Ье(1-а'' < 0»
а = ^ е®2 + Г 1-ю1 +ю2 е1-®- -х]Ь. ю2 ^ ю2 0
Функция (21) непрерывна, поэтому на ограниченном замкнутом множестве [0,1], согласно теореме Вейерштрасса, она достигает своего наибольшего и наименьшего значений. К тому же эта функция строго выпукла, так как /", > 0 :
/Г* = ю12е~ю +ю22 (а + Ь ) е"* -(1-ю, +ю2 )2 Ье(1-ю ю )Г* =
2 -ю,'* , 2 ю2Г* , ( 2 Г / <]\~|2 -(ю, -1)Г* | , ю2Г* ^
= юх е 1 +ю2 ае 2 + <ю2 -|ю2-(юх -1)1 е ^ ' )Ье 2 >
> ю12е"ю-Г' +ю22ае'"2'* > 0.
Тогда по теореме о выпуклых функциях она имеет единственный локальный минимум, совпадающий с глобальным, и необходимые условия (22) оказываются достаточными.
I
*
Условия (22) представлены в виде одного равенства и двух неравенств, разрешенных относительно параметра а, поскольку равенство Л* = 0 представляет собой трансцендентное уравнение для t*. Но, имея в виду параметрические расчеты, можно это уравнение не решать, а задавать t* как параметр и по конечной формуле находить величину а , определяющую соответствующее отношение у0/х0 .
После подстановки в (22) выражений для коэффициентов а и Ь из (21) выясняется, что точка минимума не может попасть на правую границу t* = 1 при естественном условии а1 > 1, поскольку
//(1) =
Ä + (1 - ^-L )
х„ w -1 V '
a2e 1 > 0 при w > 1.
Этот вывод находится в согласии с результатами анализа поля экстремалей, проведенного в предыдущем разделе. Там получилось, что любая оптимальная траектория завершается участками интенсивных наказаний и = 0, V = 1, т.е. всегда 4 < 1.
Реализуемые первые два варианта из (22) представимы в виде условий на отношение максимально возможной начальной скорости наказаний а>2у0 к максимально возможной начальной скорости раскрытий а>1 х0:
w2 Уо = e1+w2-(w +w )t. + 1+w2 -w1 e-(w-1> - w2 ^ 0 £ < l
(23)
coL -1 coL -1
> e1+c°2 -1 Û t* = 0.
Здесь для сокращения записи у t* не указан признак оптимальности, хотя он подразумевается.
В формулах (23) проявилась особенность, важная для практического использования оптимальной программы управления. Оказывается, что для нахождения оптимального момента переключения не нужно знать принципиально неизмеримой величины х0 - начального объема невыявленных сокрытий. Достаточно возможности измерить начальную скорость wх0 выявленных сокрытий при максимальной интенсивности поиска.
Если эта скорость окажется меньше некоторой критической доли от максимально достижимой начальной скорости а2 y0 исполнения наказаний, то розыском заниматься не нужно (t* = 0). В примере (9б) критическая доля равна 0,375.
Если же скорость выявленных сокрытий может превзойти этот критический уровень, то розыск становится полезен (t* > 0) и тем большее время, чем выше скорость раскрытий по сравнению с возможной скоростью исполнения наказаний (рис. 6).
0,4
0,2
0
0,
1,6
ю2 у0
2,4
Рис. 6. Оптимальный момент переключения управления с розыска на наказание в функции максимально возможной начальной скорости ю2у0 исполнения наказаний, отнесенной к такой же скорости юх -0 выявления сокрытий для примера (9б)
Критический уровень отношения начальных скоростей в (23) экспоненциально зависит от суммы максимальных темпов роста 1 объема невыявленных сокрытий и ю2 - объема наказанных сокрытий (рис. 7).
ю2 у0
2,4
1,6
0
1 + ю
0,4
0,
Рис. 7. Критический уровень отношения максимально возможных начальных скоростей исполнения наказаний ю2 у0 и выявления сокрытий юх -0 в зависимости от суммы максимального темпа роста
объема невыявленных сокрытий 1 и максимального темпа роста объема наказанных сокрытий ю2
0
0
0
Критерий качества 3, представляющий собой минимальное значение суммарного объема - + ух невыявленных и ненаказанных сокрытий в конце процесса, подсчитывается подстановкой оптимального момента переключения (23) в (20). Асимптотика критерия 3 как функции от -0 линейная:
3 » а-0 + Ьу0 при -0 # у0,
(24)
где а = е
_ -10-'*
ю1 -1
1
,-ю. (1-г*)
- е
+(Л-ю- ) Г*
_ -ю2 (i-)
Ь = е
Начальный участок зависимости 3 (-0) тоже линейный, но с отличающимися от (24) коэффициентами.
В примере (9б) точное решение, показанное на рис. 8 утолщенной линией 3, практически неразличимо с асимптотическим решением (24).
3
3
3
0
2
4
6
8
-<>/ у0
Рис. 8. Сравнение минимальных 3 и максимальных 3 значений критерия для примера (9б)
Для сравнения штриховой линией на рис. 8 показана прямая
(25) 33 = ( -1 + у- )тах = -0е1 +
8
6
4
2
0
соответствующая максимальным значениям критерия на неуправляемом процессе (16).
Относительный выигрыш
(26) Д = ( 7 - 7 )/7,
получаемый благодаря оптимальному управлению, весьма ощутимый: Д(х0 + 0) = 0,43 > Д(х0)>Д(+¥) = 0,2, что показано нижней кривой на рис. 8.
6. Аппроксимация оптимальной релейной программы постоянным управлением
В области правдоподобных значений исходных данных 1+а2 > 1, т2у0/(а1 х0)< 0,5 оптимальный момент t* переключения управления, как видно из рис. 7, ненулевой. Это означает, что на первом участке траектории, при 0 < t < 4, все ресурсы налоговой службы должны использоваться для розыска, а после t* все ресурсы нужно мгновенно переключить на исполнение наказаний.
Такое (или почти такое) переключение можно сделать, если все сотрудники и вся материально-техническая база универсальны. Но не все люди и не все виды оборудования одинаково хорошо приспособлены для столь различной деятельности. Социальные и технические сложности исчезают, когда распределение ресурсов между розыскной деятельностью и исполнением наказаний остается неизменным во времени.
Если проигрыш в критерии качества по сравнению с оптимальной программой управления окажется невелик, то можно остановиться на этом простейшем управлении, удобном для реализации. В противном случае придется модифицировать постановку задачи, учтя затраты времени и средств на перераспределение ресурсов управления. Распределение ресурсов нужно тогда сделать дополнительными фазовыми координатами, а новыми управлениями будут скорости изменения распределения. Все это заметно осложнит последующую оптимизацию.
При неизменных во времени управлениях и и V система дифференциальных уравнений и начальных условий (10) разрешается следующим образом.
Сначала интегрируется первое уравнение для х, не содержащее у :
(27а) х = (1-®1и)х, х(0) = х0 ^ х^) = х0е1-®1"^.
Найденное решение подставляется во второе уравнение, после чего оно интегрируется как линейное неоднородное уравнение с экспоненциальной правой частью
(27б) у = щих(^-ю2\у, у(0) = >0 ^ у + а^у = »ле{я-т,и), у(0) ° >0.
Когда а2у Ф ю1и -1, то частное решение у ^) этого неоднородного уравнения представляет собой ту же экспоненту
у ^) =-1—0-е1-®1"^, если а2у Ф а1и -1.
1 - ®1и + »V
В случае равенства характеристического корня и показателя экспоненты а2у = о1и -1 в частном решении появляется в качестве множителя линейная функция времени
у (/) = (1 + о2V) хо1е~°г2Л, если а>2V = о1и -1. В сумме с общим решением однородного уравнения
у = Ле0
при соблюдении начального условия у (0) = у0 получается
/а ( а1ихо | -„VI а1ихо и-ощь ^ ,
(28) у(/) = 1 Уо-Iе® -е ' если ®*®и-и
(28) ^ и-ои + о2у 0 Л-®и +ю2v
у (/) = [у0 + (1 + о2V) хо/] е01", если о2V = о2и -1.
Критерий качества управления на решении (27), (28) оказывается равным
где
/ = х (1)+ у (1) = К1 >если° -1 \/ ^ \ > 3 2, если о2 V = о1и -1
(29) 31 = хо+( уо
/2 =[ уо +(1 + ) хо ] е1-®1".
1-о1и + 0,^ I 1-о1и + о2 V
Кусочно-заданная функция (29) непрерывна по всем своим аргументам, в том числе и на поверхности стыка а2у = о1и -1.
Теперь надо найти оптимальные значения и , V управляющих параметров, минимизирующие критерий (29). Из качественных соображений ясно, что ресурсы налоговой службы выгодно использовать полностью, т.е. назначать и * + V* = 1. Математически это не столь очевидно. Выражение для компонент вектора градиента V/ получаются громоздкими, что затрудняет определение знаков.
Но можно убедиться в справедливости качественных соображений непосредственно из анализа исходных дифференциальных уравнений (27), не прибегая к аналитическим записям их решений.
После чего в (29) остается один произвольный параметр и , а V = 1 - и . График зависимости критерия 3 от этого параметра, представленный на рис. 9, практически повторяет график с рис. 5, где для тех же исходных данных (9б) была показана зависимость (20) критерия от момента переключения для релейной программы управления.
Окончательный результат для положения и0 минимума критерия записывается подобно (23):
(30)
®2 >0
1 +
1 +®2
ю2и
1+®2 -(®1 +®2 ) и0 [Я+Ю2 -(®1 +®2 ) и 0 ]' 1 + а 2
®2-(® + ®2 )и0 +
Я + ®2 -(®1 + ®2 ) и° [1+ ®2 -(®1 + ®2 ) и 0 ]2
^ [(1+ ®2 -1) е1+®2 +1]« и0 = 0.
а1 х0 1 + а 2 -1
« 0 < и0 < 0,
7
2,5
0
0,5
Рис. 9. Зависимость критерия (29) от постоянного управляющего параметра и (сплошная кривая) и ее сравнение с критерием (20) для релейной программы как функции от средней величины управления и = ^ (штриховая кривая)
Область невыгодности розыска и0 = 0 расширяется по сравнению с оптимальной релейной программой управления, где она определялась условием t* = 0 в (23). Для малых значений суммы 1 + а 2 максимальных темпов роста невыяв-ленных и ненаказанных сокрытий наклон начального почти линейного участка разделяющей линии уменьшается вдвое (см. рис. 10).
и0 = 0 при а2>" > 1 (1+ а2) + о (1+ ®2), (®1 х0) 2
3
и
вместо
а 2 >0
и = 0 при а°2>" > 1+ а2 + о(1+ а 2). ( а1 х0)
2,4 Ч
1,6 <
1,2 1 +
а,
Рис. 10. Расширение области невыгодности розыска при переходе от релейной программы управления (штриховая кривая t* = 0)
к постоянному управлению (сплошная кривая и° = 0 )
При больших значениях 1 + а2 вместо почти «чистой» экспоненты (23) получается та же экспонента, но с множителем, меньшим единицы.
Минимальные значения 70 критерия качества для постоянного управления находятся подстановкой оптимального уровня и0 из (30).
Как и в случае релейной программы управления, можно не решать относительно и0 при фиксированной величине х0 трансцендентное уравнение, записанное в первых двух строках (30). Вместо этого нужно произвести параметрические расчеты - задавать и0 и по конечной формуле (29) вычислять соответствующее значение х0 (и0) , имея в виду, что у0 = 1. Затем снова по конечной формуле следует
подсчитать минимальную величину критерия 70 при известных и0 и х0 (и0).
Результаты таких параметрических расчетов для примера (9б) показаны на рис. 11, 12 сплошными кривыми. Для сравнения там же штриховыми линиями нанесены прежние результаты расчетов по формулам, относящимся к релейной программе управления.
0
0
и \\
0,4
0,2
ЧЧ и
ч
а 2 >0
0,
1,6
2,4
Рис. 11. Сравнение оптимальных средних значений и для постоянного управления и (t) ° и" и для релейного управления и = t в примере (9б)
7
0
д0
0,2 0,1 0
2 4 6 8 а 2 ><>/ ( а1 х0)
Рис. 12. Сравнение минимальных значений критерия качества для постоянного управления 70 и для релейного управления 7* и их относительная разница Д0 =(70 - 7* )^7* в примере (9б)
0
8
6
4
2
Из рис. 11 видно, что оптимальные значения постоянного управления u0 и осредненного релейного управления u = t, совпадают в асимптотике при x0 ® +¥ и при x0 ® 0 .
Относительный проигрыш в критерии Д° = ( J0 - J *)/ J * , как показано на рис. 12, обязанный переходу с оптимального релейного управления на постоянное, увеличивается с ростом x° от 0 при 0 < x° < 0,5 до 0,12 при x° > 10 .
Если такой же проигрыш сохраняется для других реалистичных значений исходных параметров 1, а, и «2, то использование постоянного управления вместо оптимальной релейной программы можно считать приемлемым.
7. Реализация оптимальных управлений в условиях априорной неопределенности
Вычисления оптимальных значений управляющих параметров t, для релейной программы или u0 для постоянного управления требуют знания коэффициентов 1,al,a2 и начального отношения xjy0 . Однако все эти величины непосредственно не измеримы.
Но их можно восстановить по результатам прошлых наблюдений за величинами, которые вполне можно считать измеримыми:
(31) y (t), q+ (t) " co1ux, q- (t) " w2vy, u (t), v (t) при t < 0,
т.е. объем выявленных сокрытий, скорости розыска и исполнения наказаний, а также распределение ресурсов между раскрытием и наказанием преступлений.
Если предположить, что система дифференциальных уравнений (10) адекватно описывает реальный процесс, а не известны только ее исходные параметры, то часть из них можно сразу найти по конечным формулам:
cx (t) = q+ (t)/« (t), a2y (t) = q- (t)lv (t)
(32) «2 = q "(t V[v (t) y (t)].
Далее, считая для простоты, что измерения (31) произведены при постоянном значении управляющего параметра u (t) = u1 = const, по решению (27) удается восстановить разность
, i q + (t)
(33) 1 — c,u =-ln ) ' " c, t Ф t'.
1 t — t' q-(t')
Но чтобы найти 1 и a, по отдельности, потребуются результаты наблюдений и последующих расчетов по формуле (33) с двумя несовпадающими значениями параметра u
1 — а,й1 = С, 1 — a,u2 = c2 при м1 Ф u2, где через c обозначены значения вычисленной правой части (33). Отсюда
2 1 2 1 ~2 с -с „ см - см
(34) ©1 = , м2 .
м - м м - м
Таким образом, все исходные данные, необходимые для построения программы будущего управления, восстановимы по результатам прошлых вполне реалистичных измерений.
Однако надеяться на адекватность простой модели (10) сложному реальному процессу не приходится. И тогда вместо конечных формул (32)-(34) нужно воспользоваться отлаженными классическими численными процедурами идентификации в среднем или реализовать для модели (11) идею диапазонной идентификации [1].
Неминуемые ошибки 81,8а1,8а2 и 8х0 в предположении их малости приведут к отклонениям 83 в критерии качества, вычисляемым путем линеаризации соотношений (20), (23) или (29), (30).
Коэффициенты в разложениях получаются громоздкими, настолько, что с первого взгляда трудно оценить их порядок. В примере (9б) все они порядка единицы:
для релейной программы управления -
83* = 1,35 (8х0 + х08Л)-0,3688а2 + о (81) при х0 £ 0,375, 3* = 1,35х0 + 0,368;
83* = 1,18х0 +1,8881-0,4148а1 - 0,568а2 + о (82) при х0 = 2 > 0,375, 3* = 2,74, т.е.
= 0,88> + 0,206 81 - 0,1518©1 - 0,205 а + о (82);
3 х0 1 а1 а 2
для постоянного управления -
830 = 1,35(8х0 + х081) -0,3688а2 + о(8!) при х0 £ 0,722, 30 = 1,35х0 + 0,368;
830 = 1,28х0 + 2,1881 - 2,628ах - 2,598а2 + о (82) при х0 = 2 > 0,722, 30 = 2,92, т.е.
= 0,828> + 0,224 81 - 0,8958а1 - 0,885^2 + о (82).
3 х0 1 а1 а 2
Когда погрешности в разложениях оказываются неприемлимыми, то следует пользоваться точными формулами.
Как и следовало ожидать, увеличение начального объема х0 невыявленных сокрытий и темпа 1 их неуправляемого роста приводит к ухудшению качества управления, а увеличение эффективности розыска 1 и исполнения наказаний 2 улучшает качество управления. В рассмотренном примере оба способа управления характеризуются практически одинаковой чувствительностью критерия к вариациям первых двух параметров, но к вариациям 8 1,2 критерий для релейной программы оказался в 4 раза менее чувствительным, чем для постоянного управления.
Для программных способов управления, пользуясь разложениями, можно заранее подсчитать в линейном приближении гарантированную оценку критерия качества [2], если априори установлены границы множества Д = {8х0,81,8ах,8а2} возможных ошибок при идентификации исходных данных.
В общем случае для этого нужно решить задачу максимизации линейной функции четырех переменных на ограниченном замкнутом множестве:
(35) 8J = c,dx0 + c2d1 —c3da, — c4da2 ^ max по (dx0,d1,da1,da2)еД,где c,,...c4 = fix > 0.
Когда ошибки в исходных данных независимы друг от друга, то множество Д представляет собой 4-мерный параллелепипед, т.е. прямое произведение диапазонов возможных ошибок:
D = [dx0,dx0 ]х [d1, d1 J х [¿Се,, da, ] х [da 2, da 2 ], и решение задачи (35) очевидно
(36) maxdJ = c,dx0 + c2d1 — C3Scc1 — c4Scc2.
При использовании точных формул получится такой же вариант наихудших ошибок: максимальные значения dx0,d1 и минимальные значения dm1,dm2 (в силу знакоопределенности соответствующих производных J ).
8. Основные результаты
На основании естественных гипотез о поведенческих характеристиках налогоплательщиков и сотрудников налоговой службы построена динамическая макромодель криминогенной обстановки в экономике для изучения проблем выявления сокрытий от уплаты налогов и их наказаний.
Сформулирована и аналитически исследована на основе принципа максимума задача оптимального распределения ресурсов налоговой службы между раскрытием и наказанием налоговых преступлений. Построено поле экстремалей, в результате выявлено существование двух типов оптимальных траекторий: двухрежимных и однорежимных, обеспечивающих минимум суммарного объема нераскрытых и ненаказанных преступлений в конечный момент времени.
Двухрежимная программа управления оптимальна, когда начальный объем выявленных, но еще ненаказанных сокрытий ниже некоторой критической доли от объема невыявленных сокрытий. Тогда сначала все силы надо направить на раскрытие преступлений и только через определенное время следует переключиться полностью на исполнение наказаний. Если же начальный объем выявленных сокрытий достаточно велик по сравнению с объемом невыявленных сокрытий, надобность в раскрытии новых преступлений пропадает, и все силы тратятся только на исполнение наказаний (однорежимная программа управления).
Интегрированием системы дифференциальных уравнений, линейных по фазовым координатам, получены конечные формулы для функционала задачи и трансцендентное уравнение для момента переключения управления. Установлены естественные свойства монотонного возрастания минимизируемого функционала - конечного объема невыявленных и ненаказанных сокрытий от максимальной интенсивности новых сокрытий и монотонного убывания функционала от максимальных интенсивностей раскрытий и наказаний. Относительный выигрыш в минимизируемом критерии по сравнению с неуправляемым процессом для численного примера с правдоподобными исходными данными получился весьма ощутимым. Он возрастает
с уменьшением отношения х0, начального объема невыявленных сокрытий, к начальному объему ненаказанных сокрытий, от 20% при х0 > 10 до 43% при х0 =+0 .
Для избавления от необходимости переключения деятельности налоговой службы с розыска на исполнение наказаний решена задача о наилучшей аппроксимации оптимальной релейной программы управления неизменной во времени программой с постоянным распределением ресурсов между розыском и наказанием. В том же примере относительный проигрыш в критерии, обязанный переходу с оптимального релейного управления на постоянное, сокращается при уменьшении х0 с 12% для х0 > 10 до 0 для 0 < х0 £ 0,5. Если такой же порядок проигрыша сохранится и для других реалистичных значений исходных параметров задачи, то использование наилучшего постоянного управления вместо оптимального релейного можно считать приемлемым.
Показано, что непосредственно неизмеримые параметры поведенческих характеристик, необходимые для вычисления оптимальных параметров релейной или постоянной программ управления, могут быть восстановлены по результатам вполне реализуемых наблюдений за предысторией процесса. Нужно только, чтобы статистика была накоплена, по крайней мере, для двух несовпадающих распределений ресурсов налоговой службы между розыском и наказанием. Исследована чувствительность минимизируемого критерия к ошибкам восстановленных исходных данных.
9. Прикладные выводы
Авторы не располагают сколь-либо полной статистикой по динамике криминальной обстановки в экономике, поэтому из полученных или аналитических решений можно сделать пока только качественные выводы.
Во-первых, используемое сейчас постоянное или почти постоянное распределение ресурсов между поиском и наказанием сокрытий доходов достаточно хорошо может аппроксимировать оптимальную программу релейного переключения всего объема имеющихся ресурсов с поиска на наказание в оптимальный момент времени.
Во-вторых, пока объем невыявленных сокрытий существенно превышает объем выявленных, но ненаказанных сокрытий, то распределять ресурсы между розыском и наказанием следует примерно поровну. По мере увеличения относительной доли выявленных сокрытий по сравнению с невыявленными распределение ресурсов выгодно сдвигать в пользу исполнения наказаний. Это уменьшит суммарный объем невыявленных и ненаказанных сокрытий.
Чтобы стали возможными и обоснованными количественные рекомендации, предстоит еще проделать работу по идентификации и верификации модели. Для этого, как показано в статье, достаточно располагать статистическими временными рядами следующих принципиально измеримых показателей:
- объем выявленных, но еще ненаказанных сокрытий доходов (в рублях, нарастающими итогами);
- то же по наказанным сокрытиям;
- отношение объемов годового финансирования работ по розыску и по наказанию сокрытий доходов.
*
СПИСОК ЛИТЕРАТУРЫ
1. Волков Ю.Н., Токарев В.В. Диапазонный подход к прогнозированию экономического развития // Автоматика и телемеханика. 1988. № 6.
2. Гермейер Ю.Б. Введение в теорию исследования операций. М.: Наука, 1971 .
3. Кучеров И.И. Преступления в сфере налогообложения. М.: ЮрИнфор, 1999.
4. Понтрягин Л.С, Болтянский В.Г., Гамкрелидзе Р.В. и др. Математическая теория оптимальных процессов. М.: Физматгиз, 1961.
5. Atkinson A.B., Stiglitz J.E. Lectures on public economics L.: McGraw-Hill, 1980.
6. Chander P., Wild L. Corruption in tax administration // Journal of Public Economics. 1992. № 49. P. 333-349.
7. Graetz M., Reinganum J., Wild L. The Tax Compliance Game: Toward an Interactive Theory of Law Enforcement //Journal of Law, Economics, and Organization. Spring 1996. № 2. P. 1-32.
Vasin A.A., Vasina P.A. The Optimal Tax Enforcement under Imperfect Taxpayers and Auditors // Working Paper. № 2000/012. Moscow: New Economic School, 2000. P. 25.