УДК 519.688
Многомерное расширение классических чисел Каталана для решения прикладных задач анализа случайных точечных изображений*
А.Л. Резник, А.А. Соловьев
Институт автоматики и электрометрии СО РАН (Новосибирск, Россия)
Solving the Applied Problem of Random-Dot Images Analysis Using a Multidimensional Extension of Classic Catalan Numbers*
A.L. Reznik, A.A. Soloviev
Institute of Automation and Electrometry SB RAS (Novosibirsk, Russia)
Введенное в статье понятие обобщенной последовательности Каталана является полезным инструментом при решении многих теоретических и прикладных вероятностно-комбинаторных задач. В сочетании с алгоритмами, осуществляющими программные аналитические преобразования, обобщенные числа Каталана упрощают решение многих задач информатики и прикладной математики. В частности, они оказываются эффективным средством решения задач, относящихся к регистрации случайных точечных изображений, при построении преобразований сигналов различной степени гладкости, при разработке оптимальных по быстродействию алгоритмов поиска импульсно-то-чечных объектов со случайным временем генерации мгновенных импульсов. Предложение авторов формулировать задачи перечислительной комбинаторики в словарно-символьной форме естественным образом приводит к многомерным расширениям классических чисел Каталана и обладает несколькими преимуществами. Совместное применение многомерных чисел Каталана и высокопроизводительных систем компьютерной алгебры позволило авторам решить ряд сложных прикладных задач, связанных с надежностью регистрации случайных точечных изображений.
Ключевые слова: обобщенные числа Каталана, перечислительная комбинаторика, системы компьютерной алгебры, случайные точечные изображения.
DOI: 10.14258/izvasu(2023)4-13
The paper introduces the concept of generalized Catalan numbers as a useful tool for solving many theoretical and applied combinatorial-probabilistic problems. Combined with analytical transformation software algorithms, the generalized Catalan numbers simplify the solution of many problems in computer science and applied mathematics. In particular, they turn out to be an effective tool for solving problems related to the registration of random-dot images, in signal transformations of various degrees of smoothness, and when developing speed-optimal algorithms for searching for pulsed-point objects with a random generation time of super short pulses. The proposal of the authors to formulate the problems of enumerative combinatorics in a word-symbolic form naturally leads to multidimensional extensions of the classical Catalan numbers and has several advantages. The combined use of multidimensional Catalan numbers and high-performance computer algebra systems enables solving a number of complex applied problems related to the reliability of the registration of random-dot images.
Keywords: generalized Catalan numbers, enumerative combinatorics, computer algebra systems, random bitmaps.
Введение
Числа Каталана встречаются в огромном количестве приложений теории вероятностей и математической статистики [1-3]. Классические числа Каталана
могут быть заданы многими эквивалентными способами, например прямыми формулами
C =-
(2n)! n!(n +1)!
(1)
* Настоящая работа поддержана Министерством науки и высшего образования Российской Федерации (проект № ЛЛЛ-Л17-117052410034-6).
c =
2п п — 1
(2)
либо одним из рекуррентных соотношений ^ = 1,
Cп = £ ^ ^—1, п > 0
(3)
Co = 1,
c= c
п -i п-
п +1
п > 0
(4)
Цель настоящего сообщения состоит в представлении нового расширения классических чисел Каталана, базирующегося на словарно-символьной статистике. Описаны способы нахождения их явного аналитического вида и применение в задачах, относящихся к анализу случайных точечных изображений.
1. Метод отражения, примененный французским математиком Д. Андре для решения баллотировочной проблемы. Связь баллотировочной задачи с числами Каталана
Начнем с часто используемого в перечислительной комбинаторике метода отражения, автором которого считается французский математик Дезире Андре [4]. Один из таких примеров приводится в монографии В. Феллера [5, гл. III] и относится к баллотировочной задаче, которую в 1887 году сформулировал (и представил первое решение) Жозеф Бертран [6]: «Предположим, что кандидаты А и В участвуют в выборах. Если а голосов были отданы за кандидата А и Ь голосов были отданы за кандидата В, где a>b, то вероятность того, что А оставался впереди В в течение всего времени подсчета избирательных бюллетеней, равна (a-b)/(a+b)».
Баллотировочная задача и решеточные пути. В терминах решеточных путей предварительная (по отношению к баллотировочной задаче) подзадача формулируется следующим образом: «Даны целые положительные числа a и Ь, причем a>b. Требуется найти количество „хороших" решеточных путей, т.е. путей, начинающихся в начале координат и состоящих из a „шагов вверх" (1,1) и Ь „шагов вниз" (1,-1), при условии, что никакой шаг не заканчивается на оси X».
Решение предварительной подзадачи с помощью метода отражения. Пусть T означает конечную точку пути ^+Ь, a-b). Так как каждый «хороший» путь должен начинаться с «шага вверх», то количество «хороших» путей совпадает с количеством путей из точ-
ки (1,1) в точку ^ которые никогда не касаются оси X. Множество «плохих» путей из точки (1,1) в точку ^ которые где-либо касаются оси X, находится во взаимно-однозначном соответствии с множеством всех путей из точки (1,-1) в точку T. Это легко усмотреть, если начальные сегменты каждого из таких «плохих» путей, начинающихся в точке (1,1) и заканчивающихся его первым прикосновением к оси X, зеркально отразить относительно оси X. Вычитая общее число таких «отраженных» путей, начинающихся в точке (1,-1) и заканчивающихся в точке ^+Ь, a-b), из общего числа всех путей, соединяющих точку (1, 1) с точкой ^+Ь, a-b), получим общее количество «хороших путей»:
a + ь — 1 a — 1
a + Ь — 1 Ь — 1
a — Ь
a +ь
a + Ь a
(5)
Предварительная подзадача решена. Поскольку вероятность того, что кандидат А всегда опережал кандидата В течение всего времени подсчета избирательных бюллетеней, есть отношение количества «хороших» путей (5) к общему количеству всех путей из начала координат в точку ^+Ъ, a-b), которое рав-
a + Ь |
но , искомая вероятность равна
a
Это и есть ответ на баллотировочную задачу Бертрана.
Теперь о том, как связана баллотировочная задача с числами Каталана. Эта связь самая прямая: если в формуле (5) положить a=n+1 и Ь=п, то получим классические числа Каталана, причем правая часть равенства (5) перейдет в формулу (1), а левая часть — в формулу (2).
2. Обобщение классических чисел Каталана с применением словарно-символьной статистики
В перечислительной комбинаторике известно немало расширений чисел Каталана, для которых классическая последовательность Каталана является лишь частным случаем. В настоящем разделе предлагается новое расширение классических чисел Каталана, базирующееся на словарно-символь-ном подходе к постановке комбинаторных задач. Основным достоинством этого расширения, как уже отмечалось, является универсальность формулировок и простота обобщения словарно-символьных задач на многомерный случай.
2.1. Обобщение классической последовательности Каталана на двумерный случай в терминах сло-варно-символьной статистики. Решение двумерной задачи «методом отражения»
ЗАДАЧА № 1
В образовании слова участвуют N символов <ш» и N символов «Ь». Сколько из этих слов таких,
к=0
что при просмотре слова слева направо количество встреченных символов «Ь» никогда не превышает количества встреченных символов «я»? (Естественно, предполагается, что N >ШЬ.)
Двумерная последовательность ШОКБ1(Ыя, ШЬ) является простейшим расширением классических чисел Каталана, которые получаются из нее при Шя=Шь. Формулу (6) нетрудно получить, если задачу № 1 заменить на эквивалентную ей задачу с монотонными путя-
Решение:
шопт(ия ,шь) =
N + Ш)! N + Ш)!
N !ШЬ !
я Ь
N +1)!(Nь -1)!
(6)
ми в прямоугольнике (см. рис. 1). В получающейся задаче с решеточными путями требуется найти количество «хороших» монотонных путей, которые выходят из начала координат (0,0) и ведут в точку (Ш,ШЬ), не пересекая диагонали левого квадрата со стороной NЬ.
/
1 1 \ + 1
/ / / № 1УЬ )
V /
/ / /
/ / /
/ / /
/ /
л / /
1 / /
ШУ /
/ / (0 0) X
Рис. 1. Иллюстрация к задаче № 1 о простейшем расширении чисел Каталана
Как и в разделе 1, на предварительном этапе будет необходимо определить общее количество «плохих» путей, пересекающих диагональ левого квадрата. С применением уже использованного «метода отражения» легко доказывается, что их число совпадает с общим числом монотонных путей, выходящих из точки (-1,+1) и ведущих в точку (Ш,ШЬ). Количество же «хороших» путей есть разница между всеми монотонными путями и всеми «плохими» путями, которая и описывается формулой (6).
В свою очередь, задача № 1 допускает следующее обобщение:
ЗАДАЧА № 2
В образовании слова участвуют Nя символов «я» и NЬ символов «Ь». Сколько из этих слов таких, что при просмотре слова слева направо количество встреченных символов «Ь» никогда не превышает количества встреченных символов «я» более чем на к? (Предполагается, что к >0 и Nя+k >ШЬ.)
Решение:
WORD2(Nя, NЬ, к) =
(Ш + Ш)! _ (Ш + Ш)! Nя !Ш ! (Ш + к + 1)!(Ш _ к _1)!
(7)
Это дальнейшее расширение чисел Каталана, а именно: при к=0 задача № 2 эквивалентна задаче № 1, а при Шя=Шь и к=0 получаем классические числа Каталана. Иллюстрацией к задаче № 2 служит рисунок 2. Формула (7) соответствует количеству монотонных путей из точки (0,0) в точку (Ш ,ШЬ), лежащих в заштрихованной зоне.
2.2. Трехмерное обобщение классической последовательности Каталана
ЗАДАЧА № 3
В образовании слова участвуют N символов «я», ШЬ символов «Ь» и N символов «с». Требуется указать
общее число слов WORD3(Nя, ШЬ, Шс), для которых одновременно выполняются два условия:
1) при просмотре слова слева направо количество встреченных символов «Ь» никогда не превышает количества встреченных символов «я»;
2) при просмотре слова справа налево количество встреченных символов «с» никогда не превышает количества встреченных символов «я».
Задача № 3 может быть решена чисто геометрическими средствами с помощью последовательного трехкратного применения уже упоминавшегося нами метода «зеркального отражения». Для этого она сначала должна быть переведена в эквивалентную ей задачу отыска-
Рис. 2. Иллюстрация к задаче № 2
ния общего числа монотонных путей, каждый из которых характеризуется тем, что соединяет вершины (0,0,0) и (Ыа,Ыь,Ыс) трехмерного ограничивающего параллелепипеда, не пересекая при этом ни одной из двух отсекающих плоскостей Р,: Х=У и Р : Z=X+N-N.
' 1 2 с а
Решение этой переформулированной задачи проводится следующим образом: из общего количества монотонных путей 50, ведущих из точки (0,0,0) в точ-
N + N. + N )! ку которое равно 50 = —а---с—, не-
N а ! N- ! N с !
обходимо вычесть количество путей, которые выходят за пределы хотя бы одного из полупространств
Х>Уили Z>X+Nc-Na. Иными словами, требуется сложить количество путей 51, выходящих за отсекающую плоскость Р1, с количеством Б2 путей, выходящих за отсекающую плоскость Р, а затем вычесть из полученной суммы количество 5 путей, выходящих как за плоскость Р1, так и за плоскость Р2 (поскольку в сумме они учтены дважды).
В результате получим следующее общее решение и для задачи № 3 о количестве трехсимвольных слов, и для эквивалентной ей задачи о количестве монотонных путей, ведущих из точки (0,0,0) в точку и не пересекающих при этом ни одну из плоскостей Р,: Х=У и Р ■ Z=X+N-N:
1 2 с а
N + N. + N )! N + N. + N )! шокт№а,N.,N) = 50 -5 - 52 + я12 => а - с) v а - ^
N а N N! (N а + 1)!(N- - 1)!Nc!
(Nа + N + N )! (Nа + N + Nc )!
+-^-ь-^-, N> N. + N - 2.
(Nа +1)!N- -1)! (Nа + 2)!(N--1)!(М +1)! а - с (8)
Важно отметить, что рассчитанное соотношение для 5 и, как следствие этого, полученная формула (8) справедливы только при выполнении условия Na >N^N-2. В этом случае удается показать, что любой путь, удовлетворяющий поставленным в задаче ограничениям, не может пересечься с плоскостью Р2 раньше пересечения с плоскостью Р1. При отсутствии же такого условия решение задачи № 3 усложняется, и для его отыскания необходимы более тонкие методы, выходящие за рамки нашего рассмотрения [7].
Заметим, что при N=0 задача № 3 переходит в задачу № 2, а это означает, что решение задачи № 3 при N>0 привело к еще одному расширению чисел Каталана — на этот раз на трехмерный случай.
2.3. Прикладные научные задачи, решаемые с использованием обобщенных чисел Каталана
Числа Каталана (включая описанные в настоящей статье обобщенные числа «словарно-символьного происхождения») по самой своей природе являются инструментом дискретного анализа (а точнее — одним из инструментов перечислительной комбинаторики), с их помощью могут быть решены многие прикладные вероятностные задачи непрерывного характера. Так, при проведении исследований, связанных с оценкой надежности цифровой регистрации случайных точечных полей, возникает следующая простая по постановке вероятностная задача: «Требуется найти вероятность Рп к (е) того, что при случайном бросании п точек на интервал (0,1) не будет
образовано ни одного подынтервала размером е, содержащего более к точек».
Несмотря на кажущуюся простоту постановки, замкнутое аналитическое решение приведенной задачи известно лишь для частного случая к=1 [8-9]. Но с применением разработанных нами высокопро-
изводительных программных систем компьютерной алгебры [10-11] и расширенных чисел Каталана удалось установить и затем строго доказать ряд новых ранее неизвестных аналитических соотношений. В частности, получены точные формулы:
(е) =
C™ (1 - (m - 1)e)2m - Cm-1 (1 - (m - 1)s)2m - Cm2m2 (1 - me)m+2 (1 - (m - 2)e)m-2 + +2C2mm 3 (1 - me)m+3 (1 - (m - 2)e)m-3 - Cm-4 (1 - ms)m+i (1 - (m - 2)e)m-4
1 1
-< е <— ;
m +1 m
1
m +1
Cm (1 - (m - 1)е)2
1 1
— < е <-;
m m-1
2m+1,2
(е) =
m+h (1 - mе)m+1 (1 - (m - 1)еГ - 2Cm++1 (1 - m£)m+2 (1 - (m - 1)еГ-1
+cm:i (1 - mе)m23 (1 - (m -1)е)
1 1
-< е < — ;
m + 1 m
и рассчитан ряд замкнутых вероятностных зависимостей и асимптотических соотношений.
Библиографический список
1. Gardner M. Mathematical Games, Catalan numbers: an integer sequence that materializes in unexpected places // Scientific American. 1976.
2. Hayes B. A Question of Numbers // American Scientist. 1996. № 1.
3. Saracevic M., Sharma S., Ahmad K. A novel block encryption method based on Catalan random walks // Multimedia Tools and Applications. 2021. Vol. 8. № 7. Doi: 10.1007/s11042-021-11497-5
4. André, D. Solution directe du problème résolu par M. Bertrand // Comptes Rendus Acad. Sci. Paris. 1887. Vol. 105.
5. Feller W. An Introduction to Probability Theory and its Applications, 2nd ed. John Wiley: New York, 1957.
6. Bertrand J. Solution d'un probleme // Comptes Rendus de l'Academie des Sciences, Paris. 1887. Vol. 105.
7. Gessel I., Zeilberger D. Random walk in a Weyl chamber // Proc. Amer. Math. Soc. 1992. Vol. 115.
8. Wilks S. Mathematical Statistics. Princeton: Princeton Univ. Press. 1944.
9. Parzen E. Modern Probability Theory and Its Applications. John Wiley and Sons: New York. 1960.
10. Reznik A., Tuzikov A., Soloviev A., Torgov A. Analysis of random point images with the use of symbolic computation codes and generalized Catalan numbers // Optoelectronics Instrumentation and Data Processing. 2016. Vol. 52. № 6. Doi: 10.3103/S8756699016060017.
11. Резник А.Л., Тузиков А.В., Соловьев А.А., Торгов А.В. Интеллектуальная программная поддержка в задачах анализа случайных цифровых изображений // Вычислительные технологии. 2018. T. 23. № 5. Doi: 10.25743/ICT.2018.23.5.007