Научная статья на тему 'О существовании слов над трехбуквенным алфавитом, не содержащих квадратов с ошибками замещения'

О существовании слов над трехбуквенным алфавитом, не содержащих квадратов с ошибками замещения Текст научной статьи по специальности «Математика»

CC BY
148
8
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ПОСЛЕДОВАТЕЛЬНОСТЬ ТУЭ / THUE SEQUENCE / БЕСКВАДРАТНЫЕ СЛОВА / SQUARE-FREE WORDS / СЛОВАРНАЯ КОМБИНАТОРИКА / WORD COMBINATORICS / ОШИБКИ ЗАМЕЩЕНИЯ / MISMATCHES

Аннотация научной статьи по математике, автор научной работы — Котляров Никита Владимирович

Изучаются вопросы, связанные с существованием периодических структур в словах из формальных языков. В качестве периодических структур рассматриваются квадраты, т. е. фрагменты вида xx, где x — произвольное слово, и Δ-квадраты, т. е. фрагменты вида xy, где слово x отличается от слова y не более чем Δ буквами. Показано существование сколь угодно длинных слов над двухбуквенным алфавитом, не содержащих Δ-квадратов с длиной больше 4Δ+4. В частности, указан способ построения таких слов для любого Δ.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «О существовании слов над трехбуквенным алфавитом, не содержащих квадратов с ошибками замещения»

13. Ивапчиков А.А., Корпев А.А., Озерицкий А.В. О новом подходе к решению задач асимптотической стабилизации // Журн. вычисл. матем. и матем. физ. 2009. 49, № 12. 2167-2181.

14. Котеv A.A. Numerical aspects of a problem asymptotic stabilization by the right-hand side // Russ. J. Numer. Anal. Math. Modelling. 2008. 23, N 4. 407-422.

15. Жуков К.А., Попов А.В. Исследование экономичной разностной схемы для нестационарного движения вязкого слабосжимаемого газа // Журн. вычисл. матем. и матем. физ. 2005. 45, № 4. 677-693.

Поступила в редакцию 27.06.2017

УДК 519.765

О СУЩЕСТВОВАНИИ СЛОВ НАД ТРЕХБУКВЕННЫМ АЛФАВИТОМ, НЕ СОДЕРЖАЩИХ КВАДРАТОВ С ОШИБКАМИ ЗАМЕЩЕНИЯ

Н. В. Котляров1

Работа посвящена вопросам, связанным с существованием периодических структур в словах из формальных языков. В качестве периодических структур рассматриваются квадраты, т.е. фрагменты вида xx, где x — произвольное слово, и Д-квадраты, т.е. фрагменты вида xy, где слово x отличается от слова y не более чем на Д букв. Показано существование сколь угодно длинных слов над трехбуквенным алфавитом, не содержа-

ДД Д

Ключевые слова: последовательность Туэ, бесквадратные слова, словарная комбинаторика, ошибки замещения.

The paper concerns some problems related to the existence of periodic structures in words

xx x

Д xy x y

Д

ДД Д

Key words: Thue sequence, square-free words, word combinatorics, mismatches.

Статья посвящена некоторым вопросам, связанным с существованием периодических структур в словах из формальных языков. Наиболее простой и хорошо изученной периодической структурой являются квадраты, т.е. фрагменты вида xx, где x — произвольное непустое слово. Слово, не содержащее квадратов, называется бесквадратным. Классический результат, связанный с квадратами, установлен в работе А. Туэ [1]: доказано существование как угодно длинных бесквадратных слов над алфавитом из трех букв. С другой стороны, несложно проверить, что не существует бесквадратных слов над алфавитом из двух букв. Поэтому из результата Туэ следует, что алфавит из трех букв является минимальным алфавитом, над которым существуют как угодно длинные бесквадратные слова. В дальнейшем было получено много альтернативных доказательств данного результата Туэ, одно из наиболее изящных представлено в [2]. Естественным продолжением исследований Туэ в этой области стала работа [3]. В настоящей статье рассматривается случай, когда в словах допускаются достаточно "маленькие" квадраты. Подобное допущение рассматривается, например, в [4], где доказано существование бесконечного слова над алфавитом из двух букв, которое содержит только три различных коротких квадрата. Другие базовые результаты, касающиеся квадратов, получены в работах [5, 6].

Нетрудно заметить, что задача существования сколь угодно длинных слов, не содержащих фрагментов определенного типа, эквивалентна задаче существования бесконечных слов над тем же алфавитом, не содержащих данных фрагментов. Поэтому в работах, посвященных этой тематике, обычно рассматривается эквивалентная задача существования бесконечных слов.

1 Котляров Никита Владимирович — ETL-разработчик, ОАО "Яндекс", e-mail: nikita.kotlyarovQbk.ru.

Слово называется сильно бескубным, если оно не содержит фрагментов вида хха, где х — непустое слово, а — первая буква слова х. В [3] было доказано существование сколь угодно длинных сильно бескубных слов над двухбуквенным алфавитом, в частности в данной работе приведен пример бесконечного сильно бескубного слова над двухбуквенным алфавитом. Это слово называется последовательностью Туэ (Туэ-Морса).

Другим естественным обобщением задачи о существовании сколь угодно длинных бесквадратных слов является рассмотрение в качестве "запретных" фрагментов не только квадратов, но и квадратов с Д ошибками замещения, т.е. фрагментов вида ху, где слово х отличается от слова у ровно на Д букв. Отметим, что, например, любой фрагмент длины 2 является либо квадратом, либо квадратом с одной ошибкой замещения, поэтому для данной задачи естественно вводить ограничения снизу на длины как "запретных" квадратов, так и "запретных" квадратов с ошибками замещения. По нашим сведениям, данная задача еще не рассматривалась в научной литературе, за исключением предыдущих публикаций автора [7, 8], где было показано существование над алфавитами различных мощностей сколь угодно длинных слов, не содержащих квадратов и квадратов с одной ошибкой, в зависимости от ограничений снизу на длину квадратов. В настоящей работе рассматривается следующая задача: можно ли построить над трехбуквенным алфавитом как угодно длинное слово, не содержащее квадратов и квадратов с несколькими ошибками, при наличии ограничения на длины этих квадратов, и каким при этом должно быть это ограничение? Доказано, что существует беско-

Д

Д

1. Основные определения. Пусть В = [а\, а2,..., as} — некоторый алфавит, элементы алфавита будем называть буквами. Словом над алфавитом В называется конечная последовательность х = аад а^ ... агп-1, состоящая го букв алфавита В (при этом допускается слово из нуля букв, коВ

через В*. Букв у а^ будем обозначать через х[к]. Числ о п называется длиной слова х и обозначается через |х|. Фактором слова х будем называть произвольный фрагмент а^ ... ац_1 слов а х, где п ^ I ^ к ^ 0. Заметим, что данный фактор стова х однозначно определяется парой чисел к и I, поэтому будем обозначать его через хпри этом запись хбудет обозначать пустое слово. х[к]

Факторы можно представлять двояким образом: как фрагменты слова или как слова, которые эти факторы представляют собой. По умолчанию мы будем рассматривать факторы в качестве

х

х

будем говорить, что слово равно фактору. Для любого слова V, содержащегося в слове х в качестве фактора, все факторы слова х, равные слову V, будем называть вхождениями слова V в слово х.

Когда два фактора и и V некоторого слова х являются одним и тем же фрагментом этого слова, будем писать и ~ V. В случае, если два фактора и и V представляют собой одно и то же слово, будем использовать запись и = V. Аналогично если фактор и представляет собой слово у, то также будем использовать запись и = у.

Пусть и ~ х [*], V ~ х [1] — два фактора слова х. Будем говорить, что и содержится в V, если I ^ у ^ г ^ к. От метим, что в этом сл учае и является ф актаром факто ра V, поэтому и может быть обозначено через V• Будем говорить, что фактор т = х [*] находится слева (справа) от фактора

и = х [1], если у = к (г = I).

Определим сверхслово, или бесконечное слово, как счетную последовательность а^0 а^1 ... букв алфавита. Множество всех сверхслов над алфавитом В обозначается через Вш. Аналогично поня-

ас

(конечного или бесконечного) слова х называется фактор вида х [0]. Соответственно суффиксом, конечного слова х называется фактор вида х , где п = |х|. Квадратом называется фактор вида да, где и = V, при этом и и V называются соответственно левым, и правым корням,и данного квадрата. Периодом, квадрата т называется число |т|/2, равное длине его корней. Строгим фактором слова х будем называть фактор, который не является суффиксом или префиксом х. Пусть и и V — два слова одинаковой длины, большей либо равной к. Будем говорить, что и и V отличаются к буквами, если и [г] = v[г] ровно для к значений г. Квадратом с Д ошибками будем называть фактор вида да, где и отличается от V на Д букв. Квадрат да не более чем с Д ошибками будем называть Д-квадратом. Д = 0 Д и

v будем называть соответственно левым и правым корнями Д-квадрата. Периодом Д-квадрата w называется число |w|/2, равное длине его корней. Конечное или бесконечное слово x называется сильно бескубным, если оно не содержит фактора вида uua, где u — некоторое слово и u[0] = a. Пусть x — некоторое слово длины п. Промежутком в слове x будем называть целое чиело k от 0 до п — 2, задающее позицию между буквами x[k],x[k + 1]. Пусть u ~ xj] — некоторый фактор четной длины в слове x. Серединой фактора u будем называть промежуток (i + j — 2)/2 в слове x.

В дальнейшем в записи фактора в виде конкатенации других факторов, слов или букв его середину

|

Пусть В — некоторый алфавит. Напомним, что морфизмом называется отображение h : В* ^ ©*, удовлетворяющее условию h(xy) = h(x)h(y). Пусть для некоторого а € В образ h(a) начинается

аВ Тогда очевидно, что для любых i < j слово h1 (a) является префиксом hj (a) и |h(a)| < |hj (a) |, где h1 (a) есть композиция i отображений h, примененных последовательно к a. Поэтому можно рассмотреть сверхслово, содержащее в качестве префиксов все слова h (a), i = 1,2,3.... Будем обозначать это сверхслово через h(a). Рассмотрим морфизм х : {0,1}* ^ {0,1}*, такой, что х(0) = 01, х(1) = 10. Сверхслово х(0) называется последовательностью Туэ—Морса. В дальнейшем эту последовательность будем обозначать через Q. В [3] показано, что П обладает свойством сильной бескубности.

Сформулируем свойство для (сверх)слова x следующим образом: "у (сверх)слова x нет факторов, являющихся квадратами не более чем с Д ошибками и периодом больше p".

Пусть теперь В = {0,1} g — отображение из В2 в В*, такое, что все образы g(00),g(01),g(10) и g(11) имеют одинаковую длину, которую будем называть дли ной отображения g. Определим отображение /д из В* U Вш в В* U Вш следующим образом:

fg(aia2 .. .a„-ia„) = g(aia2)g(a2as).. .g(an-ian), /g(aia2 ...) = g(aia2)g(a2as)....

Отметим, что отображение fg определено только для слов длины большее 1. Слова g(00), g(01), g(10) ми g(11) будем называть элементами отображения g. Через Фд будем обозначать сверхслово

/д Ф).

Будем называть мультиобразом фактор v сверхслова Фд, являющийся образом некоторого фактора u сверхсло ва П. Слов о u будем называть прообразом данного мульт иобраза. Если |u| = 2, то

v

что мультиобраз, имеющий прообраз aia2 ... an, где ai € В, и является конкатенацией монообразов g(ai«2) g(a2, as) .. ., g(an-ian).

Будем называть расширением фактора u слов а Фд наименьший мультиобраз, содержащий этот фактор. Прообразом фактора слова Фд будем называть прообраз его расширения. Пусть v — слово, содержащееся вФдв качестве фактора.

Если авт, где a, в, т € В, является фактором в Q, то слова g(a,0) и ) будем называть после-

g

сильно бескубной, получаем, что последовательными элементами могут быть упорядоченные пары

{<g(00),g(01)>, <g(01),g(10)b <g(01),g(11)>, <g(10),g(00)b <g(10),g(01)b (g(n),g(10))}.

Введем еще несколько обозначений. Далее рассматриваем слова над двухбуквенным алфавитом В = {0,1} Пусть u — некоторое слово, m — натуральное число. Конкатенация m слов u обозначается через um. Если u, v — слова равной длины, то будем обозначать через u ф v слово w, такое, что |w| = |u| = |v| и w[i] = 0, есл и u[i] = w[i] = 1 в противном случае. Будем обозначать через ||u||

количество букв 1 в слове u, а через p(u,v) = ||u ф v|| расстояние Хэ^^^^га между словами и».

Пусть теперь w — фактор длины 2p в сверхслове Ф^ u ~ w [j] — некоторый монообраз или фактор монообраза, содержащийся в w [0 (w [2pp] ). Рассмотрим фактор w [j.+p] (w [j-^P])- Он является либо фактором некоторого монообраза, либо строгим фактором конкатенации двух монообраззв. В первом случае назовем двойником фактора u в факторе w фактор w [j+p] (w [j-p])- При этом w [j]

будем называть оригиналом двойника u в факторе w. Во втором случае w [j.+p] = w ^ w ^+j+pP] (w [j -p] = w [il~pP] w P ), где w [iiTpp] и w [i(w [il~pp] и w [i яввяютзя факторами рвз-

личных монообразов. Назовем двойниками u в факторе w факторы w [^Г+J и w [jrPP (w и

т [г++ГрР]) • При эт ом т [¿_+г] и т [г_+г] будем называть соответственно оригинала ми двойников т и т (т и т [г_^ГрР]) фактора и в факторе т.

Аналогично дадим определение для фактора и ~ т [*], являющегося монообразом или фактором монообраза в факторе т длины 2р и имеющего непустое пересечение с т [0 и т [2^]. Пусть т [£] есть фактор в и, содержащийся в т [0, а т — фактор в и, содержащийся в т Щ • Определим в

а с а с и

факторов т [£] и т [. Отметим, что в случае, когда р < ^(#), двойник и его оригинал могут быть факторами одного монообраза.

Отметим также, что для любого фактора и Д-квадрата т расстояние Хэмминга между корнями Д-квадрата т не меньше, чем сумма расстояний Хэмминга от двойников ишдо соответствующих им оригиналов, при периоде квадрата т, большем длины монообраза либо равном ей.

Далее через а и в будем обозначать различные буквы алфавита {0,1} т.е. в качестве в будем принимать букву, отличную от а. Кроме того, далее через а^ для г = 0,1,... будем обозначать буквы из алфавита {0,1}. Пусть и — слово над алфавитом в. Обозначим через й слово, полученное из и заменой всех 1 на 0 и всех 0 на 1. Обозначим через ик слово и[|и| — 1] ... и[0].

2. Вспомогательные утверждения. Последовательность Туэ—Морса обладает следующими свойствами.

Утверждение 1. Если слово V длины, 2п является префиксом О, то слово уу также является префиксом О.

Доказательство данного свойства можно найти, например, в [2].

Префикс длины 2п_1 сверхслова О будем обозначать через vn, п = 1, 2,....

Лемма 1. Выполнено равенство (у^пЩп)11 =

Доказательство. Докажем лемму индукцией по п. Для п = 1 утверждение очевидно. Пусть теперь утверждение леммы верно для п = к — 1, т.е. ("У2д;_2г>2д;_2)д = '1,2к-2'1,2к-2- Обозначим через q слово v2fc_ 2. Заметим, что

V2kV2k = V2kV2k = V2k-lV2k-lV2k-lV2k-l =

= qqqqqqqq = qqqqqqqq = (qq)R(qq)R(qq)R(qq)R = (qqqqqqqq)R = (v2kV2k)R,

т.е. V2kV2k = (V2kV2k)R■ Лемма 1 доказана.

Лемма 2. Если последовательность Туэ-Морса содержит фактор, равный слову и, то она содержит фактор, равный слову (u)R.

Доказательство. Пусть Q содержит фактор и. Тогда и является также фактором в при некотором п. Тогда согласно утверждению 1 и лемме 1 сверхслово Q содержит фактор v2n+2 = V2nV2nV2nV2n = V2„T^(v2raT^) Д = Д(^2 n) , т.е. последовательность Туэ содержит фактор

[Щ п) , поэтому содержит фактор (и) .

Обозначим через хд множество неупорядоченных пар {(#(00), #(01)), (#(01), #(10)), (#(01), #(11)), (g(10),#(00)) (#(11),#(10))}. Отметим, что хд содержит любые неупорядоченные пары различных элементов отображения #, кроме пары (#(00),#(11)).

Теорема. Для любого натурального Д существует бесконечное слово над алфавитом из трех букв, которое обладает свойством (Д).

Доказательство. Зададим отображение #: 00 ^ (0)д+1,01 ^ (1)д+1,10 ^ (2)д+1,11 ^ (0)д+1. Сформулируем следующее очевидное утверждение.

Утверждение 2. Пусть и и v — слова одинаковой длины, т,акие, что и равно фактору одного из элементов некоторой пары, из хд> а v — фактору другого элемента из этой же пары. Тогда, р(и, v) = |и|.

В дальнейшем мы воспользуемся следующими вспомогательными фактами. Лемма 3. Пусть w является фактором сверхслова, Фд и Д-квадщтом с периодом, большим Д. Пусть также w содержит в качестве фа,кт,ора, монообраз v, имеющий прообраз аД а = fî. Тогда, хот,я, бы один, из двойников монообраза v в w имеет прообраз а^-

Доказательство. Обозначим через p период квадрата w. Отметим, что фактор v имеет не

w

и не более двух двойников содержится в правом корне. Предположим, что ни один из двойников монообраза v в w не имеет прообраза а^. Пусть фактор v имеет двух двойников (обозначим их

через u/ и u2) в одном из корней квадрата w и двух двойников (обозначим их через u/' и u2') в другом корне. В случае, когда в каком-то из корней имеется один двойник или двойников нет, будем полагать факторы u/, u2, u/' или u2 равными пустому слову. Оригиналы этих двойников обозначим соответственно через u/ и u'2, u'/ и u^'. Так как прообразы факторов u/, u'2, u'/ и uí¡' равны ав, а прообразы факторов u/, u2, u/' и u2 не равны ав, то в силу утверждения 2 имеем

) ^ p(u/,u/) + p(u2,uíj) + p(u/',u/') + p(u2',u2') =

|u/| + |u2| + |u/'| + |u2| = A + 1 > A,

что противоречит определению A-квадрата.

Лемма 4. Пусть w является фактором сверхслова, Фй и A-квадщтом с периодом, большим A. Пусть также w содержит в качестве факт,opa, монообраз v, имеющий прообраз аа. Тогда, хот,я, бы один из двойников монообраза v в w имеет прообраз аа или вв-

Доказательство этой леммы аналогично доказательству леммы 3.

Лемма 5. Для любых а\,..., ап € {0,1} выполнено равенство (д(а\... an))R = д(а\... anR), и для, любых а', а'' € {0,1} выполнено ра венет во (д(а'а''))д = д(а'а'').

Доказательство. Отметим, что для любых а', а'' € {0,1} выполняются равенства д(а'а'') = д(а"а') и (д(с/a"))R = д{а'а"). Поэтому требуемое утверждение легко выводится из того, что

(g(o>i. ..anR))R = {д{ап ... ai))R = (д(апап-1)д(ап-1ап-2). ..д(ЩЩ))к =

= д(ЩЩ) ■ ■ ■ g(an-ian-2)g(anan-i) = g{aia2) ■.. g{an-2an-i)g(an-ian) = g(ax... an).

Лемма доказана.

Лемма 6. Пусть Фй содержит фактор w. Тогда, Фй содержит фактор, равный слову wR.

Доказательство. Пусть прообраз фактора w равен слову u. Тогда Фй содержит фактор, равный fg((u)R), так как по лемме 2 (u)R содержится в качестве фактора в последовательности Туэ— Морса. Используя лемму 5, получаем, что Фй содержит фактор, равный wR. Лемма доказана.

3. Доказательство основной теоремы. Вернемся к доказательству теоремы.

Покажем, что сверхслово Фй обладает свойством (д). Предположим обратное: Фй содержит в качестве фактора некоторый A-квадрат w с периодом p, большим A.

w

отдельно следующие случаи.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Aw

ав а = в A w аа

бескубности О в каждом корне может быть не более одного такого монообраза. Кроме этих монообразов также может быть еще один монообраз с произвольным прообразом, имеющий непустое

w

(a) Пусть w содержит только один монообраз v с прообразом а1а2, где а1а2 € {0,1}. Тогда прообраз A-квадрата w равен аоа/а2а^, где аоаз € {0,1}. В силу бескубности О не могут выполняться равенства а0 = а/ = а2 и а/ = а2 = аз. Поэтому а/а2 = а0а/ и а/а2 = а2а3, откуда следует,

а/а2 v w

w а/ = а2 а/ = а2

что слова а\а2 и aoai, а\а2 и a2a¿ имеют хотя бы один общий символ (следовательно, aoai ф а\а2 и а2аз ф (xi(x2), получаем противоречие с леммой 4.

(b) Пусть w содержит 2 монообраза. Обозначим их прообраз через а/а2а3. Тогда возможны следующие под случаи.

(i) Прообраз фактора w равен а0а/а2а3.

(ii) Прообраз фактора w равен а/а2а3а4.

(iii) Прообраз фактора w равен а0а/а2а3а4.

Первые два случая, когда прообраз фактора w равен а0а/а2а3 ми а/а2а3а4, рассматриваются аналогично случаю (а). Рассмотрим третий подслучай, когда прообраз фактора w равен а0а/а2а3а4.

а/а2 а2а3

Aw

а/а2 а/а2 = аа

Следовательно, в силу бескубности О имеем а0 = а3 = в- Следовательно, а2а3 равно слову ав,

р w

0 ,w p

p 2p

которое ие равно ни одному из слов а0а^ а1а^ а3а4. Таким образом, монообраз с прообразом а2а3 не имеет в Д-квадрате т двойников с прообразом ав, что противоречит лемме 3.

(с) Пусть т содержит три последовательных монообраза 71,72,73- Обозначим их прообразы соответственно через а1а^ а2а3, а3а4. Заметим, что монообраз 72 не может целиком содержаться ни в одном из корней квадрата т. Следовательно, монообраз 72 имеет непустое пересечение с обоими корнями. Монообраз 71 целиком содержится в левом корне, а монообраз 73 — в правом корне. Рассмотрим отдельно следующие четыре подслучая.

Первая буква монообраза 71 является первой буквой Д-квадрата т, а последняя буква монообраза 73 — последней буквой Д-квадрата т.

(и) Первая буква монообраза 71 является первой буквой Д-квадрата т, а последняя буква монообраза 73 не является последней буквой Д-квадрата т.

(ш) Первая буква монообраза 71 не является первой буквой Д-квадрата т, а последняя буква монообраза 73 является последней буквой Д-квадра та т.

(¿у) Первая буква монообраза 71 не является первой буквой Д-квадра та т, и последняя буква монообраза 73 не является последней буквой Д-квадрата т.

Первый подслучай рассматривается аналогично случаю (а), второй и третий подслучаи — аналогично подслучаю (Ш) случая (Ь). Рассмотрим четвертый возможный подслучай. Заметим, что в этом случае прообраз фактора т равен а0а1 а2а3а4а5. Поскольку монообраз 71 с прообразом а1а2 целиком содержится в левом корне Д-квадрата т, согласно нашему предположению, а1а2 = аа. Следовательно, в силу бескубности О имеем а0 = а3 = в- Поскольку монообраз 73 с прообразом а3а4 целиком содержится в прав ом корне Д-квадрата т, согласно нашему предположению, а4 = а3 = в- Следовательно, в силу бескубности О имеем а5 = а. Таким образом, Д-квадрат т не содержит факторов с прообразом ав, кроме факторов монообраза 72, следовательно, монообраз 72 не может иметь двойников в т с прообразом ав, что противоречит лемме 3.

2. Пусть теперь один из корней квадрата т целиком содержит монообраз с прообразом ав, а = в- В дальнейшем будем обозначать через Л величину, равную Д + 1. Рассмотрим подслучай, когда монообраз с прообразом ав лежит в левом корне квадрата т, причем в левом корне содержится монообразов не менее, чем в правом корне. Обозначим самый левый монообраз с прообразом ав, содержащийся в левом корне, через т [т"+Л]. Пусть левый корень квадрата содержит п монообразов:

т [з+д]' т [/+2л]' ...' т [3_(_пПл)Л]' прообразами: которых являюеся соответственно слова а0а1; а1а2, ..., ап _ 1ап. Отметим, что если в левом корне слева от т [т"+л] содержится еще один монообраз, то

аа О

этого монообраза в Д-квадрате т не может быть других монообразов. Таким образом, мы полагаем, что либо т = в, либо т = в + Л.

(а) Предположим, что фактор т [т"_++р] является монообразом, т.е. период р кратен Л.

Пусть в = 0. В этом случае р = пЛ и факторы т [Л], т [2д],..., т [(п"Пл)Л] (содержащиеся в левом корне) и т [Л+р], т [2л_+р],..., т [(пПл_Л_Р] (с°держаЩиеся в правом корне) являются монообразами. Рассмотрим два соответствующих монообраза т [(д+^л] и т • Предположим, что прообраз монообраза т равен ав- Заметим, что тогда если прообраз а'в' монообраза т[(к+1_л+р] не равен ав то пара д(ав),д(а'в') содержится в поэтому согласно утверждению 2 выполняется неравенство р(т , т ) ^ р(т [(д+^л] , т [(к+^+Т+Р) > Д) чт0 противоречит тому, что т является Д-квадратом. Пусть теперь прообраз монообраза т [(д+^л] Р&веп аа. Заметим, что если прообраз монообраза т [(д+ЛЛ+р] Равен ва ми ва, то согласно утверждению 2

имеем р(т Щ) ^ р(т [(к+1)Л] [(fc+Л)_^_^]) > Д. Пусть прообраз монообраза т [(^л^] ра-вв в е ав

ва поэтому слева или справа от монообраза т [(к+1)л] в левом корне содержится еще один монообраз 7 (без ограничения будем считать, что 7 находится слева от т [(д+^л])- Обозначим через 7' монообраз, соответствующий ему в правом корне. В силу сильной бескубности О прообраз монообреза 7 равен ва, а преобраз моноебраза 7' равен ав- Тогда согласно утверждению 2 имеем р(т , т Щ) ^ р(т , т [(¿Лл+р]) > Д- Таким образом, получаем, что для любого

к = 0,... , п — 1 монообразы т [(¿¿^л] и т [(д+^Л+р] имеют равные прообразы. Поэтому левый и

правый корни w имеют одинаковые прообразы ао ... ага. Последний символ прообраза левого корня совпадает с первым символом прообраза правого корня, поэтому а0 = ага, следовательно, Q содержит фактор ао ... ап_1ао ... ага_1а0, что противоречит сильной бескубности последовательности Q.

(ii) Пусть s > 0. Аналогично случаю s = 0 получаем, что w имеет вид U1Y0 ... Yn_iW21V1Y0 • • • Yn_i V2, где Yi = w[|„^+i)A] = wf^+i+Z+pL Ы = M < л, M = |V2| < л 7i,...,7n_i,u2vi являются монообразами. Тогда левый корень Д-квадрата w имеет прообраз аа1 ... апai, а правый корень имеет прообраз anai... anт, где а, т € {0,1} Прообраз Д-квадрата w в этом случае равен aai ... anai... агат. В силу сильной бескубности Q выполняется т = а^ а = ага. При этом прообраз фактора u2vi равен агаа^, а прообразы его двой ников, щи v2, равны соответственно аа1 и агат, что противоречит лемме 3 в случае а! = ап или лемме 4 в случае al = ага.

(Ь) Предположим теперь, что фактор w [m^J+p] не является монообразом. Тогда существует

такое r, 0 < r < Л чт0 w [m+J+p] и w [m+Л+р] являются факторами последовательных монообразов. По лемме 3 один из прообразов факторов w [т+Г+J и w [m+Л+р] совпадает с прообразом фактора w [т+л] • Далее будем полагать, что w [т"+л] является монообразом w с прообразом акак+1

для некоторого k = 0,1.

(i) Пусть прообраз акак+1 фактоpa w [т"+л] совпадает с прообразом фактора w [m+++p] •

Индукцией по j = 0,1,...,n — 1 — k докажем, что прообраз монообраза w [тт(++Л)л] Равен прообразу фактора w [т+р+++1л] • База индукции при j = 0 является очевидной.

Пусть прообраз ак+1-ак+1+1 фактора w [т+(++Л)л] совпадает с прообразом фактора w [m+ijA+J и j < n—1 — k. Заметим, что тогда прообраз фактора w [t+m+j+iA+p] начинается с +i. Пусть этот прообраз равен ак+1+1а, где а € {0,1}. Отметим, что ак+1+1 = +1а, поскольку иначе = а&+1+1 = а, чт0 противоречит сильной бескубности Q. Таким образом, фактор w [t+m+(j+1^A+p] имеет прообраз ак+1+1а, а его двойники в w имеют прообразы ак+1+1 и ак+j+^fc+j+2. Если а = а&+1+2, то получаем противоречие либо с леммой 3 в случае ак+1+1 = а, либо с леммой 4 в случае а&+1+1 = а. Значит, а = а^^.

Пусть m = s+Л, т.е. в Д-квадрате w слева от монообраза w [т"+л] содержится монообраз w [8+л] ' прообраз которого равен а0а^. В таком случае, как показано выше, а0 = аi. Докажем, что прообраз монообраза w [s+A] равен прообразу фактора w [s+++p] • Пусть прообраз фактора w [s+++p] равен ra1. Отметим, что а0аi = а1а^, так как иначе а0 = а1 = а2, что противоречит сильной бескубности Q. Фактор w[s+A] имеет прообраз а0а1; а его двойники — прообразы та1 и а1а^. Если т = а0, то получаем противоречие с леммой 4. Значит, т = а^

Таким образом, для любого j = 0,1,..., n — 1 прообраз монообраза Yj = w [5+(++Л)л] совпадает

с прообразом монообраза Yj = w [s+J+r(+^++p]' тем самЬ1М Yj = Yj

Отметим, что монообраз y0 может являться либо монообразом w , либо монообразом

w [^+(П+2)а] • ® первом случае w имеет вид «1Y0Y1... Y«._ 1Y0Yi . - - Y^_1v2, а во втором случае — вид

U1Y0 ... Yn_ 1U2|viY0Yi... Y^^, где |ui| < Л Ы < Л |vi| < Л Y0,..., Yn_ 1 = Y0,..., Y^_1 — монообразы с прообразами а0а1,..., ап _ 1а^. В первом случае получаем, что, поскольку y0 = Y0) прообраз апа1 монообраза y0 равен прообр азу а0а1 монообраза Y0) т-е • ап = а0, откуда следует, что прообраз фактора w содержит фактор апа1 ... ап _ 1апа1... ап_ 1а^, что противоречит сальной бтскубности последовательности Туэ-Морса. В втором случае в w двойниками монообраза w [8+8(++л)л] являются w [s+°_ Л и w +p) прообразы которых равны та0 и апа, гДе т, а € {0,1}. Так как прообраз монообраза w [s+S(++"i)a] н ап а^, то то лемме 3 (в случае ап = а0) и лемме 4 (в сл учае ап = а0) либо т = ага, либо а = а0, и в любом из этих случаев мы приходим к противоречию с сильной бескубностью последовательности Туэ-Морса.

(ii) Пусть прообраз ак ак+1 фактора w с прообразом w [mm-+Jr+pp] •

Индукцией по j = 0,1,...,n — 1 — k докажем, что прообраз монообраза w[т_т(+++1)л] Равен прообразу фактора w [mm+J+1 Л+i-p]' ^ВДукции при j = 0 является очевидной.

Пусть теперь прообраз ак+1- ак+1-+1 фактор а w [т+(+++Л)л] совпадает с прообразом фактора w И j < n — 1 — k- Заметим, ^то тогда прообраз фактора w [т+(1+2)Л] начинается с

afc+j+ь Пусть этот прообраз равен afc+j+i^, где а € {0,1}. Пусть его прообраз равен afc+j+2afc+j+2, а прообраз фактора w Равен «fc+j+ia Отметим, что afc+jafc+j+1 = afc+j+iafc+j+2, по-

скольку иначе afc+j = a&+j+i = a&+j+2, что противоречит сильной бескубности Q. Таким образом, фактор w [m+(j+2)A] имеет прообраз afc+j+2afc+j+2, а его двойники в w имеют прообразы a^+ja^+j+i и afc+j+ia Если а = a&+j+2, то получаем противоречие либо с леммой 3 (в случае afc+j-+i = a&+j+2), либо с леммой 4 (в случае a^+j+i = a^+j+2). Значит, а = afc+j+2.

Пусть m = s + Л, ад. в Д-квадрате w слева от монообраза w [т"+Л] содержится монообраз w L+д]' прообраз которого равен aoa2. В таком случае, как показано выше, ao = ai. Докажем, что прообраз монообраза w [s+A] равен прообразу фактора w [m+m+J +J • Пусть прообраз фактора w Г+^+Р равен ra^. Отмети м, что aoai = ai a^, поскольку и паче ao = ai = a2, что противоречит сильной бескубности Q. Факто р w [8+Л] имеет прооб раз aoai, а его двойники имеют пр ообразы rai и aia2- Если т = ao, то получаем противоречие с леммой 4. Значит, т = ao-

Таким образом, для любого j = 0,1,..., n — 1 прообраз монообраза Yj = w [5+(+++"2)а] совпадает

с прообразом монообраза Yj = w [s+s+++iA+p]) тем самым Yj = Yj •

Отметим, что между монообразом w [s_+++++J и монообразом w [5+<,(+-д)Л] может содержаться либо один, либо два монообраза. В первом случае w имеет вид u2Y0 ... Yn-iU2|viYÓYÍ • • • Yn~iv2 или u2Yo ... Yn-iu2|viYoYi... y4-2v^) ^ втором случае имеет вид u2Y0 ... Yn-iU2|viY''Y0YÍ... y4-2v2) где |u2| < Л, |u2| < Л, |v2| < Л, |v2| < Л, Yo,...,Yn-i = Yo,...,Yn-i _ монообразы с прообразами aoai,..., an-1an, u2v2 и y'' _ монообразы. Рассмотрим соответствующие подслучаи.

1) Пусть w имеет вид u2Y0 ... Yn-1u21viYoYi... Тогда v w есть прообраз, который равен Tao ... araao ... a«а, где прообраз монообраза U2V1 равен a«ao и т, а € {0,1}. Двойниками монообраза U2vi в w могут быть фактор ui, некоторый префикс монообраза Yo; некоторый суффикс монообраза Yn-2 и фактор v2. Прообразы этих двойников равны Tao aoai, an-1an, anа. Рассмотрим два подслучая. Пусть ao = an. Тогда в силу леммы 3 anao равен одной из пар Tao aoa2, an-1an, a^. Поскольку an = ao, выполнено anao = aoa2 и anao = an-1an. Значит, либо anao = Tao, либо anao = an^, откуда следует, что либо an = т, либо ao = а. В обоих случаях получаем противоречие с сильной бескубностью последовательности Q. Пусть теп ерь an = ao- Тогда согласно ле мме 4 anao или апао равно одной из пар rao, скоа2, ara_2ara, апа. Так как каждая из этих пар содержит либо ап, либо ao, то ни одна из этих пар не может быть равна апао• Следовательно, хотя бы одна из этих пар должна совпадать с anao- Заметим, что в силу бескубности последовательности Q в ней не может быть трех идущих подряд одинаковых символов. Следовательно, an-i = ao = an = ai. Поэтому anao = aoai и anao = an-1an. Значит, anao равно либо тя^ либо a^. Тем самым либо т = an, либо а = ao- В обоих случаях получаем противоречие с сильной бескубностью последовательности Q.

2) Пусть w имеет вид u2yo . ..Yn-iU21 vi YoYi... y4-2v2 и обладает прообразом, который равен тa0 ... anao ... an-1an, где прообраз монообраза u2v2 равен anao. Этот случай рассматривается аналогично первому случаю.

3) Пусть w имеет вид u2yo ... Yn-iu2|v2Y"YoYi... y4-2v2 и обладает прообразом, который равен тa0 ... a^ao ... an, где прообраз монообраза u2v2 равен anа и т, а € {0,1}. Докажем, что в этом

а = т Y Д w

фикс фактора u2 и некоторый суффикс мон ообраза Yo которые имеют прообразы, равные тa0 и aoa2. Рассмотрим два подслучая. Пусть а = ao. Тогда согласно лемме 3 имеем либо aa0 = тa0, либо аa0 = aoa2. Поскольку а = ao, то аa0 = a0a2, поэтому аa0 = тя0, тем самым а = т. Пусть теперь а = ао, тогда согласно лемме 4 либо аао, либо <тао равно либо rao, либо aoa2. Поскольку обе пары rao, aoa2 содержат букву ao, то эти пары не могут быть равны аЩ. Таким образом, <тао равно rao или aoai. Заметим, что в силу сильной бескубности поеледовательности Q данная последовательность не содержит трех подряд идущих букв, поэтому ai = ao = а, следовательно, aao = aoai, тем самым aa0 = тя0, таким образ ом, т = а. Заметим, что двойниками монообраза u2v2 в Д-квадрате w ui v2

образы тя0 = aa0 и an-1an. Рассмотрим два подслучая. Пусть а = an. Тогда согласно лемме 3 a^ равно либо тя0, либо an-1an. Так как а = an, то anа = an-1an, следовательно, a^ = aa0, тем самым an = а = ao- Таким образом, получаем, что Q содержит три идущих подряд одинаковых символа, что противоречит ее сильной бескубности. Пусть теперь а = an. В силу леммы 4 либо апа, либо апа совпадает либо с аао, либо с ara_2ara. Поскольку каждая из пар аао, с*п_2ага содер-

жит либо ап, либо а, то эти пары не могут совпадать с апа. Поэтому апа равно либо аао, либо ага-1ага. Следовательно, либо а = ага, либо а = а0, тем самым в обоих случаях последовательность Q содержит три идущих подряд одинаковых символа, что противоречит ее бескубности.

3. Пусть правый корень квадрата w содержит монообраз с прообразом ав и число монообразов, целиком содержащихся в правом корне, не меньше числа монообразов, целиком содержащихся в левом корне. Таким образом, Фй содержит в качестве фактора Д-квадрат w, такой, что в его правом корне присутствует монообраз с прообразом ав, равный (1)А+1 ми (2)А+1. Согласно лемме 6 Фй имеет фактор wR который, очевидно, тоже является Д-квадратом. В левом корне фактора wR содержится фактор (1)А+1 ми (2)А+1, этот фактор является монообразом с прообразом ав, так как ни (1)А+1, ни (2)А+1 не может быть строгим фактором конкатенации двух последовательных монообразов. Отметим, что при этом число монообразов, содержащихся в левом корне фактора wR не меньше, чем в правом корне. Это противоречит разобранному ранее случаю 2.

w ав

целиком содержащихся в левом корне, меньше числа монообразов, целиком содержащихся в правом

w

два последовательных монообраза, из которых хотя бы один в силу сильной бескубности последовательности Q является монообразом с прообразом вида ав- Поэтому данный случай сводится к случаю 2.

5. Пусть правый корень квадрата w содержит монообраз с прообразом ав и число монообразов, целиком содержащихся в правом корне, меньше числа монообразов, целиком содержащихся в левом

w

два последовательных монообраза, из которых хотя бы один в силу сильной бескубности последовательности Q является монообразом с прообр азом вида ав- Поэтому данный случай сводится к случаю 2.

Таким образом, сверхслово Фй обладает свойством (А)-

ДД

ратом. Поэтому результат теоремы неулучшаем.

СПИСОК ЛИТЕРАТУРЫ

1. Thue A. Uber unendliche Zeichenreihen // Mat. Nat. Kl. Khristiania. 1906. 7. 1-22.

2. Саломаа А. Жемчужины теории формальных языков. М.: Мир, 1986.

3. Thue A. Uber die gegenseitige läge gleicher teile gewisser Zeichenreihen // Mat. Nat. Kl. Kristiania. 1912. 1. 1-67.

4. Aviezri S. How many squares must a binary sequence Contain? // Electron. J. Combinatorics. 1995. 2.

5. Crochemore M. Repetitions in strings: algorithms and combinatorics // Theor. Comput. Sei. 2009. 410, N 50. 5227-5235.

6. Crochemore M. Squares, cubes, and time-space efficient string searching // Algorithmica. 1995. 13, N 5. 405-425.

7. Котляров H.B. О существовании сколь угодно длинных слов, не содержащих квадратов с одной возможной ошибкой замещения // Дискретн. матем. 2015. 27, вып. 2. 56-72.

8. Котляров Н.В. О словах, избегающих квадратов с одной возможной ошибкой замещения // Вестн. Моск. ун-та. Матем. Механ. 2016. № 1. 48-52.

Поступила в редакцию 13.09.2017

УДК 519.712 -

О СЛОЖНОСТИ ПОИСКА ВХОЖДЕНИЙ ПОДСТРОКИ В МНОЖЕСТВО СТРОК

Е. М. Перпер1

Рассматривается задача поиска вхождений подстроки в множество строк: пусть дано множество строк, требуется для произвольной подстроки найти все ее вхождения в строки из этого множества. Исследуются алгоритмы осуществления такого поиска, приве-

1 Перпер Евгений Михайлович — инженер АО "Крафтвэй корпорэйшн ПЛС", e-mail: e_m_perperQmail.ru.

i Надоели баннеры? Вы всегда можете отключить рекламу.