Научная статья на тему 'Комбинаторный анализ двух форм скрытой периодичности категориальных последовательностей'

Комбинаторный анализ двух форм скрытой периодичности категориальных последовательностей Текст научной статьи по специальности «Математика»

CC BY
181
36
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по математике, автор научной работы — Алексеева Н. П.

Разработаны методы выявления скрытой периодичности: симптомный анализ в случае пенетрантной формы, когда периодически повторяющиеся фрагменты сохраняются, и метод порядковой асимметрии в случае копенетрантной формы, когда эти фрагменты распадаются. Симптомный анализ скрытой периодичности основан на модификации для конечных геометрий методов главных компонент и «Гусеница» SSA. В анализе копенетрантной формы периодичности используется кластерный анализ с метрикой расстояния между градациями в виде порядковой асимметрии, которая характеризует отклонение от периодичности подпоследовательности с этими градациями.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Алексеева Н. П.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

The combinatorial analysis of two basic forms of hidden periodicity in categorial sequences

Two kinds of mixing periodical components according to the Spencer-Brown laws of form are considered. If the identical fragments of a periodic component are kept then we have a penetrant (call) form, if the identical fragments break up then we have a co-penetrant (crossing) form. The symptom analysis of hidden periodicity is used for the penetrant form, and the order asymmetry method is used for the co-penetrant form. In the symptom analysis the main components method and SSA are modified for finite geometries. The order asymmetry method is the cluster analysis where the metrics between two gradations characterizes a deviation from periodicity in a subsequence over these gradations.

Текст научной работы на тему «Комбинаторный анализ двух форм скрытой периодичности категориальных последовательностей»

МАТЕМАТИКА

519.1, 519.22-24

Н. П. Алексеева

КОМБИНАТОРНЫЙ АНАЛИЗ ДВУХ ФОРМ СКРЫТОЙ ПЕРИОДИЧНОСТИ КАТЕГОРИАЛЬНЫХ ПОСЛЕДОВАТЕЛЬНОСТЕЙ

1. Введение

Исследование скрытой периодичности является одной из распространенных задач в анализе данных. Однако разработанные для метрических рядов методы [1] оказываются мало пригодными в случае категориальных рядов, т. е. последовательностей знаков (букв, чисел, событий и т.д.), не связанных между собой отношениями порядка. В современном анализе этих последовательностей в основном преобладают комбинаторноизмерительные методы [2]. Наша задача состоит в привлечении комбинаторно-аналитических методов выявления скрытой периодичности, которые оказались возможными при условии предварительного рассмотрения структуры ее формообразования.

Тривиальной формой периодичности является повторение одинаковых фрагментов последовательности, например, abcabcabcabc. Если одинаковые фрагменты отделены друг от друга произвольными последовательностями знаков, например, abc * * * abc * *abc * abc, то имеет место форма скрытой периодичности, которую для определенности назовем пенетрантной1. В основе ее анализа лежит метод главных компонент над конечным полем с введением более сложного критерия оптимальности, чем экстремальность дисперсии. Метод был разработан для анализа дихотомических рядов, однако он легко модифицируется для последовательностей с большим количеством градаций. Приведены примеры выявления одинаковых фрагментов дихотомической и трихотомической последовательностей над конечными полями F2 и F3.

Поскольку метод получил свое развитие из практики анализа медико-биологических данных, при рассмотрении некоторых вероятностно-алгебраических объектов были использованы термины, позаимствованные из медицины и биологии. В частности, для названия дихотомического признака, построенного по типу гиперплоскости в конечной евклидовой геометрии, было использовано понятие симптома2. Для описания набора

1Эта форма периодичности получила свое название от английского слова penetrant, которое переводится как «проникающий», «проходящий», «пронизывающий».

2 Симптом — это признак, характеризующий некоторое явление.

© Н. П. Алексеева, 2007

симптомов, структура которого соответствует двойственной проективной геометрии, было введено понятие синдрома3. Упорядочивание симптомов по степени их информативности получило название метод информационных главных компонент [3] или симп-томный анализ.

Что касается второй рассматриваемой формы скрытой периодичности, то она возникает тогда, когда при смешивании периодических последовательностей одинаковые фрагменты проникают друг в друга. Поскольку в этом случае имеет место взаимное проникновение, назовем эту форму периодичности копенетрантной. Например, ряд (а а Ь ! о а Ь о в Ь / о) получен смешиванием трех рядов: (о, Ь о о, Ь о), (о, Ь о) и (! в /). Исследование этой формы периодичности основано на дифференциации градаций при помощи кластерного анализа, в котором в качестве расстояния между градациями используется специальным образом введенная характеристика порядковой асимметрии [4]. Получено выражение этой характеристики через индикаторные последовательности градаций [4].

2. Копенетрантная форма периодичности и порядковая асимметрия

2.1. Определения и примеры. Обозначим через X = X (А) = {хг}”=1 , хг € А, категориальную последовательность на множестве градаций А. Например,

X = (а, а, а, Ь, а, в, в, в, в, в, /, /, Ь, /, д, д, /, д, Ь, Ь, д, Н, Н, о, /), (1)

где А = {а, Ь, о, в, /, д, Н}. Последовательность {хг}”=1 называется периодической, если Хг+кТ = хг, где к — натуральное число, Т — период. Например, а, Ь, о, а,Ь,о,...

Рассмотрим подпоследовательность Б = {в2- }т=1 Е X, вк = хгк, :ч < ... < гт, т < п. Подпоследовательность Б, образованная из элементов X, не входящих в 5, называется дополнением до исчерпывания последовательности X. Например, для X из (1) имеем Б = (а, а, а, 6, а, Ъ,Ъ,Ъ), Б = (е, е, е, е, е, /, /, /, /, /1, /1, с, /). Определим операцию,

обратную к дополнению до исчерпывания.

Определение 1. Последовательность Z(АиВ) = {^г}”=1 называется смесью или порядковой суммой Z (АиВ) = X (А)+ У (В) последовательностей X = X (А) = {хг}П=1 и У = У (В) = {у2 }”= 1, если п = по + п1, X Е Z,У Е Z.

Определение 2. Результат порядкового суммирования категориальных последовательностей Xi(Ai), г = 1, ... ,К, называется смесью кратности К гипергетероген-ной при А П А = 0, г = з, гетерогенной при А П А^ = 0, Аг = Ау, гомогенной при

А = А,-.

При пенетрантной форме периодически повторяющиеся фрагменты компонент суммирования в смеси сохраняются, при копенетрантной форме периодичности — нет.

2.2. Порядковая асимметрия. Если в смеси градации а и Ь относятся к одной и той же периодической компоненте, то наблюдается порядок, при котором за каждой градацией а следует «симметричная» ей градация Ь. Если градации относятся к разным компонентам смеси, то возникает порядковая асимметрия, которая измеряется количеством элементов, выпадающих из структуры порядка симметрии.

Пусть имеется последовательность V(а,Ь) = {г^ }^=1 с множеством градаций {а, Ь} и ее подпоследовательности четной длины X(аЬ) = {хк}к=1 Е V(а,Ь), 2К < N, и У(Ьа) = {ут}т= 1 Е V(а,Ь), 2М < N, представляющие собой гомогенные порядковые суммы периодических последовательностей, соответственно, вида аЬаЬаЬ . . . и ЬаЬаЬа . . .

3 Синдром означает сочетание симптомов.

Определение 3. Односторонней порядковой асимметрией ,у(аЬ) называется длина дополнения X(аЬ) до исчерпывания V(а,Ь), 7(аЬ) = N — 2К. Аналогично определяем ^(Ьа) = N — 2М.

Определение 4. Минимальной, средней и максимальной порядковой асимметрией называются, соответственно, выражения

\¥о(а, Ъ) = гшп(7(аЬ), 7(60)), Wl(a, Ъ) = ——^ ^ ^^(а, Ъ) = тах(7(аЬ), 7(60)).

Очевидно, Ш1(а,Ь) = N — К — М. Основная проблема заключается в вычислении количества симметричных пар К и М. Введем в рассмотрение индикатор ряда V(а,Ь)

0, при г2 = а,

1, при г2 = Ь.

г—1 г—1

Величины аг =2(1 — ш) и вг = 2 Ш означают накопленные до г-го элемента ко-2=1 2=1

личества градаций а и Ь. Очевидно, что аг + вг = г — 1. Соответствующие градациям а и Ь индикаторы невключения ^(г) и включения Ь+(г), г € {а, Ь}, элемента гг в периодическую подпоследовательность X(аЬ) имеют вид:

, — ( ) =\1 при гг = г € X(aЬ), . + ( ) = И1 — шг)(1 — ^(г)) при г = a,

г ( ) [0 при гг = г € X(аЬ) или гг = г, г ( ) |шг(1 — ^(г)) при г = Ь.

Очевидно, что £+ (а)+(а) +£+ (Ь) + 4—(Ь) = 1, г = 1, .. ., N. Односторонняя порядковая асимметрия выражается через индикаторы невключения

N N

1(аЬ) = 2_^ ^ (а)+}_^ Ьъ (Ь).

Теорема 1. Индикаторы невключения ^ (а) и ^ (Ь), г = 1,...^, могут быть вычислены рекуррентно: Ь— (а) = 0, Ь—(Ь) = Ш1,

Ч (а) = (1 — шг)

1 - sign(/3^v+l - Нг) 2

Ч(Ь)

1 - SІgn(ff^ - &) 2

(2)

г-1г-1

для г = 2, . .., N, где Нг = аг — 2 (а) +2 4- (Ь), через \ ] обозначено округление до

2=1 2=1

большего целого.

Доказательство. Если первой стоит градация а (ш = 0), которая образует пару (аЬ) с ближайшей справа градацией Ь, то 4+ (а) = 1, следовательно, 4— (а) = 0, 4—(Ь) = 0 = ш1. Если первой стоит градация Ь (ш = 1), которая не может образовать пару (аЬ), тогда справедливы тождества 4—(Ь) = 1 = Ш1, Ь— (а) = 0. Выражения Нг — вг и вы +1 — Нг означают доступные количества элементов, с которыми может образовать симметричную пару элемент гг. Это следует из преобразования

г-1г-1 Нг — вг = I аг — У'' 4,• (а) I — I вг — У'' t„• (Ь)

0 I I п

2=1 / V 2=1

*3 (а)I .

Если для VI = а существует симметричный элемент = Ъ при /г > г, т. е. >

0, значит в (2) получаем *— (а) =0, в противном случае V. = а € X(аЬ), вм+1 — Н.\ < 0 и *— (а) = 1. Если для V. = Ь существует симметричный элемент Vj = а при ] < г, т. е. Н. — в. > 0, то в (2) получаем *— (Ь) = 0, в противном случае V. = Ь € X(аЬ), Н. — в. < 0 и ЬТ(Ь) = 1. □

Для вычисления 7(Ьа) = N — 2М можно заменить индикаторы т. на 1 — т., а также поменять начальные условия на *—(Ь) = 0, ^—(а) = и>1.

2.3. Пример декомпозиции смеси категориальных последовательностей. Для иллюстрации декомпозиции рассмотрим гипергетерогенную порядковую сумму двух гомогенных смесей кратности К1 = К2 = 5 со множествами градаций А1 = {а, Ь, с, d} и А2 = {е, ], д, К}

(aaaЬaeeeeeffЬfggfgЬЬghhcfdechfghgehefacecddahdgЬahacfЬcfdaЬЬeaefcfacddghegaf ЬghаcdЬgdeЬgаe/cЬdЬhgeаhаЬh/Ьe/ghcdcecdeаdЬ/cаhgаЬ/gh/ЬcdhceddegeаcdhgЬcа/аа),

которая и была получена в результате моделирования [4]. Для каждой пары градаций вычисляем значения средней порядковой асимметрии Wl(*, *), которые затем используем как расстояния между градациями.

Значения средней порядковой асимметрии

*) а Ъ с <1 е / 9 к

а - 2.5 5.0 4.0 8.0 7.0 5.0 5.0

Ь - 5.0 4.0 6.0 5.0 5.0 6.0

с - 3.0 5.0 4.0 5.0 4.0

ё, - 7.5 5.5 5.0 5.0

е - 5.0 4.5 5.0

/ - 4.0 4.0

9 - 4.0

Из этой матрицы расстояний на основе стратегии группового среднего [5] получаем два кластера, совпадающие с А1 = {а, Ь, с, d} и А2 = {е, ], д, К}.

3. Симптомный анализ пенетрантной формы периодичности

3.1. Определение симптома. Обозначим через X = (Х1,Х2,... ,Хп)Т вектор со случайными компонентами, имеющими распределение Бернулли. Реализации вектора X являются точками евклидовой геометрии ЕП. Нашей задачей является исследование информационных свойств компонент, образующих двойственную проективную геометрию Р2п—1 [3].

Определение 5. Симптомом ХТ с набором индексов т = (*1, .. ., *т) С (1, 2, . .. ,п) называется конечно-линейная комбинация

ХТ = а1Х1 + ... + апХп(шоА2), где а3 = \ 1 при ^ € Т . (3)

■'10 при ] € т

Через Х0 будем обозначать вырожденный симптом — случайную величину, которая принимает значение 0 с вероятностью 1. Компоненты Х1,Х2,...,Хп являются тривиальными симптомами.

вЫ +1 — Нг = I вЫ +1 — ~*3 (Ь ) — ( а. —

3=1

3=1

Предложение 1. 1) Хт + Хт = Хф;

2) если т П ц = 0, т и ц = р, то Хт + Xм = Хр;

3) если р П V = р,к = (р и и) \ (р П V), то Хр + Хи = Хк.

Доказательство. Первые два утверждения очевидны в силу того, что сумма одинаковых элементов над равна нулю. На основе результата второго утверждения в третьем, обозначая через р \ ц и V \ ц разности множеств индексов, получаем

Хр + Хи = (Хр\р. + Хр) + (ХЦ + ХА^ = Хр\)Л + Хи\р, = Хк -П

3.2. Синдром и проективная геометрия. Сочетание разнообразных симптомов, в котором сумма над Р2 любых двух симптомов также входит в это сочетание, будем называть замкнутым. Например, сочетание (Хі, Хз, Хіз) замкнуто, так как над полем Р2 справедливы утверждения

Хіз = Хі + Хз, Хі = Хз + Хіз, Хз = Хі + Хіз-

Определение 6. Пусть имеются симптомы ХТ1, Хт2, .. ., Хтк, среди которых ни один симптом не может быть выражен над полем Р2 через сумму других. Сочетание всех симптомов вида віХті + ... + вкХтк с коэффициентами над ^2 при условии, что все ві одновременно не равны 0, будем называть синдромом к-го порядка Ак.

Очевидно, что Хф Є Ак и количество симптомов в синдроме Ак равно 2к — 1. Нетрудно показать, что Ак является замкнутым сочетанием. Для упорядочивания симптомов в синдроме удобнее использовать не лексико-графический, а импульсный порядок4, который получается в результате использования рекуррентной формулы А^ = (Аj-l, Х^, Аj-l + Х^), где Аі = Хі, а через Аj-l + Х^ обозначен набор симптомов вида Xj + Хт для всех Хт Є Аj—і. Импульсный ранг К(т) определяем как порядковый номер симптома Хт с набором индексов т = (Ьі,... ,Ьт) в импульсно-упорядоченном синдроме:

т

Е(т )=^&- (4)

j=1

Симптомы, импульсный ранг которых равен степени двойки, называются базовыми симптомами. Если в качестве базовых симптомов в Аз взять Хіз, Х23 и Хі, то порядок симптомов изменится:

(Хіз,Х2з,Х12,Хі,Х3,Х123,Х2), (5)

где Хі2 = Хіз + Х2з, Хз = Хі + Хіз, Хі2з = Хі + Х2з, Х2 = Хі + Хі2.

Количество подстановок в синдроме Ап определяется группой автоморфизмов дизайна П(у,т,Х), где число элементов и число блоков V равно 2п — 1, размер блока г равен 2п~і — 1, каждый элемент встречается г раз, а каждая пара элементов встречается А = 2п-2 — 1 раз. Этот дизайн, соответствующий проективной геометрии Р^'-, образуют гиперплоскости в евклидовой геометрии ЕП [8], а также элементы синдрома Ап, сумма которых является вырожденным симптомом.

4Термин «импульсный порядок» получил название от метода построения дизайнов [6] на основе импульсной последовательности [7], так в алгебре называют периодическую последовательность над конечным полем из элементов, полученных благодаря рекуррентному соотношению типа Фибоначчи.

3.3. Информационные главные компоненты. Будем использовать в качестве базовых симптомов в синдроме Дп компоненты случайного вектора X = (Х\,..., Хп)Т

с совместным распределением ро,... ,рм, N = 2п. Для дифференциации симптомов в

N

Дп воспользуемся понятием энтропии Н(Х1, . . . , Хп) = — 2 Рг 1°Й2 Рг, которая измеря-

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

г= 1

ет в битах степень неопределенности X. Условная энтропия определяется как среднее энтропий условных распределений.

Лемма 1.

1. Н(Х2Х1) = Н(Х1,Х2) — Н(Х1).

2. Р {(Х1, ...,Хп) = (Ч,..., гп)} = Р {Х1,т = г, (Х2, ...,Хп) = (*2,..., гп)}, где т С (2, 3, .. ., п), Хт = гт, г = :ч + гт(тов2).

3. Н (Х1, ...,Хп) = Н (Х^,..., Хп,тп), где тг С (1, 2,..., г — 1,г +1,...,п).

4. Н (Хт+1,..., Хп\Х1, ...,Хт)= Н (Хт+1 + Хт! ,...,Хп + Хтк |Дт),

где Хт€ € Дт и Хф, г = 1, . . ., п — т.

Доказательство. Первое утверждение очевидно. Так как во втором утверждении {1} П т = 0, над полем ^ справедливо Х1,т = г Х1 + Хт = г Х1 = Хт + г Х1 = г1. Третье утверждение следует из второго. Четвертое следует из первого и третьего. □

Теорема 2. Для любых симптомов Хт6 € Дj-l и Хф имеет место разложение энтропии синдрома Дп с базовыми симптомами Х1, ..., Хп:

п

Н(Дп) = Н(Х1) + £ НХ + Хт3 ^-1).

j=2

Определение 7. Симптом с наибольшей энтропией называется первой информационной главной компонентой. Классы симптомов из синдрома Дп, упорядоченные по степени убывания условной энтропии, называются информационными главными компонентами, где условная энтропия г-ой главной компоненты считается относительно синдрома, образованного предыдущими г — 1 главными компонентами (г = 1, .. . ,п).

Например, если в синдроме (5) симптом Х13 обладает наибольшей энтропией, то он является первой главной информационной компонентой. Допустим Н(Х23Х13) = Н(Х12\Х1з) > Н(Хт\Х1з), где т € Д2 = (Х13, Х23, Х12), тогда получаем, что Х23 и Х12 относятся ко второй главной информационной компоненте. Четыре симптома Х1,Х3,Х123 и Х2 относятся к третьей главной информационной компоненте, так как Н(Х1Д2) = Н(Х3\Д2) = Н(Х123\Д2) = Н(Х2Д2).

3.4. Идентификация периодических фрагментов. Для иллюстрации метода выявления пенетрантной формы периодичности рассмотрим текст из шести слов с окончанием «ение» (пение чтение прощение видение бдение приведение). При помощи двоичного кода, в котором одной букве соответствует кодовое слово из четырех знаков (нулей и единиц), получаем дихотомический ряд (/1, /2,..., /N) длиной в N = 232 знака с учетом двух пробелов между словами и шести пробелов по краям, кодируемых четырьмя нулями. Вектор (0101 1001 0111 0101) соответствует окончанию «ение».

По аналогии с методом выделения скрытой периодичности для метрических рядов «ГУСЕНИЦА» — SSA (SingularSpectrum Analysis) [1], исследуемый ряд (f1, f2,..., fN) преобразуется в траекторную матрицу Y = [Y1,..., YK] , где вектора вложения Y при длине L «окна» имеют вид

Yi = (yii ,yi2 ,...,yiL )T = (fi ,---,fi+L-1 )T, i = 1,...,K. (6)

Графически ряд (f1 ,f2,..., fN) будем изображать в виде отрезков, соединяющих точки (i,fi), i = 1,... ,N. На рис. 1 изображен график дихотомического ряда, кодирующего текст, и график последовательности, полученной на основе метода информационных главных компонент и накрывающей одинаковые фрагменты промежутками постоянства. Рассмотрим более подробно эту аналитическую процедуру выявления одинаковых фрагментов ряда. Нетрудно убедиться в справедливости следующей леммы.

видение бдение приведение

Рис. 1. График дихотомического ряда (тонкая линия) и сдвинутый вверх график его конечно-линейного преобразования над полем ¥2, идентифицирующего (0101 1001 0111 0101).

Лемма 2. Пусть т = (£1,..., Ьт) С (1, 2,... ,п) и вектора вложения У\,..., Ук из (6) являются векторами реализаций базовых симптомов УТ = а\У1 +... + апУп(mod2), п < К, где а^ имеют вид (3),

в = S(L,L) =

э о о 1. оо оо

о • о .. о. .. о 1

о о о. .о о

(7)

Тогда YT = вТY1, где вт = = в*"-1.

Самым информативным является симптом с одинаковым числом нулей и единиц в векторе реализаций. Поэтому если в векторах вложения нулей много больше, чем единиц, то Ут, в котором доля единиц ближе всего к одной второй, оказывается наиболее информативным. Количество единиц вычисляется при помощи выражения УТ^е, где через е обозначен вектор из единиц. Отметим, что преобладание нулей в дихотомическом ряде является ограничением метода, а задача определения допустимой пропорции между нулями и единицами требует отдельного рассмотрения. В нашем примере оказалось достаточно ввести два пробела между словами вместо одного.

Дополним правило для выявления наиболее информативного симптома принципом минимума действия, который реализуется в том, что более информативный симптом должен содержать в себе наименьшее количество переключений от одного знака к другому, измеряемое при помощи величины (Ут + 0УТ)те. Объединим эти характеристики в показателе рентабельности, зависящем от импульсного ранга Я(т),

У т е

Кеп(Л(г))=(у. +'еу.)Тв.

При длине ряда N = 232 и длине «окна» «гусеницы» Ь =120 для выявления периодически повторяющегося фрагмента ряда достаточно ввести синдром Д12. Экстремальное значение рентабельности достигается при К(т) = 2531. Из (4) получаем т = (1, 2, 6, 7, 8, 9,12). Для восстановления периодически повторяющегося фрагмента ряда и = (и1,..., ип)т = (у1ц+1, У1Ц+2, ■ ■ ■, У1,ц+п)т, в результате преобразования которого возникает вектор из единиц: е = 0Т и, воспользуемся обратным преобразованием и = 0-1е. В случае т = (1, 2, 6, 7, 8, 9,12) матрица 0Т невырожденная, максимальная длина вектора е равна п =17. Получаем кодирующий окончание «ение» вектор ит = (0 0101 1001 0111 0101).

При идентификации заданного фрагмента дихотомического ряда можно заранее вычислить индекс симптома, который преобразует этот фрагмент в вектор из единиц. Нетрудно доказывается следующее утверждение.

Теорема 3. Пусть и = (и1,...,ип)т С У1, V = 0Ти С УТ, где 0Т = 0Т(п,п) имеет вид (7); т = (^, .. . ,£т) С (1, 2, .. . ,п), Ут = ^У! + ... + апУп(ш.о62), ац имеют

к-1

вид (3); Ьо = ип, 61 = ип-1, Ьь = 2 un-iЬfc-i(mod2), к = 2, 3, ..,п — 1; матрица

1= 1

В = {Ьij}П]=1 с элементами Ьц = Ьц^ при ] > г, иначе Ьij = 0, является ганкелевой; матрица J имеет единицы на побочной диагонали, остальные нули. Тогда вектор а = (а1, .. ., ап)т имеет вид: а = JBV(mod 2).

3.5. Обобщение результатов на случай поля При наличии в категориальной последовательности трех градаций можно построить линейные комбинации векторов вложения над полем ^3 и, тем самым, обобщить понятие симптома. Приведем пример рассмотренного ранее текста из шести слов с окончанием «ение», которое в кодах поля ^3 имеет вид (101 012 011 101). При обобщении результата теоремы 3 на случай конечного поля _Рз получаем симптом УТ, где г = (1, 2, 4, 5, 6, 7, 8, 9,10,11), преобразующий фрагмент (101 012 011 101) в вектор из единиц (рис. 2):

Ут = У1 + У2 — У4 — У5 + Уб + У7 — У8 — У9 + У10 + Уц^3).

4. Заключение. Проблема формообразования и законов, по которым оно развивается, получила в последнее время широкое распространение в литературе. Основопо-

Рис. 2. График трихотомического ряда (тонкая линия) и сдвинутый вверх график его конечно-линейного преобразования над полем ¥3, идентифицирующего (101 012 011).

ложником законов формы считают Спенсера-Брауна [9]. В примарной арифметике [10], возникшей на основе этих законов, объектом исследования является метка, над которой возможны две операции: повторение (call) и отмена (отрицание) или двойная метка (crossing), которые осуществляются в соответствии с правилами: 1) двойная метка есть пустая метка и 2) повторение есть сама метка. Форма, инвариантная относительно отрицания, называется самосоотнесением (self-reference), или реинтрантной формой. К примарной арифметике можно относиться как к попытке формализованного описания процессов, развивающихся на основе принципов подражания или отрицания [11].

При пенетрантной форме скрытой периодичности, сохраняющей целыми одинаковые фрагменты, мы имеем результат действия операции, аналогичной повторению (call), а при не сохраняющей их копенетрантной форме — результат действия операции, аналогичной отмене (crossing). Вопрос о комбинации этих форм и методов их анализа остается открытым. До настоящего времени в практических задачах обе формы появлялись по отдельности. Метод порядковой асимметрии был разработан для задачи декомпозиции случайной смеси маркетинговых потоков, симптомный анализ — для задачи исследования поведенческих актов у животных. Наиболее перспективным представляется использование этих методов в построении аналитических лингвистических процедур.

Summary

N. P. Alexeyeva. The combinatorial analysis of two basic forms of hidden periodicity in categorial sequences.

Two kinds of mixing periodical components according to the Spencer—Brown laws of form are considered. If the identical fragments of a periodic component are kept then we have a penetrant (call) form, if the identical fragments break up then we have a co-penetrant (crossing) form. The symptom analysis of hidden periodicity is used for the penetrant form, and the order asymmetry

method is used for the co-penetrant form. In the symptom analysis the main components method and SSA are modified for finite geometries. The order asymmetry method is the cluster analysis where the metrics between two gradations characterizes a deviation from periodicity in a subsequence over these gradations.

Литература

1. Голяндина Н. Э. Метод «ГУСЕНИЦА» — SSA: анализ временных рядов. СПб., 2004. 78 с.

2. Гасфилд Д. Строки, деревья и последовательности в алгоритмах. Информатика и вычислительная биология. СПб., 2003. 654 с.

3. Алексеева Н. П., Алексеев А. О. О роли конечных геометрий в корреляционном анализе бинарных признаков // Математические модели. Теория и приложения. Вып. 4 / Под ред. М. К. Чиркова. СПб., 2004. С. 102-117.

4. Алексеева Н. П., Алексеев А. О. Порядковая асимметрия и задача декомпозиции категориальных последовательностей // Математические модели. Теория и приложения. Вып. 6 / Под ред. М. К. Чиркова. СПб., 2005. С. 178-185.

5. Статистические методы для ЭВМ / Под ред. К. Энслейна, Э. Рэлстона, Г. С. Уилфа. М.: Наука, 1986. 460 с.

6. Клочкова (Алексеева) Н.П. Интегрирование дизайнов // Вестн. С.-Петерб. ун-та, 1996. Сер. 1. Вып. 1. С. 39-43.

7. Лидл Р., Нидеррайтер Г. Конечные поля. М.: Мир, 1988. Т. 1, 2. 818 с. 1980. 376 с.

8. Холл М. Комбинаторика. М.: Мир, 1970. 424 с.

9. Spencer-Brown G. Laws of Form. New York: Julian Press, 1972. 55 p.

10. Kauffman L. H. Imaginary Valus in Mathematical Logic // IEEE Computer Society Press, 1987. P. 282-289.

11. Барт А. Г. Анализ медико-биологических систем. Метод частично обратных функций. СПб.: Изд-во С.-Петерб. ун-та, 2003. 280 с.

Статья поступила в редакцию 15 марта 2007 г.

i Надоели баннеры? Вы всегда можете отключить рекламу.