О минимальных параллельных префиксных схемах

Сергеев Игорь Сергеевич

СПИСОК ЛИТЕРАТУРЫ

1. Иванов Д.Н. Размерность адамаровой алгебры делится на 4 // Успехи матем. наук. 2005. 60, № 2. 163-164.

2. Иванов Д.Н. Ортогональные разложения ассоциативных алгебр и сбалансированные системы идемпотентов // Матем. сб. 1998. 189, № 12. 83-102.

Поступила в редакцию 10.09.2010

УДК 519.714

О МИНИМАЛЬНЫХ ПАРАЛЛЕЛЬНЫХ ПРЕФИКСНЫХ СХЕМАХ

И. С. Сергеев1

Найдено точное значение сложности минимальной префиксной схемы m переменных глубины |4og2 m\ в случае, когда m является степенью двойки. Получены новые верхние оценки сложности префиксных схем при различных ограничениях на глубину и отдельно для случая схем с операцией сложения по модулю 2.

Ключевые слова: префискные схемы, сложность, глубина.

The exact complexity of a minimal prefix circuit of width m and depth [log2 m\ is obtained in the case when m is a power of two. New upper bounds for the complexity of prefix circuits are obtained under various depth restrictions and separately for the circuits of XOR-gates.

Key words: prefix circuits, complexity, depth.

Введение. Пусть о — бинарная ассоциативная операция на некотором множестве. Множество функций

x1 о ... о хк, k = l,...,m, (1)

называется системой префиксов (или префиксных сумм) упорядоченного набора переменных xi,...,xm. Схемы из функциональных элементов над базисом {о}, реализующие систему (1), называют префиксными схемами. Число m (входов схемы) будем называть порядком схемы. В ряде вычислительных и схемотехнических задач (некоторые из них приведены в [1]) возникает необходимость в построении параллельных префиксных схем, т.е. имеющих глубину по порядку log2 m. В настоящей работе рассматривается вопрос минимизации сложности префиксных схем при заданном ограничении на глубину. С понятиями схемы из функциональных элементов, сложности и глубины можно ознакомиться, например, в [2].

Обозначим через L(m) сложность минимальной префиксной схемы порядка m и глубины [log 2 m\ (это наименьшее возможное значение глубины).

В работе [3] доказано, что L(m) ^ (4 — o(1))m. В случае m = 2n указана более точная оценка: L(2n) ^ 4 • 2n — Фп+5 + 1, где Фк — k-е число Фибоначчи. В работе [4] доказана нетривиальная нижняя оценка и уточнена верхняя:

(3| - о(1)) 2™ < L(2n) < (3f§ - о(1)) 2™

Нижняя оценка относится к универсальной префиксной схеме, т.е. не зависящей от вида операции о.

В работах [3, 4] также строилось семейство префиксных схем не минимальной глубины, но таких, в которых максимальный префикс (сумма всех входов) реализуется на наименьшей возможной глубине. Обозначим через Пт,к множество префиксных схем глубины [log2 m\ + k, реализующих максимальный префикс с глубиной [log2 m\, и через L'(m, k) — сложность минимальной схемы из Пт,к. Содержательным является случай k < [log2 m \ — 2, поскольку при больших значениях k известно [4], что L'(m, k) = 2m — [log2 m\ — 2. В работе [3] доказаны оценки

L'(m, k) < (2 + 21-к)m — 2, L'(2n, k) < (2 + 21-к)2n — Фп+5-к — k + 1,

1 Сергеев Игорь Сергеевич — канд. физ.-мат. наук, ст. науч. сотр. каф. дискретной математики мех.-мат. ф-та МГУ, e-mail: isserg@gmail.com.

а в работе [4] — оценки

(2 + \21~к - о(1)) 2п < L'(2п, к) < (2 + §±2"fc - о(1)) 2п - к.

На самом деле справедлива

Теорема 1. Имеют место следующие соотношения:

а) L(2n) = 3, 5 • 2n — (8, 5 + 3, 5(n mod 2))2Ln/2J + n + 5;

б) при 1 ^ к ^ n — 2

L'(2n, k) = (2 + 2-k)2n — (5 + 2((n — к) mod 2))2L(n-k)/2j — к + 2;

в) L(m) ^ (3, 5 — o(l))m;

г) L'(m, к) ^ (2 + 2-k — o(1))m при l ^ к ^ \log2 m] — 2 и m

Оценки пп. а и б доказываются одним способом. Верхние оценки пп. в и г следуют из конструкции схем, доставляющих верхние оценки пп. а и б. Поэтому, по существу, доказательство теоремы состоит в доказательстве нижней и верхней оценок для первых двух пунктов.

Нижняя оценка. Доказательство нижней оценки опирается на классификацию элементов префиксной схемы, предложенную в [4]. Подсхема префиксной схемы, вычисляющая максимальный префикс, называется каркасной, а ее элементы, не совпадающие с выходами схемы, — каркасными. Те элементы префиксной схемы, которые не являются ни выходами, ни каркасными, называются избыточными.

Суммарное число выходов и каркасных элементов в схеме из П2п,к не меньше, чем 2n+1 — n — 2 (см., например, [4]). Далее оценивается число избыточных элементов.

Несложно проверить, что если схема является минимальной по сложности, то на выходе любого ее элемента e реализуется функция вида xi о Х1+1 о . ..о xr. В этом случае элементу e ставится в соответствие метка [l, r], при этом число l называется левым концом, а число r — правым концом метки.

Также можно проверить (см. [4]), что минимальная схема из множества П2п,к является подсхемой минимальной схемы из П2п+к 0, зависящей от первых 2n входов последней. Ключевой в доказательстве нижней оценки является следующая лемма, доказательство которой не приводится ввиду его громоздкости.

Лемма. Пусть p,N,R £ N, N < 2p, R < 2n-2p-1 и R не является степенью двойки. Тогда в минимальной префиксной схеме из множества П2П, о содержится не менее N избыточных элементов с правыми концами меток из интервала [N2n-p-1 + R2p, N2n-p-1 + (R + 1)2p — 1].

Лемма характеризует число избыточных элементов в локальных сегментах схемы. При помощи этой леммы нижняя оценка теоремы 1 устанавливается подсчетом избыточных элементов из различных сегментов. Отметим, что при выводе нижней оценки в [4] фактически использовался частный случай указанной леммы, в котором N = 1.

Верхняя оценка. Для доказательства верхней оценки строится схема S2,n, минимальная в множестве П2П1. Минимальные схемы в множествах П2П, к при к = 1 получаются из этой схемы методом работы [3].

Для i = 1,..., \n/2] положим li = 2n — 2n+1-i и l\n/2'\+1 = 2n. Также для i = 1,..., \n/2] — 1 положим mi = n — 2i и m\n/2\ =1 — (n mod 2).

Схема S2,n (рис. 1) состоит из \n/2] подсхем, обозначенных Pi,n. В подсхеме Pi,n расположены выходы схемы S^n с правыми концами меток в интервале от li + 1 до li+i. Кроме того, эта подсхема вычисляет функцию fy = xii+i о ... о xii+1, которая подается на входы подсхем Pj,n, где j > i, и функцию Yi = xi о ... о xii+1, которая (если i < n/2) подается на вход подсхемы Pi+i,n.

При построении схем Pi, n (рис. 2) в качестве подсхем используются схемы Q2k — минимальные префиксные схемы из Щк к_2. Схема Q2k не содержит избыточных элементов, поэтому ее сложность равна 2к+1 — к — 2. Такую схему можно построить методом работы [3].

В подсхеме Pi,n входы переменных разбиваются на группы: в первых двух группах — по 2i-1 входов, в остальных — по 2i. Для каждой из групп реализуется система префиксов при помощи схем Q2i-i и Q2i. Функции, реализуемые на выходах этих схем, обозначаются через а^,к, где

а . =. xii+2i-i+1 о ...оxli+k, j = 1 и к> 2i 1; j к — i

' xii+(j-1)2i+1 о ... о xli+(j-1)2i+k иначе.

Любая из функций аг 4 к вычисляется на глубине не выше 2г — 2 ^ п.

Рис. 1

Рис. 2

Выходы элементов, реализующих функции аг, 1 , уг-г ◦ аг, 1 , уг и аг^,у-, где з > 1 (все элементы расположены на глубине г), подаются на входы подсхемы б^т. Соответствующий максимальному префиксу выход этой подсхемы реализует функцию вг. Таким образом, при любом г < \п/2\ функция вг вычисляется на глубине, не превосходящей г + тг = п — г, а функция в\п/2\ вычисляется на глубине \п/2\ + тЫ21 = п — (\п/2\ —1).

Выходы элемента, реализующего функцию аг,о = а^^г-!, и выходы аг,1,...,аг,2т1 подсхемы б^т подаются на входы подсхемы Шг, которая вычисляет функции аг,к о в1 ◦ ... ◦ в— 1, в том числе ^г (при к = 2тг), на глубине не выше п. Ясно, что на выходах подсхемы Шг реализуются функции Х1 о ... о хк, где к е[1г + 2г-1} и {1г + з2г | з = 1,..., 2тг}.

Из сказанного следует, что построенная схема действительно принадлежит множеству П2"д. Легко проверить, что сложность схемы Рг,п равна С (тг)+2тг (3-2г —4) —1, где через С (к) обозначена сложность схемы . После этого индукцией несложно доказать, что значение С(п) совпадает с заявленным в п. б теоремы 1.

Случай операции ф. Оценки теоремы 1 могут быть улучшены для некоторых конкретных бинарных операций, например для операции ф сложения по модулю 2. Введем обозначения Ь®(т) и Ь'®(т,к) для сложности реализации системы (1) с операцией ф по аналогии с обозначениями Ь(т) и Ь'(т, к). Приведем без доказательства следующий результат.

Теорема 2. Имеют место следующие соотношения:

а) L®(2п) ^ Зуу-2га— тп, где тп = °"n+3+°"n+2+^n+1 °"n п 7; а Gn определяется из рекуррентной формулы

гч к Q А ТО

(Тп = 2ап-з + <тга_4 + 1 с начальными условиями <то = уу, <7i = уу, (72 = уу, ^з = уу>

б) L®(m) ^ (3^ -о(1)) ш;

в) если k ^ [(log2 m)/2] — 17 то L'®(m, k) = 2m — [log2 m] — 2;

г) L'®(m, к) ^ (2 + • 41_fc - o(l)) m при 1 ^ к ^ f(log2 m)/2] - 1 um^oo.

Уточним, что rra ~ с%п, где с' = 7, 235..., а % = 1, 395... — максимальный по абсолютной величине корень многочлена x4 — 2x — 1. Способ построения схем, удовлетворяющих оценкам теоремы 2, в целом аналогичен вышеуказанному способу построения универсальных префиксных схем.

Автор приносит благодарность научному руководителю С. Б. Гашкову за внимание к работе. Работа выполнена при финансовой поддержке РФФИ, гранты № 08-01-00863 и 08-01-00632, и программы фундаментальных исследований Отделения математических наук РАН "Алгебраические и комбинаторные методы математической кибернетики и информационные системы нового поколения" (проект "Задачи оптимального синтеза управляющих систем").

СПИСОК ЛИТЕРАТУРЫ

1. Blelloch G.E. Prefix sums and their applications // Synthesis of parallel algorithms. San Francisco: Morgan Kaufmann, 1993. 35-60.

2. Лупанов О.Б. Асимптотические оценки сложности управляющих систем. М.: Изд-во МГУ, 1984.

3. Ladner R.E., Fischer M.J. Parallel prefix computation //J. Association for Computing Machinery. 1980. 27, N 4. 831-838.

4. Fich F.E. New bounds for parallel prefix circuits // Proc. ACM Symp. Theory of Comput. (Boston, USA, 1983). N.Y.: ACM Press, 1983. 100-109.

Поступила в редакцию 19.09.2010

УДК 517.521.7

О ВЗАИМОСВЯЗИ МЕТОДОВ ЧЕЗАРО И МЕТОДОВ ДИСКРЕТНЫХ СРЕДНИХ РИССА

И. В. Хахинов1

В статье рассматриваются вопросы взаимосвязи методов суммирования Чезаро и методов дискретных средних Рисса различных порядков.

Ключевые слова: методы Чезаро, дискретные средние Рисса, теоремы включения, метод суммирования Абеля.

Inclusion problems of Cesaro methods and discrete Riesz means are discussed.

Key words: Cesaro methods, discrete Riesz means, inclusion theorems, Abel summation method.

1. Введение. Везде далее, если не оговорено противное, {an}+=0 — последовательность действительных чисел; ^ an — соответствующий ей ряд (когда пределы суммирования не указаны, мы считаем, что оно производится от 0 до

Пусть Q и Л — методы суммирования числовых рядов. Суммируемость ряда ^ an к числу S методом Q обозначается кратко: ^ an = S(Q).

Будем говорить, что метод Л включается методом Q (Л С Q), если из того, что ^ an = S (Л), следует, что £ an = S(Q). Будем говорить, что методы Q и Л эквивалентны, если имеют место оба включения Л С Q и Q С Л. Будем говорить, что метод Q сильнее метода Л, если Л С Q, но методы Q и Л не эквивалентны.

1 Хахинов Илья Вячеславович — асп. каф. математического анализа мех.-мат. ф-та МГУ, e-mail: ivkhakhinov@mail.ru.

О минимальных параллельных префиксных схемах Текст научной статьи по специальности «Математика»

Аннотация научной статьи по математике, автор научной работы — Сергеев Игорь Сергеевич

Похожие темы научных работ по математике , автор научной работы — Сергеев Игорь Сергеевич

Текст научной работы на тему «О минимальных параллельных префиксных схемах»