СПИСОК ЛИТЕРАТУРЫ
1. Иванов Д.Н. Размерность адамаровой алгебры делится на 4 // Успехи матем. наук. 2005. 60, № 2. 163-164.
2. Иванов Д.Н. Ортогональные разложения ассоциативных алгебр и сбалансированные системы идемпотентов // Матем. сб. 1998. 189, № 12. 83-102.
Поступила в редакцию 10.09.2010
УДК 519.714
О МИНИМАЛЬНЫХ ПАРАЛЛЕЛЬНЫХ ПРЕФИКСНЫХ СХЕМАХ
И. С. Сергеев1
Найдено точное значение сложности минимальной префиксной схемы m переменных глубины |4og2 m\ в случае, когда m является степенью двойки. Получены новые верхние оценки сложности префиксных схем при различных ограничениях на глубину и отдельно для случая схем с операцией сложения по модулю 2.
Ключевые слова: префискные схемы, сложность, глубина.
The exact complexity of a minimal prefix circuit of width m and depth [log2 m\ is obtained in the case when m is a power of two. New upper bounds for the complexity of prefix circuits are obtained under various depth restrictions and separately for the circuits of XOR-gates.
Key words: prefix circuits, complexity, depth.
Введение. Пусть о — бинарная ассоциативная операция на некотором множестве. Множество функций
x1 о ... о хк, k = l,...,m, (1)
называется системой префиксов (или префиксных сумм) упорядоченного набора переменных xi,...,xm. Схемы из функциональных элементов над базисом {о}, реализующие систему (1), называют префиксными схемами. Число m (входов схемы) будем называть порядком схемы. В ряде вычислительных и схемотехнических задач (некоторые из них приведены в [1]) возникает необходимость в построении параллельных префиксных схем, т.е. имеющих глубину по порядку log2 m. В настоящей работе рассматривается вопрос минимизации сложности префиксных схем при заданном ограничении на глубину. С понятиями схемы из функциональных элементов, сложности и глубины можно ознакомиться, например, в [2].
Обозначим через L(m) сложность минимальной префиксной схемы порядка m и глубины [log 2 m\ (это наименьшее возможное значение глубины).
В работе [3] доказано, что L(m) ^ (4 — o(1))m. В случае m = 2n указана более точная оценка: L(2n) ^ 4 • 2n — Фп+5 + 1, где Фк — k-е число Фибоначчи. В работе [4] доказана нетривиальная нижняя оценка и уточнена верхняя:
(3| - о(1)) 2™ < L(2n) < (3f§ - о(1)) 2™
Нижняя оценка относится к универсальной префиксной схеме, т.е. не зависящей от вида операции о.
В работах [3, 4] также строилось семейство префиксных схем не минимальной глубины, но таких, в которых максимальный префикс (сумма всех входов) реализуется на наименьшей возможной глубине. Обозначим через Пт,к множество префиксных схем глубины [log2 m\ + k, реализующих максимальный префикс с глубиной [log2 m\, и через L'(m, k) — сложность минимальной схемы из Пт,к. Содержательным является случай k < [log2 m \ — 2, поскольку при больших значениях k известно [4], что L'(m, k) = 2m — [log2 m\ — 2. В работе [3] доказаны оценки
L'(m, k) < (2 + 21-к)m — 2, L'(2n, k) < (2 + 21-к)2n — Фп+5-к — k + 1,
1 Сергеев Игорь Сергеевич — канд. физ.-мат. наук, ст. науч. сотр. каф. дискретной математики мех.-мат. ф-та МГУ, e-mail: [email protected].
а в работе [4] — оценки
(2 + \21~к - о(1)) 2п < L'(2п, к) < (2 + §±2"fc - о(1)) 2п - к.
На самом деле справедлива
Теорема 1. Имеют место следующие соотношения:
а) L(2n) = 3, 5 • 2n — (8, 5 + 3, 5(n mod 2))2Ln/2J + n + 5;
б) при 1 ^ к ^ n — 2
L'(2n, k) = (2 + 2-k)2n — (5 + 2((n — к) mod 2))2L(n-k)/2j — к + 2;
в) L(m) ^ (3, 5 — o(l))m;
г) L'(m, к) ^ (2 + 2-k — o(1))m при l ^ к ^ \log2 m] — 2 и m
Оценки пп. а и б доказываются одним способом. Верхние оценки пп. в и г следуют из конструкции схем, доставляющих верхние оценки пп. а и б. Поэтому, по существу, доказательство теоремы состоит в доказательстве нижней и верхней оценок для первых двух пунктов.
Нижняя оценка. Доказательство нижней оценки опирается на классификацию элементов префиксной схемы, предложенную в [4]. Подсхема префиксной схемы, вычисляющая максимальный префикс, называется каркасной, а ее элементы, не совпадающие с выходами схемы, — каркасными. Те элементы префиксной схемы, которые не являются ни выходами, ни каркасными, называются избыточными.
Суммарное число выходов и каркасных элементов в схеме из П2п,к не меньше, чем 2n+1 — n — 2 (см., например, [4]). Далее оценивается число избыточных элементов.
Несложно проверить, что если схема является минимальной по сложности, то на выходе любого ее элемента e реализуется функция вида xi о Х1+1 о . ..о xr. В этом случае элементу e ставится в соответствие метка [l, r], при этом число l называется левым концом, а число r — правым концом метки.
Также можно проверить (см. [4]), что минимальная схема из множества П2п,к является подсхемой минимальной схемы из П2п+к 0, зависящей от первых 2n входов последней. Ключевой в доказательстве нижней оценки является следующая лемма, доказательство которой не приводится ввиду его громоздкости.
Лемма. Пусть p,N,R £ N, N < 2p, R < 2n-2p-1 и R не является степенью двойки. Тогда в минимальной префиксной схеме из множества П2П, о содержится не менее N избыточных элементов с правыми концами меток из интервала [N2n-p-1 + R2p, N2n-p-1 + (R + 1)2p — 1].
Лемма характеризует число избыточных элементов в локальных сегментах схемы. При помощи этой леммы нижняя оценка теоремы 1 устанавливается подсчетом избыточных элементов из различных сегментов. Отметим, что при выводе нижней оценки в [4] фактически использовался частный случай указанной леммы, в котором N = 1.
Верхняя оценка. Для доказательства верхней оценки строится схема S2,n, минимальная в множестве П2П1. Минимальные схемы в множествах П2П, к при к = 1 получаются из этой схемы методом работы [3].
Для i = 1,..., \n/2] положим li = 2n — 2n+1-i и l\n/2'\+1 = 2n. Также для i = 1,..., \n/2] — 1 положим mi = n — 2i и m\n/2\ =1 — (n mod 2).
Схема S2,n (рис. 1) состоит из \n/2] подсхем, обозначенных Pi,n. В подсхеме Pi,n расположены выходы схемы S^n с правыми концами меток в интервале от li + 1 до li+i. Кроме того, эта подсхема вычисляет функцию fy = xii+i о ... о xii+1, которая подается на входы подсхем Pj,n, где j > i, и функцию Yi = xi о ... о xii+1, которая (если i < n/2) подается на вход подсхемы Pi+i,n.
При построении схем Pi, n (рис. 2) в качестве подсхем используются схемы Q2k — минимальные префиксные схемы из Щк к_2. Схема Q2k не содержит избыточных элементов, поэтому ее сложность равна 2к+1 — к — 2. Такую схему можно построить методом работы [3].
В подсхеме Pi,n входы переменных разбиваются на группы: в первых двух группах — по 2i-1 входов, в остальных — по 2i. Для каждой из групп реализуется система префиксов при помощи схем Q2i-i и Q2i. Функции, реализуемые на выходах этих схем, обозначаются через а^,к, где
а . =. xii+2i-i+1 о ...оxli+k, j = 1 и к> 2i 1; j к — i
' xii+(j-1)2i+1 о ... о xli+(j-1)2i+k иначе.
Любая из функций аг 4 к вычисляется на глубине не выше 2г — 2 ^ п.
Рис. 1
Рис. 2
Выходы элементов, реализующих функции аг, 1 , уг-г ◦ аг, 1 , уг и аг^,у-, где з > 1 (все элементы расположены на глубине г), подаются на входы подсхемы б^т. Соответствующий максимальному префиксу выход этой подсхемы реализует функцию вг. Таким образом, при любом г < \п/2\ функция вг вычисляется на глубине, не превосходящей г + тг = п — г, а функция в\п/2\ вычисляется на глубине \п/2\ + тЫ21 = п — (\п/2\ —1).
Выходы элемента, реализующего функцию аг,о = а^^г-!, и выходы аг,1,...,аг,2т1 подсхемы б^т подаются на входы подсхемы Шг, которая вычисляет функции аг,к о в1 ◦ ... ◦ в— 1, в том числе ^г (при к = 2тг), на глубине не выше п. Ясно, что на выходах подсхемы Шг реализуются функции Х1 о ... о хк, где к е[1г + 2г-1} и {1г + з2г | з = 1,..., 2тг}.
Из сказанного следует, что построенная схема действительно принадлежит множеству П2"д. Легко проверить, что сложность схемы Рг,п равна С (тг)+2тг (3-2г —4) —1, где через С (к) обозначена сложность схемы . После этого индукцией несложно доказать, что значение С(п) совпадает с заявленным в п. б теоремы 1.
Случай операции ф. Оценки теоремы 1 могут быть улучшены для некоторых конкретных бинарных операций, например для операции ф сложения по модулю 2. Введем обозначения Ь®(т) и Ь'®(т,к) для сложности реализации системы (1) с операцией ф по аналогии с обозначениями Ь(т) и Ь'(т, к). Приведем без доказательства следующий результат.
Теорема 2. Имеют место следующие соотношения:
а) L®(2п) ^ Зуу-2га— тп, где тп = °"n+3+°"n+2+^n+1 °"n п 7; а Gn определяется из рекуррентной формулы
гч к Q А ТО
(Тп = 2ап-з + <тга_4 + 1 с начальными условиями <то = уу, <7i = уу, (72 = уу, ^з = уу>
б) L®(m) ^ (3^ -о(1)) ш;
в) если k ^ [(log2 m)/2] — 17 то L'®(m, k) = 2m — [log2 m] — 2;
г) L'®(m, к) ^ (2 + • 41_fc - o(l)) m при 1 ^ к ^ f(log2 m)/2] - 1 um^oo.
Уточним, что rra ~ с%п, где с' = 7, 235..., а % = 1, 395... — максимальный по абсолютной величине корень многочлена x4 — 2x — 1. Способ построения схем, удовлетворяющих оценкам теоремы 2, в целом аналогичен вышеуказанному способу построения универсальных префиксных схем.
Автор приносит благодарность научному руководителю С. Б. Гашкову за внимание к работе. Работа выполнена при финансовой поддержке РФФИ, гранты № 08-01-00863 и 08-01-00632, и программы фундаментальных исследований Отделения математических наук РАН "Алгебраические и комбинаторные методы математической кибернетики и информационные системы нового поколения" (проект "Задачи оптимального синтеза управляющих систем").
СПИСОК ЛИТЕРАТУРЫ
1. Blelloch G.E. Prefix sums and their applications // Synthesis of parallel algorithms. San Francisco: Morgan Kaufmann, 1993. 35-60.
2. Лупанов О.Б. Асимптотические оценки сложности управляющих систем. М.: Изд-во МГУ, 1984.
3. Ladner R.E., Fischer M.J. Parallel prefix computation //J. Association for Computing Machinery. 1980. 27, N 4. 831-838.
4. Fich F.E. New bounds for parallel prefix circuits // Proc. ACM Symp. Theory of Comput. (Boston, USA, 1983). N.Y.: ACM Press, 1983. 100-109.
Поступила в редакцию 19.09.2010
УДК 517.521.7
О ВЗАИМОСВЯЗИ МЕТОДОВ ЧЕЗАРО И МЕТОДОВ ДИСКРЕТНЫХ СРЕДНИХ РИССА
И. В. Хахинов1
В статье рассматриваются вопросы взаимосвязи методов суммирования Чезаро и методов дискретных средних Рисса различных порядков.
Ключевые слова: методы Чезаро, дискретные средние Рисса, теоремы включения, метод суммирования Абеля.
Inclusion problems of Cesaro methods and discrete Riesz means are discussed.
Key words: Cesaro methods, discrete Riesz means, inclusion theorems, Abel summation method.
1. Введение. Везде далее, если не оговорено противное, {an}+=0 — последовательность действительных чисел; ^ an — соответствующий ей ряд (когда пределы суммирования не указаны, мы считаем, что оно производится от 0 до
Пусть Q и Л — методы суммирования числовых рядов. Суммируемость ряда ^ an к числу S методом Q обозначается кратко: ^ an = S(Q).
Будем говорить, что метод Л включается методом Q (Л С Q), если из того, что ^ an = S (Л), следует, что £ an = S(Q). Будем говорить, что методы Q и Л эквивалентны, если имеют место оба включения Л С Q и Q С Л. Будем говорить, что метод Q сильнее метода Л, если Л С Q, но методы Q и Л не эквивалентны.
1 Хахинов Илья Вячеславович — асп. каф. математического анализа мех.-мат. ф-та МГУ, e-mail: [email protected].