Научная статья на тему 'Безопасная синхронизация потоков без динамического выделения памяти'

Безопасная синхронизация потоков без динамического выделения памяти Текст научной статьи по специальности «Математика»

CC BY
355
24
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
МНОГОПОТОЧНОСТЬ / ПРИМИТИВЫ СИНХРОНИЗАЦИИ / FUTURE И PROMISE / ДИНАМИЧЕСКОЕ ВЫДЕЛЕНИЕ ПАМЯТИ / ПРОИЗВОДИТЕЛЬНОСТЬ / MULTITHREADING / SYNCHRONIZATION PRIMITIVES / FUTURE AND PROMISE / DYNAMIC MEMORY ALLOCATION / PERFORMANCE

Аннотация научной статьи по математике, автор научной работы — Вишневская Татьяна Ивановна, Килочек Юрий Игоревич

В работе представлен новый метод синхронизации потоков по схеме future и promise, не требующий динамического выделения памяти. Дано описание экспериментального сравнения производительности программной реализации предложенного метода с существующими. Продемонстрирована целесообразность использования нового метода.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Robust thread synchronization without dynamic memory allocation

This paper introduces a novel design for future and promise style thread synchronization, which doesn't require dynamic memory allocation. We benchmarked our implementation alongside existing mature implementations that follow traditional approach. Compared to those, ours demonstrates significant performance improvements.

Текст научной работы на тему «Безопасная синхронизация потоков без динамического выделения памяти»

Заключение

Автор считает новым описание множества периодов периодической функции с учётом вырожденного случая периодичности - постоянства функции. Ранее в работах по этой тематике [7] рассматривались периодические функции, имеющие множеством периодов n -мерные решётки, где n - размерность вектора независимых переменных. Также новым, по мнению авторов, являются результаты исследования соотношения между периодичностью функции нескольких переменных в смысле определения 1 и её периодичности по отдельным переменным. Представленная работа является расширением и продолжением исследований, проведенных в [10, 11]. В настоящее время изучается проблема периодичности суммы и произведения периодических функций нескольких переменных. Для периодических функций одной переменной разные аспекты этой проблемы изучены в работах [5, 6].

Литература

1. Ашкрофт Н., Мермин Н. Физика твёрдого тела. - М.: Мир, 1979. Т. 1. 400 с.

2. Ахиезер Н.И. Элементы теории эллиптических функций. - М.: Наука, 1970. - 304 с.

3. Будак Б.М. Фомин С.В. Курс высшей математики и математической физики. Кратные интегралы и ряды. - М.: Наука, 1965. 608 с.

4. Negishi T. On periodic decomposition of entire functions of several variables // Aequationes Math. 2014. Vol. SS. № 1-2. P. 1-34.

5. Mirotin A.R., Mirotin E.A. On Sums and Products of Periodic Functions // Real Anal. Exchange. 2008. Vol. 34. № 2. P. 347-358.

6. Эвнин А.Ю. Период суммы двух периодических функций // Вестн. Южно-Ур. гос. унта. Сер. Математика. Физика. Химия. 2005. № 2. С. 56-61.

7. Скриганов М.М. Геометрические и арифметические методы в спектральной теории многомерных периодических операторов // Труды МИАН СССР. 1985. Т. 171. С. 3-122.

8. Седлецкий А.М. Разложение аналитической функции на сумму периодических // Изв. АН СССР. Сер. матем. 1984. Т. 48. № 4. C. S33-853.

9. Fine N.J., Wilf H.S. Uniqueness Theorems for Periodic Functions // Proc. Amer. Math. Soc. -1965. Vol. 16. № 1. P. 109-114.

10.Соколова Г.К., Орлов С.С. Об основном периоде периодической функции нескольких переменных // Материалы междунар. конф. «Воронежская зимняя математическая школа С. Г. Крейна - 2018». - Воронеж: ИПЦ «Научная книга», 2018. С. 312-315.

11.Соколова Г.К., Орлов С.С. Об основных периодах периодической функции нескольких переменных // Материалы 19-й междунар. Саратовской зимн. шк. «Современные проблемы теории функций и их приложения». - Саратов: Научная книга, 2018. С. 294-297.

Сведения об авторе

Галина Константиновна Соколова

студент

Иркутский государственный университет Эл. почта: [email protected] Россия, Иркутск

About the author

Galina Konstantinovna Sokolova

student

Irkutsk State University E-mail: [email protected] Russia, Irkutsk

УДК 004.451.23 Т.И. Вишневская, Ю.И. Килочек

МГТУ им. Н.Э. Баумана

БЕЗОПАСНАЯ СИНХРОНИЗАЦИЯ ПОТОКОВ БЕЗ ДИНАМИЧЕСКОГО ВЫДЕЛЕНИЯ ПАМЯТИ

В работе представлен новый метод синхронизации потоков по схеме future и promise, не требующий динамического выделения памяти. Дано описание экспериментального сравнения производительности программной реализации предложенного метода с существующими. Продемонстрирована целесообразность использования нового метода.

Ключевые слова: многопоточность, примитивы синхронизации, future и promise, динамическое выделение памяти, производительность.

T.I. Vishnevskaya, Yu.I. Kilochek

Bauman Moscow State Technical University

ROBUST THREAD SYNCHRONIZATION WITHOUT DYNAMIC MEMORY ALLOCATION

This paper introduces a novel design for future and promise style thread synchronization, which doesn't require dynamic memory allocation. We benchmarked our implementation alongside existing mature implementations that follow traditional approach. Compared to those, ours demonstrates significant performance improvements.

Keywords: multithreading, synchronization primitives, future and promise, dynamic memory allocation, performance

Введение

Экспоненциальный рост количества транзисторов в процессорах, явление, известное как «Закон Мура» [1], завершается в связи с приближением к фундаментальным физическим ограничениям [2,3]. Если не произойдет революционной смены технологической базы, основным направлением повышения производительности процессоров будет использование параллелизма на всех уровнях.

Однако, любая декомпозиция вычислительной задачи на параллельные подзадачи сопряжена с необходимостью синхронизации этих подзадач. Существует множество различных подходов к решению этой проблемы, с различными достоинствами и недостатками. В данной работе рассматривается синхронизация задач по схеме future и promise ввиду её универсальности, гибкости и сложности некорректного использования.

Термин promise введен Дэниэлом Полом Фридманом (Daniel Paul Friedman) и Дэвидом Вайзом (David Wise) в 1976 году [4]. Схожая сущность под названием future была описана Генри Бейкером (Henry Baker) и Карлом Хьюиттом (Carl Hewitt) в 1977 году [5]. Концепция изначально зародилась в функциональном программировании, и её назначение заключается в отделении некоторого значения от того, как это значение было вычислено. В частности, вычисление этого значения может быть прозрачно распараллелено.

В современном понимании, future и promise являются частями единой концепции. С одной стороны, этот механизм можно рассматривать как обобщение вызова функции. Выполнение вызывающего кода может продолжаться без необходимости ожидания завершения выполнения вызванной функции (т.е. асинхронно). При этом future является контейнером результата функции, который, возможно ещё не был вычислен. Promise — это аналог оператора return, который завершает выполнение функции и устанавливает значение результата. С другой стороны future и promise можно рассматривать как, соответственно, выходной и входной концы блокирующей очереди. Но эту очередь можно использовать только для передачи одного единственного значения-результата.

Гибкость, универсальность и простота использования способствовали тому, что future и promise нашли широкое применение в различных областях, от веб-приложений [6] до критических систем управления и жизнеобеспечения [7]. Однако эти достоинства даются ценой относительно низкой производительности. Анализ существующих реализаций future и promise в различных языках программирования показал, что все они устроены схожим образом. В частности, все они используют динамическое выделение памяти для хранения внутреннего состояния. В данной работе, предлагается метод реализации, лишенный этого недостатка за счет более сложного алгоритма внутренней синхронизации.

Анализ существующих реализаций для синхронизации потоков

В ходе данной работы были проанализированы пять реализаций future и promise в трёх популярных языках программирования:

1. java.util.concurrent.Future и java.util.concurrent.CompletableFuture (Java 8, OpenJDK 10) 1 используют атомарную операцию типа compare-and-swap (CAS) для атомарной установки поля результата. Дополнительно организована блокировка потоков, которые пытаются получить еще не готовый результат, во избежание продолжительного активного ожидания. Так как

1 https://github.com/dmlloyd/openjdk/blob/jdk/jdk10/src/java.base/share/classes/ java/util/concurrent/Com-pletableFuture.java

java.util.concurrent.Future является лишь интерфейсом, вся логика целиком реализована в классе j ava.util. concurrent.CompletableFuture.

2. System.Threading.Tasks.Task и System. Threading.Tasks.TaskCompletionSource (C# 7, .NET 4.7) 2 также используют атомарную CAS-операцию, но применительно к битовой маске состояния задачи в цикле до успешного его завершения. Этот подход можно рассматривать как специализированный вариант циклической блокировки (spinlock). После этого устанавливается поле результата и пробуждаются заблокированные потоки. С ожидающей стороны потоки блокируются только если это необходимо для исключения продолжительного активного ожидания. Стоит отметить что вся логика реализована внутри Task, а TaskCompletionSource является лишь тонкой оберткой ссылки на Task.

3. boostfture и boost::promise (C++, Boost 1.66.0) 3 реализованы как обертки над boost::shared_ptr, которые ссылаются на внутренний объект общего состояния, содержащего поле результата. Потокобезопасный доступ к нему осуществляется с помощью boost::mutex и boost::condition_variable. При этом boost::shared_ptr на большинстве платформ реализован через два атомарных счётчика. boost::mutex и boost::condition_variable на POSIX системах оборачивают соответствующе pthread примитивы. На Windows boost::mutex реализован через атомарную CAS-операцию и события (events) для блокирующего ожидания, а boost::condition_variable через CAS-операцию и семафоры.

4. stdfture и std::promise (C++, libc++ 6.0) 4 реализованы так же, как их аналоги в Boost, за исключением того, что что вместо shared_ptr используется специализированный, более эффективный счетчик ссылок.

5. stdfture и std::promise (C++, libstdc++ 7.3.0) 5 также реализованы аналогично Boost, за исключением того, что что для взаимного исключения напрямую используются фьютекс (с эмуляцией через мьютекс и условную переменную на платформах не поддерживающих фьютексы).

Рассмотренные реализации выполняют взаимное исключение различными способами: с помощью атомарных операций, мьютексов, условных переменных, событий, семафоров, фьютексов или их комбинаций. Стоит отметить что java.util.concurrent.CompletableFuture полагается на тот факт, что все объекты в языке Java имеют семантику ссылок. Это позволяет производить установку возвращаемого значения любого типа с помощью атомарной инструкции. Это самый эффективный способ, но требует выделения объекта возвращаемого значения в динамической памяти. Однако, в Java это неизбежно в любом случае, и существенным недостатком не является.

Реализации System.Threading.Tasks.Task необходимо поддерживать структуры языка C#, которые обладают семантикой значений. Установка значений структур с помощью атомарных инструкций, как это сделано в java.util.concurrent.CompletableFuture, в общем случае не возможна. Это обусловлено тем, что структуры, в отличие от ссылок, могут не помещаться в операнды атомарных инструкций. Также, помимо базового механизма отложенного результата, Sys-tem.Threading.Tasks.Task поддерживает обширную дополнительную функциональность. По этим причинам, атомарная инструкция применяется к сложной битовой маске состояния, а не к самому значению.

Рассмотренные реализации на языке C++ выделяют общее состояние в динамической памяти и используют атомарный счётчик ссылок для управления его временем жизни. Низкоуровневые примитивы синхронизации, используемые для организации безопасного многопоточного доступа к внутреннему состоянию, отличаются не существенно. На всех платформах, на нижнем уровне абстракции, все сводится к фьютекс-подобной схеме. А именно: быстрый захват примитива взаимного исключения в адресном пространстве пользователя в случае низкой конкуренции, а иначе — системный вызов с блокировкой потока.

Не сложно заметить, что все рассмотренные реализации состоят из трех основных частей: future, promise и объекта общего состояния. При этом общее состояние выделяется в динамической памяти.

2 https://referencesource.microsoft.com/#mscorlib/system/threading/Tasks/Future.cs

3 https://github.com/boostorg/thread/blob/boost-1.66.0/include/boost/thread/future.hpp

4 https://github.com/llvm-mirror/libcxx/blob/release_60/include/future

5 https://github.com/gcc-mirror/gcc/blob/gcc-7_3_0-release/libstdc++-v3/include/std/future

Future и promise же являются либо непосредственно ссылками на объект общего состояния, либо простыми обертками, предоставляющими необходимый интерфейс, над такими ссылками (рис. 1).

общее состояние

объекты ниэкоурс-ймс-аой синхронизации (ийприыер mule* * condition variable, или Tute*)

состояние результата

* устлчопг*«

слот для значения результата Рис. 1. Классическая реализация future и promise

Динамическое выделение памяти сопряжено с существенными накладными расходами:

1. Обход сложных структур данных, что подразумевает инвалидацию кэша.

2. Возможна необходимость дополнительной синхронизации внутри аллокатора для выделения дополнительной памяти потоку (а если аллокатор не применяет кэширование аллокаций в локальной памяти потоков, то это необходимо при каждой аллокации).

3. Возможна необходимость системного вызова для выделения дополнительной памяти процессу, если локальный кэш пуст (таких как mmap или VirtualAlloc).

В языках со сборкой мусора, большая часть этих накладных расходов откладывается на этап сборки, хотя само выделение обычно очень быстрое. В языках без сборки мусора дополнительно необходимо поддержание атомарного счётчика ссылок для управления временем жизни общего состояния.

По этой причине, логичным следующим шагом является устранение необходимости динамического выделения памяти. Разумеется, это невозможно в языках, в которых все объекты имеют семантику ссылок, таких как Java, потому все дальнейшие рассуждения предполагают, что язык программирования допускает пользовательские типы с семантикой значений (в частности, C++).

Метод синхронизации потоков без динамического выделения памяти

Основная идея предлагаемого метода состоит в том, чтобы разбить объект общего состояния на две части и поместить их внутри future и promise. Переместим содержимое общего состояние во future, а ссылки на общее состояние заменим на взаимные ссылки между future и promise. При этом promise необходимо снабдить его собственным низкоуровневым примитивом синхронизации для взаимного исключения (например, мьютексом) (рис. 2).

producer

ptgmisa

seHvarue: Value) mute«., spantoek или Futax

yiSMiwb не fulune

consumer

fulune

mute* ■*■ ctwicfrtion variable или fule*

указатель на promise

де1{): Value

слот для значения результата

Рис. 2. Реализация future и promise, не требующая динамического выделения памяти

В этом случае возникает следующая сложность: для корректного выполнения любой операции (get, set или перемещения любой из частей) необходимо захватить оба мьютекса. Обычно, для исключения взаимных блокировок (deadlocks), при необходимости захвата нескольких мьютексов, достаточно всем потокам захватывать их в одном и том же порядке. Но в данном подходе это не возможно, так как с каждой стороны для получения доступа к мьютексу парного объекта, необходимо захватить мьютекс данного, чтобы безопасно прочитать ссылку на парный объект. По

этой причине использовался метод асимметричных попыток с откатом: если со стороны future производится попытка захвата мьютекса внутри promise и если это не удается, то освобождается мьютекс внутри future, чтобы дать возможность захватить его потоку, который удерживает мьютекс внутри promise (алг. 1).

Алгоритм 1. Захват двух мьютексов (со стороны future) по методу асимметричных попыток с откатом

1. proc F_LOCK(future: Future) do

2. while true do

3. lock(future.mutex)

4. let success: Boolean = try_lock(future.promise.mutex)

5. if success then

6. break

7. end if

8. unlock(future.mutex)

9. end while

10.end proc

Со стороны promise же осуществляется простой последовательный захват мьютексов внутри promise и внутри future (алг. 2). Таким образом, в случае конфликта двух потоков предпочтение будет отдано тому, который пытается произвести захват со стороны promise.

Алгоритм 2. Захват двух мьютексов (со стороны promise)

1. proc P_LOCK(promise: Promise) do

2. lock(promise.mutex)

3. lock(promise.future.mutex)

4. end proc

Экспериментальная оценка производительности метода

Для предложенного метода разработана программная библиотека на языке C++. Проведена экспериментальная оценка эффективности данного метода в сравнении с существующими реализациями, а именно Boost и libstdc++. Для оценки производительности метода измерялись значения следующих параметров: Tinit - время инициализации (создания) связанной пары future и promise, Tset - время установки значения через promise и Tget - время извлечения значения через future. Также, для наглядности, вычисляется суммарная величина, "общее время" - Ttotal.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

^total =Tinit+Tset +Tget

Для минимизации погрешности измерений, проводились замеры 10 миллионов повторений каждой из указанных операций. При расчете времени для одной операции полученное время разделили на количество повторений. Результаты сравнения производительности программной реализации предложенного метода с существующими классическими реализациями представлены в таблице.

Таблица

Реализации для синхронизации потоков Tinit, нс Tset, нс Tget, нс Ttotal, нс

libstdc++ 8.1 101.4 335.9 390.5 827.9

Boost 1.67 255.6 71.5 237.5 564.7

Предложенная реализация 100.6 69.8 99.9 270.4

Из таблицы несложно заметить, что время инициализации Tinit почти такое же как у libstdc++8.1, а время установки значения Tset, не многим лучше Boost. Тем не менее, предложенная реализация существенно опережает существующие классические реализации по остальным параметрам.

Заключение

Авторы считают, что в данной работе новыми являются следующие положения и результаты:

1. Новый, более эффективный по производительности метод реализации future и promise

не требующий динамического выделения памяти. Общее время выполнения операций синхронизации сократилось на 20-30%.

2. Предложенный метод может быть полезен в ситуации, где производительность не критична, а на динамическую память имеются существенные ограничения, либо она вообще отсутствует, что делает классический метод неприменимым. Примером являются встраиваемые (embedded) системы.

3. Сохранена защита от некорректного использования.

4. Многопоточные системы в настоящее время широко используются и представленный метод уже имеет применение в сетевой подсистеме коммерческого ПО для распределенной визуализации 3D сцен.

Литература

1. Moore G.E. Cramming more components onto integrated circuits // Electronics. 1965. Т. 38. № 8. C.114-117.

2. Kumar S. Fundamental Limits to Moore's Law // arxiv:1511.059561. 2015. [Электронный ресурс]. URL: https://arxiv.org/pdf/1511.05956.pdf (дата обращения: 14.05.2018).

3. WaldropM.M. The chips are down for Moore's law // Nature. 2016. Т. 530. C. 144-147.

4. Friedman D.P., Wise D.S. The Impact of Applicative Programming on Multiprocessing // IEEE Transactions on Computers, 1978. Т. C. 27. № 4. С. 289-296.

5. Baker H.C., Hewitt C. The Incremental Garbage Collection of Processes // Proceedings of the 1977 symposium on Artificial intelligence and programming languages, 1977. Т. 12. № 8. С. 55-59.

6. Madsen M., Lhotak O., Tip F. A Model for Reasoning About JavaScript Promises // Proceedings of the ACM on Programming Languages, 2017. Т. 1. № 86.

7. Hametner R., Medina Duarte O. Asynchronous Programming with Futures in C on a Safety-Critical Platform in the Railway-Control Domain // IEEE International Conference on Emerging Technologies And Factory Automation, 2017.

Сведения об авторах

Татьяна Ивановна Вишневская

к.ф.-м.н., доцент

МГТУ им. Н.Э. Баумана, факультет Информатика и системы управления Эл.почта: [email protected] Россия, Москва Юрий Игоревич Килочек студент магистратуры

МГТУ им. Н.Э. Баумана, факультет Информатика и системы управления Эл. почта: [email protected] Россия, Москва

Information about authors

Tatyana Ivanovna Vishnevskaya

Ph.D. Physical and mathematical sciences, Associate Professor

Bauman Moscow State Technical University E-mail: [email protected] Russia, Moscow Yuri Igorevich Kilochek

Master's degree student Bauman Moscow State Technical University E-mail: yuri. kilochek@gmail. com Russia, Moscow

УДК 517.929, 517.983.51 В.В. Шеметова

Иркутский государственный университет

ПРИМЕНЕНИЕ ТЕОРИИ РАСПРЕДЕЛЕНИЙ К ДИФФЕРЕНЦИАЛЬНО-ОПЕРАТОРНЫМ УРАВНЕНИЯМ С ЗАПАЗДЫВАНИЕМ

В представляемой работе изучена однозначная разрешимость двух классов начальных задач для дифференциально-операторного уравнения первого порядка с отклоняющимся аргументом. Применяются теория обобщенных функций (распределений) Соболева-Шварца со значениями в банаховом пространстве и концепция фундаментального решения.

Ключевые слова: Дифференциально-операторное уравнение, банахово пространство, распределение, фундаментальное решение.

i Надоели баннеры? Вы всегда можете отключить рекламу.