Научная статья на тему 'Повышение эффективности многоядерных вычислений на основе параллельного масштабирования'

Повышение эффективности многоядерных вычислений на основе параллельного масштабирования Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
143
27
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ВРЕМЯ МАСШТАБИРОВАНИЯ РАБОЧЕЙ НАГРУЗКИ ПРИ ПОСЛЕДОВАТЕЛЬНОМ РЕШЕНИИ / ВРЕМЯ МАСШТАБИРОВАНИИ РАБОЧЕЙ НАГРУЗКИ ПРИ ПАРАЛЛЕЛЬНОМ РЕШЕНИИ / МНОГОЯДЕРНАЯ АРХИТЕКТУРА / ВЫСОКОПРОИЗВОДИТЕЛЬНЫЕ ВЫЧИСЛЕНИЯ / ОБЛАЧНЫЕ ВЫЧИСЛЕНИЯ / ПЕРЕДАЧА ДАННЫХ / SEQUENTIAL TIME OF SOLVING SCALED WORKLOAD / PARALLEL TIME OF SOLVING SCALED WORKLOAD / MULTICORE ARCHITECTURE / HIGH PERFORMANCE COMPUTING / CLOUD COMPUTING / DATE TRANSMISSION

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Цимина Наталья Александровна, Чернов Андрей Владимирович

Повышенный интерес к высокопроизводительным вычислениям, возникший в последнее время связан с двумя новинками в вычислениях: облачные вычисления и многоядерные процессоры. Многоядерные процессоры интегрируют много ядер в одну микросхему, чтобы преодолеть физические ограничения архитектуры процессора и обеспечить высокую вычислительную мощность с однокристальной схемой. В настоящей работе рассмотрен один из возможных подходов на базе параллельных вычислений, то есть масштабирование рабочей нагрузки путем распределения ее не только по ядрам вычислительной системы, но и с помощью распараллеливания самих алгоритмов.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Цимина Наталья Александровна, Чернов Андрей Владимирович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Increase of efficiency of multinuclear calculations on the basis of parallel scaled workload

Heightened interest in high-efficiency calculations arisen is connected recently with two novelties in calculations: cloud computing and multinuclear processors. Multinuclear processors integrate many kernels into one chip to overcome physical restrictions of architecture of the processor and to provide high computing capacity with the single-crystal scheme. In the real work we will consider one of possible approaches on the basis of parallel calculations, then is scaling of working loading by its distribution not only on kernels of the computing system, but also by means of parallel algorithms.

Текст научной работы на тему «Повышение эффективности многоядерных вычислений на основе параллельного масштабирования»

Институт Государственного управления, права и инновационных технологий (ИГУПИТ)

Интернет-журнал «НАУКОВЕДЕНИЕ» №3 2013

Главный редактор - д.э.н., профессор К.А. Кирсанов тел. для справок: +7 (925) 853-04-57 (с 1100 - до 1800) Опубликовать статью в журнале - http://publ.naukovedenie.ru

Цимина Наталья Александровна

Tsimina Natalia Aleksandrovna Ростовский Г осударственный строительный университет Rostov State University of Civil Engineering Ассистент кафедры Прикладной математики и вычислительной техники РГСУ Assistant, Department of Applied Mathematics and Computer Science RGSU

E-Mail: [email protected]

Чернов Андрей Владимирович

Chernov Andrei Vladimirovich Ростовский Государственный строительный университет Rostov State University of Civil Engineering Заведующий кафедры Прикладной математики и вычислительной техники РГСУ Head of Department of Applied Mathematics and Computer Science RGSU

Доктор технических наук, профессор E-Mail: [email protected]

Повышение эффективности многоядерных вычислений на основе параллельного масштабирования

Increase of efficiency of multinuclear calculations on the basis of parallel scaled

workload

Аннотация: Повышенный интерес к высокопроизводительным вычислениям,

возникший в последнее время связан с двумя новинками в вычислениях: облачные вычисления и многоядерные процессоры. Многоядерные процессоры интегрируют много ядер в одну микросхему, чтобы преодолеть физические ограничения архитектуры процессора и обеспечить высокую вычислительную мощность с однокристальной схемой. В настоящей работе рассмотрен один из возможных подходов на базе параллельных вычислений, то есть масштабирование рабочей нагрузки путем распределения ее не только по ядрам вычислительной системы, но и с помощью распараллеливания самих алгоритмов.

The Abstract: Heightened interest in high-efficiency calculations arisen is connected

recently with two novelties in calculations: cloud computing and multinuclear processors. Multinuclear processors integrate many kernels into one chip to overcome physical restrictions of architecture of the processor and to provide high computing capacity with the single-crystal scheme. In the real work we will consider one of possible approaches on the basis of parallel calculations, then is scaling of working loading by its distribution not only on kernels of the computing system, but also by means of parallel algorithms.

Ключевые слова: Время масштабирования рабочей нагрузки при последовательном решении; время масштабировании рабочей нагрузки при параллельном решении; многоядерная архитектура; высокопроизводительные вычисления; облачные вычисления; передача данных.

Keywords: Sequential Time of Solving Scaled Workload; Parallel Time of Solving Scaled Workload; Multicore Architecture; High performance computing; cloud computing; date transmission.

Институт Государственного управления, Главный редактор - д.э.н., профессор К.А. Кирсанов

права и инновационных технологий (ИГУПИТ) тел. для справок: +7 (925) 853-04-57 (с 1100 - до 1800)

Интернет-журнал «НАУКОВЕДЕНИЕ» №3 2013 Опубликовать статью в журнале - http://publ.naukovedenie.ru

В последнее время вновь возник повышенный интерес к высокопроизводительным вычислениям[1]. Это связано с двумя новинками в вычислениях: облачные вычисления и многоядерные процессоры. Облачные вычисления используют облако компьютеров, обычно кластер суперкомпьютера и технологию Сети, чтобы обеспечить виртуальные компьютеры по требованию. Многоядерные процессоры интегрируют много ядер в одну микросхему, чтобы преодолеть физические ограничения архитектуры процессора и обеспечить высокую вычислительную мощность с однокристальной схемой. Облачные вычисления и традиционные высокопроизводительные вычислительные требуют энергозатратного питания; многоядерная архитектура появилась в качестве технологии способной удовлетворить этому требованию. Многоядерные процессоры обеспечивают новую размерность, тем самым увеличивая производительность, что в свою очередь позволяет достигнуть линейного ускорения в высокопроизводительных вычислениях, где с увеличением числа ядер возникает проблема размера. Многие из подходов предложенных в последние годы, рассматривают проблему ограничения памяти, включая подход упреждающей выборки данных, предложенный Ксян-Хи Саном, Янг Ченом и Суренда Бьяном [3].

В настоящей работе рассмотрим один из возможных подходов на базе параллельных вычислений, то есть масштабирование рабочей нагрузки путем распределения ее не только поя драм вычислительной системы, но и с помощью распараллеливания самих алгоритмов [2].

Количество параллельных приложений не может увеличиваться бесконечно, чтобы не встретить какое-либо физическое ограничение (например, ограничение памяти).

Т Ж * *

Ограниченное памятью ускорение определяется как: А = -^ос—-, где Ж -

ТпарЖ

масштабируемая рабочая нагрузка при ограничении пространства памяти, Тпос - масштабируемая

рабочая нагрузка при последовательном решении, Тпар - масштабируемая рабочая нагрузка

при параллельном решении. Работа (или рабочая нагрузка) определяется как число инструкций, которые должны быть выполнены исполнителем. Ускорение, в контексте архитектуры ЭВМ, определяется как отношение времени выполнения в исходной архитектуре и время выполнения в улучшенной архитектуре.

Предположим, что время масштабируемая рабочая нагрузка при параллельном решении может быть увеличено на Г (р). То есть масштабируемая рабочая нагрузка

Ж * = аЖ + (1 - а)Г (р)Ж. Фактор Г (р) отражает увеличение времени р рабочей нагрузки, при увеличении емкости памяти.

А = аЖ + (1 - а)Г(р)Ж = а + (1 - а)Г(р) аЖ + (1 - а)Г(р)Ж/р а + (1 - а)Г(р)/р

В целом, вычислительная рабочая нагрузка увеличивается быстрее, чем требования к памяти, таким образом Г(р) > р и ограниченная памятью модель ускорения дает более высокое ускорение, чем фиксированный размер и фиксированное разовое ускорение.

Время выполнения состоит из времени вычисления Iв и времени доступа к данным t. Поэтому, Т = tв + tд . В контексте параллельной обработки, эта формула удовлетворяет двум предположениям: загрузка сбалансирована, и каждый процессор выполняет вычисления и передачу данных одновременно.

Ограниченное памятью ускорение многоядерной архитектуры - определяется как отношение времени выполнения решения масштабируемой рабочей нагрузки на

Институт Государственного управления, Главный редактор - д.э.н., профессор К.А. Кирсанов

права и инновационных технологий (ИГУПИТ) тел. для справок: +7 (925) 853-04-57 (с 1100 - до 1800)

Интернет-журнал «НАУКОВЕДЕНИЕ» №3 2013 Опубликовать статью в журнале - http://publ.naukovedenie.ru

одноядерном процессоре ко времени выполнения решения масштабируемой рабочей нагрузки на многоядерном, где масштабируемая рабочая нагрузка - объем работы, который подразумевается в расширенном смысле с ограничением на задержку доступа к данным.

Предположим, что работа масштабируется с функцией F(p) с ограничением по памяти. Согласно модели с ограниченной памятью для ускорения, объем работы, который может масштабироваться с ограничением доступа к данным, зависит от доступной памяти и требования к памяти приложения при исследовании.

Например, у приложения, умножающего матрицы, есть 3H2 требований к памяти и 2H3 требований к вычислительной мощности, где N - размерность матриц, предполагаем, что две исходные матрицы - квадратные, N х N. Поэтому, вычисления требуют с точки

зрения памяти функцию F (р), около 0,38 • p72. Следовательно, масштабируемая рабочая нагрузка при ограничении на память - F(р~)te +1д. Ускорение при ограничении на память:

F (p)t в +1 t в +1 з/

A =---------;-— = —;-----д—. В целом, F(р) > р , так как F(р) = 0,38 • р/2 (для достаточно

F (р) в/ р + ^ tj р + tA

больших р ).

ЛИТЕРАТУРА

1. Бурякова Н.А., Чернов А.В. Классификация частично формализованных и

формальных моделей и методов верификации программного обеспечения.: Инженерный Вестник Дона, Номер 4, 2010.

2. Цимина Н.А., Чернов А.В. Основные методы формальной проверки

программного обеспечения на модели.: «Строительство-2012». Материалы Международной научно-практической конференции.- Ростов н/Д: Рост.гос.строит. ун-т, 2012.

3. Byna, S., Chen, Y., Sun,X.-H.: A Taxonomy of Data Prefetching Mechanisms. In

Proc. оf Intl. Symp. On Parallel Arcitectures, Algorithms, and Networks. 2008.

Рецензент: Ковалев Сергей Михайлович, Доктор технических наук, профессор кафедры Автоматики и телемеханики на железнодорожном транспорте Ростовского государственного университета путей сообщения.

i Надоели баннеры? Вы всегда можете отключить рекламу.