Научная статья на тему 'Математические модели и расчет показателей надежности масштабируемых вычислительных систем при групповом восстановлении'

Математические модели и расчет показателей надежности масштабируемых вычислительных систем при групповом восстановлении Текст научной статьи по специальности «Математика»

CC BY
17
7
i Надоели баннеры? Вы всегда можете отключить рекламу.
i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Математические модели и расчет показателей надежности масштабируемых вычислительных систем при групповом восстановлении»

Пленарная секция 15

Большой объем проведенных расчетов показал, что при малой величине среднеквадратического отклонения практически всегда малым является и равномерное отклонение рассматриваемой статистической проекционной оценки от искомого решения. По-видимому, это связано с достаточной среднеквад-ратической точностью одновременной оценки производной от решения, что требует дополнительно довольно сложного исследования.

Исследование выполнено в рамках государственного задания ИВМиМГ СО РАН № 0251-2021-0002.

Математические модели и расчет показателей надежности масштабируемых вычислительных систем при групповом восстановлении

К. В. Павский1'2, В. А. Павский3

1Институт физики полупроводников им. А. В. Ржанова СО РАН

2Сибирский государственный университет телекоммуникаций и информатики

3Кемеровский государственный университет

Email: pkv@isp.nsc.ru

DOI: 10.24412/cl-35065-2022-1-01-73

Масштабируемость вычислительных систем (ВС) является одной из архитектурных особенностей для повышения производительности. Например, 93 % суперкомпьютеров их списка Top500 составляют кластерные системы. Количество узлов в масштабируемых ВС может измеряться несколькими тысячами и более. Например, вычислительная система Fugaku (1 место в 58-й ред Top 500) состоит из 158 976 вычислительных узлов. Рост числа элементарных машин (ЭМ, например, вычислительный узел) повышает число отказов в системе [1]. Поэтому анализ надежности масштабируемых ВС является актуальной проблемой.

В работе предлагаются математические модели функционирования масштабируемых ВС с отказами и групповым восстановлением для расчета показателей надежности. Модели построены в рамках теории массового обслуживания с использованием развитого аппарата производящих функций. Получены решения для оценки потенциальных возможностей систем по повышению производительности, а также функция распределения нахождения ВС в состоянии низкой производительности при отказах и групповом восстановлении.

Работа выполнена в рамках ГЗ 0242-2021-0011 и при финансовой поддержке Российского фонда фундаментальных исследований (грант № 20-07-00039).

Список литературы

1. Gupta S., Patel T., Engelmann C., Tiwari D. Failures in large scale systems: long-term measurement, analysis, and implications // SC '17: Proceedings of the International Conference for High Performance Computing, Networking, Storage and Analysis, Denver (USA), Nov. 12-17, 2017. Art. N 44.

Обратная задача для полулинейного волнового уравнения

В. Г. Романов

Институт математики им. С. Л. Соболева СО РАН

Email: romanov@math.nsc.ru

DOI: 10.24412/cl-35065-2022-1-01-56

Для квазилинейного волнового уравнения изучается задача об определении входящей в это уравнение функции f(x, u) по некоторой информации о решениях задач Коши для дифференциального уравнения. Искомая функция предполагается гладкой по всем переменным и финитной по x. Рассматриваются

i Надоели баннеры? Вы всегда можете отключить рекламу.