УДК 681.321.3
Б.М. Петров, О.Н. Уткина, М.Б. Петров
ОСОБЕННОСТИОБЛАЧНЫХТЕХНОЛОГИЙ ПРОГРАММНЫХ СРЕДСТВ МНОГОЯДЕРНЫХ НАНОПРОЦЕССОРНЫХ СИСТЕМ
При разработке перспективных облачных технологических систем, использующих новейшие достижения наноэлектроники, необходимо рассмотреть основные особенности программных средств (ПС)
облачныхтехнологических многоядерных нанопроцессорных систем (ОТМНС), которые влияют на оценку живучестиОТМНС.
Разработка перспективныхвысокоэффективных динамических
облачныхтехнологическихсистем, базирующихся на новых методах обработки информации, использующих новейшие достижения многоядерной наноэлектроники, для основных типов почтовых
сервисов:Ошаі1,УаЬоошаі1,ШеЬшаі1, Hotmail т.п., онлайновых текстовых сервисов: ZohoWriter, Google, онлайновых графических сервисов: Lunapic, GooglePicasa и множества сервисов музыкальных, видио и других развлекательных.
Значительное повышение живучестиоблачныхнанопроцессорных систем может быть получено за счет использования программных средств для мониторинга и управлениясетеобразной многоядерной структурой кристаллананопроцессора, древообразной
многокорневоймногокэшовойструктурой памяти, многоконвейерной структурой с различными уровнями конвейеров, использованием микротехнологий, обеспечивающих плотность упаковки операций в одном такте для большой разрядности, которые позволяют перейти от интеграции схем к интеграции систем и удовлетворить все возрастающие требования заказчиков к быстродействию, точности и количеству решаемых задач при разработке современных аппаратно-программных комплексов управления и обработки информации.
Использование новых сложных методов обработки информации, нового перспективного языка функционального программирования (F#) значительно усложняет современные ОТМНС, а возрастающая ответственность выполняемых ими функций выдвигает на одно из первых мест проблему расчета живучести ОТМНС.
Проблема живучести программного обеспечения (ПО) возникла при создании больших вычислительных комплексов, когда трудоемкость и стоимость технических средств (логических элементов и приборов памяти) стала непрерывно снижаться, а стоимость и трудоемкость разработки ПОстала повышаться.
В настоящее время в Интернете находятся сотни миллиардов к пакетов (1011), которые имеют емкостьсотни миллиардов байт информации (1011),
которые обрабатываются на серверах с производительностью сотни миллиардов (1011), производительность серверных систем равна
произведению тактовой частоты на разрядность системной шины данных, которые работают сотни тысяч часов (105), в итоге мы имеем информационную сложность современного Интернета 10 , которая должна обеспечиваться новыми моделями расчета и обеспечения живучести.
В настоящее время Интернет используют не только коммерческие структуры, но и космические и авиационные системы у нас и за рубежом, цена ошибки (потери), которую не смогли обнаружить на этапе подготовки и внедрения облачных, серверных систем превысила десятки и сотни млн. долл. (не считая морально-политических и других последствий). Особенностями ОТМНС, сервисы которых обеспечивают высокую перспективную высокоэффективную высокоэкономичную информационную облачную инфраструктуру, не предъявляющую никаких особых требований ни к операционной системе, ни к браузеру, ни к Web-приложению, являются:
- доступностьсервисов через Web-браузер любой фирмы с использованием открытых стандартов или через специальный интерфейс прикладного программирования для доступа к Web-сервисам;
- доступность сервисов облачной инфраструктуры по требованию, те. сервисы представляются только тогда, когда вам это требуется;
- при использовании высокоэффективной информационной облачной инфраструктуры не требуется никаких дополнительных затрат в инфраструктуру или дополнительной настройки, т.е. дополнительных капиталовложений;
- при использовании высокоэкономичной облачной инфраструктуры
оплачиваются только те сервисы, с которыми работаете;
- при использовании высокоэкономичной облачной инфраструктуры
оплачиваются только то фактическое время, в течение которого эта облачная инфраструктура используется;
- при использовании высокоэкономичной облачной инфраструктуры нет необходимости строить сеть и покупать сервисы и получать какие-то дополнительные технические знания;
- при использовании высокоэкономичной облачной инфраструктуры
организуется многоарендная архитектура, которая представляет собой программу-сервер, которая поддерживает развертывание множества клиентов, одновременно пользующиеся одним и тем же экземпляром программы-сервера.
- при использовании высокоэкономичной облачной многоарендной
архитектуры, обеспечивается поддержка множества клиентов на меньшем количестве аппаратных средств;
- при использовании облачной инфраструктуры ускоряется и упрощается процедура развертывания обновлений для приложений и обновлений для системы безопасности;
- при использовании высокоэффективной информационной облачной инфраструктуры, обеспечивается более надежность, живучесть и безопасность.
Особенностями ОТМНС, которые обеспечивают высокую защищенность за счет живучестии безопасности, являются:
- конфигурирование массива с избыточностью данных;
- конфигурирование CRON;
- конфигурированиеЬУМ;
- МБ5-вишдля контроля целостности;
- проверка на spy, и на backdoor;
- наличие firewall clam;
- наличие межсетевых экранов и сканеров безопасности;
- наличие политики безопасности сетевого оборудования;
- наличие системы аутентификации и авторизации;
- наличие системы обнаружения атак;
- наличие системы антивирусной защиты;
- ограничения на ввод ГОи шифрование каналов.
Особенностями ОТМНС, которые обеспечивают высокую
функциональность за счет быстродействии доступа в Интернет, являются:
- оптимальная настройка маршрутизации;
- оптимизация пропускной способности сети;
- планирование приоритетов вторичных процессов;
- балансировка нагрузки и многоканальность;
- наличие системы от несанкционированного доступа;
- дефрагментация и физическая чистка HDD;
- автоматизация уведомлений;
- делегирование доступа и чистка баз данных.
Особенностями ОТМНС, которые обеспечивают высокую
работоспособность за счетсистемы обслуживания и стабильности, являются:
- поиск и удаление временных файлов;
- поиск и удаление .bac файлов;
- поиск и удаление битых ссылок;
- регулярное и своевременное обновление всей системы;
- RAIDс избыточностью;
- наличие вторичных серверов и нескольких внешних IP;
- наличие ИБП и сетевых фильтров.
Вероятность достижения требуемого уровня функциональности ОТМНС сильно зависит от:
- допустимого коэффициента нагрузки (0,1 - 0,8) и от балансировки ее;
- возможности перераспределения обязанностей, коэффициента делегирования задач (0,3 - 0,9) вторичным серверам;
- коэффициента конфигурации и полноты, глубины и достоверности проверок (число точек контроля в серверах);
-сложности выполняемых задач, коэффициента ресурсоемкости задач (0,1
1,0) при построении очередей задач.
УДК 681.321.3
Б.М. Петров, О.Н. Уткина, М.Б. Петров
ОСОБЕННОСТИ ОЦЕНКИ ЖИВУЧЕСТИ ОБЛАЧНЫХ ТЕХНОЛОГИЙ ПРОГРАММНЫХ СРЕДСТВ МНОГОЯДЕРНЫХ НАНОПРОЦЕССОРНЫХ СИСТЕМ
При разработке перспективных облачных технологических систем, использующих новейшие достижения наноэлектроники, необходимо рассмотреть основные особенности оценки живучести программных средств (ПС) облачных технологических многоядерных нанопроцессорных систем (ОТМНС), которые отличаются от оценкинадежностиОТМНС.
При этом высокоэффективная информационная облачная инфраструктура должна выдерживать не менее 99,99% атак, а система резервного копирования должна каждый день делать инкрементальное резервное копирование и полное резервное копирование, а источник бесперебойного питания должен обеспечивать работу сервисов не менее 24 часов, а ОТМНС должна уметь обрабатывать не менее 10000 обращений к базам данных. При конфигурировании необходимо обращать особое внимание на самые важные для данной ситуации характеристики и необходимо проводить постоянный мониторинг для своевременного обнаружения и исправления возникающих проблем при обслуживании сервера.
Для получения максимальной вероятности достижения требуемого уровня функциональности ОТМНС необходимо в первую очередь обеспечивать:
- оптимальное построение очередей задач;
- разработку адаптивной системы резервного копирования под текущие задачи;
- высокий уровень безопасности за счет анализа всех направлений, по которым можно ожидать атаки;
- постоянное поддержание баз данных в компонентном состоянии;
- мониторинг, дефрагментацию и регулярную чистку сервера.
Внедрение многоядерныхнанопроцессоров (НП), многоядерного
программирования, новейшего языка функционального программирования-F# привело к значительному увеличению сложности ПО. Существует прогноз, что к 2015 году, когда будут внедрены разрабатываемые сейчас ОТМНС, вклад ПО составит более 99 % стоимости технических
вычислительных средств.
В настоящее время существует несколько моделей оценки живучести ПС микропроцессоров (МП), модели оценки живучестиПС ОТМНС с учетом их
особенностей, пока в литературе не рассматривались. Все известные модели оценки живучести ПС МП можно разделить на две группы.
В первой группе моделей на этапе разработки ПО определяется показатель сложности ПО. Оцениваются количественные и качественные характеристики: общее время выполнения алгоритма с учетом сложности арифметических и логических команд и их длительности (длина программы Тпо), ее объем, уровень и интеллектуальное содержание программы. Следует отметить, что рассматриваемые модели имеют два серьезных недостатка, которые на порядок и более ухудшают оценку сложности.Во-первых, они не учитывают структуру алгоритма многоядерного и функционального программирования, а во-вторых, объем и время программирования на новом перспективном языке программирования F#, а в третьих надежность изменяется нелинейно при усложнении алгоритма, поэтому приходится корректировать наработку на ошибку в ПС - ТПО.
Во второй группе моделей для прогнозирования одной из важнейших характеристик живучести ПО - интенсивности ошибок используют модели, базирующиеся на теории надежности технических систем. Эти модели чаще всего используются на практике, т.к. они позволяют определить следующие показатели живучести ПО: времена появления ошибок; результирующее время между ошибками; количество ошибок за заданный период времени.
Как в технических средствах, в качестве показателей живучестииспользуются: функция надежности (вероятность безошибочной работы) - R(t), среднее время между появлениями ошибок в ПО - Тср, интенсивность ошибок 1no(t), которую обозначают через функцию риска Z(t) (количество, скорость, темп выявления ошибок) условную вероятность того, что ошибка произойдет в интервале времени ( t, t + A t) при условии, что программа не отказывала в течение времени t.
Модели второй группы отличаются между собой теми ограничениями и предположениями, которым они соответствуют. Поэтому необходимо очень строго сравнивать предположения, принятые в конкретной модели.
При исследовании живучести ПО предполагаем, что в процессе функционирования в ОТМНС возникают различные виды отказов (сбои, перемежающиеся отказы, ошибки, внезапные отказы), включающие отказы технических и программных средств (ТС, ПС).
ЖивучестьОТМНС определяется совместной вероятностьюРСНпс = Ртс(А) X Рпо(В/А),где РТС(А) - безусловная вероятность безотказной работы
технических средств ;РПО(В/А) - условная вероятность безотказной работы программногообеспечения при условии, что в технических средствах отказне произошел. Целесообразно принять допущение о независимости отказов в ТС и ПС, т.е.Рвнпс = Ртс(А) x Рпо(В).
Повышение значения показателя ТОПО может быть за счет уменьшения количества и сложности команд, совершенствования программирования и методов тестирования, за счет внедрения методов автоматического доказательства правильности программ.
Второй подход называется проектированием ОТМНС "с допуском на сбой" (толерантным), "устойчивостью" программ и задается показателем P(t) - вероятностью успешного выполнения задания или ТС -средней наработкой на ошибку, приводящей к срыву выполнения задания. Этот
показатель характеризует устойчивость ПОк различного рода ошибкам, искажениям, отказам и зависит от различных видов избыточности (информационной, временной, алгоритмической), введенных в ОТМНС и согласованных с механизмами типовых ошибок.
Программное обеспечение в ОТМНС представляет одну из областей возникновения ошибок и значительно влияет на работоспособность устройства. Для оценки безотказности программного обеспечения построена укрупненная модель, позволяющая учесть основные особенности ПО в ОТМНС. Для адекватного отражения в модели реальных процессов отказов ПО предварительно проведен анализ видов и механизмов ошибок. На основе анализа приняты следующее определения и допущения, которые позволяют построить инженерную модель расчета безотказности ПО ОТМНС:
- программа называется правильной, если она выдает правильные результаты при правильных исходных данных и при отсутствии ошибок в командах и константах;
- программа называется устойчивой, если она выдает правильные результаты при наличии ошибок в исходных данных или в командах, т.е. возникающие ошибки в процессе функционирования нейтрализуются;
- отказ ПО определяется как недопустимое отклонение результатов выполнения задания от заданных в ТУ, по точности, по времени;
- безотказность ПО характеризуется вероятностью безотказной (безошибочной) работы ПО в течение заданного времени, в заданных условиях (т.е. с требуемой точностью и быстродействием), для данного ОМНС в комплект которого включено ПО;
- для проведения расчетов в качестве основной характеристики
безотказности ПО используется интенсивность отказов 1о ;
- проведение полного и тщательного анализа типа ошибок и его влияния на ПО не реально из-за множества логических путей, поэтому проверка ПО в ОТМНС проводится выборочно. Адекватное отражение реальных условий работы можно получить при тестировании наиболее вероятного множества входных данных, которое охватывает наиболее вероятные ветви алгоритма и наиболее сложные и вероятные сочетания условных переходов.
Различают последствия при возникновении ошибок:
а) средние (45%) и незначительные (ЗО%) последствия при ошибках в данных, которые искажают данные, точность вычислений (т.е. ухудшают характеристики ОМНС) , эти ошибки обнаруживаются и исправляются при циклической обработке;
б) катастрофические (5%) и серьезные (20%) последствия при ошибках в командах, в последовательности передачи управления, которые приводят к искажению программы и срыву решения задачи.
В таблицах 1, 2, 3, 4 приведена классификация ошибок ПОпо типам, этапам возникновения и обнаружения ошибок.
Таблица 1
Тип ошибки Вес ошибки, %
Неполная или ошибочная спецификация 30
Отклонение от спецификации 10
Нарушение стандартов программирования 16
Ошибочная выборка данных 10
Логическая ошибка в последовательности операций 9
Ошибка в арифметической операции 8
Ошибки в документации и в исходных данных 8
Ошибка в обработке прерываний 6
Ошибка в константах 3
Таблица 2
Причины ошибок Вес ошибки, %
Ошибочные модели описания аппаратуры 25
Ошибки оформления 20
Ошибки в числовых значениях 15
Ошибочные символы и знаки 13
Недостаточные требования к быстродействию 11
Недостаточные требования к точности 9
Ошибочные и неопределенные исходные данные 7
Таблица 3
Этап, на котором допущена ошибка Вес ошибки, %
Выбор цели 35
Алгоритмизация и спецификация 25
Кодирование 23
Отладка 10
Опытная эксплуатация 5
Тиражирование и поддержание 2
Таблица 4
Этап, на котором обнаружена ошибка Вес ошибки, %
Разработка контрольных примеров и тестов 40
Отладка 20
Натурные испытания и моделирование 15
Стыковка с другими программами прикомплексных испытаниях 15
Сдача заказчику и эксплуатация 10
УДК 681.321.3
Б.М. Петров, О.Н. Уткина, М.Б. Петров
МОДЕЛЬ РАСЧЕТА ЖИВУЧЕСТИ ОБЛАЧНЫХ ТЕХНОЛОГИЙ ПРОГРАММНЫХ СРЕДСТВ МНОГОЯДЕРНЫХ НАНОПРОЦЕССОРНЫХ СИСТЕМ
При разработке перспективных облачных технологических систем, использующих новейшие достижения наноэлектроники, необходимо разработать новую модель расчета живучести программных средств (ПС) облачных технологических многоядерных нанопроцессорных систем (ОТМНС). В статье предложена модель прогнозирования безотказности программного обеспечения, позволяющая учесть влияние различных компонентов живучести на безотказность ПС.
Рассмотрим функциональную зависимость, называемую математической моделью прогнозирования безотказности программного обеспечения ОТМНС и позволяющую учесть влияние различных компонентов ненадежности на безотказность программного обеспечения (ПО)ОТМНС.
При оценке безотказности ПО ОТМНС используется комплексный подход, при котором применяются несколько вложенных моделей, параметры которых уточняются по мере накопления информации. Рассмотрим модель, которая может быть применена для расчета безотказности ПО НП с соответствующим определением параметров: а, ^НПО(т)и введением
дополнительных коэффициентов, учитывающих особенности ПООТМНС. Интенсивность отказов (ошибок) ПО ОТМНС определяется по формуле:
^Р.ПО ОТМНС (т)= ( -^УПО (т) + ^НПО (т) Х КТПІ Х КПКІ Х КСЛ Х КЯД Х ККЭШ Х ККОН
Х КЯП Х КПР Х ехр (- а Х t)) Х КПИ ,
гдет- фактическое время отладки ПО в часах;
^УПО (т), ^НПО (т) - начальное значение интенсивности отказов ПО ОТМНС, равноеразности фактического (начального) и установившегося значения, ^НПО (т) соответствующего начальному этапу отладки прит = 0, ^НПО (т) прит = ¥;
КТПІ - коэффициент, учитывающий влияние i-й технологии
программирования на процесс разработки и отладки ПО;
КПКІ - коэффициент, учитывающий влияние наличия проверочного кода на i-м уровне (внутри метода, библиотеки классов, консольного приложения) на процесс разработки и отладки ПО;
КСЛ- коэффициент, учитывающий влияние сложности ПО, разрабатываемого для клиентских, серверных приложений на процесс разработки и отладки ПО;
КЯД - коэффициент, характеризующий надежность ПОс учетом
многоядерной структуры и протоколов мониторинга обмена данных и
управления, включающих или отключающих ядра при сбоях в тестах, определяется по формуле Бернулли;
ККЭШ - коэффициент, характеризующий надежность ПОс учетом
многокэшевой структуры памяти и протоколов мониторинга обмена данных и управления, включающих или отключающих различные структуры уровней КЭШ-памяти при сбоях в тестах, определяется по формуле Бернулли;
ККОН - коэффициент, характеризующий надежность ПОс учетом
многоконвейерной структуры и протоколов мониторинга обмена данных и управления, включающих или отключающих различные уровни (ступени) конвейеров при сбоях в тестах, определяется по формуле Бернулли;
КЯП - коэффициент, учитывающий различие в сложности проектирования ПО, выполненных на языках программирования (КЯП(С)=1,0; КЯП(С++)=0,7; Кяп(С#)=0,3); КяПГ#)=0,1);
КПР - коэффициент производительности, учитывающий наличие временной избыточности на уровне элементного состава дляПО, который равен отношению фактически используемой тактовой частоты к допустимой по ТУ тактовой частоте;
КПИ - коэффициент, учитывающий степень использования
стандартного ПО НП;
а - коэффициент, характеризующий изменение безотказности ПОпри отладке, зависит от типа НП и применяемой технологии программирования.
Установившееся значение интенсивности отказов (ошибок) ПО СНПС определяется остаточными ошибками, которые находятся в редко встречающихся комбинациях передачи управления между ветвями или в редко встречающихся комбинациях данных и констант. Кроме того, ^УПО (t) учитывает вносимые ошибки, которые возникают по мере изменения характеристик ПО, при введении новых инструкций в процессе совершенствования ПО, после окончаний этапа отладки. Во время этапа отладки введение новых инструкций не допускается.
Численное значение ^УПО (т)зависит от вида программы и от уровня
безотказности, который необходимо обеспечить, исходя из требований на СНПС в целом при эксплуатации. Анализ данных показывает, что ^УПО (т)зависит от сложности ПО (общего количества команд) и отличается от ^НПО (t) более чем в 100 раз, кроме того имеется нижний уровень для ^УПО (t), который соответствует для ПО СНПС не более 0.0005 1/ч.
Модель расчета надежности ПО СНПС позволяет на этапе проектирования сравнивать по безотказности различные варианты построения ПО СНПС с учетом применяемой элементной базы, сложности ПО, заданного времени отладки и используемой технологии программирования (ТП).
Влияние современныхТП на надежность ПО через коэффициент КТП приведено в таблице 1. По субъектно-ориентированному
программированию, компонентно-ориентированному программированию,
родовому программированию и порождающему программированию данных для получения значений коэффициентов нет, поэтому в таблице прочерки. Таблица 1
№ Вид технологии программирования Ктп
1 ПОбез применения технологии программирования 1,0
2 Процедурное программирование 0,81
3 Модульное программирование 0,64
4 Технология главного программиста 0,45
5 Структурное программирование 0,27
6 Нисходящая (восходящая) технология программирования 0.21
7 Последовательно-параллельная технология программирования 0.15
8 Объектно-ориентированное программирование 0,1
9 Субъектно-ориентированное программирование -
10 Компонентно-ориентированное программирование -
11 Родовое программирование -
12 Порождающее программирование -
13 Серверное программирование 0,05
14 Функциональное программирование 0,01
15 Многоядерное программирование 0,001
При построении функциональной зависимости начального значения интенсивности ошибок^НПО (т)от фактического времени отладкираньше использовали метод наименьших квадратов, который позволяет выбрать математическую модель (вид уравнения регрессии), наиболее адекватно описывающую физику процесса отработки, и определить параметры этой модели. Но большие ошибки метода наименьших квадратов, а главное не учет изменения механизма отладки при замене версий ПС потребовал рассмотреть другие методы.
Анализ метода кубических сплайн-функций дефекта один, метода фрактального анализа и метода вейвлет анализа показал, что лучшим методом анализа при построении функциональных зависимостей надежности ПОот времени отладки с учетом смены версий программных модулей в СНПС является метод вейвлет анализа. Этот метод успешно развивается в последнее время и является новым направлением в теории и технике временных рядов, обработки сигналов и изображений, и называется вейвлет анализ или вейвлет преобразование (ВП) и позволяет исследовать структуру неоднородных процессов.
Вейвлеты (функции двух аргументов: масштаба и сдвига) представляют собой особые функции в виде коротких волн с нулевым интегральным значением и с локализацией по оси независимой переменной (t или x), способных к сдвигу по этой оси и растяжению или сжатию (масштабированию). Почти любой вейвлет порождает полную
ортогональную систему, вейвлет-функции имеют форму пакетов с колокольными огибающими.
При вейвлет-анализе (ВА) происходит декомпозиция процесса, благодаря изменению масштаба,и вейвлеты способны выявить различие в
характеристиках процесса на разных шкалах, а посредством сдвига можно проанализировать свойства процесса в различных точках на всем исследуемом интервале и восстанавливать, синтезировать процесс.
ВП одномерного сигнала это его представление в виде обобщенного ряда или интеграла Фурье по системе базисных функций. Yab(t) = 1/Va xY((t-b)/a), обладает свойствами материнского (исходного) вейвлета^^) за счет операций сдвига во времени (b) и изменения временного масштаба (a) или (j). Множитель 1/Va обеспечивает независимость нормы этих функций от масштабирующего числа а.
Функция Yab(t) двух аргументов (параметров) а-масштаба и b-сдвига есть вейвлет^^-Ь)^), порождаемый материнским вейвлетом Y(t). Малые значения а соответствуют мелкому масштабу Yab(t) или высоким частотам (w-1/а), большие параметры а - крупному масштабу Yab(t), т.е. растяжению материнского вейвлета^^) и сжатию его спектра. Поэтому в частотной области спектры вейвлетов похожи на всплески (волночки) с пиком на частоте w0 и полосой Aw (полосовой фильтр), с ростом параметра а w0 и Aw уменьшаются. Поэтому вейвлет-анализ называют автоматически
самонастраиваемым математическим микроскопом, который позволяет сохранять хорошее разрешение на разных масштабах процесса отладки ПС, когда происходит нарушение автомодельности процесса при смене версии программного модуля и изменяется интенсивность ошибок.
Для построения спектра функции отладки программного обеспечения^НПО (т)или средней наработки на ошибку программного обеспечения - ТО.ПО(т), заданной в виде трех непересекающихся последовательных косинусоид (м.б. скрытых в шумах), версии программного обеспечения: 0 - ая версия -тестирование в течение 60 дней, 1 - ая версия - приемо-сдаточные испытания изделия в течение 30 дней), 2 - аяверсия приемо-сдаточные испытания объекта изделия в течение 15 дней, с частотами 1/60, 1/30, 1/15 Гц, их частоты возрастают, так как частота - величина обратная масштабу, т.е. а = 15, 30, 60, с шагом дискретности ТО = 1, b = 364 дней (за год), тогда ^НПО (t)= cos (2-p-1/60) + cos (2-p-1/30) + cos (2-p-т/15).По мере получения дополнительных данных по результатам испытаний ПО СНПС по изменению интенсивности ошибок ПО, значения коэффициентов будут усредняться и уточнятся, что позволит применить вейвлет-анализ с автоматической самонастраиваемыми коэффициентами при сохранении хорошего разрешения на разных масштабах процесса отладки ПО, даже при нарушении автомодельности процесса при смене версии программных модулей и скачкообразном изменении интенсивности ошибок.
УДК 681.321.3
Б.М. Петров, О.Н. Уткина, М.Б. Петров
МОДЕЛЬ РАСЧЕТА ЖИВУЧЕСТИ
ОБЛАЧНЫХ ТЕХНОЛОГИЙ ТЕХНИЧЕСКИХ СРЕДСТВ МНОГОЯДЕРНЫХ НАНОПРОЦЕССОРНЫХ СИСТЕМ
При разработке перспективных облачных технологических систем, использующих новейшие достижения наноэлектроники, необходимо разработать новую модель расчета живучеститехнических средств (ТС) облачных технологических многоядерных нанопроцессорных систем (ОТМНС). В статье предложена модель прогнозирования безотказности технических средств, позволяющая учесть влияние различных компонентов живучести на безотказность ТС.
Сегодня универсальныенанопроцессоры (НП) содержат 2, 4, 8, 16 ядер в одном корпусе, а серверные НП уже содержат 128 - 256 ядер в одном корпусе (это сложная сетеобразная структура), выполненных по сетевой, кольцевой или многокорневойдревоструктуре со сложными протоколами обмена данных, использующие структурную и информационную избыточность. Сегодня НП используют различные архитектуры КЭШпамяти первого, второго и третьего уровней для каждого ядра, что позволяет повысить быстродействие и безотказность ОТМНС, за счет использования временной и информационной избыточности.
Тридцать лет назад мы стали учитывать при расчетах надежности микропроцессорных систем (МПС) режимную и структурную избыточность, двадцать лет назад мы стали учитывать при расчетах надежности МПС временную и функциональную избыточность, десять лет назад мы стали учитывать при расчетах надежности МПС информационную и программную избыточность. Сейчас при переходе к наноэлектронике и в будущем при переходе к квантэлектронике мы должны учитывать при расчетах живучести алгоритмическую и архитектурную избыточность, учитывающую протоколы обмена иуправления информацией, и может быть и брейнпьютерную (мозговую)избыточность, учитывающую многокорневые деревья анализа и обработки данных с инверсией на различных рангах.
Разработка современных систем, использующих новейшие достижения НЭ: микропроцессоров (МП) и нанопроцессоров, которые отличаются значительным увеличением степени интеграции на три - четыре порядка (современные НП имеют более миллиарда транзисторов в одном корпусе), а возрастающая ответственность выполняемых ими функций, потребовала разработки новой модели расчета надежности технических средств (ТС) ОТМНС, которая рассмотрена в данной статье.
Значительное повышение надежности может быть получено за счет использования в ОТМНСсетеобразной многоядерной структуры кристалла, древообразной многокорневоймногокэшовой структуры памяти,
многоконвейерной структуры с различными уровнями (ступенями) конвейеров, использованием микротехнологий, обеспечивающих плотность упаковки операций в одном такте для большой разрядности, которые
позволяют перейти от интеграции схем к интеграции систем и удовлетворить все возрастающие требования заказчиков к быстродействию, точности и количеству решаемых задач при разработке современных комплексов обработки информации, основой которых являются ОТМНС.
В настоящее время все существующие методы оценки надежности ТС МП можно разделить на две группы (методы оценки надежности нанопроцессоров, с учетом их особенностей, пока в литературе не рассматривались). К первой группе относятся модели расчета надежности МП, основанные на применении модели, используемой для расчета надежности БИС и МП с небольшим усложнением пересчетных коэффициентов.
Наиболее существенным недостатком этих моделей является малая чувствительность интенсивности отказов к изменению степени интеграции, что приводит к серьезным ошибкам, а также не учет новых схемоконструктивных особенностей МП и особенно НП, таких как наличие многоядерной, многокэшовой, многоконвейерной структуры и наличие совмещенных микротехнологий, которые позволяют в одном такте, за счет большой разрядности системной шины, уплотнить и выполнить несколько различных по сложности микрокоманд. Результаты расчета надежности МПС отличаются от эксплуатационных данных на три порядка, что недопустимо при оценке надежности сложных МПС.
Ко второй группе относятся модели, основанные на учете большого числа физических характеристик процесса изготовления БИС и МП на основании данных стандарта США. В этих моделях при расчете надежности учитывается работа БИС в двух режимах: активном и пассивном, а также общее количество переключений, происходящих в приборе, общая площадь кристалла, активная площадь кристалла, площадь металлизации, число степеней диффузии, энергия активации и некоторые постоянные, характеризующие скорость протекания процесса отказа, распределение и свойства загрязнений и дефектов и многие другие параметры, которые на этапе проектирования МПС не доступны.
Учитывая недостатки моделей и большие ошибки, возникающие при оценке надежности МП, и тем более НП, необходимо разработать новую математическую модель расчета интенсивности отказов МП и НП с учетом их особенностей, таких, как высокая степень интеграции, изменение механизма отказа и их структурных особенностей.
В инженерной практике большое распространение получили формализованные коэффициентные модели расчета надежности МП. Сущность коэффициентных моделей расчета надежности заключается в сравнении рассматриваемого устройства с другим устройством, надёжность которого (базовая интенсивность отказов) определена ранее и найдена некоторая эмпирическая зависимость в виде функции, связывающей параметры надежности с рядом коэффициентов, учитывающих электрические, схемные и конструктивные характеристики МП и НП,
уровень сложности, особенности технологического производства, влияние электрических и эксплуатационных нагрузок.
Широко распространены коэффициентные модели оценки, основанные на расчете надежности МП и НП по средним интенсивностям отказов ее отдельных компонентов (кристалл, металлизационные соединения, выводы, корпус и т.д.), отличающихся относительной схемно-конструктивной, функциональной и технологической независимостью.
Следует отметить, что с переходом от МП первых поколений ксовременным НП большой сложности становится нецелесообразно учитывать в модели расчета безотказности проинтегрированные резисторы, транзисторы, конденсаторы и другие элементы как отдельные компоненты. А контактные узлы, кристалл, ядра, кэш-память различных уровней, конвейеры, корпус могут считаться отдельными компонентами
ненадежности, тем более, что технологически они независимы и процессы их изготовления базируются на достаточно замкнутых типовых технологических циклах. Так как эти процессы типовые и
автоматизированы, то отказ каждого элемента содержит полезную информацию о недостатках технологии или оборудования, используемых для изготовления НП, и характеризует вполне определенный механизм отказа.
На основании механизмов отказов, возникающих в НП, и различных факторов, ускоряющих процессы деградации, построена функциональная многокомпонентная математическая модель расчета надежности НП, которая учитывает влияние различных факторов на базовые интенсивности отказов отдельных компонентов ненадежности.
В этой модели расчета интенсивности отказов НП влияние технологии изготовления, уровня сложности (критерием сложности, т.е. индикатором, является количество активных элементов или бит), контактных соединений и пережоговых перемычек, типа корпуса и метода герметизации, тепловых и эксплуатационных режимов работы, а также проведенного объема проверки программного обеспечения, учитывается введением пересчитывающих коэффициентов. Полученная модель предлагает определение и
использование зависимостей для всех коэффициентов и объединение их совместных влияний в следующем выражении:
^p.Hn(t) - (^oi(t) х Ктиі х Ксл х Кяд х Ккэш х Ккон х Кмт х Ккч х Кнап + ^к(0
х КкорхКвывхКэкс)хКтхКпр, где
^Oi(t)- базовая интенсивность отказов кристалла НП i - й технологии с учетом соответствия его современному уровню проектированияизготовления (технологическим нормам), зависит от чистоты и качества исходных материалов;
^K(t) - базовая интенсивность отказов типа корпуса, определяется материалом и конструкцией корпуса НП;
КТИІ - коэффициент, учитывающий сложность технологии изготовления НП, конструктивно-технологических особенностей данной технологии изготовления, зависит от быстродействия, типа технологии, потребляемой мощности, линейных размеров транзистора, определяется относительно n-МОП технологии изготовления (Кшінп=0,4);
КСЛ - коэффициент, характеризующий надежность НП с учетом сложности i - ой степени интеграции относительно НП первого поколения, с минимальной зоной перехода, это размер матрицы активного поля транзисторов или логических ячеек;
КЯд - коэффициент, характеризующий надежность НП с учетом многоядерной структуры и протоколов мониторинга обмена данных и управления, включающих или отключающих ядра при сбоях в тестах, определяется по формуле Бернулли;
ККЭШ - коэффициент, характеризующий надежность НП с учетом многокэшевой структуры памяти и протоколов мониторинга обмена данных и управления, включающих или отключающих различные структуры уровней КЭШ-памяти при сбоях в тестах, определяется по формуле Бернулли;
ККОН - коэффициент, характеризующий надежность НП с учетом многоконвейерной структуры и протоколов мониторинга обмена данных и управления, включающих или отключающих различные уровни (ступени) конвейеров при сбоях в тестах, определяется по формуле Бернулли;
КМТ - коэффициент, характеризующий надежность НП с учетом дополнительных микротехнологий, обеспечивающих максимальную плотность упаковки операций в одном такте для данной разрядности, и протоколов мониторинга обмена данных, включающих или отключающих различные уровни операций упаковки при сбоях в тестах, определяется по формуле Бернулли;
ККЧ - коэффициент, характеризующий надежность НП с учетом конфигураций частот системной шины данных, увеличивающих или уменьшающих (замедляющих) частотные режимы работы процессора при сбоях в тестах с учетом нагрузочной функциональной способности, зависит от величин тактовых частот, задержек динамических сигналов, определяющих работоспособность НП, соответствует коэффициенту электрической нагрузки по частоте (Ккч = 0,7 для ЦСП, НП, МК, ПЛИС); КНап - коэффициент, характеризующий надежность НП с учетом потребляемой мощности относительно номинального значения и чувствительности электрических параметров, зависит от величины напряжения питания 5v-0,7v (Кнап(5у)=1,0; Кнап(3,Зу)=0,7;Кнап(2,5у)=0,5; Кнап(0,9у)=0,2), определяющего работоспособность НП;
ККОР - коэффициент, характеризующий надежность НП с учетом типа и материала корпуса, его конструкции, технологии герметизации;
КВЫВ - коэффициент, характеризующий надежность НП с учетом типа и количества соединений (выводов), их длины, шага и диаметра;
КЭКС - коэффициент, характеризующий надежность НП с учетом
климатических и механических режимов работы i - го ЭРИ;
КТ - коэффициент, характеризующий надежность НП с учетом влияния температурного режима работы;
КПР - коэффициент, характеризующий зависимость надежности НП от вида приемки (9, 5, 1), группы использования (космическая, военная, индустриальная, коммерческая) и от степени освоенности норм технологического процесса.
Применение коэффициентного подхода позволяет проводить независимый анализ различных компонентов ОТМНС, используя данные, полученные при испытаниях подобных элементов и структур, что значительно упрощает анализ надежности изделий.
При определении коэффициентов влияния целесообразно использовать различные статистические методы анализа отказов и построения зависимостей для поправочных коэффициентов. Статистические методы анализа отказов при проведении испытаний на надежность используются для оценки степени влияния тех или иных факторов (электрических, тепловых, климатических, механических, степени интеграции, применяемой
элементной базы, степени отработки технических средств) на численные значения показателей безотказности и установления характера этих влияний.
Декомпозиция полной модели безотказности на отдельные компоненты ненадежности, приведенная с учетом основных причин и механизмов отказов, возникающих в НП, позволяет легко и просто оценивать и сравнивать различные варианты построения ОТМНС. При этом каждый компонент ненадежности в модели описывается простыми аналитическими функциями или числовыми соотношениями. Выводы зависимостей значений коэффициентов влияния для основных компонентов ненадежности определяются на основании частных физико-статистических моделей.
За последние годы предложено несколько методов построения зависимости интенсивности отказов МП от сложности (для НП пока этот вопрос не рассматривался, так как практически нет исходных данных). При анализе этих методов было отмечено, что малая чувствительность моделей расчета интенсивности отказов к изменению степени интеграции приводит к большим ошибкам, примерно на три порядка. Эти ошибки вызывают недопустимо высокие погрешности при оценке надежности ОТМНС.
Анализ показал, что ошибки возникают при осцилляции (выпячивании) алгоритма расчета, а также из-за недостаточной гибкости метода расчета при стремительном увеличении степени интеграции в НП. Данные анализа надежности систем, выполненных на НП одной серии, показали, что если НП имели единую технологию изготовления; одинаковые электрические характеристики, такие как, время цикла, разрядность, потребляемую мощность; идентичные температурные, климатические и механические воздействия, но разную степень интеграции, то безотказность их была разной.
Исследования зарубежных методов показывают, что сложность НП является одним из основных критериев, используемых при расчете надежности. Для построения зависимости надежности от сложности НП необходимо определить индикатор, который более точно характеризует сложность НП. Следует отметить, что все компоненты НП формируются в едином технологическом процессе и технологические операции воздействуют на весь кристалл в целом. В результате структура и свойства компонентов НП получаются сравнительно идентичными и взаимозависимыми, поэтому можно представить всю структуру в виде однородного активного поля, параметры которого взаимосвязаны и зависят от общих показателей структуры (глубины диффузии, концентрации примесей).
Многие физические характеристики активного поля НП, такие, как геометрические размеры площади кристалла, общая длина металлизации, суммарная площадь окисной пленки и другие характеристики получить на этапе разработки аппаратуры очень трудно. Поэтому целесообразно за индикатор сложности НП принять степень интеграции (т.е. количество активных элементов n, расположенных на кристалле) и количество бит в ЗУ.
При использовании в качестве индикатора сложности общей площади кристалла, как предложено в зарубежных моделях расчета надежности МП, возникают большие ошибки, так как для увеличения вероятности выхода годных схем в МП вводят технологическую избыточность, которая используется по мере обнаружения дефектов в кристалле на этапе изготовления. Изолирование дефектов на кристалле за счет избыточности приводит к невозможности построения аналитической зависимости интенсивности отказов от площади кристалла, так как площадь при введении избыточности меняется нелинейно.
Наша задача, при определении коэффициента сложности НП с учетом выбранного индикатора, состоит в построении зависимости Кс(п) таким методом, который позволит вычислять значения его с достаточной точностью. Построенная функция должна проходить через экспериментально полученные точки и соответствовать физической сущности процесса изменения сложности. Форма функции должна быть гладкой (т.е. непрерывной и иметь несколько непрерывных производных), что соответствует постоянному совершенствованию физических процессов изготовления НП.
Используемые в настоящее время методы предполагают экспериментальное построение математической модели. Алгоритм построения зависимости Кс(п) в отличие от этих методов должен позволять на основании данных эксплуатации построить адекватную математическую модель. Эта модель должна описывать реальный физический процесс и по мере накопления данных автоматически уточняться.
В последнее время появился метод фрактального анализа, который можно использовать для построения зависимостей Кс(п). Этот метод довольно
интенсивно развивается в последнее десятилетие и имеет ряд серьезных преимуществ перед классическими методами, он еще недостаточно разработан и изучен, поэтому его большие возможности еще не получили распространения в задачах надежности. В данной работе впервые предпринята попытка применить данный метод к определению функциональных зависимостей: коэффициента сложности от степени интеграции НП.
Стохастический процесс называется фрактальным, когда некоторые из его важнейших характеристик проявляют свойства масштабирования с соответствующими масштабными показателями (могут быть степенные соотношения). Это может быть процесс описывающий процесс развития микроэлектроники с учетом степени интеграции, который можно разделить на несколько неперекрывающихся интервалов размера m,
Х(т)(і) = 1/m xSmit=m(i-1)X(t) , значения i - интервалов усредняются.
Непрерывный во времени стохастический процесс Хt со стационарными приращениями Yi = Xi - Xi-1 c показателем Н (0,5 £ Н £ 1,0) для любого действительного положительного коэффициента расширения а считается:
- статистически самоподобными, если процессы Хt и перемасштабированный (с масштабом времени или пространства at) a-H Xat имеет одинаковые конечномерные плотности распределения вероятностей для всех положительных целых n:
- самоподобным второго порядка, если процессы Xat и aHXt имеют одинаковые статистические характеристики до второго порядка: среднее значение M[Xt] = М[Xat] / aH , дисперсию o2[Xt] = s2 [Xat] / a2H , корреляционнуюфункцию R(tt) = R(at; at)/ a2H ;
- асимптотически самоподобным второго порядка, если стохастические характеристики до второго порядка для Xat и aHXt одинаковы при а ®¥.
- фрактальная размерность d объекта определяется как d = lnN/ln1/p, где N
- количество самоподобных объектов/частей (вариантов себя), требуемых для охвата заданного d-мерного объекта; р- размер линейного масштаба охватываемых объектов.
- при построении зависимости Кс(п) - интенсивности отказов от степени интеграции НП целесообразно принять предположение, что значение поправочного коэффициента фрактальной размерности для соотношений смежных самоподобных процессов развития микроэлектроники XOi(t) для 5-7 поколений к Aoi(t) для 1-4 поколений, равно значению поправочного коэффициента фрактальной размерности для соотношений смежных самоподобных процессов развития наноэлектроники XOi(t) для 1-6 поколений к A,Oi(t) для 5 - 7 поколений процессов развития микроэлектроники, которые анализируются и управляются полумарковским процессом;