Экзафлопсный инструментарий симуляции процессов роста и физических свойств кремниевых наноструктур для современной наноиндустрии

Гергель Виктор Павлович; Линев Алексей Владимирович; Сатанин Аркадий Михайлович; Федосеев Дмитрий Викторович; Швецов Александр Владимирович

УДК 004.942, 004.272.26, 530.145

ЭКЗАФЛОПСНЫЙ ИНСТРУМЕНТАРИЙ СИМУЛЯЦИИ ПРОЦЕССОВ РОСТА И ФИЗИЧЕСКИХ СВОЙСТВ КРЕМНИЕВЫХ НАНОСТРУКТУР ДЛЯ СОВРЕМЕННОЙ НАНОИНДУСТРИИ

Нижегородский госуниверситет им. Н.И. Лобачевского

[email protected]

Поступила в редакцию 10.09.2012

Обсуждаются проблемы разработки экзафлопсных технологий симуляции процессов роста и физических свойств гигантских ансамблей атомов, составляющих кремниевые и гибридные нанокластеры на основе кремния и золота, являющиеся потенциально перспективными в оптоэлектронных и биологических приложениях. В качестве примера рассмотрены расчетные алгоритмы и программы для реализации методов молекулярной динамики и динамического метода Кона - Шэма в системах многоэлектронных кремниевых квантовых точек.

Ключевые слова: суперкомпьютерное моделирование, кремниевые нанокристаллы, оптоэлектроника, GPU, технология CUDA, параллельные вычисления.

Введение

Разработки научно-технического задела в области создания сверхмасштабируемого программного обеспечения суперкомпьютеров, ориентированного на эффективное функционирование на вычислительных системах со сверхвысокой степенью параллельности и экзаф-лопсным уровнем производительности в настоящее время вызывают повышенный интерес. Отчасти это связано с впечатляющим развитием быстродействия гетерогенных систем и явным отставанием разработки соответствующего программного обеспечения. Побудительной причиной внимания к вычислительным системам эк-зафлопсного уровня также являются практические потребности в инструментарии высокоэффективного и сверхпроизводительного компьютерного моделирования физических процессов оптического и транспортного характера. Такое моделирование напрямую связано с попытками создания оптоэлектронных устройств и элементов интегральной оптики нового поколения, которые позволят радикально повысить степень интеграции и быстродействие интегральных схем. Для решения возникающих задач необходим предварительный анализ систем, основанный на компьютерной симуляции различных процессов, в них происходящих.

В данной работе мы обсудим опыт создания прототипов технических решений экзафлопсной симуляции процессов роста и физических свойств гигантских ансамблей атомов, состав-

ляющих кремниевые нанокристаллы и гибридные нанокластеры на основе кремния и золота, являющиеся потенциально перспективными в оптоэлектронных и биологических приложениях.

Моделирование кремниевых наноструктур и современные гетерогенные вычислительных системы

Кремниевые нанокристаллы составляют основу современной микроэлектроники, а также используются для диагностики биологических объектов. Проблема моделирования на атомном уровне актуальна при проектировании кремниевых наночастиц, которые играют важную роль при создании активных оптических элементов -квантовых точек - легированных кремниевых нанокристаллов, оптические свойства которых существенно отличаются от свойств массивных образцов. Такие структуры могут быть положены в основу оптической памяти нового поколения, устройств оптической передачи информации и т.д. Важное значение в современной нанотехнологии отводится структурам, создаваемым на основе материалов с сильно различающимися электронными свойствами, например, на основе кремния и золота. Прогресс в этом направлении активно обсуждается в последнее время [1-4]. Привлекательной выглядит идея управляемого переноса возбуждений по массиву кремниевых нанокристаллов за счет миграции отдельных возбужденных носителей или

экситонов [5-8]. При этом металлические наночастицы, взаимодействующие с кремниевыми нанокристаллами, могут сыграть роль своеобразных «катализаторов» для этих процессов.

Кажется совершенно естественным, что исследователи из Института Технологии производства при Китайской Академии Наук (СЛ8-1РБ) выбрали для демонстрации возможностей суперкомпьютера Т1апЬе-1Л моделирование нанокристалла кремния, состоящего из 110 миллиардов атомов с беспрецедентной скоростью в 1.87 петафлопс [9]. Проведенные расчеты нацелены на улучшение технологии получения и использования кристаллического кремния, используемого в качестве основного материала в солнечных панелях и в полупроводниковой электронике. Поставленный численный эксперимент задает уровень возможностей современных компьютерных технологий.

Можно ли ожидать качественно новых эффектов в наноструктурах, например, возникновения у них новых свойств, которые будут иметь место при увеличении числа атомов от сотен тысяч (моделируемых на терафлопсных компьютерах) до нескольких миллиардов частиц (когда необходимы экзафлопсные технологии моделирования)? Из физических соображений следует, что принципиальную роль в формировании квантовых электронных состояний в нанообъектах играет оксидная диэлектрическая (или полупроводниковая) матрица, в которой формируются ансамбли нанокристаллов кремния и наночастицы золота. В настоящее время, при использовании первопринципных методов расчета, отработанный подход к проблеме учета влияния диэлектрического окружения нанокристаллов состоит в моделировании и расчете так называемой «суперячейки», состоящей из нанокристалла и окружающих его атомов диэлектрической матрицы. Однако размер диэлектрического окружения в суперячейке, как правило, не превышает одного-двух атомных монослоев, что явно недостаточно для корректного описания влияния окружающей матрицы на свойства нанокристалла. Увеличение размера суперячейки до сих пор сдерживалось недостаточной мощностью расчетных технологий, требующих для этих целей огромных временных затрат. Переход к экзафлопсным технологиям позволит радикально сократить время вычислений, что, в свою очередь, даст возможность увеличить размер не только самих нанокристалов, но и окружающей их ячейки до размеров, соответствующих реальным системам.

Принципиальная проблема, возникающая на пути увеличения числа частиц, состоит в том,

что состояния электронов и ионов в наночастицах характеризуются большим числом степеней свободы, поэтому в общем случае оказывается невозможным прямое численное интегрирование соответствующего уравнения Шредингера. Выход из положения был найден в работе Кона и Шэма [10], где предложено использовать электронную плотность вместо волновой функции для расчета основных характеристик системы. Идея Кона и Шэма позволяет переформулировать У-частичное уравнение Шредингера в виде системы У-связанных одночастичных уравнений Шредингера, решения которых определяют электронную плотность. Теория Кона

- Шэма (метод функционала плотности) лежит в основе современных расчетов электронных свойств конденсированных систем [11]. Поскольку электронная плотность - это скалярная функция трех пространственных переменных и времени, ее расчет возможен для больших атомных кластеров. В настоящее время именно метод Кона - Шэма реализован в виде стандартных пакетов, позволяющих изучать электронную структуру нанокластеров и рассчитывать транспортные характеристики нанообъектов (например, SIESTA, WIEN2K, Atomistix ToolKit и другие). Однако для моделирования нанокристаллов, состоящих из большого числа частиц, данные пакеты не могут быть использованы, поскольку в них отсутствует методология эк-зафлопсных технологий. Существует также большой класс ситуаций, когда нанокристаллы (квантовые точки) с высоким уровнем заселения квантовых состояний электронами подвергаются воздействию лазерного поля. Для систем во внешних полях отыскание нестационарной версии обменно-корреляционной энергии является нетривиальной задачей. В работах [12, 13] теория Кона - Шэма была распространена на случай нестационарных систем (см. обзорную статью [14]), однако такая схема пока не реализована в виде доступных прикладных программ.

В силу чрезвычайно высокой трудоемкости, расчеты поведения больших массивов атомов могут быть выполнены только на суперкомпью-терных системах транспетафлопсной (экзаф-лопсной) производительности. Вопросы создания экзафлопсных систем находятся только в процессе обсуждения, тем не менее, надо отметить, что одна из существенных проблем создания таких систем - это вопрос энергопотребления. Так, наиболее быстродействующий на данный момент времени суперкомпьютер К-ком-пьютер (Япония) имеет энергопотребление порядка 10 МВт, что сопоставимо с энергопотреб-

лением отдельных районов современных городов. Одно из направлений для решения проблемы энергопотребления - это использование гибридной архитектуры для построения суперкомпьютеров. Среди 5 лучших мировых наиболее быстродействующих вычислительных систем 4 используют те или иные ускорители вычислений - прежде всего на основе новейших графических процессоров. Графические процессоры имеют в своем составе большое количество достаточно простых вычислительных ядер (что, в частности, резко снижает энергопотребление) и позволяют получать рекордную производительность вычислений для задач с низкой информационной зависимостью между параллельно выполняемыми частями вычислений.

Выявленная тенденция создания суперком-пьютерных систем - гибридность архитектуры

- определяет одну из самых главных проблем разработки программного обеспечения для таких систем. Во-первых, разрабатываемые методы и алгоритмы должны учитывать архитектурные особенности планируемых к использованию суперкомпьютеров. Во-вторых, разрабатываемые параллельные программы должны эффективно работать на огромном количестве -десятки миллионов - вычислительных ядер. В-третьих, гибридность архитектуры требует применения для разработки параллельных программ сразу нескольких вычислительных технологий - для распределенных вычислительных узлов технологии MPI, для процессоров с общей памятью - технологии OpenMP, и для графических процессоров - технологий CUDA и OpenCL. Подобная агрегация различных технологий представляет определенный вызов для исследователей и разработчиков в отношении возможности создания надежного и эффективно масштабируемого программного обеспечения для вычислительных систем экзафлопсного уровня (см. подробней [15-18]).

Рассмотрим конкретные примеры реализации сформулированных проблем с использованием суперкомпьютерных технологий.

Симуляция роста кремниевых наночастиц методами молекулярной динамики

Прежде всего, важно научиться моделировать процессы роста кремниевых наночастиц и предсказать какие наночастицы возникают в той или иной технологии их получения. К настоящему времени существует множество методов формирования нанокристаллов кремния: ионная имплантация; химическое осаждение из газовой фазы; магнетронное распыление; кол-

лоидный синтез и другие. Они позволяют создавать кремниевые кристаллиты с размерами преимущественно от 2 до 6 нм. Метод молекулярной динамики позволяет выполнять расчеты характеристик физических систем, состоящих из огромных массивов атомов. Основное упрощение состоит в выборе интерполяционного потенциала взаимодействия частиц, который должен правильно передавать характер их взаимодействия на атомных масштабах. В отличие от первопринципных подходов, когда расчет ведется на языке квантовой теории (требуется вычислять электронные волновые функции, обменную и корреляционную энергию и т.д.), метод молекулярной динамики позволяет работать со значительно большими системами частиц, а данные о получающихся структурах неплохо согласуются с экспериментом. В частности, такие потенциалы установлены для наиболее интересных для полупроводниковой технологии веществ: кремний-кремний, кремний-золото, кремний-кислород.

Подробнее обсудим моделирование роста наночастиц кремния из аморфной фазы. Проводимое исследование отражает методику получения нанокристаллов, разрабатываемую в НИФТИ, согласно которой нанокристаллы кремния образуются путем отжига сверхтонких слоев аморфного кремния (толщиной в несколько десятков нанометров). Кроме того, мы обсудим ситуацию, когда в качестве «затравочной» матрицы выступает диоксид кремния, а нанокристаллы кремния получаются путем отжига системы.

Процесс отжига моделируется добавлением случайной силы, действующей на атом, дисперсия которой пропорциональна температуре. Как известно, на опыте кристаллы кремния в матрицах диоксида светятся слабо (следствие эффекта непрямозонности в Бі), то для активации фотолюминесценции часто имплантацией в матрицу диоксида кремния вводятся атомы металла, чаще всего золота. Атомы золота формируют квантовые точки размером в несколько десятков нанометров. Поскольку система отжигается, то начальное положение атомов золота также можно моделировать как ансамбль частиц со случайным начальным положением и максвелловским распределением по скоростям.

Для описания взаимодействия между атомами кремния используется эмпирический анизотропный УТ потенциал Терсоффа (ІТегеоІЇ) [19]. Данный потенциал применим для расчёта энергии взаимодействия атомов с 8р3 гибриди-зованными внешними орбиталями, в том числе для кристаллов, состоящих из атомов элементов

IV группы. Параметры потенциала Терсоффа подбираются так, чтобы удовлетворить ряду экспериментальных фактов, в частности, требуя соответствие параметров численно «выращенной» алмазной решетки тем, которые измеряются методами рентгеновской дифракции. Согласно [19] взаимодействие атомов кремния и кислорода также характеризуется модифицированным потенциалом Терсоффа, параметры которого подобраны так, чтобы получающаяся согласно численным расчетам интерфейсная

подчиняются распределению Максвелла для заданной температуры Т.

Для обобщения модели на произвольное число компонентов в алгоритм молекулярной динамики были внесены изменения. Частицы разных типов хранятся в разных массивах, при расчёте потенциала происходит перебор по всем парам типов частиц. Суммирование взаимодействий между частицами двух типов происходит по обычной схеме. Блок-схема алгоритма приведена на рис. 1.

Вывод

данных

Рис.1. Блок-схема алгоритма молекулярной динамики для многокомпонентных систем

граница 81/8Ю2 согласовывалась с экспериментальными данными. Взаимодействие атомов золота между собой, а также с атомами кислорода и кремния можно описать парными эмпирическими потенциалами. Параметры потенциалов для указанных пар атомов приведены в работах [20-25].

Закон движения атома кремния массы т в поле других частиц определяется вторым законом Ньютона:

тГ г =-Уг/г . (1)

В выражении (1) градиент берётся по координате г-ой частицы. Решение системы дифференциальных уравнений второго порядка для всех частиц проводится с помощью позиционного метода Верле:

гг (/ + ДО = 2гг (/) - гг (/ - Д/) + Г (ОД/2 + о( Д/2). (2)

Данный метод имеет второй порядок точности по времени, однако он не является само-стартующимся. Для получения г*(Д/) выполняется несколько шагов интегрирования методом Эйлера с шагом Д/еы << Д/.

Считается, что по оси г система ограничена жёсткими стенками, а по осям х и у она бесконечна. Для моделирования бесконечного пространства воспользуемся периодическими граничными условиями. Начальное расположение атомов соответствует аморфному состоянию вещества, а проекции начальных скоростей

Для реализации задачи моделирования на системах с графическими ускорителями было проведено исследование алгоритма на предмет масштабируемости при использовании вРИ.

Исследование показало, что наиболее трудоемкой частью программы является этап вычисления сил, действующих на частицу. В ходе исследования алгоритма выяснилось, что данная часть программы может эффективно выполняться на графических ускорителях. Вследствие чего была реализована следующая схема распараллеливания:

- алгоритм распараллеливается по данным;

- каждый вычислительный поток графического ускорителя считает силу, действующую на одну частицу;

- вычисление новых координат частиц так же происходит на вРИ.

Например, для моделирования 10 частиц (при условии, что число соседей каждой части-

2 4

цы не превышает 10 штук) на протяжении 10

18

шагов по времени требуется выполнение 10 операций. Это позволяет говорить о применимости экзафлопсных вычислений в данной задаче. Возможность применения такого подхода обусловлена тем, что вычисление сил для каждой частицы может выполняться независимо, и, как следствие, не требуется никакой синхронизации. Анализ информационной структуры и временных затрат алгоритма и предложенной

схемы его распараллеливания показывает низкие значения ускорения и эффективности при определенных наборах параметров, однако обеспечивает хорошую масштабируемость при увеличении размеров задачи.

Разработанный программный компонент моделирования роста гигантских ансамблей нанокристаллов кремния и гибридных структур -кремниевых и золотых нанокластеров в оксидной матрице - показывает хорошую масштабируемость при запусках с использованием до 64 узлов (28672 ОРИ-ядер), обеспечивая на 64 узлах решение задачи моделирования с числом частиц, большим в 16 раз, за меньшее в 2,5 раза время по сравнению с запуском на 1 узле.

Моделирование массивов наночастиц с использованием параллельной версии метода Кона - Шэма на гибридных вычислительных комплексах

Как отмечено выше, актуальной задачей является разработка эффективного параллельного алгоритма, реализуемого на графических процессорных комплексах, для расчета оптических свойств многоэлектронных систем с использованием теории функционала плотности. Расчет свойств таких ансамблей первопринципными методами требует значительных вычислительных ресурсов, что объясняется как большим количеством узлов пространственной сетки, необходимым для расчета, так и значительным числом частиц (электронов) в рассматриваемых системах. Графические процессоры способны существенно уменьшить время расчетов, так как представляют собой сеть параллельно работающих процессоров и характеризуются высокой скоростью записи и чтения из памяти.

Отправной точкой теории функционала плотности является система N нестационарных уравнений Шредингера для электронных орбиталей фу(г, 1):

д

Ф j (г, t ) =

dt

2m

+ uks (rt )

Ф j (r, t), (3)

где

Uks (r, t) = u(r, t) + J d¥ ”(r, t\ + uxc (r, t)

J r _ r

Ir'-r |

складывается из потенциала внешнего поля u(r, t ), потенциала Хартри

г (r, t) = J d

3_' n(r', t)

Ir'-r I

и обменно-корреляционного потенциала

uxc(r,t) [12, 13]. Для аппроксимации uxc(r,t)

используется адиабатическое приближение локальной плотности [27]. В этом случае uxc зависит лишь от значения электронной плотности в данной точке в данный момент времени. Электронная плотность взаимодействующей системы может быть определена как сумма квадратов модулей всех одночастичных орбиталей, заполненных Np электронами,

np

n(r, t) = Х 1ф j (r, t)2|. (4)

j=i

В качестве тестового примера решения динамического уравнения Кона - Шэма (3) рассмотрена динамика электронных состояний в сферической квантовой точке. Результатом численного решения является фурье-образ дипольного момента системы

(e • r) = J e • n(r, t)rd3r,

который характеризует спектр возбуждений взаимодействующих электронов в квантовой точке.

При разработке параллельных алгоритмов важным моментом является анализ эффективности использования параллелизма, позволяющий построить теоретическую оценку ускорения вычислений и сделать выводы о работоспособности и применимости выбранных алгоритмов и подходов к их распараллеливанию. Для ускорения расчетов согласно (3) необходимо выбрать наиболее эффективную версию параллельного алгоритма. Как оказалось, наиболее эффективным является метод Рунге - Кутта 4-го порядка. Основное достоинство данного алгоритма состоит в том, что вычисление значений волновой функции в каждом узле сетки может выполняться независимо, а значит и параллельно. Метод Рунге - Кутта требует O(N) действий. Недостатком метода является то, что он явно не сохраняет норму волновой функции. Однако метод Рунге - Кутта допускает блочное разбиение пространства [28, 29]. При этом вычисление волновой функции на новом шаге по времени в каждом блоке происходит независимо от остальных. После чего требуется лишь пересылка значений волновой функции в граничных узлах для систем с распределенной памятью и всего лишь расширение блоков на граничные узлы для системы с общей памятью.

Численные эксперименты решения (3) проводились на кластере со следующим аппаратнопрограммным обеспечением: 2 CPU Intel Xeon X5670 2.93 ГГц, 6 ядер; 24 ГБ оперативной памяти; NVidia Tesla X2070; итерконнект QDR Infiniband; операционная система Clustrx T-Platforms Edition; компилятор Intel C++ Com-

piler XE 12.0. При выполнении экспериментальных исследований для 1-16 узлов использовались одинаковые наборы входных данных, для 17/34/68 узлов использовались наборы входных данных, отличающихся размером моделируемой сетки пропорционально используемому количеству узлов (19/37,9/75,8 млн узлов сетки соответственно). В запуске с максимальным количеством узлов (68) вычисления проводились на 30464 графических ядрах. Разработанный программный компонент показал хорошую масштабируемость в случае пропорционального изменения размера решаемой задачи (ускорение 0,73 при увеличении числа узлов с 17 до 64 с пропорциональным увеличением размеров задачи, что соответствует ускорению вычислений в 2,9 раза). При запуске с максимальным количеством узлов (68) вычисления проводились на 30464 графических ядрах.

Таким образом, на основе метода Рунге -Кутта может быть построен эффективный параллельный алгоритм решения нестационарного уравнения Кона - Шэма. Подробное обсуждение методики и полученные результаты будут изложены в отдельной статье.

Выводы

Обсуждаемые выше проблемы оптоэлектроники показывают, что для приложений требуется разработка экзафлопсных технологий вычислений, которые, позволяя оперировать с большими массивами частиц, дадут возможность получить все более детальное и точное описание физических систем. В качестве примеров приведена методика моделирования процесса роста и формирования нанокристаллов кремния в оксидной матрице методами молекулярной динамики. Разработан алгоритм моделирования динамики частиц кремния, связанных потенциалом Терсоффа. Предложена схема распараллеливания для систем с распределенной памятью гибридной архитектуры. Представлены данные предварительных вычислительных экспериментов, демонстрирующие производительность и масштабируемость решения. Программно реализован метод динамического функционала плотности для расчета отклика ансамблей нанокристаллов кремния в оксидной матрице. Показано, что наиболее эффективным для решения временного уравнения Шрединге-ра является метод Рунге - Кутта. Изучена возможность масштабирования данных схем на системах с распределенной памятью и описана реализации алгоритма на GPU. Приведенные примеры показывают эффективность использо-

вания экзафлопсных технологий вычислений для решения актуальных физических задач. Отметим, что в состав разработанного комплекса программ входят также блоки, описывающие процесс переноса возбуждений по массиву квантовых точек (детали изложены в [30]).

Работа поддержана госконтрактом № 07.514.11.4147 Минобрнауки.

Список литературы

1. Ebbesen T.W., Genet C., Bozhevolnyi S.I. // Phys. Today. 2008. 61. 44.

2. Zhang S., Genov D.A., Wang Y. et al. // Phys. Rev. Lett. 2008. 101. 047401.

3. Tassin P., Zhang L., Koschny T. et al. // Phys. Rev. Lett. 2009. 102. 053901.

4. Singh R., Rockstuhl C., Lederer F. et A. // Phys. Rev. B. 2009. 79. 085111.

5. Kawazoe T., Kobayashi K., Ohtsu M. // Appl. Phys. Lett. 2005. 86. 103102.

6. Belyakov V.A., Burdov V.A., Lockwood R., Meldrum A. // Adv. Opt. Tech. 2008. 279502.

7. Meldrum A., Lockwood R., Belyakov V.A., Burdov V.A. // Physica E. 2009. 41. 955.

8. Kim B.-H., Cho C.-H., Mun J.-S. et al. // J. Adv. Mat. 2008. 20. 3100.

9. Ge W., Hou C., Xu J., et al. Trans-scale simulation of silicon deposition process on tianhe-1A. Submitted to Supercomputing 2011. Nov. 12-18. Seattle. USA.

10. Kohn W., Sham L.J. // Phys. Rev. A. 1965. 140. 1133.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

11. Martin R.M. Electronic structure: basic theory and practical methods. University of Illinois, Urbana-Champaign, 2004.

12. Runge E., Gross E.K.U. // Phys. Rev. Lett. 1984. 52. 997.

13. Runge E., Gross E.K.U. // Phys. Rev. Lett. 1989. 55. 2850.

14. Сатанин А.М. Введение в теорию функционала плотности. Интернет-издание Нижегородского госуниверситета, 2009. 64 с.

15. Гергель В.П. Высокопроизводительные вычисления для многоядерных процессорных систем. Сер. Суперкомпьютерное образование. М.: Изд-во МГУ, 2010.

16. Линев А.В., Боголепов Д.К., Бастраков С.И. Технологии параллельного программирования для процессоров новых архитектур. Сер. Суперкомпью-терное образование. М.: Изд-во МГУ, 2010.

17. Гергель В.П., Фурсов В.А.. Лекции по параллельным вычислениям. Самара: СГАУ, 2009. 164 с.

18. Гергель В.П., Стронгин Р.Г. Опыт Нижегородского университета по подготовке специалистов в области суперкомпьютерных технологий // Вестник Нижегородского университета им. Н. И. Лобачевского. 2010. №3 (1). С. 191-199.

19. Tersoff J. New empirical approach for the structure and energy of covalent systems // Physical Review B. 1988. 37(12), 6991. APS.

20. Yasukawa A. // JSME Int. J. A. 39 1996. 313-320.

21. Umeno Y., Kitamura T., Date K. et al. // Computational materials science. 2002. 25. 447-45.

22. Nordlund K., Samela J. // Nuclear Instruments and methods in physics research B. 2009. 267. 1420-1423.

23. Dongare A.M., Zhigilei L.V., Rajendran A.M., LaMattina B. // Composites: Part B. 2009. 40. 461-467.

24. Ryu S., Cai W. // J. Phys.: Condens. Matter. 2010. Vol. 22. 055401. 8 p.

25. Watanabe T. et al. // Jpn. J. Appl. Phys. 1999. Vol. 38. L366.

26. Ohta H., Hamaguchi S. // J. Chem. Phys. 2001. 115. 6679.

27. Лундквист С., Марч Н. Теория неоднородного электронного газа. М.: Мир, 1987. 400 c.

28. O’Broin C., Nikolopoulos L.A.A. An OpenCL implementation for the solution of TDSE on GPU and CPU architectures // arXiv:1201.6062v1 [physics.comp-ph]. 2012.

29. Caplan R.M., Carretero R. Simulating the nonlinear schrodinger equation using the computational capability of NVIDIA Graphics Cards // ACSESS Proceedings. 2010. P. AP10-04.

30. Беляков В.А., Линёв А.В., Горшков А.В., Крылов И. Б. Моделирование релаксации массива кремниевых нанокристаллов по методу Монте-Карло с использованием графических ускорителей // Вестник ННГУ им. Н.И. Лобачевского. 2012.

EXAFLOP SIMULATION TOOLKIT FOR GROWTH PROCESSES AND PHYSICAL PROPERTIES OF SILICON NANOSTRUCTURES IN MODERN NANOINDUSTRY

V.P. Gergel, A. V. Linev, A.M. Satanin, D.V. Fedoseev, A V. Shvetsov

We discuss some problems of exaflop technology development for simulating growth processes and physical properties of giant atomic ensembles making up hybrid silicon nanoclusters based on silicon and gold, which are potentially promising in optoelectronic and biological applications. As an example, computational algorithms and programs are considered for the implementation of molecular dynamics methods and the Kohn-Sham method for systems of multi-electron silicon quantum dots.

Keywords: supercomputer simulation, silicon nanocrystals, optoelectronics, GPU, CUDA technology, parallel computing.