УДК 535.421
ОПРЕДЕЛЕНИЕ ТРЕБОВАНИЙ К ВЫЧИСЛИТЕЛЬНОЙ СИСТЕМЕ ДЛЯ СИНТЕЗА ГОЛОГРАММ
Сергей Александрович Шойдин
Сибирский государственный университет геосистем и технологий, 630108, Россия, г. Новосибирск, ул. Плахотного, 10, кандидат физико-математических наук, доцент кафедры наносистем и оптотехники, тел. (383)343-91-11, e-mail: kaf.nio@ssga.ru
Артем Левонович Пазоев
Сибирский государственный университет геосистем и технологий, 630108, Россия, г. Новосибирск, ул. Плахотного, 10, магистрант кафедры наносистем и оптотехники, тел. (383)343-91-11, e-mail: kaf.nio@ssga.ru
В работе определены требования к вычислительной системе, пригодной для синтеза голограмм в среде Matlab. Экспериментально найдена зависимость времени вычисления функций, определяющих структуру голограмм, от их размеров. Экстраполяцией полученных результатов найдены требования к вычислительным системам, пригодным для синтеза голограмм в среде Matlab в реальном времени.
Ключевые слова: голограмма, цифровая голография.
DEFINITION OF REQUIREMENTS TO COMPUTER SYSTEMS FOR SYNTHESIS COMPUTER HOLOGRAMS
Sergey A. Shoydin
Siberian State University of Geosystems and Technologies, 630108, Russia, Novosibirsk, 10 Plakhotnogo St., Ph. D., associate Professor of the Department of Nanosystems and Optotech-nics, tel. (383)343-91-11, e-mail: kaf.nio@ssga.ru
Artem L. Pazoev
Siberian State University of Geosystems and Technologies, 630108, Russia, Novosibirsk, 10 Plakhotnogo St., undergraduate of the Department of Nanosystems and Optotechnics, tel. (383)343-91-11, e-mail: kaf.nio@ssga.ru
The work shows the requirements for the computer system, necessary for the synthesis of holograms in Matlab programming environment. The dependence time of the computation has been found experimentally. Extrapolation of the results obtained has revealed the requirements for computational systems suitable for the synthesis of holograms in the Matlab environment in real time.
Key words: hologram, digital holography.
В голографии изображения реальных объектов записываются с большой плотностью информации на единицу площади записывающего материала [1]. Таким образом, реальные объекты, например формата А4, могут требовать до 1010-1012 байт на кадр. Массивы таких размеров слишком велики для прямых вычислений. В настоящей работе ставилась цель определения параметров компьютеров (PC), пригодных для указанных процессов.
На рис. 1 приведена блок схема универсального (не специализированного на работе только с изображениями) компьютера [2]. Там же показан порядок процессов проходящих при вводе данных, обработке, сохранении и визуализации изображений в компьютере. Компьютер состоит из семи основных структурных блоков: устройства ввода (а), устройства вывода (б), накопитель информации (постоянная память) (в), оперативная память (г), центральный процессор (д), графический процессор (е), и системная шина (ж), которая объединяет все структурные блоки.
Рис. 1. Блок-схема ПК
Порядок работы устройства заключается в следующем:
1) ввод информации в память компьютера;
2) загрузка информации из постоянной памяти в оперативную память компьютера перед обработкой;
3) запрос данных процессором из оперативной памяти для их последующей обработки;
4) обработка данных процессором;
5) загрузка обработанных процессором данных в оперативную память;
6) запись обработанных данных из оперативной памяти в накопитель информации;
7) отправка данных на плату видеокарты для преобразования их в графическую информацию, предназначенную для визуализации на мониторе;
8) подготовка графических данных видеокартой для отправки на устройства вывода (монитор);
9) отправка графической информации на устройство вывода (монитор).
В качестве тест-объекта было выбрано изображение в виде двумерной функции Гаусса. Исследовался режим синтеза изображения по известному алгоритму, который состоит из двух процессов - синтеза массива данных по известной аналитической зависимости (функции Гаусса) и запись вычисленного массива в оперативную память.
Первоначально были измерены значения временных затрат на вычисление значений функции Гаусса и резервирования места для этих значений в оперативной памяти PC для нескольких компьютеров (рис. 2).
На рис. 2 приведены значения измеренного времени вычисления массива изображения (ось ординат) в зависимости от размера матрицы изображения N2 (ось абсцисс) для: а) всего диапазона измеренных величин и б) в первых 10 % массива. Измерения проводились для нескольких PC. В таблице показаны основные характеристики, влияющие на выполнение исследуемых команд, и производительность согласно тесту GPGPU из программы AIDA64 [3] (сборка AIDA64 Engineer Edition 5.75.3958 Beta от 07.09.2016) для всех исследованных компьютеров.
а)
б)
Рис. 2. Значения измеренного времени в зависимости от размера матрицы
изображения N . Измерения проводились для нескольких PC:
а) весь диапазон измеренных величин; б) график увеличен в 10 раз, в окрестности нуля
Таблица
Основные характеристики, влияющие на выполнение исследуемых команд, и производительность согласно тесту GPGPU всех исследованных компьютеров
Номер PC на графике Основные характеристики Производительность, ГФлопс (109 опер./сек.)
Центральный процессор Оперативная память
1 Intel Core I5-4460 (3181 МГц, 4 ядра, Кэш 1024/6144/64 кб) DDR3, PC10600, 2х8 Гб 406,8
2 Intel Core i7-2600K (3412,2 МГц, 4 ядра, Кэш 64/1024/8192 кб) DDR3, PC10600, 4х2 Гб, 1333 МГц 216,7
3 AMD Athlon X4-860K (3890,1 МГц, 4 ядра, Кэш 4096/64 кб) DDR3, PC19200, 4х4 Гб, 1600 МГц 124,0
4 Intel Core i3-530 (2926,4 МГц, 2 ядра, Кэш 32/256/4096 кб) DDR3, PC10600, 4х1 Гб, 1333 МГц 46,77
5 Intel Core 2 Duo E6400 (2135 МГц, 2 ядра, Кэш 64/2048 кб) DDR2, PC6400, 2х1 Гб, 400 МГц 34,08
6 AMD Athlon 64 3000+ (2009,2 МГц, 1 ядро, Кэш 128/512 кб) DDR, PC3200, 1+0,5 Гб, 200 МГц 7,95
7 Intel Celeron-S A80530 (868,6 МГц, 1 ядро, Кэш 16/256 кб) SDRAM, PC133, 1х256 Мб 2,91
Видно (рис. 2), что рост времени в среднем почти линейно зависит от размера матрицы. Три графика (5, 6, 7) с наибольшим ростом временных затрат относятся к устаревшим моделям компьютеров. Операции с большими изображениями на них бесперспективны и в дальнейшем мы их не будем использовать в нашей задаче. На кривых с меньшим ростом временных затрат (1, 2, 3, 4) графики имеют существенные изломы, причина которых требует дополнительного изучения.
Действительно, если производить измерения чаще, то значения суммарного времени вычисления массивов размерности NN для графика 3 рис. 2, б (РС № 3, таблица) дали результаты, приведенные на рис. 3.
t(N2), sec.
Рис. 3. График для компьютера № 3 (таблица) при единичной дискретизации
по всему диапазону значений N
Точки на графике (рис. 3) группируются не одинаково. Зрительно просматривается три прямых луча и один с г-образными изломами. Природа изгибов не вполне ясна. Из полученных графиков можно сделать выводы о необходимых параметрах вычислительного устройства. Экстраполируем полученные данные [4] и получаем, что требуемое время для вычисления изображения размером 1010 точек около 5-14 минут (рис. 4).
Рис. 4. Экстраполяция для времени вычисления массива изображения,
размером до 1010 точек
Требуемая емкость оперативной памяти может быть оценена с использованием диспетчера задач Windows. Это было определено как 24 байта на точку изображения. Для требуемых 1010 точек это около 225 Гб. Это может быть реализовано, например, на материнских платах от производителя Supermicro и оперативной памяти формата DDR3.
Для больших голографических изображений, порядка 1012 точек указанные параметры существенно превосходят доступные возможности исследованных универсальных вычислителей (PC). Для более полного изучения проблемы синтеза голограмм требуется в дальнейшем изучить проблему биений измеряемого времени вычисления изображений (рис. 3), с целью правильного усреднения полученного разброса данных для экстраполяции на значительные удаления. Также, для более точной экстраполяции желательно проверить разработанные алгоритмы на более мощных вычислительных компьютерах, в частности, с большим количеством оперативной памяти.
БИБЛИОГРАФИЧЕСКИЙ СПИСОК
1. Шойдин С. А. Исследование влияния аберраций оптической системы на плотность записи информации в голографических запоминающих устройствах : дис. ... к.ф.-м.н. / Государственный оптический институт им. С. И. Вавилова. - СПб., 1983.
2. Шауцукова Л. З. Информатика 10-11. - М. : Просвещение, 2004. - 420 с.
3. AIDA64 - программа для определения железа компьютера, тестирования и мониторинга [Электронный ресурс]. - М., 2010-2017. - Режим доступа: http://www.aida64.ru. (дата обращения: 31.03.2017).
4. Ахиезер Н. И. Лекции по теории аппроксимации. - М. : Наука, 1965. - 408 с.
© С. А. Шойдин, А. Л. Пазоев, 2017