Научная статья на тему 'Нейросетевое сжатие видеоизображений'

Нейросетевое сжатие видеоизображений Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
168
21
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
NEURAL NETWORK / PSNR / DISCRETE COSINE TRANSFORMATION / KOHONEN NETWORK / KARUNEN-LOEW TRANSFORMATION / IMAGE COMPRESSION

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Зайцев С.С.

В статье освещаются вопросы нейросетевой обработки изображений. Рассматривается возможность компрессии изображений при помощи нейронных сетей.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

NEURAL NETWORK COMPRESSING OF VIDEO IMAGES

The article covers the issues of neural network image processing. The possibility of image compression with the help of neural networks is considered.

Текст научной работы на тему «Нейросетевое сжатие видеоизображений»

wheeled vehicle equipped with a locked drive. This is due to the greater slippage of the wheels of a vehicle equipped with a differential drive, compared to a vehicle equipped with a locked drive.

With good adhesion and the presence of a kinematic disparity, the efficiency of a wheeled vehicle equipped with a locked drive has lower values, compared to the efficiency of a vehicle equipped with a differential drive.

If there is a kinematic disparity with a simultaneous deterioration in the adhesion, the efficiency the wheeled vehicle equipped with a locked interaxle drive is further reduced compared to the movement of the vehicle under the same conditions, but without a kinematic disparity. With a complete loss of adhesion by the wheels of one of the axles, a vehicle equipped with a differential interaxial drive can't get off the place, so the efficiency in this case equals to 0.

Conclusions:

1. The obtained dependences correspond to the known data on the properties of the differential and

locked drive, what confirms the correctness of the chosen approach.

2. The offered criterion allows to carry out a choice of type of the interaxial drive on the basis of quantitative comparison of indicators.

REFERENCES:

1. Smirnov G.A., Kupreyanov A.A., Guchkov D.K. About a choice of rational schemes of system "transmission - driving machine" of all-wheel drive cars. "Automobile industry". - 1984.- No. 5.- P. 15-17.

2. Barykin A.Y. Self-locking differential: the probability and ways of using the adhesion of wheels with the road. "Automobile industry "- 2004.- No. 9.-P. 17-21.

3. Andreev A.F., Vantsevich V.V., Lefarov A.Kh. Differentials of wheel vehicles. - M.: Machine building, 1986. - 176 p.

4. Efimov A.V., Kireev S.O., Korchagina M.V. A mathematical model for estimating the type of in-teraxle drive. Problems of machine building and machine reliability. - 2018. - No. 1. - P. 94-100.

NEURAL NETWORK COMPRESSING OF VIDEO IMAGES

Zaitsev S.S.

Student

Moscow Aviation Institute (National Research University) НЕЙРОСЕТЕВОЕ СЖАТИЕ ВИДЕОИЗОБРАЖЕНИЙ

Зайцев С.С.

Студент

ФГБОУ ВО Московский авиационный институт (национальный исследовательский университет),

Москва

Abstract

The article covers the issues of neural network image processing. The possibility of image compression with the help of neural networks is considered.

Аннотация

В статье освещаются вопросы нейросетевой обработки изображений. Рассматривается возможность компрессии изображений при помощи нейронных сетей.

Keywords: neural network, PSNR, discrete cosine transformation, Kohonen network, Karunen-Loew transformation, image compression.

Ключевые слова: нейронная сеть, PSNR, дискретное косинус преобразование, сеть Кохонена, преобразование Карунена-Лоэва, сжатие изображений.

Хорошо известно, что изображения, вследствие своей двухмерности и многоспектральности, занимают очень большой объём памяти и их компактное хранение (архивация) представляет серьёзную проблему. В связи с этим актуальной научно -технической проблемой является разработка и создание средств для компрессии и декомпрессии видеоданных.

Проблема сжатия изображений и видеопоследовательностей актуальна также при создании центров хранения, архивов и каталогов (баз данных) изображений и видеопоследовательностей в цифровом виде (медицинские изображения, космиче-

ские изображения, получаемые при помощи датчиков дистанционного зондирования, фотоизображения и др.). Решение этой проблемы позволит уменьшить объем информации, хранимой на носителях.

Задачу сжатия изображения можно представить следующим образом. Цифровое изображение представляет из себя двумерный массив данных размером. Если за М обозначить количество строк, а за N - количество столбцов, то можно компактно записать полное цифровое изображение в виде матрицы:

fix, у) =

f(0,0) f(Xff)

f(0,1) fill)

f(0,N -1) f(1,N-1)

[(М-1,0) [(М-1,1) - ¡(М-1,Ы -1).

Задача сжатия изображения состоит в том, чтобы наиболее экономично представить изображение последовательностью двоичных символов, удовлетворяя некоторым дополнительным условия. Дополнительные условия заключаются в том.

чтобы можно было в точности восстановить изображение по полученной последовательности, либо в допустимой мере искажения изображения при его восстановлении по отношению к исходному.

Для выполнения процесса сжатия изображений предлагается использовать рекуррентную нейронную сеть следующей архитектуры:

Рис. Архитектура нейронной сети

Разработанная нейронная сеть имеет следующую архитектуру:

• кодера E;

• декодера D;

• бинаризатора B.

За основу кодера и декодера была взята модель рекуррентной нейронной сети. Входные изображения сначала кодируются, а затем преобразованные в двоичные коды, которые могут быть сохранены или переданы в декодер. Сеть декодера создает оценку исходного входного изображения на основе полученного двоичного кода. Мы повторяем это процедура с остаточной ошибкой: разница между исходным изображением и реконструкцией декодера.

Рассмотрим, что делает данная модель на шаге

f.

bt = B(Et(rt-1)),xct = Dt{bt) + Yxt-i,rt _ x -~ Xt, -~ x, x0 - 0.

Здесь Dt и Et играют роль декодера и кодера с их текущем состоянием на шаге соответственно, bt - сжатые данные в двоичном формате, xt -оценка реконструированного изображения и наконец t - отклонение реконструированного изображения от начального.

На каждом шагу В создает битовый поток bt Е {-1; 1}т, здесь m - количество бит, полученные после каждой итерации. После к итераций мы получим тх к бит. Поскольку данная модель полностью сверточна, т является линейной функцией входного размера. Для частей изображений 32 х 32,т = 128.

В данном алгоритме применена одна из модификаций LSTM под названием управляемые рекуррентные нейроны (Gated recurrent units, GRU). В ней фильтры «забывания» и входа объединяют в один фильтр «обновления» (update gate). Кроме того, состояние ячейки объединяется со скрытым

состоянием, есть и другие небольшие изменения. Построенная в результате модель проще, чем стандартная LSTM.

Рис. Модуль GRU

2Ь = а(Ш2 • [Ъ-^хЛ),

Ъ = 1апк(Ш •[п*Ъ-1,хф, Ъ = (1- г^ * + Ъ.

Рекуррентные модули, используемые для создания кодера и декодера, включают в себя два сверточных ядра: один на входном слое, который поступает в блок из предыдущего слоя, а другой -на слое состояния, который обеспечивает повторяющийся характер модели. В строгом виде данный алгоритм записывается следующим образом:

1. Принять за начальный остаток И [0] исходное изображение /: Д[0] = I

2. Установить счетчик I = 1 для первого шага

3. Шаг[ 1] принимает И[I — 1] в качестве входного параметра и запускает кодер и бинаризатор для получения сжатого изображения В [¿]

4. Шаг[[] декодер из сжатого изображения В [¿] реконструирует изображение Р [¿]

5. Остаток на Шаге[[] расчитывается: R[i] = I - P[i]

6. Установить счетчик i = i + 1 и перейти к шагу 3

Для реконструкции изображения был выбран подход под названием однократная реконструкция (One-shot Reconstruction). Этот метод прогнозирует полное изображение после каждой итерации декодера (у = 0). Каждая последующая итерация имеет доступ к большему количеству битов, генерируемых кодером, что позволяет улучшить реконструкцию. Несмотря на попытки восстановить исходное изображение на каждой итерации, на следующий шаг передается только результат предыдущей итерации. Это уменьшает количество весов, и эксперименты показывают, что прохождение как исходного изображения, так и остатка не улучшает реконструкцию.

СПИСОК ЛИТЕРАТУРЫ:

1. Гонсалес Р., Вудс Р. Цифровая обработка изображений. // Пер. с англ,-Москва.- Техносфера. 2006. -1072 с.

2. Круглов В.В., Дли М.И., Голунов Р.Ю. Нечеткая логика и искусственные нейронные сети. М.: Наука, 1998. 221 с.

3. Осовский С. Нейронные сети для обработки информации / пер. с польского И.Д.Рудин-ского. - М.: Финансы и статистика, 2002. - 344 с.

4. Сэломон Д. Сжатие данных, изображений и звука// М. - Техносфера.- 2004.-368 с.

5. Уоссермен Ф. Нейрокомпьютерная техника: Теория и практика: Пер. с англ. М.: Мир, 1992. 240 с.

STABILITY OF CHEMICAL REACTOR IN THE BIG

Maevsky V.

Candidate of technical sciences, assistant professor, associate professor of the Department of Information Systems and Technologies of Yaroslavl State Technical University, Russia, Yaroslavl

ИССЛЕДОВАНИЕ ДИНАМИЧЕСКИХ ХАРАКТЕРИСТИК ХИМИЧЕСКОГО РЕАКТОРА В

АДИАБАТИЧЕСКОМ РЕЖИМЕ

Маевский В.К.

Кандидат технических наук, доцент, доцент кафедры информационных систем и технологий ярославского государственного технического университета, Россия, Ярославль

Abstract

The study of the dynamic characteristics of a chemical reactor in the adiabatic mode of operation The research is conducted on a mathematical model of the reactor by the simulation environment in AnyLogic.

Аннотация

Рассмотрено исследование динамических характеристик химического реактора в адиабатическом режиме работы. Исследование проводится на математической модели реактора методом имитационного моделирования в среде AnyLogic

Keywords: dynamic characteristics, chemical reactor, adiabatic mode of operation, mathematical model, simulation, of AnyLogic.

Ключевые слова: динамические характеристики, химический реактор, адиабатический режим работы, математическая модель, имитационное моделирование, AnyLogic.

Работа посвящена исследованию динамических характеристик химического реактора в адиабатическом режиме. Рассматривается химический реактор для получения синтетического каучука. Особенностями рассматриваемого реактора являются: высокая скорость полимеризации с высокой скоростью тепловыделения; налипание полимера на стенки реактора в ходе полимеризации; необходимость поддержания температуры и основного мономера в зоне полимеризации в определенных диапазонах для обеспечения качества полимера.

Процесс получения каучука в реакторе циклический: в реактор непрерывно подаются шихта (раствор мономеров) и катализаторный раствор, а отводится полимеризат (полимер с остатками шихты и катализатора). Перемешивание в реакторе

обеспечивается осевым насосом, установленном в нижней части реактора.

Работа реактора возможна в двух режимах: изотермическом и адиабатическом. В изотермическом режиме работы тепло из реакционной зоны отводится хладоагентом, находящемся в рубашке реактора и охлаждающем стакане, находящемся внутри реактора. В ходе работы реактора на его стенки внутри реактора налипает полимер, который ухудшает теплопередачу. Для очистки теплопере-дающих поверхностей реактора от налипающего в ходе полимеризации полимера реактор снабжен скребковой мешалкой. При значительном ухудшении теплопередачи становится невозможным поддержание необходимой температуры в зоне полимеризации. Поэтому периодически реактор ставят

i Надоели баннеры? Вы всегда можете отключить рекламу.