Научная статья на тему 'Методы распознавания образов при нарушениях семантической целостности визуальной информации'

Методы распознавания образов при нарушениях семантической целостности визуальной информации Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
475
54
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
КОМПЬЮТЕРНОЕ ЗРЕНИЕ / СЕМАНТИЧЕСКАЯ ЦЕЛОСТНОСТЬ / ИНФОРМАЦИОННАЯ БЕЗОПАСНОСТЬ / ВИЗУАЛЬНАЯ ИНФОРМАЦИЯ / РАСПОЗНАВАНИЕ ОБРАЗОВ / COMPUTER VISION / SEMANTIC INTEGRITY / INFORMATION SECURITY / VISUAL INFORMATION / PATTERN RECOGNITION / computer vision / semantic integrity / information security / visual information / pattern recognition

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Ким Ю.В., Матвеева А.А., Викснин И.И.

Рассмотрены вопросы компьютерного зрения с целью последующего внедрения его в управление транспортными средствами и автоматизации движения. Предложены методы распознавания объектов и участников дороги. Выделены три основных этапа распознавания образов на изображении: подготовка изображения к анализу, анализ, классификация объектов. Для каждого этапа проведен поиск путей повышения качества распознавания образов и сохранения семантической целостности визуальной информации. На первом этапе предложено использование нормирования, позволяющее сделать объекты изображения нечувствительными к изменениям освещенности. Для решения задачи анализа разработан метод кластеризации на основе k -средних и роя частиц, обеспечивающий автоматическую настройку параметров кластеризации. На этапе классификации объектов предложено использовать каскады Хаара с нормированной обучающей выборкой. Это обеспечивает унификацию изображений и позволяет использовать обучающую выборку меньшего объема. Для обучения и тестирования использованы изображения автомобилей, предоставленные лабораторией Стэнфордского университета и находящиеся в открытом доступе. С целью проверки эффективности разработанного алгоритма распознавания образов были размыты 300 тестовых изображений. Выполнено сравнение результатов работы предложенного алгоритма с результатами работы каскадов Хаара без нормированной обучающей выборки и без дополнительной подготовки изображения к классификации. Каскады Хаара с ненормированной обучающей выборкой обеспечили корректное распознавание автомобиля в 8% случаев, в то время как предложенный алгоритм приводил к распознаванию в 72% случаев, включая эти 8% изображений. Сохранение семантической целостности визуальной информации является важным аспектом в контексте дорожного движения, так как неверное детектирование объектов дороги может привести к непоправимым последствиям. Предложенный алгоритм анализа изображений позволяет уменьшить вероятность возникновения ошибок в распознавании образов.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Ким Ю.В., Матвеева А.А., Викснин И.И.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

PATTERN RECOGNITION METHODS IN CASE OF VISUAL INFORMATION SEMANTIC INTEGRITY VIOLATIONS

We consider computer vision issues with a view to embed it into vehicles and automate the traffic process by detecting of objects and road users. Three basic stages of pattern recognition in the image are enumerated: image preparation for analysis, analysis, object classification. The search of methods that improve pattern recognition quality and provide visual information semantic integrity was carried out respectively for each stage. We propose to use normalization for the first stage, which allows making image objects insensitive to the light changes. For the second stage clustering method based on particle swarm optimization and k-means was developed that provides automatic tuning of clustering parameters. During the third stage Haar cascades with normalized training samples are proposed for application providing object unification and giving an opportunity to use less amount of training samples. Car images provided by Stanford University laboratory and publicly available were used for training and testing. To assess the effectiveness of the developed pattern recognition algorithm, 300 test images were blurred. We compared the results of the proposed algorithm operation with Haar cascades operating results without normalized training samples and without preparation for classification. Haar cascades with non-normalized training images provided correct car recognition in 8% of cases, meanwhile, the proposed algorithm recognized 72% of cases including those 8% of images. Visual information semantic integrity preservation is an important aspect in context of road traffic, because incorrect object detection can cause fatal consequences. The proposed algorithm of image analysis reduces the probability of error occurrences during pattern recognition.

Текст научной работы на тему «Методы распознавания образов при нарушениях семантической целостности визуальной информации»

НАУЧНО-ТЕХНИЧЕСКИИ ВЕСТНИК ИНФОРМАЦИОННЫХ ТЕХНОЛОГИИ, МЕХАНИКИ И ОПТИКИ сентябрь-октябрь 2018 Том 18 № 5 ISSN 2226-1494 http://ntv.i1mo.ru/

SCIENTIFIC AND TECHNICAL JOURNAL OF INFORMATION TECHNOLOGIES, MECHANICS AND OPTICS September-October 2018 Vol. 18 No 5 ISSN 2226-1494 http://ntv.ifmo.ru/en

УДК 004.932.1

МЕТОДЫ РАСПОЗНАВАНИЯ ОБРАЗОВ ПРИ НАРУШЕНИЯХ СЕМАНТИЧЕСКОЙ ЦЕЛО СТНОСТИ В ИЗУАЛЬНОЙ ИНФОРМАЦИИ

Ю.В. Ким", А.А. Матвеева", И.И. Викснин"

a Университет ИТМО, Санкт-Петербург, 197101, Российская Федерация Адрес для переписки: yulia1344@gmail.com

Информация о статье

Поступила в редакцию 30.05.18, принята к печати 29.06.18 doi: 10.17586/2226-1494-2018-18-5-809-816 Язык статьи - русский

Ссылка для цитирования: Ким Ю.В., Матвеева А.А., Викснин И.И. Методы распознавания образов при нарушениях семантической целостности визуальной информации // Научно-технический вестник информационных технологий, механики и оптики. 2018. Т. 18. № 5. С. 809-816. doi: 10.17586/2226-1494-2018-18-5-809-816

Аннотация

Рассмотрены вопросы компьютерного зрения с целью последующего внедрения его в управление транспортными средствами и автоматизации движения. Предложены методы распознавания объектов и участников дороги. Выделены три основных этапа распознавания образов на изображении: подготовка изображения к анализу, анализ, классификация объектов. Для каждого этапа проведен поиск путей повышения качества распознавания образов и сохранения семантической целостности визуальной информации. На первом этапе предложено использование нормирования, позволяющее сделать объекты изображения нечувствительными к изменениям освещенности. Для решения задачи анализа разработан метод кластеризации на основе ¿-средних и роя частиц, обеспечивающий автоматическую настройку параметров кластеризации. На этапе классификации объектов предложено использовать каскады Хаара с нормированной обучающей выборкой. Это обеспечивает унификацию изображений и позволяет использовать обучающую выборку меньшего объема. Для обучения и тестирования использованы изображения автомобилей, предоставленные лабораторией Стэнфордского университета и находящиеся в открытом доступе. С целью проверки эффективности разработанного алгоритма распознавания образов были размыты 300 тестовых изображений. Выполнено сравнение результатов работы предложенного алгоритма с результатами работы каскадов Хаара без нормированной обучающей выборки и без дополнительной подготовки изображения к классификации. Каскады Хаара с ненормированной обучающей выборкой обеспечили корректное распознавание автомобиля в 8% случаев, в то время как предложенный алгоритм приводил к распознаванию в 72% случаев, включая эти 8% изображений. Сохранение семантической целостности визуальной информации является важным аспектом в контексте дорожного движения, так как неверное детектирование объектов дороги может привести к непоправимым последствиям. Предложенный алгоритм анализа изображений позволяет уменьшить вероятность возникновения ошибок в распознавании образов. Ключевые слова

компьютерное зрение, семантическая целостность, информационная безопасность, визуальная информация, распознавание образов

PATTERN RECOGNITION METHODS IN CASE OF VISUAL INFORMATION SEMANTIC INTEGRITY VIOLATIONS Yu.V. Kima, A.A. Matveeva", I.I. Viksnin"

a ITMO University, Saint Petersburg, 197101, Russian Federation Corresponding author: yulia1344@gmail.com

Article info

Received 30.05.18, accepted 29.06.18 doi: 10.17586/2226-1494-2018-18-5-809-816 Article in Russian

For cit"tion: Kim I.V., Matveeva A.A., Viksnin I.I. Pattern recognition methods in case of visual information semantic integrity violations.

Scientific and Technical Journal of Information Technologies, Mechanics and Optics, 2018, vol. 18, no. 5, pp. 809-816 (in Russian). doi: 10.17586/2226-1494-2018-18-5-809-816

Abstract

We consider computer vision issues with a view to embed it into vehicles and automate the traffic process by detecting of objects and road users. Three basic stages of pattern recognition in the image are enumerated: image preparation for analysis,

analysis, object classification. The search of methods that improve pattern recognition quality and provide visual information semantic integrity was carried out respectively for each stage. We propose to use normalization for the first stage, which allows making image objects insensitive to the light changes. For the second stage clustering method based on particle swarm optimization and ¿-means was developed that provides automatic tuning of clustering parameters. During the third stage Haar cascades with normalized training samples are proposed for application providing object unification and giving an opportunity to use less amount of training samples. Car images provided by Stanford University laboratory and publicly available were used for training and testing. To assess the effectiveness of the developed pattern recognition algorithm, 300 test images were blurred. We compared the results of the proposed algorithm operation with Haar cascades operating results without normalized training samples and without preparation for classification. Haar cascades with non-normalized training images provided correct car recognition in 8% of cases, meanwhile, the proposed algorithm recognized 72% of cases including those 8% of images. Visual information semantic integrity preservation is an important aspect in context of road traffic, because incorrect object detection can cause fatal consequences. The proposed algorithm of image analysis reduces the probability of error occurrences during pattern recognition. Keywords

computer vision, semantic integrity, information security, visual information, pattern recognition

Введение

Компьютерное зрение - это широкий пласт теоретических изысканий и технических методик по распознаванию, отслеживанию и классификации объектов [1, 2]; дисциплина, изучающая способы получения и анализа информации из изображений. Оно является одним из наиболее перспективных направлений в технических разработках7"1 в том числе: мобильные приложения; системы обеспечения безопасности, контроль автоматизированных транспортных средств; системы навигации, автопилотирования и реагирования на чрезвычайные ситуации; диагностирование заболеваний, ярким примером которому является автоматическое детектирование циркулирующих опухолевых клеток, и т.д.

Опираясь на вышеперечисленные примеры, можно прийти к заключению, что компьютерное зрение уже вошло в обиход, стало неотъемлемой частью инфраструктуры некоторых крупных городов и теперь доступно потребителям для повседневного использования. В ближайшем будущем планируется дальнейшее развитие компьютерного зрения в крупном промышленном производстве, маркетинге, медицине и т.п., а также продвижение его в таких сферах, как аналитика и прогнозирование.

Одной из основных целей в области компьютерного зрения является снижение процента ошибки распознавания образов [3]. Ошибкой распознавания образов в данной работе считается ситуация, когда нужный объект на изображении не обнаруживается либо обнаруживается некорректно.

На основе изученных источников была поставлена цель исследования: поиск эффективных методов для распознавания образов в случае вероятности возникновения нарушения семантической целостности [4]. Реализация цели потребовала решения следующих задач:

1. рассмотрение целостности информации [5, 6] на основе ее концептуальных составляющих, а именно синтаксической, семантической и прагматической целостности;

2. освещение этапов процесса распознавания образов.

Существует множество методов улучшения качества распознавания образов [7, 8], но в большинстве случаев они предлагаются отдельно друг от друга. Однако целью данной работы является предложение последовательности методов, которые можно будет использовать на протяжении всего процесса анализа изображения.

Исходя из этого, третьей задачей является:

3. поиск методов сохранения семантической целостности визуальной информации относительно каждого

этапа распознавания образов.

Сохранение целостности информации является важным аспектом в обеспечении информационной безопасности. Семиотическая модель сообщения включает в себя три составляющие: синтаксис (правила кодирования, декодирования, интерпретации), семантику (содержание сообщения), прагматику (полезность сообщения) [9]. Синтаксическая целостность - свойство формы представления информации, семантическая целостность - свойство содержательной характеристики сообщения, прагматическая целостность - свойство полезности информации в контексте окружающей среды и собственного состояния получателя. В данной работе компьютерное зрение изучается с целью внедрения его в транспортные средства для автоматизации дорожного движения: неверно распознанные объекты могут привести к непоправимым последствиям, поэтому семантическая целостность играет наиболее существенную роль.

Этапы распознавания образов

Процесс распознавания образов состоит из трех основных этапов:

1. подготовка изображения к анализу;

2. обработка визуальной информации;

3. классификация объектов на изображении.

Нарушение семантической целостности визуальной информации может произойти по следующим причинам:

- наличие шумов на изображении;

- размытие изображения;

- неверно подобранная обучающая выборка для классификатора;

- недостаточность обучающей выборки для классификатора.

Нормирование изображения

В процессе дорожного движения необходимо обеспечить корректную обработку визуальной информации как в дневное, так и в ночное время суток, поэтому на начальном этапе анализа изображения предлагается нормировать изображение. Нормирование позволяет сделать изображение нечувствительным к изменениям освещенности и осуществляется согласно формуле (1) в отношении каждого пикселя:

[r'= g', Ь\, =

g

b

I 2 . 2 . I 2 yjr + g + b

I 2 . 2 . .2 yr +g +b

I 2 . 2 . .2 ^/r + g + b

(1)

где r, g, b - исходные составляющие RGB (red, green, blue) вектора пикселя (i, j); r', g', b' - нормированные составляющие RGB вектора пикселя (i, j), i - номер строки в массиве пикселей изображения, j - номер столбца в массиве пикселей изображения.

Нормирование изображения, представленного на рис. 1, проиллюстрировано на рис. 2.

Рис. 1. Исходное изображение

Рис. 2. Нормированное изображение

Кластеризация изображения

Для минимизации ошибок распознавания было посчитано целесообразным использовать кластеризацию [10]. Однако большинство существующих методов кластеризации [11, 12] однозначно не обеспечивает сохранение семантической целостности информации, так как обладает следующими недостатками:

- чувствительность к выбросам;

- необходимость предварительного указания пользователем количества кластеров;

- необходимость определения пользователем параметров кластеризации.

С учетом перечисленных недостатков был разработан новый способ кластеризации. Он объединяет в себе элементы метода роя частиц, который предполагает движение группы частиц с целью нахождения лучшего решения в данной области, и метода ^-средних, который разделяет изображение на заранее заданное число кластеров с определенными центроидами и распределяет пиксели посредством вычисления минимального значения их функции расстояния относительно каждого центроида. Из каждого метода были отобраны операции, обеспечивающие автоматическое вычисление всех параметров без необходимости вмешательства пользователя. Из метода роя частиц были заимствованы следующие действия: движение группы частиц (попиксельное прохождение по изображению), поиск лучшего решения для роя в целом (нахождение в заданной области пикселя с максимальным значением средней интенсивности). Относительно алгоритма кластерного анализа ^-средних [13] были улучшены следующие его составляющие: исчезла необходимость предварительного установления числа кластеров пользователем; помимо минимизации функции расстояния, была добавлена дополнительная операция по минимизации функции цвета. Данный аспект вносит наибольший вклад в обеспечение семантической целостности, ведь отдель-

r

ный объект изображения (в некоторых случаях - часть объекта) характеризуется относительной однородностью цвета и отсутствием резких перепадов, т.е. если функция расстояния d для пикселей a и b одного объекта стремится к минимуму, то и функция цвета f будет стремиться к минимуму.

Метод кластеризации, основанный на рое частиц [14, 15], состоит из следующих шагов.

1. Последовательное выделение на изображении шириной W и высотой H областей (кластеров); поиск в

каждой области пикселя с максимальным значением средней интенсивности - центра масс (если таких пикселей в одной области несколько, берется любой из них). Средняя интенсивность пикселя рассчитывается по формуле (2): r' + g' + b'

I = , TU (2)

av 3 ' w

где r', g', b' - нормированные составляющие RGB вектора пикселя.

2. Сравнение значений средней интенсивности центров масс из соседних областей с целью объединения

кластеров, в которых значения средней интенсивности пикселей-центроидов отличаются на незначительную величину.

3. Для каждого пикселя xi, i е [1; WH] изображения относительно каждого центроида расчет двух параметров: квадратного корня функции расстояния d и квадратного корня так называемой функции цвета f Значения функции расстояния и функции цвета определяется соответственно по формулам (3)-(4):

d(xi,cj) =(xi - cj)2 (3)

f (xi,cj) = (rXi - rj)2 +(g'xi - g'cj)2 + (bXi - b'cj)2, (4)

где r'xi, g'xi, b'xi - нормированные составляющие RGB вектора пикселя x,; cj - центр масс кластера Cj , j е [1; M], M- количество полученных кластеров; r'cj, g'cj, b'j - нормированные составляющие RGB вектора центра масс cj.

4. Далее для пикселя xi происходит выявление центроида ca, a е [1; M], относительно которого минималь-

но значение квадратного корня функции расстояния, и центроида cb, b е [1; M], относительно которого минимальна величина квадратного корня функции цвета. Если a Ф b, выполняются расчеты разностей значений функций по формулам (5)-(6):

ddff =1 d (x, , ca ) - d (x, , cb )l (5)

fdff =| f (x, , ca ) - f(xi, cb ) . (6)

5. В качестве приоритетной выбирается функция, вычисленная разность значений которой была меньше

(в случае равенства разностей или равенства a и b приоритетной становится функция расстояния; это объясняется тем, что если пиксели расположены ближе друг к другу, то вероятность их принадлежности к одному объекту выше, нежели если они будут иметь похожий цвет, но большее значе-ние функции расстояния). Распределение пикселей по кластерам происходит в соответствии с приоритетной функцией, т.е. пиксель xi будет отнесен к тому кластеру, с центроидом которого этот пиксель имел минимальное значение приоритетной функции.

6. Избавление от шумов посредством вычисления нелокальных средних [16]. Так как в рамках данной работы рассматриваются только изображения с преимущественно стационарным шумом (белый шум), было отдано предпочтение методу шумоподавления нелокальных средних. Формула (7) иллюстрирует его:

u(p)fv(q)f (p, q)dq, (7)

C(p)Jq

где u(p) - отфильтрованное значение интенсивности цветовой составляющей пикселя в точке p; v(q) -нефильтрованное значение интенсивности цветовой составляющей пикселя в точке q; f (p, q) - весовая функция; C(p) - нормализующий фактор.

В качестве весовой функции используется гауссова функция, которая задается формулой (8): B(q)-B( p)l2

f (p, q) =e h2 , (8)

где h - фильтрующий параметр (для полноцветных изображений обычно используется h = 3); B(p) - локальное среднее значение интенсивности цветовых составляющих точек изображения вокруг точки p; B(q) - локальное среднее значение интенсивности цветовых составляющих точек изображения вокруг точки q.

Нормализующий фактор C(p) вычисляется по формуле (9):

C(p) =f f (p, q)dq . (9)

Jq

Результат кластеризации на основе метода роя частиц представлен на рис. 3.

Рис. 3. Кластеризованное изображение

Классификация объектов на изображении

Для классификации использовались каскады Хаара. Данный метод базируется на признаках Хаара. Каждый такой признак состоит из смежных прямоугольных областей. Они позиционируются на изображении, далее суммируются интенсивности пикселей в областях, после чего вычисляется разность между суммами - значение признака Хаара. Признаки Хаара организованы в каскадный классификатор. Работа с ним подразумевает два шага. Первый шаг заключается в настройке классификатора с использованием обучающей выборки изображений. Второй шаг заключается в использовании настроенного классификатора. При работе с каскадами Хаара изображение представляется в виде матрицы согласно формуле (10):

г х, у у

II (х, у) = £ I (г, у), (10)

2=0, у=0

где I - интенсивность пикселя входного изображения. Каждый элемент матрицы представляет собой сумму пикселей в прямоугольнике от точки (0, 0) до точки (х, у).

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Процедура обучения проходит за Т итераций, в результате которых получается каскад из Т слабых классификаторов. Работа обученного классификатора происходит следующим образом. На вход алгоритму поступает изображение размером W^H. Алгоритм сканирует изображение на 11 масштабах: размер окна 24^24 пикселя, и при этом каждый следующий уровень в 1,25 раза больше предыдущего. Дополнительно для проведения классификации было решено нормировать обучающие изображения: это повышает качество распознавания и дает возможность использовать обучающую выборку меньшего объема, так как исчезает необходимость использовать изображения объекта отдельно в дневное и ночное время. Результат работы классификатора Хаара по распознаванию автомобиля представлен на рис. 4.

Рис. 4. Результат работы классификатора Хаара

Для оценки эффективности вышеупомянутой последовательности действий исходное изображение было подвергнуто размытию - вычислению для каждого пикселя среднего значения составляющих цветов всех соседствующих пикселей. Радиус размытия, т.е. максимальное количество пикселей, учитываемое при расчете среднего значения целевого пикселя с каждой стороны, равен 50. Размытое изображение представлено на рис. 5.

Рис. 5. Исходное изображение после размытия и добавления шумов

Результат применения классификатора Хаара с ненормированной обучающей выборки показан на

рис. 6.

Рис. 6. Распознавание автомобиля посредством классификатора Хаара с ненормированной обучающей выборкой

Как можно заметить, появилось несколько дополнительных «распознанных» областей, не охватывающих все части автомобиля. Однако с помощью последовательного применения нормирования, кластеризации методом роя частиц, каскадного классификатора Хаара с нормированной обучающей выборкой удалось устранить возникшее нарушение семантической целостности визуальной информации. Результат распознавания представлен на рис. 7, 8.

Рис. 7. Результат распознавания образов посредством применения предложенного алгоритма анализа

изображений

Рис. 8. Результат распознавания образов посредством применения предложенного алгоритма анализа изображений, спроецированный на исходное изображение

Представленный эксперимент был проведен на 300 тестовых изображениях [17]. В 8% случаев нарушение семантической целостности было устранено классификатором Хаара без нормированной обучающей выборки, в то время как разработанный алгоритм обеспечил корректную работу распознавания образов в 72% случаев, включая упомянутые 8%.

Заключение

Таким образом, путем выполнения поставленных задач достигнута цель исследования. Отобраны методы, снижающие вероятность возникновения нарушения семантической целостности. Относительно первого этапа распознавания образов - это бинаризация и нормирование; относительно второго этапа -это кластеризация с учетом функции расстояния и функции цвета; относительно третьего этапа - это каскады Хаара с нормированной обучающей выборкой. В дальнейшем планируется применение разработанного алгоритма на практике, в частности, рассматривается возможность автоматизации дорожного движения [18].

Литература

1. Dunjko V., Briegel H.J. Machine learning & artificial intelligence in the quantum domain: a review of recent progress // Reports on Progress in Physics. 2018. V. 81. N 7. Art. 074001. doi: 10.1088/1361-6633/aab406

2. Forsyth D.A., Ponce J. Computer Vision: A Modern Approach. Prentice Hall, 2003.

3. Neto U.B., Dougherty E.R. Error Estimation for Pattern Recognition. NY: Wiley, 2015. 321 p.

4. Akinin M.V., Akinina A.V., Sokolov A.V., Tarasov A.S. Application of EM algorithm in problems of pattern recognition on satellite images // Proc. 6th Mediterranean Conference on Embedded Computing. Bar, Montenegro, 2017. 4 p. doi: 10.1109/meco.2017.7977190

5. Jovanov I., Pajic M. Sporadic data integrity for secure state estimation // Proc. IEEE 56th Annual Conference on Decision and Control. Melbourne, Australia, 2017. P. 163-169. doi: 10.1109/cdc.2017.8263660

6. Santra P., Roy A., Majumder K. A Comparative analysis of cloud forensic techniques in IaaS // Advances in Intelligent Systems and Computing. 2017. V. 554. P. 207-215. doi: 10.1007/978-981-10-3773-3_20

7. Singh S., Sinha M. Pattern recognition based on specific weights // International Journal of Applied Pattern Recognition. 2018. V. 5. P. 1-10. doi: 10.1504/ijapr.2018.090518

8. Исрафилов Х.С. Исследование методов бинаризации изображений // Вестник науки и образования. 2017. Т. 2. № 6. С. 43-50.

9. Цветков В.Я. Семантика сообщений в телекоммуникационных системах [Электронный ресурс]. -Режим доступа: http://window.edu.ru/catalog/pdf2txt/178/56178/271417p_page =2, свободный. Яз. рус. (дата обращения 03.09.2018).

10. Aly A.A., Deris S.B., Zaki N. Research review for digital image segmentation techniques // International // Journal of Computer Science & Information Technology. 2011. V. 3. N 5. P. 99-105. doi: 10.5121/ijcsit.2011.3509

11. Li N., Liu M., Li Y. Image segmentation algorithm using watershed transform and level set method // Proc. IEEE Int. Conf. on Acoustics, Speech and Signal Processing. Honolulu, 2007. P. 613-616. doi: 10.1109/icassp.2007.365982

12. Guo Y., Liu Y., Georgiou T., Lew M.S. A review of semantic segmentation using deep neural networks // International Journal of Multimedia Information Retrieval. 2017. V. 7. N 2. P. 87-93. doi: 10.1007/s13735-017-0141-z

13. Fachrurrozi E.M., Fiqih A., Saputra B.R., Algani R., Primanita A. Content based image retrieval for multi-objects fruits recognition using k-means and k-nearest neighbor // Proc. Int. Conf. on Data and Software Engineering (ICoDSE). Palembang, Indonesia, 2017. doi: 10.1109/icodse.2017.8285855

14. Карпенко А.П., Селиверстов Е.Ю. Обзор методов роя частиц дял задачи глобальной оптимизации (particle swarm optimization) // Наука и образование: научное издание МГТУ им. Н.Э. Баумана. 2009. № 3. С. 2.

15. Viksnin I.I., Drannik A.L., Iureva R.A., Komarov I.I. Flocking factors' assessment in case of destructive impact on swarm robotic systems // Proc. 18th Conference of Open Innovations Association and Seminar on Information Security and Protection of Information Technology (FRUCT-ISPIT). St. Petersburg, Russia, 2016. P. 357-363. doi: 10.1109/fruct-ispit.2016.7561550

16. Leng K. An improved non-local means algorithm for image denoising // Proc. IEEE 2nd Int. Conf. on Signal and Image Processing (ICSIP). 2017. P. 149-153. doi: 10.1109/siprocess.2017.8124523

17. Cars Dataset [Электронный ресурс]. URL: https://ai.stanford.edu/~jkrause/cars/car_dataset.html (дата обращения: 15.02.2018).

18. Ke R., Li Z., Tang J., Pan Z., Wang Y. Real-time traffic flow parameter estimation from UAV video based on ensemble classifier and optical flow // IEEE Transactions on Intelligent Transportation Systems. 2018. P. 1-11. doi: 10.1109/tits.2018.2797697

References

1. Dunjko V., Briegel H.J. Machine learning & artificial intelligence in the quantum domain: a review of recent progress. Reports on Progress in Physics, 2018, vol. 81, no. 7, art. 074001. doi: 10.1088/1361-6633/aab406

2. Forsyth D.A., Ponce J. Computer Vision: A Modern Approach. Prentice Hall, 2003.

3. Neto U.B., Dougherty E.R. Error Estimation for Pattern Recognition. NY, Wiley, 2015, 321 p.

4. Akinin M.V., Akinina A.V., Sokolov A.V., Tarasov A.S. Application of EM algorithm in problems of pattern recognition on satellite images. Proc. 6th Mediterranean Conference on Embedded Computing. Bar, Montenegro, 2017, 4 p. doi: 10.1109/meco.2017.7977190

5. Jovanov I., Pajic M. Sporadic data integrity for secure state estimation. Proc. IEEE 56th Annual Conference on Decision and Control. Melbourne, Australia, 2017, pp. 163-169. doi: 10.1109/cdc.2017.8263660

6. Santra P., Roy A., Majumder K. A Comparative analysis of cloud forensic techniques in IaaS. Advances in Intelligent Systems and Computing, 2017, vol. 554, pp. 207-215. doi: 10.1007/978-981-10-3773-3_20

7. Singh S., Sinha M. Pattern recognition based on specific weights. International Journal of Applied Pattern Recognition, 2018, vol. 5, pp. 1-10. doi: 10.1504/ijapr.2018.090518

8. Israfilov H.S. Research of methods for binarization of images. Herald of Science and Education, 2017, vol. 2, no. 6, pp. 4350. (in Russian)

9. Tsvetkov V.I. Semantics of Messages in Telecommunication Systems. Available at: http://window.edu.ru/catalog/pdf2txt/178/56178/271417p_ page=2 (accessed: 03.09.2018).

10. Aly A.A., Deris S.B., Zaki N. Research review for digital image segmentation techniques. International Journal of Computer Science & Information Technology, 2011, vol. 3, no. 5, pp. 99-105. doi: 10.5121/ijcsit.2011.3509

11. Li N., Liu M., Li Y. Image segmentation algorithm using watershed transform and level set method. Proc. IEEE Int. Conf. on Acoustics, Speech and Signal Processing. Honolulu, 2007, pp. 613-616. doi: 10.1109/icassp.2007.365982

12. Guo Y., Liu Y., Georgiou T., Lew M.S. A review of semantic segmentation using deep neural networks. International Journal of Multimedia Information Retrieval, 2017, vol. 7, no. 2, pp. 87-93. doi: 10.1007/s13735-017-0141-z

13. Fachrurrozi E.M., Fiqih A., Saputra B.R., Algani R., Primanita A. Content based image retrieval for multi-objects fruits recognition using k-means and k-nearest neighbor. Proc. Int. Conf. on Data and Software Engineering. Palembang, Indonesia, 2017. doi: 10.1109/icodse.2017.8285855

14. Karpenko A.P., Seliverstov E.Y. Overview of the particle swarm methods for the global optimization problem. Science and Education: a scientific edition of the Bauman Moscow State Technical University, 2009, vol. 3, p. 2. (in Russian)

15. Viksnin I.I., Drannik A.L., Iureva R.A., Komarov I.I. Flocking factors' assessment in case of destructive impact on swarm robotic systems. Proc. 18h Conference of Open Innovations Association and Seminar on Information Security and Protection of Information Technology. St. Petersburg, Russia, 2016, pp. 357-363. doi: 10.1109/fruct-ispit.2016.7561550

16. Leng K. An improved non-local means algorithm for image denoising. Proc. IEEE 2nd Int. Conf. on Signal and Image Processing, 2017, pp. 149-153. doi: 10.1109/siprocess.2017.8124523

17. Cars Dataset. URL: https://ai.stanford.edu/~jkrause/cars/car_dataset.html (accessed: 15.02.2018).

18. Ke R., Li Z., Tang J., Pan Z., Wang Y. Real-time traffic flow parameter estimation from UAV video based on ensemble classifier and optical flow. IEEE Transactions on Intelligent Transportation Systems, 2018, pp. 1-11. doi: 10.1109/tits.2018.2797697

Авторы

Ким Юлия Вячеславовна - инженер, Университет ИТМО, Санкт-Петербург, 197101, Российская Федерация, ORCID ID: 0000-0002-6951-1875, yulia1344@gmail.com

Матвеева Анастасия Андреевна - инженер, Университет ИТМО, Санкт-Петербург, 197101, Российская Федерация, ORCID ID: 0000-0002-2935-991X,

anastasiamatveevaitmo@gmail.com

Викснин Илья Игоревич - аспирант, научный сотрудник, Университет ИТМО, Санкт-Петербург, 197101, Российская Федерация, Scopus ID: 57191359693, ORCID ID: 0000-00023071-6937, wixnin@mail.ru

Authors

Yulia V. Kim - engineer, ITMO University, Saint Petersburg, 197101, Russian Federation, ORCID ID: 0000-0002-6951-1875, yulia1344@gmail.com

Anastasia A. Matveeva - engineer, ITMO University, Saint Petersburg, 197101, Russian Federation, ORCID ID: 0000-0002-2935-991X, anastasiamatveevaitmo@gmail.com

Ilya I. Viksnin - postgraduate, Scientific researcher, ITMO University, Saint Petersburg, 197101, Russian Federation, Scopus ID: 57191359693, ORCID ID: 0000-0002-3071-6937, wixnin@mail.ru

i Надоели баннеры? Вы всегда можете отключить рекламу.