Применение методов искусственного интеллекта и машинного зрения в задаче детектирования объектов движения для дальнейшего определения динамических характеристик транспортных потоков

Епифанов Владислав Александрович

адаптивный; координированный (сетевой) адаптивный режим.

Дорожные контроллеры построены по модульному принципу и в составе системной платформы и модулей рассчитаны на непрерывную круглосуточную работу в стационарных условиях на открытом воздухе и безопасны в экологическом отношении в ходе всего периода эксплуатации [5, с. 168].

В ходе оценки существующих условий движения на исследуемом участке автомобильной дороги, было доказано, что в настоящее время пропускная способность ряда транспортных узлов исследуемого объекта в периоды пиковых нагрузок исчерпана или близка к исчерпанию.

При исследовании расчета уровней загрузки движением элементов объекта было выявлено, что на рассматриваемом участке в периоды пиковых нагрузок наблюдаются неудовлетворительные условия движения автотранспорта. Наибольший коэффициент загрузки движением наблюдается в утренний пиковый период и в вечерний пиковый период.

По результатам расчета, был спрогнозирован рост транспортной нагрузки на исследуемый объект, обусловленный ростом уровня автомобилизации и активным жилищным строительством.

По результатам расчета в перспективе 2036 г. в целом по анализируемым направлениям будет проявляться тенденция к росту интенсивности

транспортных потоков, обусловленные ростом уровня автомобилизации и развитием территорий.

На основе проведенного анализа технических средств рекомендуется использование ТПИ, ЗПИ, камер видеонаблюдения, дорожных контролеров.

Список литературы:

1) Давыдов А.Н., Регулирование риска на автомобильной дороге как метод обеспечения безопасности // Традиции и инновации в строительстве и архитектуре, Электронный ресурс: материалы 71 -й Всероссийской научно-технической конференции по итогам НИР 2013 года. под редакцией М.И. Бальзанникова, Н.Г. Чумаченко. Самара, 2014. С. 828 - 829 .

2) Dormidontova T.V., EvdokimovS.V.Rationale for statistical characteristics of road safety parameters. В сборнике: MATEC Web of Conferences Editors: S. Jemiolo, A. Zbiciak, M. Mitew-Czajewska, M. Krzeminski and M. Gajewski. 2017. С. 40.

3) Dorokhov A.N. Textbook, Lan, 352 (2011).

4) Ivanov T.V. Textbook, Piter, 170 (2013).

5) Павлова В.А. Безопасность дорожного движения и возможные риски возникновения -дорожно-транспортного происшествия// Пути улучшения качества автомобильных дорог: Сборник статей. [Электронный ресурс]/ Под.ред М.И. Бальзанникова, К.С. Галицкова; СГАСУ. Самара, 2015. С. 158 - 168.

ПРИМЕНЕНИЕ МЕТОДОВ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА И МАШИННОГО ЗРЕНИЯ В ЗАДАЧЕ ДЕТЕКТИРОВАНИЯ ОБЪЕКТОВ ДВИЖЕНИЯ ДЛЯ ДАЛЬНЕЙШЕГО ОПРЕДЕЛЕНИЯ ДИНАМИЧЕСКИХ ХАРАКТЕРИСТИК ТРАНСПОРТНЫХ ПОТОКОВ

Епифанов Владислав Александрович

Магистрант АСУ ИТАСУ НИТУ МИСИС, г. Москва DOI: 10.31618^^2413-9335.2019.3.61.20

АННОТАЦИЯ.

Целью исследования является изучение методов и применение на практике, как искусственного интеллекта, так и методов классического компьютерного зрения применимых для решения задачи детектирования транспортных средств в потоке. В результате исследования выявлены подходы поиска объектов на изображениях и видео, а также условия корректной работы с преимуществами и недостатками.

Ключевые слова: Искусственный интеллект, детектирование объектов, нейронные сети, машинное зрение, транспорт.

Сегодня огромное значение придается фото и видео контенту. Большая часть населения планеты имеет в своем доступе как минимум одно устройство для создания фотографий и видео. Фото и видео аналитика применяется во многих сферах деятельности как отдельных организаций, так и государств: фото и видео фиксация применяется в людных местах, общественном транспорте [1], магазинах, в подъездах жилых домов, на дорогах общего пользования для отслеживания правонарушений различного рода. Кроме того, информация, собранная с фото и видео систем, может быть использована как данные для создания имитационных моделей [3] различных объектов. Например, для создания имитационной модели супермаркета с учетом загруженности каждого из отделов и касс. При этом в модели можно проследить за точками задержек и оптимизировать потоки людей путем

изменения сначала имитационной модели, так чтобы результат достиг приемлемых значений, после чего можно приступать к реконструкции самого объекта. Помимо магазинов данный подход можно использовать во многих сферах, таких как склады, парковки, сферы социальных услуг, а также в транспорте при реконструкции старых и постройке новых дорожных сооружений (эстакады, перекрестки, светофоры и т.д.). Так для увеличения пропускной способности автомобильных дорог может быть использована имитационная модель, описывающая дорожную сцену, модернизируя которую можно понять, каким образом можно эффективнее организовать движение. Для того, чтобы построить модель качественно, необходимо располагать точными данными о текущих характеристиках транспортной системы, которую необходимо смоделиро-

вать. Одним из способов получения данной информации является анализ видео контента соответствующей местности на предмет наличия транспортных средств и их количества, при условии, что анализирующая система будет корректно работать.

На сегодняшний день по стране установлено более 7,5 тысяч стационарных комплексов фото-видео фиксации и более 4 тысяч передвижных комплексов для фиксирования нарушений правил дорожного движения. [2]. Несмотря на большое распространение фото-видео информации и заинтересованность большого количества структур в их обработке, есть острая необходимость в создании новых и доработки старых систем автоматического распознавания и фиксации. Так, например, во время фиксации правонарушений на проезжей части нередко возникают ошибки, связанные с тенью или пересечением транспортных средств на видео. Также во время распознавания возникают ошибки при незначительном повороте подвижных объектов и их пересечения. При решении указанных выше проблем можно говорить о точном слежении за объектами на проезжей части, что позволит собрать значения характеристик соответствующего транспортного потока таких как средняя скорость и плотность путем усреднения динамических характеристик отдельных объектов движения. Данные о скорости и плотности позволят также вычислить интенсивность. В результате информация о трех основных характеристиках потока позволит рассчитать любые интересующие показатели транспортных потоков.

Описанные проблемы возможно решать при помощи различных методов обработки изображений и видео [4], но каждый из них имеет как преимущества, так и недостатки. По этой причине для решения задач детектирования и распознавания применяются каскады методов, что позволяет добиться наилучших результатов.

В рамках работы рассмотрены три метода, применимые для решения задачи детектирования объектов движения на видео.

Первый метод - Метод вычитания фона В данном классе методов видеопоследовательность рассматривается как последовательность кадров [5], где каждый кадр задается матрицей интен-сивностей пикселей.

В основе метода лежит предположение, что для каждого кадра видео существует модель фона, которая представляет из себя матрицу интенсивно-стей пикселей:

где:

F = {F ( х ,у) ,0 < х <W ,0< у <Н }, F (х ,у ) Е {0,... ,255 } ,k = 1, N , W -

ширина кадра, Н - высота кадра Тогда, если взять модель отдельного кадра как:

I = { I ( х ,у ) ,0< х<Ш ,0 < у<Н },

где:

I (х ,у) Е {0,... ,255 } ,к = 1 ^, то для одноканального (в оттенках серого) изображения процедуру вычитания фона можно разбить на два этапа:

Попиксельное вычитание интенсивностей кадра видео и фона

О ( х ,у ) = |( I ( х ,у)-Р (х ,у ))| По полученной разности строится маска кадра. Если разность интенсивности текущего кадра и фона превышает пороговое значение, то данный пиксель принадлежит объекту, иначе фону.

В результате работы метода получают бинарное изображение, на котором движущиеся объекты обозначены одним цветом, а фон другим (Рисунок 1).

Рисунок 1. Маска кадра с изображением объекта

Основные различие методов, относящихся к методам вычитания фона - это способы построения модели фона. Способы построения моделей фона можно разделить на рекурсивные и нерекурсивные.

К рекурсивным относят способы, которые для построения модели фона используют только информацию о текущем кадре. К методам данного подкласса можно отнести: MOG (Mixture of Gaussian, смесь гауссовых распределений), Codebook (метод

шифровальной книги). К нерекурсивным относят способы основанные информации о предыдущих кадрах. К методам данного подкласса можно отнести: метод усреднения N предыдущих, метод определения медианы.

Данный метод отрабатывает с высокой скоростью и имеет множество вариаций. К недостаткам данного метода можно отнести определение группы близко расположенных объектов как один объект (Рисунок 2).

Рисунок 2. Сливание группы объектов в один

Также при в случае схожести цвета объекта и фона объект может не обнаружиться, или быть разделен (Рисунок 3)

Рисунок 3. Разделение объекта

Также минусом является то, что при обездвижении объекта его детектирование становится невозмож-

ным.

Второй метод - применение нейронных сетей для задачи детектирования объектов. Для решения задачи детектирования применяются сверточные нейронные сети [6]. Для обучения таких сетей применяется алгоритм обратного распространения ошибки. (Рисунок 4).

Рисунок 4. Многослойная нейронная сеть (перцептрон)

Такие сети имеют множество входов и выходов. Кроме того, сеть имеет множество внутренних узлов. Пронумеруем все узлы включая входы и выходы числами от 1 до N. Веса соединяющие 1-й и _]-й узел обозначим как Wy. Это веса, стоящие на соответствующем ребре. Обозначим выход 1-го узла как 01. Обозначим правильные ответы сети как Ьк. Если обучающий пример известен, то функция ошибки, полученная по методу наименьших квадратов будет выглядеть следующим образом:

=1 X (1к-0к)2

кЕОиЬриЬБ

Для изменения весов реализуется стохастический градиентный спуск. Таким образом от шага к шагу происходит модернизация весов после каждого обучающего примера. Для минимизации ошибки необходимо двигаться в противоположную градиенту сторону. То есть на основании каждого правильного ответа добавлять ко всем весам следующее значение:

йЕ

=

ния

4 ''

где 0 < ц < 1 - коэффициент скорости обуче-Структура сверточной нейронной сети.

В состав сверточной нейронной сети входят слои трех основных типов:

• Сверточные слои

• Слои пуллинга

• Полносвязные слой Сверточный слой

Сверточный слой представляет собой набор матриц, каждая из которых имеет ядро. Количество матриц определяется требованиями к задаче. Увеличение количества карт приводит к повышению качества распознавания, но также при увеличении количества матриц свертки возрастает вычислительная сложность сети. Размер всех карт сверточ-ного слоя одинаков и вычисляются по формуле: (ы,к) = (тШ -кШ + 1,тН - кН + 1), Где: (ш, К) - размер новой матрицы свертки тШ - ширина матрицы предыдущего слоя свертки

тН - высота матрицы предыдущего слоя свертки

кШ - ширина ядра свертки кН - высота ядра свертки Иллюстрация размеров матрицы свертки (Рисунок 5).

Рисунок 5. Соотношение размера матриц свертки текущего и предыдущего слоя

Евразийский Союз Ученых (ЕСУ) # 4 (61), 2019_29

Ядро матрицы сверточного слоя также является матрица, которая проходит скользящим окном по всей матрице свертки. И находит признаки различных областей. Примером ядра свертки может быть следующая матрица (Рисунок 6).

Рисунок 6. Пример ядра свертки

Данная матрица ядра свертки соответствует прямой под углом 45 градусов и если данное ядро наложить на прямую, то в этом месте отклик будет велик.

Рисунок 7. Ядро свертки

На изображении (Рисунок 7) в синем окне показано описанное выше ядро светрки. В области обозначенной синей рамкой будет максимальный отклик.

Слои пуллинга представляют собой слои задачей которых является уменьшение размерности матриц предыдущих слоев свертки. Если на предыдущем слое были выявлены какие-либо признаки, то на следующем слое такое подробное изображение уже не нужно, и оно уплотняется. Обычно операция пуллинга уменьшает изображение в два раза используя при этом ядро матрицы пуллинга равно 2X2 (Рисунок 8).

1 2 3 4

5 6 7 8

9 10 11 12

13 14 15 16

6 8

14 16

Рисунок 8. Результат работы слоя пуллинга

Классической функцией слоя пуллинга является Max-Pool, при которой выбирается максимальное значение из значений ядра.

Полносвязый слой представляет собой слой перцептрона (Рисунок 4). Его целью является классификация.

Третий подход в решении задачи - это применения HOG дескриптора.

HOG (histogram of oriented gradients) [7] - метод базирующийся на гистограмме направленных градиентов. Для работы данного метода необходимо наличие большого набора изображений объекта и еще больший набор изображений, на которых объекта нет. Данный набор данных (dataset) должен быть подготовлен для применения данного метода. Для этого все изображения необходимо

масштабировать до фиксированного размера. После того, как датасет сформирован, можно приступать к тренировке дескриптора. На первом шаге необходимо посчитать градиент изображения. Для

-1 -2 -1

0 0 0

1 2 1

Рисунок 9. Ядра

того, чтобы посчитать градиент изображения на практике используется оператор Собеля[8]. Имеет следующее ядро для расчета производной по осям координат (Рисунок 9).

-1 0 1

-2 0 2

-1 0 1

Собеля

После расчета производных по направлениям в точке изображения рассчитывается градиент изображения в данной точке как квадратный корень из от квадрата суммы производных.

Следующим шагом изображение разбивается на ячейки, размер ячейки как правило равняется одной восьмой от наименьшей из сторон изображе-

ния. И для каждой ячейки рассчитывается гистограмма направленных градиентов. Данная гистограмма имеет 9 бинов, по бину на каждые 20 градусов направления вектора.

Заполнение гистограммы направленных градиентов производится по данных о углах направления градиентов и их значений (Рисунок 10).

Рисунок 10. Заполнение гистограммы градиентов

Как видно из рисунка значение градиента делится между ячейками гистограммы градиентов соответствующих углов в пропорции соответствующей близости угла ячейки к углу направления градиента в точке.

После того как все гистограммы градиентов будут пересчитаны они передаются на машину опорных векторов (8УМ) где они рассматриваются как точки в п-мерном пространстве признаков. В свою очередь 8УМ решает задачу кластеризации полученных точек на точки, принадлежащие объекту и точки объекту не принадлежащие. Как правило происходит линейное разделение точек.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

После того как классификатор обучен, для поиска объекта на кадре по нему проходят скользящим окном. Для каждой картинки скользящего окна считается дескриптор и определяется с какой стороны от границы она лежит.

В рамках работы были реализованы и протестированы указанные выше подходы для решения

задачи детектирования объектов движения. На основе проделанной работы были выявлены следующие показатели:

• Метод вычитания фона не требователен к вычислительным ресурсам, при этом границы объектов находятся неточно, есть вероятность деления объектов;

• Метод базирующийся на сверточных нейронных сетях имеет высокую точность, при этом требователен к вычислительным ресурсам;

• Метод основанный на HOG имеет высокий процент найденных объектов, при этом находит ложные объекты. Вычислительная сложность средняя.

Исходя из сильных и слабых сторон методов можно сделать вывод о необходимости использования всех описанных методов для достижения высокой точности при минимальных вычислительных затратах.

После проведения тестирования реализаций рассмотренных методов получили следующие результаты замеров скорости и точности их работы на процессоре Intel Core i5 7400:

Таблица 1. Результат работы HOG на классе «автомобиль»

time: 0.846ms class: 1 response = 1

time: 0.843ms class: 1 response = 1

time: 0.813ms class: 1 response = 1

time: 0.814ms class: 1 response = 1

time: 0.842ms class: 1 response = 1

time: 0.815ms class: 1 response = 1

time: 0.812ms class: 1 response = 1

time: 0.842ms class: 1 response = 1

time: 0.835ms class: 1 response = 1

time: 0.813ms class: 1 response = 1

Таблица 2. Результат работы HOG на классе «Фон»

time: 0.819ms class: 0 response = 0

time: 0.663ms class: 0 response = 0

time: 0.823ms class: 0 response = 0

time: 0.817ms class: 0 response = 0

time: 0.821ms class: 0 response = 0

time: 0.819ms class: 0 response = 0

time: 0.815ms class: 0 response = 0

time: 0.814ms class: 0 response = 0

time: 0.817ms class: 0 response = 0

time: 0.816ms class: 0 response = 0

Таблица 3. Результат работы НС на классе «передний вид автомобиля»

time: 113.12ms Class: 1 response: 1 confidence: 0.999994

time: 100.23ms Class: 1 response: 0 confidence: 0.99609

time: 99.49ms Class: 1 response: 1 confidence: 1

time: 101.31ms Class: 1 response: 1 confidence: 1

time: 97.87ms Class: 1 response: 1 confidence: 0.999994

time: 98.47ms Class: 1 response: 1 confidence: 1

time: 98.26ms Class: 1 response: 1 confidence: 0.999998

time: 105.12ms Class: 1 response: 1 confidence: 1

time: 113.91ms Class: 1 response: 1 confidence: 1

time: 72.57ms Class: 1 response: 1 confidence: 1

Таблица 4. Результат работы НС на классе «задний вид автомобиля»

time: 33.28ms Class: 0 response: 0 confidence: 1

time: 32.61ms Class: 0 response: 0 confidence: 1

time: 34.47ms Class: 0 response: 0 confidence: 1

time: 33.85ms Class: 0 response: 0 confidence: 1

time: 32.61ms Class: 0 response: 1 confidence: 1

time: 38.00ms Class: 0 response: 0 confidence: 1

time: 33.02ms Class: 0 response: 0 confidence: 1

time: 31.85ms Class: 0 response: 0 confidence: 0.999992

time: 34.04ms Class: 0 response: 0 confidence: 1

time: 30.41ms Class: 0 response: 0 confidence: 1

Исходя из данных представленных в таблицах можно сделать вывод, что средняя скорость анализа изображений на предмет наличия автомобиля при помощи обученного HOG менее 1 миллисекунды, при этом точность классификации составляет более 96 процентов. В свою очередь классификация автомобилей на передний и задний вид при помощи нейронной сети требует порядка 40 миллисекунд на

кадр, точность такой классификации составляет более 94 процентов на тестовой выборке. Также стоит заметить, что обучение HOG на классификацию автомобилей не дало желаемого результата в точности. Таким образом, текущая реализация использует все описанные выше методы. Для уменьшения области классификации используется метод вычи-

тания фона. Далее, в силу того, что не все полученные участки являются автомобилями, есть необходимость их фильтрации. Чтобы не использовать тяжелую нейронную сеть для каждого такого участка, на них используется HOG классификатор, работающий ощутимо быстрее. И на заключительном этапе используется нейронная сеть с архитектурой GoogleNet для классификации полученных автомобилей.

Данный каскад методов позволяет компенсировать недостатки, всех указанных выше методов (снижение вычислительных затрат за счет сокращения операций классификации сверточной нейронной сетью, решение проблемы деления объектов и ложного поиска), при этом все лучшие качества каждого из методов останутся без значимых ухудшений.

Литература

1. Котарев С. Н., Котарева О. В., Александров А. Н. Использование возможностей государственно-частного партнерства в сфере обеспечения безопасности населения на транспорте // сборник материалов XI международной научно-практической конференции «управление деятельностью по обеспечению безопасности дорожного движения (состояние, проблемы, пути совершенствования)» -Орёл: Орловский юридический институт Министерства внутренних дел Российской Федерации имени В.В. Лукьянова, 2017. - С. 186-189.

2. Развитие систем автоматической фиксации нарушений правил дорожного движения. [Электронный ресурс]. - Режим доступа: https://xn--90adear.xn--p1ai/news/item/1545 (Дата обращения 14.11.2018)

3. А.С. Акопов Имитационное моделирование. - М.: Юрайт, 2014.

4. Зайцева Е. В., Степанова А.Л. Классификация современных методов трекинга объектов в интеллектуальных системах видеонаблюдения // Горный информационно-аналитический бюллетень (научный журнал), 2013 - С. 56-62.

5. Mrs. Clara Shanthi.G, Mr.Saravanan.E. Background Subtraction Techniques: Systematic Evaluation and Comparative Analysis // International Journal of Modern Engineering Research (IJMER), 2013. - С. 514-517.

6. Zeiler M.D., Fergus R. Visualizing and understanding convolutional networks // European Conference on Computer Vision (ECCV). Part I., 2014. Zurich, Switzerland. -С. 818-833.

7. Histogram of Oriented Gradients. [Электронный ресурс]. - Режим доступа: https://www.learno-pencv.com/histogram-of-oriented-gradients/ дата обращения 20.11.2018)

8. Алгоритмы выделения контуров изображений. [Электронный ресурс]. - Режим доступа: chttps://habrahabr.ru/post/114452/ (дата обращения 20.11.2018)

УДК 625.098_

ИННОВАЦИИ ПО УМЕНЬШЕНИЮ ТРАНСПОРТНЫХ ШУМОВ В ГОРОДЕ

Заплетаев Иван Сергеевич

Студент 5 курса Академии Строительства и Архитектуры Самарского государственного технического университета

г. Самара

Лялякин Владислав Владимирович

Студент 5 курса Академии Строительства и Архитектуры Самарского государственного технического университета

г. Самара

Дормидонтова Татьяна Владимировна

кандидат технических наук, доцент заведующая кафедрой, Академия Строительства и Архитектуры Самарского государственного технического университета

г. Самара

АННОТАЦИЯ.

В статье представлены исследования параметров автомобильной дороги и транспортных средств на предмет транспортных шумов. Предложены методы достижения оптимального уровня шума в городах и поселениях. В работе были выявлены закономерности в решениях для улучшения ситуации с транспортным шумом.

Ключевые слова: шум, транспорт, дорога, асфальт, транспортный шум, экраны.

Введение

Сегодня увеличение числа автомобилей растёт с каждым годом, вследствие чего возрастают и транспортные шумы. Они, в свою очередь, мешают людям жить и доставляют множество проблем. В работе были проанализированы методы контроля транспортного шума в городах, благодаря которым в разы уменьшается шумовая нагрузка на проживающих близ дороги людей, а также общего шума от автомобильной дороги, мостов и тоннелей.

Любой город имеет постоянное беспересадочное автобусное сообщение с другими городами. Как правило, структура автомобильных перевозок в крупных городов для транспортной отрасли экономики и транспорта общего пользования составляет 79,6 % и 19,6 % соответственно. Был проведен анализ нескольких городов миллионников по данной структуре, рисунок 1.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Епифанов Владислав Александрович

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Епифанов Владислав Александрович