УДК 004.931, 681.518.3
В. В. Мокшин, А. П. Кирпичников, И. М. Якимов, И. Р. Сайфудинов
ОПРЕДЕЛЕНИЕ ТРАНСПОРТНЫХ СРЕДСТВ НА УЧАСТКАХ ДОРОГ КЛАССИФИКАТОРОМ ХААРА И ОПЕРАТОРОМ LBP С ПРИМЕНЕНИЕМ ADABOOST И ОТСЕЧЕНИЕМ ПО ДОРОЖНОЙ РАЗМЕТКЕ
Ключевые слова: Обнаружение транспортных средств, функции Хаара, LBP-operator, Adaboost, классификация, логистические задачи.
Эта статья о применении двух методов для распознавания транспортных средств с отсечением лишних кандидатов прямоугольников по дорожной разметке. Система использует комбинацию машинного обучения с признаками Хаара и оператора LBP для обнаружения и сопровождения транспортных средств на дороге, обнаруженные кандидаты отсекаются, если они выходят за край дорожной разметки. Признаки Хаара и оператор LBP используются для выделения признаков, как входные параметры для обучения сильного классификатора методом Adaboost. Классификаторы обучаются, используя образцы изображений из базы данных различных источников объемом более 5000 изображений для обнаружения и классификации транспортных средств в видеопоследовательностях сцен трафика. Результаты обнаружения используются системой для выделении транспортных средств из видео последовательности кадров. Система может обнаруживать транспортные средства с целью дальнейшей классификации и оценки загрузки транспортных потоков. Полученная информация может использоваться для планирования транспортных потоков.
Keywords: vehicledetection, Haarfunctions, LBP-operator, Adaboost, classification, logisticstasks.
This article is about the comparison of two methods for identifying vehicles sredtv. The system uses a combination of machine learning with signs of Haar and LBP operator for the detection and tracking of vehicles on the road. Signs of Haar and operator LBP used for feature extraction, as inputs for training the classifier by strong Adasboost. Classifiers are trained using sample images from a database of images of different sources of more than 5000 pieces. for the detection and classification of vehicles in video sequences of traffic scenes. The results of the detection system used for tracking. The system can detect and track vehicles in real time. The results of detection system uses for allocation of vehicles from the video frame sequence. The system can detect vehicles with the aim offurther classification and evaluation of traffic load. Thisinformationcanbeusedforplanningtrafficflows.
Введение
Автоматическое обнаружение, распознавание транспортных средств является актуальной задачей, решение которой может пригодиться при производстве автомобилей с автоматическим управлением, в системах помощи водителю или в управлении дорожной инфраструктурой [1], а также в логистических задачах для оценки загрузки дорог различного типа транспорта [2]. Это может позволить информировать водителя о текущей ситуации на дороге (приближающиеся объекты, предупреждение столкновения и т.д.). Типов транспортных средств в мире ограниченное количество и они имеют отличительные цвет и форму. Но разнообразие типов и вариаций, встречаемых в реальной среде, оставляют задачу высокоточного обнаружения транспортных средств нерешенной до сих пор.
В связи с важностью задачи по данной теме было опубликовано множество работ [3-9], но большинство из них работают с выборками ограниченного объема, что не позволяет надежно оценить качество получаемых алгоритмов. В данной работе была исследована возможность использования признаков Хаара и оператора LBP(локальныедвоичные после-довательности)для обучения детектора транспортных средств и обнаружения объектов на городских магистралях при помощи дополнительного обнаружения дорожной разметки.
Обзор алгоритма
На вход алгоритма поступает цветное изображение с камеры, которое затем преобразуется в градации серого, для уменьшения сложности вычислений. Далее параллельными потоками выполняются 2 задачи:
- обнаружение образов транспортного средства по заранее обученному классификатору
- обнаружение дорожной разметки.
После обнаружения в кадре образов транспортных средств, найденные соответствия сравниваются с границами найденной дорожной разметки. Если предположительный объект находится в допустимом диапазоне разметки, он считается транспортным средством, иначе данный объект исключается из рассмотрения, предполагая, что транспортные средства движутся на дороге в соответствии с дорожной разметкой.
Признаки Хаара
Функции Хаара (Haarfeatures) представляют из себя примитивы прямоугольной формы показанной на рис.1. Признак — отображение f: X => Df где Df — множество допустимых значений признака. Если заданы признаки fi_, — ,fn, то вектор признаков х = (/i(x), ...,/^(х))называется признаковым описанием объектах 6 X. Признаковые описания допустимо отождествлять с самими объектами. При этом множество X = * ... * Dfn называют признаковым пространством [3].
Численная характеристика изображения, соответствующая конкретному признаку Хаара, определяется посредством вычитания суммарного значения области темных пикселей из суммарного значения области светлых пикселей.
1. Edge features
шнФФ
(а) (Ъ) (с) (d)
шшв! <*><т>
(с) (dl (е) О (S) W
(a) (b) (с) (d) (
3. Center-surround features
(a) (HJ
4. Special diagonal line feature used in [3,4,5]
H
Рис. 1 - Признаки Хаара
Эти примитивы используются в роли признаков для классификации. Для обнаружения этих признаков использует интегральное представление изображений.
Интегральное представление
Интегральное представление изображения [2] позволяет быстро рассчитать суммарную яркость произвольного прямоугольника на данном изображении, причем какой бы прямоугольник не был, время расчета неизменно. В каждом элементе матрицы хранится сумма интенсивности всех пикселей, находящихся левее и выше данного элемента. Элементы матрицы рассчитываются по следующей формуле: 1 i < x,j < у 0 ,j = 0 *
где I(i,j) - яркость пикселя исходного изображения. Каждый элемент матрицы L(x,y) представляет собой сумму пикселей в прямоугольнике от (0,0) до(х,у), т.е. значение каждого пикселя (х,у) равно сумме значений всех пикселов левее и выше данного пикселя. Расчет матрицы занимает линейное время, пропорциональное числу пикселей в изображении, поэтому интегральное изображение просчитывается за один проход.
Расчет матрицы рассчитывается по формуле: L(x,y) = I(x,y) — L(x — 1,у — 1) + L(x,y — 1) + L(x — 1 ,у)
По такой интегральной матрице очень быстро вычисляется сумма пикселей произвольного прямоугольника, произвольной площади. Пусть в прямоугольнике ABCD есть интересующий объект D (рис.2).
Рис. 2 - Интересующий объект D в прямоугольнике
Из рис.2. видно, что сумму внутри прямоугольника можно выразить через суммы и разности смежных прямоугольников по следующей формуле:
Б(АВСО) = Ь(А) + Ь(С) -Ь(В)- Ь(Р) Алгоритм сканирования окна с признаками выглядит так:
- есть изображение, выбрано окно сканирования, выбраны используемые признаки
- далее окно сканирования начинает последовательно двигаться по изображению с шагом в 1 ячейку окна,
- при сканировании изображения в каждом окне вычисляется приблизительно 200 000 вариантов расположения признаков, за счет изменения масштаба признаков и их положения в окне сканирования, -сканирование производится последовательно для различных масштабов,
- масштабируется не само изображение, а сканирующее окно (изменяется размер ячейки),
- все найденные признаки попадают к классификатору.
В процессе поиска вычислять все признаки сложно. Классификатор должен реагировать только на определенное, подмножество всех признаков. Для этого необходимо обучить классификатор нахождению транспортных средств по данному определенному подмножеству. Для этой цели используется алгоритм Adaboost, задача которого выбрать те примитивы, которые наиболее эффективно выделяют данный объект.
Алгоритм Adaboost
Эффективная модель, допускающая мало ошибок классификации, называется «сильной». «Слабая» же, напротив, не позволяет надежно разделять классы или давать точные предсказания, делает в работе большое количество ошибок. Бустинг [3] -это процедура последовательного построения композиции алгоритмов машинного обучения, когда каждый следующий алгоритм стремится компенсировать недостатки композиции всех предыдущих алгоритмов.
Идея бустинга заключается в том, чтобы, имея множество плохих (незначительно отличающихся от случайных) алгоритмов обучения, получить один хороший. В основе такой идеи лежит построение цепочки классификаторов, который называется каскадом, каждый из которых обучается на ошибках предыдущего. Таким образом, имеет место последовательная обработка примеров каскадом классификаторов, причем так, что задача для каждого последующего становится труднее. Результат определяется путем простого голосования: пример относится к тому классу, который выдан большинством моделей каскада.
Бустинг над решающими деревьями считается одним из наиболее эффективных методов с точки зрения качества классификации.На примере бустин-га стало понятно, что хорошим качеством могут обладать сколь угодно сложные композиции, если их правильно настраивать [3].
Математическая формулировка бустинга: Наряду с множествами X и 7 вводится вспомогательное множество Я, называемое пространством
оценок. Рассматриваются алгоритмы, имеющие вид суперпозиции а(х) = С(Ь(х)), где функция b: X ^ R называется алгоритмическим оператором, функция C: R ^ Y - решающим правилом. Многие алгоритмы классификации имеют именно такую структуру: сначала вычисляются оценки принадлежности объекта классам, затем решающее правило переводит эти оценки в номер класса. Значение оценки, как правило, характеризует степень уверенности классификации. Алгоритмическая композиция - алгоритм
а:Х ^ Y видаа (х) = C(F(b1(x), ...,bT(xj)),x 6 X, составленный из алгоритмических
ров bt:X ^ R,t = 1,...,Т, корректирующей операции F:RT ^ R и решающего правила C:R ^ Y. Ба-зовымиалгоритмами обозначаются функции at(x) = C(bt(x)), а при фиксированном решающем правиле C — и сами операторы bt(x). Суперпозиции вида F(b1,.,bT) являются отображениями из X в R, то есть, опять же, алгоритмическими операторами.
В задачах классификации на два непересекающихся класса в качестве пространства оценок обычно используется множество действительных чисел. Решающие правила могут иметь настраиваемые параметры. Процесс последовательного обучения базовых алгоритмов применяется, чаще всего при построении композиций. Критерии останова могут использоваться различные, в зависимости от специфики задачи, возможно также совместное применение нескольких критериев:
• построено заданное количество базовых алгоритмов T;
• достигнута заданная точность на обучающей выборке;
• достигнутую точность на контрольной выборке не удаётся улучшить на протяжении последних нескольких шагов при определенном параметре алгоритма.
Развитием данного подхода явилась разработка более совершенного семейства алгоритмов бустин-га AdaBoost (adaptiveboosting - адаптированное улучшение), предложенная Йоавом Фройндом (Freund) и Робертом Шапиром (Schapire) в 1999 году, который может использовать произвольное число классификаторов и производить обучение на одном наборе примеров, поочередно применяя их на различных шагах. Рассматривается задача классификации на два класса, Y = {-1, +1}. К примеру, базовые алгоритмы также возвращают только два ответа -1 и +1, и решающее правило фиксировано: C(b) = sign(b). Искомая алгоритмическая композиция имеет вид:
a(x) = c{F(b1(x).....bT(x)))
= sign(^t=^1atbt(xjj,x 6Х
Функционал качества композиции Qt определяется как число ошибок, допускаемых ею на обучающей выборке:
(2(Ь,ш1) = Qт = ^t==1{yi^t = ^А^)] < 0,
где, Ш1 = .ж^- вектор весов объектов. Для
решения задачи нужна экспоненциальная аппроксимация пороговой функции потерь [г < 0], причем экспонента Ег = е~г. Общий алгоритм адаптивного усиления, AdaBoost, выглядит следующим образом: Дано:
• У = {-1,+1},
• Ь±(х),...,Ът(х) возвращают -1 и + 1,
X1 - обучающая выборка.
Решение:
1. Инициализация весов объектов:
w1:= 1/1, 1 = 1, . . . , I;
для всех t = 1, . . . , Т, пока не выполнен критерий останова:
2Ъг:=аг2 1шц>(3(Ь:1ЛгС): а
3. Пересчёт весов объектов. Правило мультипликативного пересчёта весов. Вес объекта увеличивается
а
в раз, когда Ь, допускает на нём ошибку, и во столько же раз уменьшается, когда Ь правильно классифицирует х1. Таким образом, непосредственно перед настройкой базового алгоритма наибольший вес накапливается у тех объектов, которые чаще оказывались трудными для предыдущих алгоритмов:
4. Нормировка весов объектов:
Другими словами это выглядит следующим образом:
Весь процесс обучения состоит из нескольких этапов обучения, на каждом этапе из всего множества слабых классификаторов мы выбираем один который лучше всего сработал на примерах, которые ранее оказались трудными. Трудность примеров будем записывать с помощью веса и в конце составим общий классификатор как линейную комбинацию слабых классификаторов. Например, у нас имеется обучающая выборка, состоящая из «плюсов» и «минусов» объектов двух классов. Нам нужно построить классификатор, который отделяет их. В качестве классификатора будет использоваться разделение пространства по прямой вертикальной или горизонтальной линии. На рис.3 изображен пример хорошего классификатора. Но он является сложным, у нас имеются только вертикальные и горизонтальные прямые.
На первом этапе, найдем среди всех простых признаков, т.е. вертикальных и горизонтальных линий, линию, которая наилучшим образом разделяет текущий пример. Допустим это окажется классифи-
катор как на рис.4. Все что левее это «плюсы» все что правее «минусы».
+ *
+;* (±f
ш —
_
* _
+
+ +
А, 8, = 0.300 о2
а,=0.424
Рис. 4 -1-й классификатор
Классификатор разделил пример на 2 половинки. «Плюсы» справа он классифицировал неправильно, значит, для него они являются трудными примерами. Мы запишем это для следующей итерации, увеличив их вес, для иллюстрации увеличим их размер.
Рис. 3 - Пример хорошего классификатора
На второй итерации нужно найти классификатор, который наилучшим образом классифицирует все примеры с учетом их веса. Поскольку не правильно классифицированные из 1-го этапа «плюсы» стали важными, скорее всего из двух классификаторов, горизонтального и вертикального, мы выберем тот, который лучше классифицирует их. Лучшим классификатором оказался изображенный на рис 5. Потому что он надежно убирает два «минуса», а слева примеры он классифицировал частично правильно
частично не правильно.
= 0.196 а2=0.704
Рис. 5 - 2-йклассификатор
Третий классификатор уже поделил их вертикально, т.е. разделил верхние «плюсы» от нижних «минусов» (рис.6.).
Если теперь мы просуммируем все эти классификаторы с весами, то мы получим результирующий сложный классификатор, который состоит из комбинации трех простых классификаторов (рис.7)
е3 = 0.344 а2=0.323 Рис. 6 - 3-й классификатор
Рис. 7 - Результирующий классификатор
Эта линейная сумма будет аппроксимировать идеальный сложный классификатор.
Оператор LBP
Оператор LBP впервые был предложен T.Ojala в 1996 году [5]. Он представляет собой эффективный оператор, который представляет каждый пиксель изображения в виде бинарного числа, зависящего от интенсивностей соседних пикселей изображения.
Этот оператор является эффективным в вычислительном плане, так как работает только с целочисленной арифметикой (это позволяет достигать real-time производительности в некоторых задачах), а также он инвариантен к изменениям яркости на изображении, вызванным съемкой в различных условиях освещения.
Классический LBP, который применяется к пикселю изображения, использует восемь пикселей окрестности (рис.8).
Рис. 8 - LBP оператор
Он принимает центральный пиксель в качестве порога и сравнивает значение яркости в каждом пикселе окрестности с ним. Если это значение больше порога (или равное значение), то пиксель принимает значение 1. Если же меньше — 0. Полученное восьмибитное число характеризует окрестность пикселя. Всего вариантов таких чисел 2Л8=256. Таким образом, мы присвоили каждому пикселю изображения одну из 256 меток, характеризующих его. Далее из
Л
Í $ \ ■
!> *
1 * *
Л
• * .1
* N
*
*
•
♦ • *
• *
•
!'*■ % • ■
этих данных строитсягистограмма, и сравниваются текстуры по гистограммам LBP.
Однако в этом методе не используются окрестности произвольного радиуса с произвольным числом значащих пикселей. В 2002 году был предложен метод eLBP (extended LBP), который удовлетворяет этим условиям. Теперь окрестность выглядит как на рис.9.
Рис. 9 - Модификация оператор LBP, eLBP
Для нахождения значения яркости в точках произвольной окрестности пикселя используется билинейная интерполяция. То есть точке присваивается среднее взвешенное значение соседних пикселей. В остальном метод работает таким же образом, как классический LBP.
Однако видно, что с увеличением окрестности, увеличивается количество разрядов в числах, с которыми требуется вести работу. То есть для окрестности радиуса 2 из 16 точек требуется работать уже с числами, состоящими из 16 бит. И количество би-нов гистограммы становится огромным. Через некоторое время было выяснено, что больше всего информации несут так называемые uniformpatterns. Суть заключается в том, что эти паттерны содержат не более определенного числа переходов от 0 к 1 в записи и наоборот. То есть числа 00011000 или 00000000 будут являться uniformpatterns, а 00100100 - нет, если заданное число переходов - два (000 переход 11 переход 000 -uniform (2 перехода), 00 переход 1 переход 00 переход 1 переход 00 - нет (4 перехода).
Оператор LBP применяется как составная часть многих классификаторов. Самое простое применение - это составление гистограмм и сравнение их. Также он используется с такими алгоритмами машинного обучения, как SVM и AdaBoost.
Обнаружение дорожной разметки
Метод обнаружения разметки основан на создании вида картинки сверху, используя обратное перспективное отображение
(inverseperspectivemapping, IPM). Это изображение затем фильтруется, используя выборочные Гауссовы пространственные фильтры, которые оптимизированы для обнаружения вертикальных линий. Это отфильтрованное изображение по порогу оставляет только самые высокие значения, прямые линии обнаруживаются, используя упрощенное Хью преобразование, за которым следует шаг обозначения линии методом RANSAC, а затем шаг установки новых сплайнов RANSAC выполняется для уточнения обнаруженных прямых линий и правильного определения изогнутых дорожек. Наконец, выполняется очистка и шаг локализации во входном изображении для обнаружениясплайнов.
Первым шагом генерируется вид сверху изображений дороги. Это имеет 2 преимущества:
- мы можем избавиться от эффекта перспективы в изображении, а также полос которые сходятся на горизонте, линии теперь вертикальны и параллельны. При этом используется главное предположение, что полосы параллельны (или близко параллельны) к камере;
- мы можем сосредоточить внимание только на подобласти входного изображения, которое значительно помогает в снижении времени работы.
Чтобы получить 1РМ входное изображение, мы предполагаем, что дорога является ровной, и используем параметры камеры собственные (фокусное расстояние и оптический центр) и внешние (угол наклона, угол поворота вокруг вертикальной оси, и высоту над землей), чтобы выполнить это преобразование. Мы начнем с определения мирового кадра = [ХШ,УШ,1Ш]
центрированным на оптический центр камеры, кадр камеры {^с} = { ХС,УС,1С}, и изображение кадра = {и, V} показаны на рис.10.
Рис. 10 - 1РМ координаты. Слева: оси координат (мировой, камеры, и изображения кадров). Справа: угол наклона « и угол поворота вокруг вертикальной оси р
Мы предполагаем что кадр камеры Хс остается в плоскости Хш, кадра мира, т.е. мы позволим угол наклона и угол поворота для оптической оси. Высота кадра камеры над плоскостью земли к. Начиная с любой точки на плоскости изображения 1Р = {и, V, 1,1}, можно показать, что их проекции на плоскости дороги могут быть найдены с применением однородного преобразования а1Т =
i --с? fu 2 1 — Si Sn fv 1 2 1 1 ~jTCuC2 — ~^CVS1S2 — C1S2 0
1 fu 2 1 — S1C1 1 1 — J^CUC 2 — ~jT CVS1C2 — C1C2 0
0 1 7ci Jv 1 , f CVC1 + 51 Jv 0
0 1 -~hfv 1 1 -CvC^-Si 0
Т.е. дР = g¡T 1Р точка на переднем плане соответствующая 1Р на плоскости изображения, где {fu,fv} горизонтальные и вертикальные фокусные расстояния, соответственно, {си, cv} координаты оптического центра, и сг = cos a, с2 = cos р, s1 = sin a, и s2 = sin p. Эти преобразования могут быть эффективно вычислены в матричной
форме для сотен точек. Обратное преобразование может быть легко установлено
Здесь снова, начиная с точки на переднем плане дР = {хд,уд,—к,1\ мы можем получить ее субпиксельные координаты на изображении кадра 1Р = дТ 9Р, а затем масштабировать однородную часть. Используя эти два преобразования, мы можем спроектировать окно интереса от входного изображения на земную плоскость. Рис. 11 показывает типовое изображение 1РМ. Как видно, дорожная разметка в 1РМ изображении имеет фиксированную ширину и появляются как вертикальные параллельные прямые.
Рис. 11 - 1РМ пример. Слева: входное изображение с интересующим регионом в красном. Справа: 1РМ картинка
Далее применяется фильтрация и пороговая
обработка (рис.12), за которыми следует
обнаружение линий Хью преобразованием и методом RANSAC[9].
|
Рис. 12 - Фильтрация изображения и пороговая обработка. Слева: используемое ядро для фильтрации. Середина: после фильтрации. Справа: после пороговой обработки
Условия. Инструменты
Для обучения классификатора необходимы:
- изображения транспортных средств из реальной среды.
- выборка отрицательных фотографий, на которых отсутствует объект распознавания (транспортное средство).
- библиотека компьютерного зрения OpenCV. В данной статье использовалась версия 2.4.10.
- интегрированная среда разработки Microsoft Visual Studio 2012.
В данной статье для примеров и контрпримеров использовалась база [6] транспортных средств состоящая из 3500 положительных образцов и 1628 отрицательных образцов для классификатора Хаара
и другая база [7] с 1000 положительными примерами и 800 отрицательными примерами для оператора LBP. Для обоих случаев использовалось 16 каскадных обучающих этапов (stages). Алгоритмом усиления классификаторов бы GentleAdaboost.
Примеры положительных и отрицательных образцов для классификатора Хаара и оператора LBP показаны на рис.13,14,15.
Рис. 13 - Примеры положительных примеров для классификатора Хаара
Рис. 14 - Положительные примерьЛВР
Рис. 15 - Отрицательные примеры Хаара и LBP
Машинное обучение проводилось на персональном компьютере со следующими характеристиками:
- Процессор: AMD Athlon(tm) X2 Dual-Core QL-65 2.10 Ghz
- ОЗУ: 4,00 ГБ
- Тип системы: 64-разрядная операционная система Windows 7 SP1.
Результаты
По результатам видно, что в случае применения признаков Хаара без вспомогательной информации
о разметке есть многочисленные ложные ошибки распознавания 2 рода, это объясняется не качественной выборкой положительных примеров. К тому же время, потраченное на обучение классификатора признаками Хаара, составило более 71 часа, в то время как обучение классификатора оператором LBP составило 58 минут. Несмотря на то, что во втором случае положительных образцов было меньше в 3 раза, различие скорости времени работы алгоритмов не пропорциональное. Этот факт объясняется тем, что в своих расчетах каскад Хаара использует числа с плавающей точностью, а каскад LBP целые числа.
Рис. 16 - Результаты обнаружения с оператором LBP
Рис. 17 - Результаты обнаружения с оператором Хаара
По результатам проведенных испытаний обнаружения с информацией о дорожной разметке были выявлены следующие закономерности:
- дорожная разметка успешно идентифицируется;
- транспортные средства успешно (рис.18) локализуются относительно дорожной разметки.
Рис. 18 - Правильно обнаруженная разметка и транспортное средство
Однако в некоторых сложных обстановках система дает сбой в виде неправильно обнаруженных сплайнов и транспортных средств (рис.19).
Рис. 19 - Неправильное обнаружение Выводы
По полученным результатам были сделаны следующие выводы. В некоторых случаях (как правило, когда важна скорость работы системы) имеет смысл использоватькаскад с LBP функциями вместо признаков Хаара. Когда важна точность обнаружения лучше использовать каскад Хаара, например, в медицине при обнаружении опухолей, патологических клеток (признаков), где ошибки 1-го и 2-го рода (неверно отвергнута, неверно принята соответственно) имеют огромное значение. Для успешного решения задачи обработки изображений необходима хорошая база данных, т.е. положительных и отрицательных примеров.
Плюсы А daBoost:
- хорошая обобщающая способность. В реальных задачах практически всегда строятся композиции, превосходящие по качеству базовые алгоритмы. Обобщающая способность может улучшаться по
мере увеличения числа
- базовых алгоритмов;
- простота реализации;
- время построения композиции практически полностью определяется временем обучения базовых алгоритмов;
- возможность идентифицировать объекты, являющиеся шумовыми выбросами. Это наиболее «трудные» объекты х^ для которых в процессе наращивания композиции веса wi принимают наибольшие значения.
Минусы AdaBoost
Бывает переобучение при наличии значительного уровня шума в данных. Экспоненциальная функция потерь слишком сильно увеличивает веса «наиболее трудных» объектов, на которых ошибаются многие базовые алгоритмы. Однако именно эти объекты чаще всего оказываются шумовыми выбросами. В результате AdaBoost начинает настраиваться на шум, что ведёт к переобучению. Проблема решается путём удаления выбросов или применения менее «агрессивных» функций потерь. В частности, применяется алгоритм GentleBoost.
AdaBoost требует достаточно длинных обучающих выборок. Другие методы линейной коррекции, в частности, бэггинг, способны строить
алгоритмы сопоставимого качества по меньшим выборкам данных.
Бывает построение неоптимального набора базовых алгоритмов. Для улучшения композиции можно периодически возвращаться к ранее построенным алгоритмам и обучать их заново.
Бустинг может приводить к построению громоздких композиций, состоящих из сотен алгоритмов. Такие композиции исключают возможность содержательной интерпретации, требуют больших объёмов памяти для хранения базовых алгоритмов и существенных временных затрат на вычисление классификаций.
Недостатком алгоритма обнаружения дорожной разметки является, необходимость точной калибровки камеры.
Описанная методика имеет достаточно широкое применение, в том числе при оценке загрузки трафика различным транспортом. Полученная информация о транспортных потоках имеет интерес для оценки состояния и планировании транспортных коридоров грузовых потоков [10-11].
Исследование выполнено при финансовой поддержке гранта РГНФ в рамках научного проекта №15-12-16001 «Развитие финансовых механизмов управления транспортной системой крупных городов и регионов России»
Литература
1. Сайфудинов И.Р., Мокшин В.В., Кирпичников А.П. Многоклассовое обнаружение и отслеживание транспортных средств в видеопоследовательности // Вестник Казанского технологического университета. 2014. Т. 17. № 19. С. 348-355.
2. О.Н. Рожко, В.В.Хоменко, Е.В. Макарова Инновации в управлении транспортными логистическими системами: монография . Казань: Изд-во «Бриг». 2015. -187 с.
3. P. Viola and M.J. Jones, «Rapid Object Detection using a Boosted Cascade of Simple Features», proceedings IEEE Conf. on Computer Vision and Pattern Recognition (CVPR 2001), 2001
4. Р.Гонсалес, Р.Вудс, «Цифровая обработка изображений», ISBN 5-94836-028-8, изд-во: Техносфера, Москва, 2005. - 1072 с.
5. Jan "Sochman, Ji"r'iMatas, «AdaBoost», Center for Machine Perception, Czech Technical University, Prague, 2010
6. Yoav Freund, Robert E. Schapire, «A Short Introduction to Boosting», Shannon Laboratory, USA, 1999., pp. 771-780
7.Zhiguang Yang, Haizhou Ai: Demographic Classification with Local Binary Patterns. ICB 2007: 464-473.
8. https://yadi.sk/d70H2AipxrcrXqyMaltsevAnton
9. L. Dlagnekov and S. Belongie, UCSD/Calit2 Car License Plate, Make and Model Database, http://vision.ucsd.edu/car_data.html
10. Монография под редакцией проф. Шарнина Л.М. Обнаружение и идентификация динамических объектов в системах компьютерного зрения. Изд-во: Школа, Казань, 2014.-356с.
11. Мокшин В.В., Кирпичников А.П., Шарнин Л.М. Отслеживание объектов в видео потоке по значимым признакам на основе фильтрации частиц // Вестник Казанского технологического университета. 2013. Т. 16. № 18. - С. 297-303.
© В. В. Мокшин - канд. тех. наук, доцент каф. автоматизированных систем обработки информации и управления КНИТУ-КАИ, e-mail: [email protected]; А. П. Кирпичников - док. физ.-мат. наук, зав. каф. интеллектуальных систем и управления информационными ресурсами КНИТУ, e-mail: [email protected]; И. М. Якимов - канд. техн. наук, профессор кафедры автоматизированных систем обработки информации и управления КНИТУ-КАИ им А.Н.Туполева; И. Р. Сайфудинов - аспирант кафедры автоматизированных систем обработки информации и управления КНИТУ-КАИ им А.Н.Туполева, e-mail: [email protected].
© V. V. Mokshin- PhD, Associate Professor of the Department of Automated Information Processing Systems & Control, KNRTU named after A.N. Tupolev, e-mail: [email protected]; A. P. Kirpichnikov - Dr. Sci, Head of the Department of Intelligent Systems & Information Systems Control, KNRTU, e-mail: [email protected]; I. M. Yakimov - PhD, Professor of the Department of Automated Information Processing Systems & Control, KNRTU named after A.N. Tupolev; I. R. Saifudinov - Graduate Student of the Department of Automated Information Processing Systems & Control, KNRTU named after A.N. Tupolev, e-mail: ildar09@mailru.