Распознавание дорожного полотна

Юнусова Лилия Рафиковна; Магсумова Алия Рафиковна

РАСПОЗНАВАНИЕ ДОРОЖНОГО ПОЛОТНА Юнусова Л.Р.1, Магсумова А.Р.2

1Юнусова Лилия Рафиковна - магистрант;

2Магсумова Алия Рафиковна - магистрант, направление: информатика и вычислительная техника, магистерская программа: технология разработки программного обеспечения, кафедра информационных систем, отделение информационных технологий и энергетических систем, Высшая инженерная школа Набережночелнинский институт Казанский федеральный университет, г. Набережные Челны

Аннотация: в статье рассматривается и анализируется распознавание дорожного полотна, описывается метод использования сегментирования изображения. Ключевые слова: детектирование, распознавание, разметка, полотно, сегментация.

Для распознавания дороги используются семантические сегменты. Каждый пиксель становится меткой для лотереи и средства изображения. Это основное отличие от классификации, когда все изображение наносится только на одну метку. Один объект того же класса, что и многие другие произведения.

Различные объекты того же класса, что и объекты, которые обрабатывают экземпляр, разделяются. Обычно разбиение экземпляра осуществляется с помощью семантического, а не более сложного.

Классический метод сегментации. До эры глубокого обучения для сегментации использовались различные методы обработки изображений, в зависимости от области интересов.

Самым простым способом семантической классификации является присвоение конкретной метки, поскольку необходимо вручную соблюдать правила или характеристики кодирования и область видимости. Эти правила могут быть оформлены как свойства пикселей, например, интенсивность серого. Один из способов использовать эту технику называется алгоритм разделения и слияния. Этот алгоритм рекурсивно делит изображения на субдомены, и, если они не принадлежат определенной метке, смежные субдомены с одинаковой меткой

Проблема этого метода заключается в том, что вы должны написать правила вручную в коде. Тем не менее, может быть очень сложно описать сложные классы типа «человек» только с информацией об интенсивности серого. В этом случае, укажите, какие сложные объекты, функции извлечения и методы оптимизации необходимы соответствующим образом.

Было предложено несколько решений для улучшения качества базовой модели FCN. Ниже приведены некоторые решения, которые доказали свою эффективность:

U-Net - это простое улучшение архитектуры FCN. Связь по сети Skype между выходом блока свертки и каждым входом транспонированного блока свертки того же уровня.

Рис. 1. Схема и-Ые1 сети

Различные изображения от градиентов и информативные, так что вы можете убить. От информации к крупномасштабному (верхний уровень) классифицируется по модели от информации к сегменту по более глубокому уровню модели небольшого масштаба.

Работа этой сети по распознаванию проезжей части.

Рис. 2. Модель тирамису

Эта модель похожа на UNet, но, как показано в densenet, плотные блоки используются для прямых и транспонированных извилин. Темный блок - это многократный сверточный слой, который используется в качестве входных данных для всех предыдущих слоев из сопоставления объектов и последующих слоев. В результате сеть функционирует с очень эффективными параметрами от пожилых людей.

Рис. 3. Схема сети Тирамису

Недостаток этого метода является результатом характера комбинаторных операций в нескольких системах машинного обучения и является менее эффективным с точки зрения памяти. Следовательно, это мощный кластерный графический процессор, который требует этой архитектуры.

Мультимасштабный метод

Некоторые модели глубокого обучения явно отличаются от информации о методе представления. Например, ParsNet Scene Parsing (PSPNet) использует ядра разных размеров для вывода сопоставлений объектов из сверточных нейронных сетей (таких как ResNet). Пересчитайте размер вывода и вывод функции дисплея из CNN. Для генерации прогноза на объединенном выводе выполняется окончательная свертка.

Рис. 4. Архитектура сети PSPNet

Метод информации о том, отличается ли глубокое изучение некоторых моделей от других. Например, обязательство поддерживать анализ сцен в анализе Размер чистого ядра выводится из сопоставления объектов в сверточную нейронную сеть ResNet. Выходной размер из CNN и выходной сигнал функции функции пересчитываются. Окончательная свертка выполняется на объединенном выводе для получения прогноза. Функция потери Дайса

Это также компенсирует крайнюю предвзятость класса к проблеме разделения значения, используемого для решения другой популярной потери и функции. Функция Dice используется для вычисления перекрытия между предсказанным классом и фактическим классом. Коэффициент Dyce (D) рассчитывается по

следующей формуле:

D =

2 x£W

е £

Наша цель - максимизировать совпадение между предсказанным классом и истинным (другими словами, мы хотим максимизировать коэффициент кости). Вместо этого мы будем иметь дело с более знакомой минимизацией (1-0), поскольку большинство библиотек машинного обучения предоставляют широкие возможности только для минимизации.

OD

dpj

= 2

(Й^+ЕГ*?)'

Производная коэффициента Дайса

Рис. 6. Семантическая сегментация

Список литературы

1. Грузман И.С., Киричук В.С., Косых В.П., Перетягин Г.И., Спектор А.А. Цифровая обработка изображений в информационных системах: Учеб. пособие. Новосибирск.: Изд-во НГТУ, 2003. 352 с.

2. Гонсалес P. Цифровая обработка изображений / P. Гонсалес, Р. Вудс. М.: Техносфера, 2005. 1072 с.

3. Маркелов А.А. Алгоритмы и программная система классификации полутоновых изображений на основе нейронных сетей: Диссертация на соискание ученой степени кандидата технических наук / А.А. Маркелов. Томск, 2007.

Распознавание дорожного полотна Текст научной статьи по специальности «Компьютерные и информационные науки»

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Юнусова Лилия Рафиковна, Магсумова Алия Рафиковна

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Юнусова Лилия Рафиковна, Магсумова Алия Рафиковна

Текст научной работы на тему «Распознавание дорожного полотна»