РАСПОЗНАВАНИЕ ДОРОЖНОГО ПОЛОТНА Юнусова Л.Р.1, Магсумова А.Р.2
1Юнусова Лилия Рафиковна - магистрант;
2Магсумова Алия Рафиковна - магистрант, направление: информатика и вычислительная техника, магистерская программа: технология разработки программного обеспечения, кафедра информационных систем, отделение информационных технологий и энергетических систем, Высшая инженерная школа Набережночелнинский институт Казанский федеральный университет, г. Набережные Челны
Аннотация: в статье рассматривается и анализируется распознавание дорожного полотна, описывается метод использования сегментирования изображения. Ключевые слова: детектирование, распознавание, разметка, полотно, сегментация.
Для распознавания дороги используются семантические сегменты. Каждый пиксель становится меткой для лотереи и средства изображения. Это основное отличие от классификации, когда все изображение наносится только на одну метку. Один объект того же класса, что и многие другие произведения.
Различные объекты того же класса, что и объекты, которые обрабатывают экземпляр, разделяются. Обычно разбиение экземпляра осуществляется с помощью семантического, а не более сложного.
Классический метод сегментации. До эры глубокого обучения для сегментации использовались различные методы обработки изображений, в зависимости от области интересов.
Самым простым способом семантической классификации является присвоение конкретной метки, поскольку необходимо вручную соблюдать правила или характеристики кодирования и область видимости. Эти правила могут быть оформлены как свойства пикселей, например, интенсивность серого. Один из способов использовать эту технику называется алгоритм разделения и слияния. Этот алгоритм рекурсивно делит изображения на субдомены, и, если они не принадлежат определенной метке, смежные субдомены с одинаковой меткой
Проблема этого метода заключается в том, что вы должны написать правила вручную в коде. Тем не менее, может быть очень сложно описать сложные классы типа «человек» только с информацией об интенсивности серого. В этом случае, укажите, какие сложные объекты, функции извлечения и методы оптимизации необходимы соответствующим образом.
Было предложено несколько решений для улучшения качества базовой модели FCN. Ниже приведены некоторые решения, которые доказали свою эффективность:
U-Net - это простое улучшение архитектуры FCN. Связь по сети Skype между выходом блока свертки и каждым входом транспонированного блока свертки того же уровня.
Рис. 1. Схема и-Ые1 сети
Различные изображения от градиентов и информативные, так что вы можете убить. От информации к крупномасштабному (верхний уровень) классифицируется по модели от информации к сегменту по более глубокому уровню модели небольшого масштаба.
Работа этой сети по распознаванию проезжей части.
Рис. 2. Модель тирамису
Эта модель похожа на UNet, но, как показано в densenet, плотные блоки используются для прямых и транспонированных извилин. Темный блок - это многократный сверточный слой, который используется в качестве входных данных для всех предыдущих слоев из сопоставления объектов и последующих слоев. В результате сеть функционирует с очень эффективными параметрами от пожилых людей.
Рис. 3. Схема сети Тирамису
Недостаток этого метода является результатом характера комбинаторных операций в нескольких системах машинного обучения и является менее эффективным с точки зрения памяти. Следовательно, это мощный кластерный графический процессор, который требует этой архитектуры.
Мультимасштабный метод
Некоторые модели глубокого обучения явно отличаются от информации о методе представления. Например, ParsNet Scene Parsing (PSPNet) использует ядра разных размеров для вывода сопоставлений объектов из сверточных нейронных сетей (таких как ResNet). Пересчитайте размер вывода и вывод функции дисплея из CNN. Для генерации прогноза на объединенном выводе выполняется окончательная свертка.
Рис. 4. Архитектура сети PSPNet
Метод информации о том, отличается ли глубокое изучение некоторых моделей от других. Например, обязательство поддерживать анализ сцен в анализе Размер чистого ядра выводится из сопоставления объектов в сверточную нейронную сеть ResNet. Выходной размер из CNN и выходной сигнал функции функции пересчитываются. Окончательная свертка выполняется на объединенном выводе для получения прогноза. Функция потери Дайса
Это также компенсирует крайнюю предвзятость класса к проблеме разделения значения, используемого для решения другой популярной потери и функции. Функция Dice используется для вычисления перекрытия между предсказанным классом и фактическим классом. Коэффициент Dyce (D) рассчитывается по
следующей формуле:
D =
2 x£W
е £
Наша цель - максимизировать совпадение между предсказанным классом и истинным (другими словами, мы хотим максимизировать коэффициент кости). Вместо этого мы будем иметь дело с более знакомой минимизацией (1-0), поскольку большинство библиотек машинного обучения предоставляют широкие возможности только для минимизации.
OD
dpj
= 2
(Й^+ЕГ*?)'
Производная коэффициента Дайса
Рис. 6. Семантическая сегментация
Список литературы
1. Грузман И.С., Киричук В.С., Косых В.П., Перетягин Г.И., Спектор А.А. Цифровая обработка изображений в информационных системах: Учеб. пособие. Новосибирск.: Изд-во НГТУ, 2003. 352 с.
2. Гонсалес P. Цифровая обработка изображений / P. Гонсалес, Р. Вудс. М.: Техносфера, 2005. 1072 с.
3. Маркелов А.А. Алгоритмы и программная система классификации полутоновых изображений на основе нейронных сетей: Диссертация на соискание ученой степени кандидата технических наук / А.А. Маркелов. Томск, 2007.