Автоматическое распознавание типа застройки для системы экологического мониторингая

Игнатьев А.В.; Гилка В.В.; Матыцына Д.А.

Автоматическое распознавание типа застройки для системы экологического мониторинга

А.В. Игнатьев, В.В. Гилка, Д.А. Матыцына Волгоградский государственный технический университет

Аннотация: В статье предложена методика автоматического распознавания типа застройки для системы экологического мониторинга. на базе свёрточных нейронных сетей. Для обучения нейронной сети была выбрана библиотека Kerns, содержащая многочисленные реализации основных компонентов нейронных сетей, таких как слои, целевые и передаточные функции, оптимизаторы, и множество инструментов для упрощения работы с изображениями и текстом. Описаны процессы реализации сети с помощью облачной платформы Google Colab, подготовки обучающей выборки, обучения построенной нейронной сети, а также ее тестирования при обучении. Результатом работы является модель свёрточной нейронной сети, способная с точностью порядка 90-92 процентов определять, какой конкретно тип застройки показан на картографическом изображении, что позволяет автоматизировать этот процесс и использовать её в качестве подсистемы для системы экологического мониторинга атмосферного воздуха. Ключевые слова: система экологического мониторинга атмосферного воздуха, распознание типа застройки, свёрточные нейронные сети, машинное обучение, компьютерное зрение.

Важным источником загрязнения атмосферного воздуха, значение которого в загрязнении городской среды возрастает с каждым годом, является автотранспорт. С ростом интенсивности автотранспортных потоков в городах, наиболее загрязненные территории переместились из промышленных зон в места компактного проживания населения. За последние годы в городах всего мира, в т.ч. РФ, происходит значительный рост количества автомобилей. По данным аналитического центра «Автостат», на 1 января 2018 года парк автомобильной техники на территории Российской Федерации составил 50,6 млн единиц. Почти 84% от этого числа приходится на легковые автомобили, легкой коммерческой технике принадлежит 8% от общего объема парка, грузовых автомобилей свыше 7%, около 1% российского парка занимают автобусы.

Волгоградская область входит в число двадцати пяти субъектов РФ с наибольшим количеством легковых автомобилей (около 660 тыс.). Доля выбросов загрязняющих веществ в атмосферу от автотранспорта в общем объеме выбросов в целом по области превышает 60%, а в городе Волгограде достигает 70%.

В отработавших газах автотранспорта обнаруживается около 280 компонентов, многие из которых являются токсичными.

Существующие атмосферные модели дисперсии, основанные на использовании комплексного подхода , такие как ОБРЫ [1, 2], САЬШЕ-4 [3], и комплексные системы на основе геоинформационных систем [4, 5], и др. не позволяют в полной мере учесть фактор рассеивания загрязняющих веществ внутри застройки, что является важным для оценки и прогнозирования загрязнения атмосферного воздуха в условиях города и при планировании сетей мониторинга.

Моделирование рассеивания выбросов автотранспорта в условиях различной застройки были выполнены Сидоренко В.Ф. на полигоне городского моделирования [6, 7].

В соответствии с полученными данными, распределение концентраций оксида углерода внутри жилой застройки определяется по характерным сочетаниям типов застроек.

При строчной застройке концентрация рассчитывается так же, как и на открытой территории (рис. 1). Угловая застройка позволяет снизить концентрацию СО на 10% (рис. 2). Перед фронтально стоящим зданием наблюдаются повышенные концентрации СО, за зданием концентрация снижается на 50-70% от расчётов на открытой территории (рис. 3). При замкнутых планировочных решениях в дворовом пространстве концентрация СО увеличивается на 20-30% по сравнению с ожидаемой для обычного фронтально расположенного здания (рис. 4).

Рис. 1. - Карта загазованности жилой застройки при строчной застройке

Рис. 2. - Карта загазованности жилой застройки при угловой застройке

Рис. 3. - Карта загазованности жилой застройки при фронтальной застройке

Рис. 4. - Карта загазованности жилой застройки при замкнутой застройке Программного продукта, позволяющего с помощью картографического изображения местности произвести распознавание типа застройки, не существует, а проведение подобной разметки вручную занимает продолжительное время.

Для решения задач распознания образов в данный момент наибольшую эффективность показывают нейронные сети различных архитектур [8, 9], но

только проект Романа Кучукова [10, 11] посвящен распознаванию типа застройки местности по спутниковым фотографиям. При этом программа не определяет каких-либо конкретных способов организации застройки, а лишь выделяет свойственные каждому временному промежутку микрорайоны и, таким образом, необходима разработка нейронной сети, созданной специально для задачи автоматического распознавания типа застройки для системы экологического мониторинга атмосферного воздуха.

Поскольку обучение нейронной сети - это процесс, требующий высокой вычислительной мощности, а также большого количества времени, было решено использовать облачный сервис Google Colaboratory (Google Colab) для обучения модели [12, 13].

Основная задача заключается в реализации максимально точного алгоритма, позволяющего распознать, какой тип застройки представлен на картографическом снимке. Для того чтобы решить поставленную задачу, необходимо подготовить качественную обучающую выборку. Это требование можно назвать главным.

Общий способ решения представлен поставленной задачи представлен на рис. 5.

Как видно из представленной диаграммы, процесс обучения схож со стандартной процедурой обучения нейронной сети для задач компьютерного зрения. Главным отличием являлось тестирование сети после каждой эпохи обучения. Валидационная выборка не всегда отображает реальное состояние обученности сети, так как данная выборка является частью обучающей выборки и, как следствие, изображения такой выборки так или иначе фигурировали в прошлых эпохах.

N /

Подготовка данных для обучения сети

N /

> Эпоха обучения нейронной сети

\ !

Проверка сети на валидационной выборке

*

Проверка сети на тестовой выборке

; V.

Пока значение качества распознавания на тестовой выборке не начало понижаться]

Рис. 5. - Общий способ решения Чтобы исключить возможность переобучения сети, а также повысить качество анализа степени подготовки сети к реальным испытаниям, была подготовлена тестовая выборка, состоящая из изображений, не входящих в процесс обучения. Процесс распознавания этих изображений не обучал сеть, а использовался для оценки текущего состояния сети. Таким образом, обучение сети было решено приостановить после десятой эпохи, когда процент угадывания на валидационной выборке еще повышался, а процент угадываний на тестовой выборке начал снижаться. Из этих данных был сделан вывод о том, что сеть готова к применению.

Поскольку в дальнейшем планируется интеграция в систему экологического мониторинга, важным аспектом была подготовка обучающей

выборки посредством тех же картографических изображений, что и будут использованы в самой системе. В существующей системе используется карты, созданные посредством программы QGIS [14], а также карта Волгоградской области, сгенерированная в этой программе. На рис. 6 представлен интерфейс программы, а также приведен пример карты,

используемой при обучении сети.

Рис. 6 - Главное окно программы QGIS С помощью данной программы был создан набор изображений, содержащих однозначно определенный тип застройки. Важным фактором при создании выборки был масштаб. Ведь если масштаб изображений на выборке будет слишком большим, то высока вероятность, что в изображения попадут и далеко стоящие здания, что приведет к неверному распознаванию типа застройки вблизи магистрали, а если масштаб будет слишком маленьким, то возможны случаи, когда по малому оцениваемому участку невозможно точно определить тип застройки. После проведения анализа карты местности и проб различных масштабов, было решено остановиться на квадратных изображениях 224 х 224 пикселя, содержащих участок земли приблизительно 100 х 100 метров. Такой масштаб позволяет захватить в

изображении автомобильную дорогу, относительно которой оценивается тип застройки, а также ближайшие соседние дома, но при этом не происходит попадания на изображения дворовых территорий за оцениваемым участком. Пример изображения, используемого для обучения сети, показан на рис. 7

Рис. 7 - Изображение строчной застройки для обучения сети Вручную был составлен набор из тысячи изображений и для каждого из изображений был определен тип застройки. Для увеличения объема выборки также была использована открытая нейросетевая библиотека Keras [15], направленная на работу с нейронными сетями глубинного обучения. С помощью функции ImageDataGenerator объем обучающей, валидационной и тестовой выборок был расширен в несколько раз путем разворота изображений на различное количество градусов, нанесения шумов, приближения изображения, а также сдвигом. Далее, с помощью нейронной сети Inception V3 было произведено обучение модели.

Использованная для обучения сверточная нейронная сеть проходила тестирование на определенной выборке при каждой из эпох обучения. Обучение нейронной сети было окончено, когда результат отгадывания на вручную отобранном для тестирования наборе изображений достиг 90 %. На представленных ниже рис. 8 и 9 представлены графики потерь и точности обучаемой нейронной сети при каждой эпохе.

Рис. 8 - График потерь при обучении нейронной сети

Рис. 9 - График точности нейронной сети при обучении Для валидационной выборки использовалось 10% от общей выборки, используемой при обучении.

Для тестовой выборки использовались изображения, не входящие в обучающий набор изображений. Они были вручную помечены и передавались сети, чтобы приблизительно оценить ее поведение в реальных условиях, когда передаваемые изображения не совпадают с теми, на которых сеть обучалась.

Как видно из представленных графиков, процент правильно распознанных изображений на валидационной выборке выше, чем на тестовой. Это объясняется тем, что при каждой эпохе валидационная выборка отбиралась случайным образом из общего набора изображений. Поэтому изображение, входящее в нее, в предыдущие эпохи проходило через сеть и прямо влияло на ее веса, в то время как тестовая выборка не влияла на обучение сети.

После 10-й эпохи было принято прекратить процесс обучения, так как процент отгадывания на тестовой выборке стал понижаться, что говорит о том, что сеть переобучилась.

Затем было решено в полуавтоматическом режиме протестировать обученную модель нейронной сети, выборочно проверив результат ее предсказаний и сравнив с ожидаемым.

Следует отметить, что для тестовой выборки использовались не только примеры, на которых явно отображен конкретный тип застройки, но и изображения, содержащие различные шумы в виде малоэтажных застроек, автомобильных дорог меньшей рядности, а также примеры, на которых тяжело однозначно определить тип застройки.

Сеть правильно распознавала в среднем 28 изображений из 30, что является отличным показателем для сверточных сетей.

Окончательная проверка производилась в режиме ручного тестирования с помощью графического интерфейса, созданого с помощью библиотеки Qt для языка Python.

Были созданы тестовые примеры, с помощью которых выполнялась проверка обучения нейронной сети.

На рис. 10 показано распознавание изображения со строчной застройкой.

Рис. 10 - Ручное тестирование программы изображением со строчной

застройкой

Аналогично протестировано распознавание других типов застройки.

Результатом работы является модель сверточной нейронной сети, способная с точностью порядка 90-92 процентов определять, какой конкретно тип застройки показан на картографическом изображении. Разработанное программное средство позволит в автоматическом режиме проводить распознавание типа застройки по картографическому изображению, не прибегая к помощи эксперта в данной области, а также сократит время на построение карты застройки при дальнейшей интеграции в систему мониторинга.

Работа выполнена при финансовой поддержке РФФИ и Администрации Волгоградской области. Проект № 19-47-340001.

Литература

1. Berkowicz R. OSPM - A Parameterised Street Pollution Model // Environmental Monitoring and Assessment. 2000. Volume 65, Issue 1-2. Pp. 323331.

2. Ottosen T.B., Ketzel M., Skov H., Hertel O., Brandt J., Kakosimos K.E. A parameter estimation and identifiability analysis methodology applied to a street canyon air pollution model // Environmental Modelling & Software. 2016. Volume 86. Pp. 165-176.

3. Benson P. CALINE4 - a dispersion model for predicting air pollutant concentrations near roadways. Sacramento, California: California Department of Transportation, Office of Transportation Laboratory, 1984. 296 p.

4. Абрамова А.Г., Плуготаренко Н.К., Петров В.В., Маркина А.В. Системный подход к разработке концепции экологического мониторинга промышленных городов // Инженерный вестник Дона, 2012, №4-2. URL: ivdon.ru/ru/magazine/archive/n4p2y2012/1342/.

5. Пашкевич М.А., Петрова Т.А. Оценка площадного загрязнения атмосферного воздуха в мегаполисе с использованием геоинформационных систем // Записки Горного института. 2017. Т. 228. С. 738-742.

6. Сидоренко В.Ф. Теоретические и методологические основы экологического строительства. Волгоград: ВолгГАСА, 2000. 200 с.

7. Аброськин А.А. Динамическая система экологического мониторинга атмосферного воздуха для обеспечения экологический безопасности строительных объектов: дис. ... канд. техн. наук наук: 05.23.19. Волгоград, 2017. 142 с.

8. Плуготаренко Н.К., Варнавский А.Н. Применение нейронных сетей для построения модели прогнозирования состояния городской воздушной среды // Инженерный вестник Дона, 2012, №4-2. URL: ivdon.ru/magazine/archive/n4p2y2012/1351/.

9. Соловьев Р.А., Тельпухов Д.В., Кустов А.Г. Автоматическая сегментация спутниковых снимков на базе модифицированной свёрточной нейронной сети UNET // Инженерный вестник Дона, 2017, №4. URL: ivdon.ru/ru/magazine/archive/n4y2017/4433.

10. CityClass project // URL: medium.com/@romankuchukov/cityclass-project-37a9ebaa1df7.

11. CityClass project#2 // URL: medium.com/@romankuchukov/cityclass-project-2-13fe3aa35860.

12. Colaboratory // URL: research.google.com/colaboratory/faq.html.

13. Google Colab Tutorial // URL: tutorialspoint.com/google_colab/index.htm.

14. Документация QGIS // URL: qgis.org/ru/docs/index.html#documentation-for-qgis-2-0.

15. Keras: The Python Deep Learning library // URL: keras.io.

References

1. Berkowicz R. Environmental Monitoring and Assessment. 2000. Volume 65, Issue 1-2. pp 323-331.

2. Ottosen T.B., Ketzel M., Skov H., Hertel O., Brandt J., Kakosimos K.E. Environmental Modelling & Software. 2016. Volume 86. pp 165-176.

3. Benson P. CALINE4 - a dispersion model for predicting air pollutant concentrations near roadways. Sacramento, California: California Department of Transportation, Office of Transportation Laboratory, 1984. 296 p.

4. Abramova A.G., Plugotarenko N.K., Petrov V.V., Markina A.V. Inzhenernyj vestnik Dona, 2012, №4-2. URL: ivdon.ru/ru/magazine/archive/n4p2y2012/1342/.

5. Pashkevich M.A., Petrova T.A. Zapiski Gornogo instituta, 2017. V. 228. pp. 738-742.

6. Sidorenko V.F. Teoreticheskie i metodologicheskie osnovy ekologicheskogo stroitel'stva [Theoretical and methodological foundations of ecological construction]. Volgograd: VolgGASA, 2000. 200 p.

7. Abros'kin A.A. Dinamicheskaya sistema ekologicheskogo monitoringa atmosfernogo vozdukha dlya obespecheniya ekologicheskiy bezopasnosti stroitel'nykh ob"ektov [A dynamic system of environmental monitoring of atmospheric air to ensure environmental safety of construction sites]: dis. ... cand. tech. Sciences: 05.23.19. Volgograd, 2017.142 p.

8. Plugotarenko N.K., Varnavskiy A.N. Inzhenernyj vestnik Dona, 2012, №42. URL: ivdon.ru/magazine/archive/n4p2y2012/1351/.

9. Solov'ev R.A., Tel'pukhov D.V., Kustov A.G. Inzhenernyj vestnik Dona, 2017, №4. URL: ivdon.ru/ru/magazine/archive/n4y2017/4433.

10. CityClass project URL: towardsdatascience.com/cityclass-project-eng-15bc5fcd8e1.

11. CityClass project#2 URL: towardsdatascience.com/cityclass-project-2-e08530dd0ccc.

12. Colaboratory URL: research.google.com/colaboratory/faq.html.

13. Google Colab Tutorial URL: tutorialspoint.com/google_colab/index.htm.

14. QGIS Documentation URL: qgis.org/en/docs/index.html#documentation-for-qgis-2-0.

15. Keras: The Python Deep Learning library URL: keras.io.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Игнатьев А. В., Гилка В. В., Матыцына Д. А.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Игнатьев А. В., Гилка В. В., Матыцына Д. А.

Automatic recognition of building type for environmental monitoring system

Текст научной работы на тему «Автоматическое распознавание типа застройки для системы экологического мониторингая»