УДК 556.555.6:504.064.36
В.С. Валиев, Р. Р. Хасанов, Д.В. Иванов
Институт проблем экологии и недропользования АН РТ, [email protected]
НЕЙРОСЕТЕВАЯ КОРРЕКЦИЯ ИНТЕРПОЛЯЦИОННЫХ УЗЛОВ МЕТОДА ОБРАТНЫХ ВЗВЕШЕННЫХ РАССТОЯНИЙ С ИСПОЛЬЗОВАНИЕМ ВСПОМОГАТЕЛЬНЫХ ДАННЫХ НА ПРИМЕРЕ ПОСТРОЕНИЯ БАТИМЕТРИЧЕСКИХ КАРТ
ВОДНЫХ ОБЪЕКТОВ
В работе продемонстрирован способ использования нейросетевых технологий для коррекции неполных рядов данных. Показан алгоритм коррекции батиметрических карт водных объектов, генерирующий недостающие узлы интерполяционных сеток с помощью специально спроектированной нейронной сети, прогнозирующей наиболее вероятные глубины в заданных диапазонах значений доли мелкодисперсных фракций донных отложений.
Ключевые слова: донные отложения; батиметрические карты; нейросети; малые реки; гранулометрический состав.
Введение
Изучение пространственной структуры природных объектов и их параметров предполагает построение интерполяционных поверхностей, визуализирующих распределение интересующих исследователя показателей.
Существует большое количество методов интерполяции, в простейшем случае при визуализации пространственного распределения данных применяют метод обратных взвешенных расстояний (Inverse Distance Weighting - IDW) (Lukaszyk, 2004). Недостатки этого метода интерполяции в той или иной мере присущи и другим методам, так как все они чувствительны к плотности и равномерности интерполяционных сеток.
Метод IDW использует систему взвешивания расположенных в пространстве точек, предполагающую, что объекты, которые находятся ближе, обладают большим сходством. Соответственно, ближайшие к интерполируемому местоположению измеренные значения показателя оказывают большее влияние на прогнозируемое значение, чем более удаленные от него. Алгоритм рассчитывает большие веса для точек, расположенных ближе к прогнозируемому местоположению, определяя их в виде степенной функции от расстояния, т.е. реализует экспоненциальный тип интерполяции (Lukaszyk, 2004).
Таким образом, метод обратных взвешенных расстояний является очень простым и достаточно эффективным методом интерполяции в тех случаях, когда интерполируемая поверхность покрыта точками фактических наблюдений относительно
равномерно. Однако в случаях, когда наблюдаются отсутствующие значения, неравномерное пространственное распределение данных метод IDW существенно искажает картину.
Очень часто проблема заключается в том, что для вычисления наиболее приближенных к реальности значений интерполируемого показателя не хватает данных. Одним из решений этой проблемы является использование при интерполяции дополнительных, корректирующих показателей, так или иначе взаимосвязанных с динамикой прогнозируемого показателя и способных прогнозировать его значения на уровне вероятностных оценок.
Материал и методика исследования
С целью построения и проверки алгоритма такой сводной корректируемой интерполяции были проведены экспериментальные расчеты глубин, основанных на частичных и разрозненных батиметрических данных, неопределенность которых корректировалась специально сконструированной нейронной сетью, обученной на закономерностях, полученных при статистической оценке распределения ряда характеристик донных отложений малых рек Республики Татарстан: Казанка, Меша, Свияга, Була, Карла, Мелекеска, Ушня, Мензеля и Ик (116 точек грунтовой съемки). Расстояние между соседними точками каждого створа не превышало 10 м.
Результаты и их обсуждение
Гранулометрический состав донных отложе-
2/212!
31
НЕЙРОСЕТЕВАЯ КОРРЕКЦИЯ ИНТЕРПОЛЯЦИОННЫХ УЗЛОВ МЕТОДА ОБРАТНЫХ ВЗВЕШЕННЫХ РАССТОЯНИЙ С ИСПОЛЬЗОВАНИЕМ ВСПОМОГАТЕЛЬНЫХ ДАННЫХ НА ПРИМЕРЕ ПОСТРОЕНИЯ БАТИМЕТРИЧЕСКИХ КАРТ ВОДНЫХ ОБЪЕКТОВ
ний рек на мелководье и на более глубоких участках различался количеством частиц размером <0.01 мм (табл.). Накопление тонкодисперсных частиц в речных отложениях более равномерно и инерционно, чем перепады глубин. Если в донных отложениях заданной точки на мелководье отмечается высокая доля мелкодисперсных фракций, то высока вероятность того, что в непосредственной близости к этой точке располагается более глубоководная зона и наоборот, если доля мелкодисперсных фракций невелика, то и вероятность присутствия по соседству более глубокого участка очень мала.
Указанная закономерность была отмечена только для верхнего слоя (0-15 см) донных отложений рек, отобранных с глубин до 8 м.
Очевидно, что если сопоставить обе характеристики - глубину и долю мелкодисперсных фракций - попарно, то становится заметно, что на разных глубинах могут встречаться как высокие, так и низкие значения доли мелкодисперсных фракций. Тем не менее, частота (вероятность) обнаружения высоких значений пелитовой фракции на более глубоких участках выше, соответственно, можно построить вероятностную кривую наблюдаемой зависимости.
В качестве нелинейного аппроксиматора использована нейронная сеть обратного распространения, построенная на классическом многослойном перцептроне Румельхарта (НеЬЬ, 2002).
Такую сеть легко можно интерпретировать как модель вход-выход, в которой веса и пороговые значения (смещения) являются свободными параметрами модели. Ее элементы организованы в послойную топологию с прямой передачей сигнала. Обучение перцептрона включает три стадии: 1) подача на входы обучающих данных; 2) обратное распространение ошибки; 3) корректировка весов ^ашей, 1994).
Активационная функция в алгоритме обратного распространения ошибки должна обладать непрерывностью, дифференцируемостью и являться монотонно неубывающей. Одной из наиболее часто используемых функций активации является логистическая (сигмоидальная) функция вида:
градиентными методами, к которым относится и метод обратного распространения ошибки.
Функционирование многослойного перцептрона можно представить следующими образом (Бухарин, Навоев, 2015). Нейрон имеет несколько входных сигналов X и один выходной сигнал OUT. Параметрами нейрона, определяющими его работу, являются: вектор весов w, пороговый уровень 0 и вид функции активации F:
NETj! =
X
¿7(1+1)
OUTa
где а - параметр наклона сигмоиды, изменяя который, можно построить функции с различной крутизной.
Гладкость, непрерывность функции активации — важные положительные качества. Непрерывность первой производной позволяет обучать сеть
где 1 - номер входа, j - номер нейрона в слое, l - номер слоя; x - входной сигнал; w - весовой коэффициент нейрона; NET - взвешенная сумма входных сигналов; 0 - пороговый уровень данного нейрона; F - функция активации.
Нами использовался многослойный пер-цептрон (два входа, один выход, три скрытых слоя с 15 нейронами, см. рис. 1). Крутизна сигмоида а=1.0; коэффициент импульса равен 0.9; скорость обучения 0.01, использовался также добавочный нейрон (сдвиг сети). Локальные минимумы на профиле ошибок обходили перераспределением весовых коэффициентов нейронов.
Программирование перцептрона осуществлялось в среде Delphi 7, IDW интерполяция и построение карт в ГИС MapInfo Pro 16.
Ошибка нейросети на обучающей выборке не превышала 0.001. Обучение продолжалось до тех пор, пока отмечалось совпадение снижения ошибок сети и на обучающем, и на контрольном массиве данных. Для того чтобы избежать переобучения сети, осуществлялось сопоставление градиента ошибок: если ошибка сети на контрольном наборе снижалась, а на обучающем нет, то обучение прерывалось.
Обучающий массив данных (алгоритм обучения «с учителем») представлял собой массив данных, содержащий информацию о долях мелкодисперсных фракций (<0.01 мм) в донных отложениях двух смежных точек и средней глубине в этих точках - всего 92 пары точек и их средняя глубина, контрольный - 40 аналогичных наборов. На вход X1 подавалось значение доли пелитовой фракции в одной такой точке, на вход X2 значение доли пелитовой фракции во второй точке, на выходе Y1 формировалась расчетная глубина.
После создания и тестирования нейросети был проведен эксперимент, суть которого заключалась в генерации карт глубин при различных исходных
32
российский журннл ииой экологии
Таблица. Вариационные показатели содержания частиц <0.01 мм в донных отложениях
малых рек, %
Квантили вариационного ряда Диапазоны глубин
до 1 м от 1 до 3 м от 3 до 5 м от 5 до 7 м более 7 м
0.25 квантиль 6.5 6.3 8.9 10.9 12.4
0.5 квантиль 11.5 15.2 17.7 19.7 21.6
0.75 квантиль 21.3 22.8 32.8 36.9 41.8
условиях: 1) по фактически полученным в результате замеров данным; 2) по тем же данным, но в условиях искусственно созданной неопределенности (при частичном удалении ряда точек), заполняемой интерполяцией методом IDW; 3) в условиях той же искусственно созданной неопределенности (при частичном удалении ряда тех же самых точек), но при расчете значений удаленных точек с помощью спроектированной нейросети.
Створы для генерации карт глубин были получены по реальным результатам замеров и сведены в виде матрицы 4x14 точек, представляющей гипотетический водный объект, главным условием которой явилось равенство расстояний между соседними точками. Это было сделано для того, чтобы при обработке нейросетью нивелировать влияние расстояния на каждую отдельно взятую точку и сформировать для расчетных значений
равные условия.
Первый способ генерации карты глубин (по полным рядам фактически замеренных значений) являлся контрольным и осуществлялся с помощью классического метода обратных взвешенных расстояний с параметрами интерполяции, подобранными для размерности 101x437 ячеек (рис. 2А).
Затем мы проредили сетку, удалив 16 репер-ных точек, и вновь провели IDW интерполяцию (рис. 2B). И наконец, была предпринята попытка восстановить удаленные значения с помощью нейросетевого аппроксиматора. Для этого вычислялось два значения: 1) средневзвешенное фактических глубин в точках, окружающих пропущенное значение, M1; 2) среднее значение расчетных глубин по точкам, между которыми находится пропущенное значение, полученное с помощью нейросети по долям содержащихся в этих точках мелкодисперсных фракций, М2. Значение глубины пропущенной точки рассчитывалось как среднее геометрическое M и М, ( v'Ml X M 2 )• В результате была
построена IDW интерполяция, представленная на рисунке 2C.
Рисунок 2 наглядно демонстрирует преимущество использования ней-росетевого корректора, уточняющего пропущенные значения с помощью дополнительной информации, недоступной стандартным методам интерполяции. Части A и C отображают практически одинаковую картину распределения глубин, тогда как классическая интерполяция пропущенных значений (часть B) в значительной степени искажает ее.
Рис. 1. Топология спроектированной нейросети
Заключение
Очевидно, что представленный в работе пример построения батиметри-
2/2121
33
НЕЙРОСЕТЕВАЯ КОРРЕКЦИЯ ИНТЕРПОЛЯЦИОННЫХ УЗЛОВ МЕТОДА ОБРАТНЫХ ВЗВЕШЕННЫХ РАССТОЯНИЙ С ИСПОЛЬЗОВАНИЕМ ВСПОМОГАТЕЛЬНЫХ ДАННЫХ НА ПРИМЕРЕ ПОСТРОЕНИЯ БАТИМЕТРИЧЕСКИХ КАРТ ВОДНЫХ ОБЪЕКТОВ
Интерполяция IDW по полным данным
B
Интерполяция IDW с отсутствующими значениями
C
Интерполяция IDW с расчетом отсутствующих значений нейросетью
Рис. 2. Карты глубин, построенные с коррекцией и без коррекции пропущенных значений
ческих карт требует целый ряд допущений и соблюдения определенной размерности, однако он демонстрирует необходимость и возможность использования коррекции неполных или «дырявых» рядов данных с помощью нелинейных методов, снижающих неопределенность за счет оценки дополнительной информации. В частности, наглядно показано, что для коррекции батиметрических карт водных объектов недостающие узлы интерполяционных сеток можно генерировать с помощью специально спроектированных нейронных сетей, прогнозирующих наиболее вероятные глубины в заданных диапазонах значений доли мелкодисперсных фракций донных отложений.
Список литературы
1. Бухарин С.В., Навоев В.В. Методы теории нейронных сетей в экспертизе технических и экономических объектов. Воронеж: Научная книга, 2015. 274 с.
2. Hebb D.O. The organization of behavior: a neuropsychological theory. Lawrence Erlbaum Associates, 2002. 335 p.
3. Fausett L.V. Fundamentals of neural networks: architectures, algorithms and applications. Prentice-Hall, 1994. 461 р.
4. Lukaszyk S. A new concept of probability metric and its applications in approximation of scattered data sets // Computational mechanics. 33 (4). 2004. P. 299-304.
References
1. Buharin S.V., Navoev V.V. Metody teorii nejronnyh setej v ekspertize tekhnicheskih i ekonomicheskih ob"ektov [Methods of the theory of neural networks in the examination of technical and economic objects]. Voronezh: Nauchnaya kniga, 2015. 274 p.
2. Hebb D.O. The oganization of behavior: a neuropsycholog-
34
российский журнал прикладной экологии
ical theory. Lawrence Erlbaum Associates, 2002. 335 p.
3. Fausett L.V. Fundamentals of neural networks: architectures, algorithms and applications. Prentice-Hall, 1994. 461 p.
4. Lukaszyk S. A new concept of probability metric and its applications in approximation of scattered data sets // Computational mechanics. 33 (4). 2004. P. 299-304.
Valiev V.S., Khasanov R.R., Ivanov D.V. Neural network correction of interpolation nodes of the method of inverse distance weighting using auxiliary data on the example of construction of bathy-metric maps of water objects.
The work demonstrates a method of using neural network technologies for the correction of incomplete data series. A specific algorithm for correction of bathymetric maps of water bodies which generates the missing nodes of interpolation grids using a specially designed neural network that predicts the most probable depths in the given ranges of the proportion of finely dispersed fractions of bottom sediments is shown.
Keywords: sediments; bathymetric maps; neural networks; small rivers; grading.
Информация об авторах
Валиев Всеволод Сергеевич, старший научный сотрудник, Институт проблем экологии и недропользования АН РТ, 420087, Россия, г. Казань, ул. Даурская, 28, E-mail: [email protected].
Хасанов Рустам Равилевич, младший научный сотрудник, Институт проблем экологии и недропользования АН РТ, 420087, Россия, г Казань, ул. Даурская, 28, E-mail: [email protected].
Иванов Дмитрий Владимирович, кандидат биологических наук, зам. директора по научной работе, Институт проблем экологии и недропользования АН РТ, 420087, Россия, г. Казань, ул. Даурская, 28, E-mail: [email protected].
Information about the authors
Vsevolod S. Valiev, Senior Researcher, Research Institute for Problems of Ecology and Mineral Wealth Use of Tatarstan Academy of Sciences, 28, Daurskaya st., Kazan, Russia, 420087, E-mail: [email protected].
Rustam R. Khasanov, Junior Researcher, Research Institute for Problems of Ecology and Mineral Wealth Use of Tatarstan Academy of Sciences, 28, Daurskaya St., Kazan, Russia, 420087, E-mail: [email protected].
Dmitrii V. Ivanov, Ph.D. in Biology, Deputy Director, Research Institute for Problems of Ecology and Mineral Wealth Use of Tatarstan Academy of Sciences, 28, Daurskaya st., Kazan, Russia, 420087, E-mail: [email protected].
2/2121
35