УДК 621.385.833
КЛАССИФИКАЦИЯ ИЗОБРАЖЕНИЙ НАНОСТРУКТУРЫ ПОВЕРХНОСТИ С ПРИМЕНЕНИЕМ НЕЙРО-НЕЧЕТКОЙ СЕТИ
ШЕЛКОВНИКОВ Е. Ю., ТЮРИКОВ А. В., ГУЛЯЕВ П.В., ОСИПОВ НИ.
Институт механики Уральского отделения РАН, 426067, г. Ижевск, ул. Т. Барамзиной, 34
АННОТАЦИЯ. Рассмотрены вопросы классификации СТМ-профилограмм с использованием построенной нейро-нечеткой сети типа Такаги-Сугено-Канга. Разработана методика агрегации полученных результатов классификации на основе метода анализа иерархий. Приведены результаты работы нейро-нечеткой сети при классификации сильно зашумленных СТМ-топографий наночастиц.
КЛЮЧЕВЫЕ СЛОВА: сканирующий туннельный микроскоп, нейро-нечеткая сеть, классификация СТМ-топографий, метод анализа иерархий.
ВВЕДЕНИЕ
Классификация наноструктур поверхности, изображения которых получены с применением сканирующего туннельного микроскопа (СТМ), часто является нетривиальной задачей. Это связано как с природой СТМ-топографий, отражающих электронно-атомное строение поверхности, так и со значительной «зашумленностью» изображений, которая возникает из-за неидеальных условий эксперимента, колебаний зондирующего острия и т.п. Поэтому разработка методики автоматической интеллектуальной классификации нанообъектов является важной и актуальной задачей. Принципы применения нечеткой и нейро-нечеткой сетей (ННС) для классификации наноструктур отражены, например, в работах [1 - 3].
Между профилограммами, снятыми с СТМ-изображений нанообъектов, и самими нанообъектами существует взаимно однозначное соответствие, а, следовательно, наборы таких профилограмм могут быть использованы для классификации нанообъектов. Для того чтобы построить базу знаний, применяемую при классификации, должны быть использованы СТМ-изображения наночастиц, о которых достоверно известно их отношение к тому или иному классу. Например, для этой цели могут применяться изображения наночастиц, полученные ранее в результате проведенного моделирования.
МЕТОД НЕЙРО-НЕЧЕТКОЙ КЛАССИФИКАЦИИ
Алгоритм локализации нанообъекта на СТМ-топографии подробно описан в работе [1]. Выделенное изображение адатомов меди и никеля представлены на рис. 1. СТМ-топография разбивается на профилограммы в двух перпендикулярных направлениях. Пример дискретизации такой нормализованной профилограммы представлен на рис. 2.
а) б) в) г)
Рис. 1. Частицы меди (а, б — двух- и трехмерный вид соответственно) и никеля (в, г — двух- и трехмерный вид соответственно), локализованные на СТМ-изображениях
Рис. 2. Дискретизация нормализованной СТМ-профилограммы, подлежащей классификации (х1 = 0; хп = 1)
Под нечёткой базой знаний в дальнейшем понимается совокупность нечётких правил «ЕСЛИ-ТО», задающих взаимосвязь между входами и выходами исследуемого объекта.
Для классификации конкретной профилограммы, дискретизированной так, как показано на рис. 2 нечеткая база знаний выглядит следующим образом:
Правило №1: если = гПт и г2 = и
... и гп = ¿ПТ0, то т=т1 (образец есть эталон 1);
Правило №2: если = г3™1 и г2 = гзт и
... и гп = гПТ2 , то (0 = ю2 (образец есть эталон 2); (1)
Правило №К : если = 23™к и г2 = г3™" и
... и гп = гПтк , то со = юК (образец есть эталон К).
База знаний, таким образом, соответствует алгоритму Такаги-Сугено-Канга (ТСК) нулевого порядка [4 - 6], в общем случае которого выходная переменная является линейной комбинацией значений входных переменных. Для /-го правила, таким образом, в алгоритме ТСК значение /-й выходной переменной можно записать:
со = щ + . (2)
1=1
Применение же алгоритма ТСК нулевого порядка (согласно [5], совпадающего, при построении базы знаний, с упрощенным алгоритмом Мамдани) существенно упрощает процедуру подбора параметров системы нечеткого вывода (поскольку отсутствует необходимость в определении коэффициентов а■ в выражении (2)).
Для классификации применялись симметричные функции принадлежности (ФП) т( х) гауссова типа:
(х-а)2
т(х) = е 2а2 , (3)
параметрами которых являются точка максимума х = а, и параметр а (который характеризует «ширину колокола» ФП), являющийся аналогом среднеквадратического отклонения в нормальном распределении.
Машина нечеткого вывода в задаче классификации реализуется следующим образом. Профилограмма, задаваемая вектором входных переменных z, должна быть соотнесена с элементом из дискретного множества w = { w , w2,...., WK }:
( Zj, Z2,...., zn )®{wi,w2,....,wK }. (4)
База знаний (1) фактически задается как:
f n Л
П z; = z; ®w=w, (5)
V j=1 )
где П - операция ¿-нормы. Таким образом, степень принадлежности классифицируемой профилограммы (дискретизированной конкретными входными переменными z = (z*1,...., z"n) эталонному образцу с номером) вычисляется как:
n
m( z* )=Пт (z* у), i=1..K, (6)
j=i
где m (z*j) - степень принадлежности j-й ординаты классифицируемой профилограммы
i-му эталону. Поэтому результатом классификации является эталон с максимальной степенью принадлежности:
w=ar§{w,w2,..,wK} max(mi (z*)m (z*),....,m (z*)), (7)
где arg - операция агрегации результатов нечеткого вывода по всем правилам базы знаний,
*
использующая операцию max над степенями принадлежности в нечетком множестве z .
Обучение нейронной сети сводится к оптимальной настройке параметров ФП. Поскольку в силу специфики архитектуры базы знаний максимум «колокола» ФП жестко фиксирован (у j-й гауссовой ФП (3) для i-го правила параметр a равен zэт'у), настройке
подвергаются только ширины «колоколов». Так для j-й гауссовой ФП и i-го правила s = sj}-
При обучении ННС применяются наборы входных переменных, соответствующих случайным образом искаженным профилограммам заранее известных образцов, то есть
используются p пар вида (z^, d (где z'l) = {z'l\,..., } - множество входных
переменных; d(l) - желаемое выходное значение ННС, соответствующее одному из обучаемых ННС эталонов). Критерием обученности ННС обычно считается минимизация целевой функции ошибки (ЦФО) ННС вида:
E = Ц\w( z(l))- d(l) I2, (8)
2 i=1 L J
соответствующей евклидовой норме [7], суммирование в которой выполняется по всем обучающим парам. Подстройка sj}- происходит с применением метода наискорейшего
спуска, в котором изменение нужного параметра происходит против его градиента [3]. База данных обучающих профилограмм содержала в себе по 150 искаженных профилограмм каждого вида частиц, с нарастающим процентом искажения, составляющим 10 - 15 %. Результаты обучения показали достижение ЦФО значений 5 -10-3 за количество итераций (эпох обучения), равном 11.
После проведения классификации всех профилограмм, проведенных через частицу, следует сделать вывод о результирующем векторе принадлежности, знание которого позволило бы сделать окончательный вывод о классе частицы. Наиболее прямым является путь простого усреднения компонент вектора принадлежности с последующей его нормировкой. Однако, такое действие автоматически говорит о том, что все профилограммы, задействованные в классификаторе, вносят абсолютно одинаковый вклад в результат классификации. Такое предположение, очевидно, является неверным, поскольку совершенно
ясно, что некоторые из профилограмм, задействованных в классификаторе, являются более информативными и несут в себе больше специфической информации, чем другие. Очевидно, что зашумленность профилограммы также уменьшает ее полезность при анализе нечеткой нейронной сетью. Таким образом, необходим метод, позволяющий объективно подходить к выбору весов, задействованных при взвешенном усреднении компонент вектора принадлежности.
Одним из наиболее распространенных методов, применяемых для этих целей, является метод анализа иерархий (МАИ), предложенный Т.Л. Саати [8, 9]. Смыслом этого метода является использование иерархической структуры, объединяющей цель выбора, критерии, альтернативы и другие факторы, влияющие на выбор решения [9]. Вершиной такой иерархии (рис. 3) является главная цель; элементы нижнего уровня представляют множество вариантов достижения цели (альтернатив); элементы промежуточных уровней - узлы, соответствуют критериям или факторам, которые связывают цель с альтернативами.
Результат классификации частицы
Рис. 3. Иерархия, используемая для агрегации результатов классификации СТМ-профилограмм
Приоритетами МАИ являются числа, связанные с узлами иерархии, сумма которых на каждом уровне, по определению, равна 1. Если при классификации наночастицы задействовано £ профилограмм, то результатом работы классификатора будут £ векторов принадлежности вида
Р">=(Р.'",...,Рк"'),..., РИ=(Р,М,...,Рк">) (9)
в случае, если ННС обучена К образцам. Таким образом, нижний слой иерархии составляют классы частиц, к которым следует отнести идентифицируемый образец (рис. 3). Следующий слой образуют £ профилограмм, задействованных при классификации. На более высоком уровне находятся критерии, применяемые для определения «качественности» профилограмм. Для определения приоритетов критериев, которых всего М, необходимо построить М обратносимметричных матриц парных сравнений. Например, для т-го критерия матрица парных сравнений будет следующей:
А
(т)
(а(т) /а(т)
(т) /а(т)
(т) (т) (т)
а /а а а
а
(т) (т)
а( ) /а1( )
а
(т) /ан
(т) /а(т)
(т) / а (т) ^ (т) /а(т)
а
(т) / (т)
а ' / а
(т) /
а /а
( ) '5 У
(10)
в которой а^т) - эффективностьу-й профилограммы относительно т -го критерия.
Вектор приоритетов каждого критерия должен определяться согласно [9], как нормированный главный собственный вектор (соответствующий наибольшему собственному значению). Полученный таким способом вектор приоритетов профилограмм для т-го
„(т) _1г,(т) г, (т)). Матрица парных сравнений критериев В определяется аналогичным образом:
г д/д д/д ... д/Дмл д/д д/д ... д/Дм
( )
критерия есть а _1 а/ ,....
В-
(11)
Дм / Д Дм / Дг •■■ дм / дм У
где Ду - эффективность у -го критерия качества профилограмм. Определенный вектор приоритетов критериев качества профилограмм есть Ь _(Ь1,...Ьм). Таким образом,
компоненты главного вектора приоритетов, который является результирующим вектором принадлежностей, на основе анализа иерархии (рис. 3), вычисляются как линейная свертка вида:
м 5
Ру _ XX ЬтаГ'Р
т_1 £_1
( т) „ (
у _ 1...К.
(12)
Важной частью применения МАИ является корректное определение критериев информативности профилограмм. Одним из наиболее важных критериев является критерий зашумленности профилограммы. Тем более что его применение (в плане построения матрицы парных сравнений) происходит без субъективного влияния оператора. Ясно, что в процессе сканирования (в силу хаотичности влияния множества факторов) одни профилограммы должны получаться более «шумными», чем другие. Интегральным числовым критерием «зашумленности» £ -й профилограммы может служить средняя величина абсолютной разности выбросов между соседними точками:
(дг х
П 1 1 1 -r.nr.pf
г, у-соседние точки
г (6')- г (6')
(13)
где суммирование ведется по всем соседним точкам профилограммы, а п - ее дискретизация
(количество точек). Тогда отношение (дг) (д г)
показывает, во сколько раз £1
профилограмма является более «шумной», чем £2-я. Очевидно, что обратное отношение
(д21/(д21
-1
показывает, насколько £1 -я информативнее -й, и, следовательно, может
служить элементом матрицы парных сравнений (10) для данного критерия (можно назвать его «критерием чистоты» профилограммы).
Другим важным критерием информативности профилограммы является ее расположение внутри полного набора профилограмм. Здесь имеется в виду тот факт, что некоторые области классифицируемой частицы несут в себе уникальную информацию, присущую только данной частице и никакой другой. Поэтому векторы принадлежности, полученные после работы ННС с такими профилограммами, гораздо менее «размыты», чем векторы, полученные после работы ННС с другими профилограммами, несущими меньше
2
специфической информации о частице (например, расположенные ближе к краям выделенной частицы). На рис. 4 показана выделенная часть частицы меди (область наибольшей информативности), которая, по мнению исследователя, может нести в себе специфическую информацию о классифицируемой частице. Коэффициент информативности профилограмы (число, показывающее во сколько раз профилограмма, проходящая через
область наибольшей информативности, информативнее профилограммы, через нее не проходящей) может быть определен заранее или подбираться в процессе классификации опытным путем. Ясно, что такие коэффициенты информативности формируют матрицу парных сравнений для данного критерия (можно назвать его «критерием расположения» профилограммы). В отличие от «критерия чистоты», параметры «критерия расположения» назначаются исследователем вручную. Поэтому его приоритет (вес на уровне критериев) иерархии должен быть ниже приоритета «критерия чистоты», что определяет вид матрицы парных сравнений критериев. Результаты классификации СТМ-топографий значительно зашумленных (~ 20 %) изображений частиц меди, никеля и цинка представлены в таблице, где в числителях дробей приведены компоненты векторов принадлежности классифицированных частиц, полученные без использования методики агрегации результатов классификации профилограмм с применением МАИ (то есть с простым усреднением векторов принадлежности 16*16 профилограмм). Также в таблице в знаменателях дробей показаны результаты классификации тех же частиц с использованием методики агрегации результатов.
Таблица
Результаты классификации пакета 16 Х16 профилограмм
Топография Мера принадлежности эталону
Медь Никель Цинк
Медь 0,79/0,93 0,15/0,04 0,06/0,03
Никель 0,13/0,06 0,74/0,91 0,13/0,03
Цинк 0,09/0,02 0,14/0,05 0,77/0,93
Анализ показал, что ННС достаточно надежно осуществляет классификацию сильно зашумленных СТМ-изображений, формируя вполне определенный ответ, что подтверждается рассмотрением компонент векторов принадлежности. Очевидно, что без использования агрегации данных достоверность классификации существенно снижена в силу излишней зашумленности и «неспецифичности» части использованных профилограмм. Применение же МАИ значительно (~ 20 %) повысило точность классификации, приблизив ее к результатам распознавания «специфических» профилограмм.
СПИСОК ЛИТЕРАТУРЫ
1. Тюриков А. В., Суворов А. С., Шелковников Е. Ю., Гуляев П. В., Гафаров М. Р. Локализация и идентификация СТМ-изображений ультрадисперсных частиц с применением аппарата нейронных сетей // Химическая физика и мезоскопия. 2009. Т. 11, № 4. С. 467-475.
2. Липанов А. М., Тюриков А. В., Суворов А. С., Шелковников Е. Ю., Гуляев П. В. Применение генетического алгоритма для обучения нейронной сети в задаче идентификации СТМ-изображений // Ползуновский вестник. 2010. № 2. С. 217-221. http://elib.altstu.ru/elib/books/Files/pv2010_02/pdf/216lipanov.pdf
3. Тюриков А. В. Принципы применения нейро-нечеткой сети для классификации СТМ-изображений нанообъектов // Ползуновский альманах. 2016. № 2. С. 7-10.
4. Заде Л. Понятие лингвистической переменной и ее применение к принятию приближенных решений / пер. с англ. Н.И. Ринго, под ред. Н.Н. Моисеева и С.А. Орловского. М.: Мир, 1976. 167 с.
5. Круглов В. В., Дли М. И., Голунов Р. Ю. Нечеткая логики и искусственные нейронные сети. М.: Физматлит, 2001. 224 с.
Рис. 4. Наиболее информативная область классифицируемой частицы меди
6. Мелихов А. Н., Бернштейн Л. С., Коровин С. Я. Ситуационные советующие системы с нечеткой логикой. М.: Наука, 1990. 272 с.
7. Осовский С. Нейронные сети для обработки информации / пер. с польского И.Д. Рудинского. М.: Финансы и статистика, 2002. 344 с.
8. Саати Т. Л. Принятие решений при зависимостях и обратных связях. Аналитические сети / пер. с англ. О.Н. Андрейчиковой. М.: Изд-во ЛКИ, 2008. 360 с.
9. Saaty T. L. The Hierarchon: A Dictionary of Hierarchies. Pittsburgh, Pennsylvania: RWS Publications, 1992.
570 p.
ANALYSIS OF A PROJECTIVE APPROACH FOR SOLVING THE NAVIER-STOKES EQUATION FOR PROCESS OF MODELING THE MANUFACTURING STM PROBES
Shelkovnikov E.Yu., Tyurikov A.V., Gulyaev P.V., Osipov N.I.
Institute of Mechanics, Ural Branch of the Russian Academy of Sciences, Izhevsk, Russian
SUMMARY. Questions of classification of STM-images of nanostructure of a surface with use of a mathematical apparatus of neuro-fuzzy networks and a method of the analysis of hierarchies for aggregation of results of classification STM-profilogram are considered. The neuro-fuzzy Takagi-Sugeno-Kang type network which functioning is constructed on a knowledge base of a fuzzy logic is presented, and selection of parameters is carried out according to the principles of tutoring of neural networks. For aggregation of results of classification STM-profilograms a method of the analysis of hierarchies is offered which essence consists in use of hierarchical structure for the quantitative analysis of priorities of the set of profilograms used in classification. The choice of two criteria of informational content of profilogram for use in this method is justified: criterion of a noising of the profilogram and criterion of its arrangement within the STM-topography. Results of work of neuro-fuzzy network at classification of strongly noisy STM-topographies of nanoparticles of copper, nickel and zinc are given. It is shown that application of a method of the analysis of hierarchies considerably increased accuracy of classification.
KEYWORDS: scanning tunnel microscope, the probe, chemical etching, Navier-Stokes equations. REFERENCES
1. Tyurikov A. V., Suvorov A. S., Shelkovnikov E. Yu., Gulyaev P. V., Gafarov M. R. Lokalizatsiya i identifikatsiya STM-izobrazheniy ul'tradispersnykh chastits s primeneniem apparata neyronnykh setey [Localization and identification of stm-images of ultradispersed particles using the neural net framework]. Khimicheskaya fizika i mezoskopiya [Chemical Physics and Mesoscopy], 2009, vol. 11, no. 4, pp. 467-475.
2. Lipanov A. M., Tyurikov A. V., Suvorov A. S., Shelkovnikov E. Yu., Gulyaev P. V. Primenenie geneticheskogo algoritma dlya obucheniya neyronnoy seti v zadache identifikatsii STM-izobrazheniy [Application of a genetic algorithm for learning a neural network in the problem of identifying STM images]. Polzunovskiy vestnik [Polzunovsky vestnik], 2010, no. 2, pp. 217-221. http://elib.altstu.ru/elib/books/Files/pv2010_02/pdf/216lipanov.pdf
3. Tyurikov A. V. Printsipy primeneniya neyro-nechetkoy seti dlya klassifikatsii STM-izobrazheniy nanoob"ektov [Principles of using a neural-fuzzy network for the classification of STM images of nanoobjects]. Polzunovskiy al'manakh [Polzunovsky Almanac], 2016, no. 2, pp. 7-10.
4. Zadeh L. A. The concept of a linguistic variable and its application to approximate reasoning. American Elsevier Publishing, New York, 1973.
5. Kruglov V. V., Dli M. I., Golunov R. Yu. Nechetkaya logiki i iskusstvennye neyronnye seti [Fuzzy logic and artificial neural networks]. Moscow: Fizmatlit Publ., 2001. 224 p.
6. Melikhov A. N., Bernshteyn L. S., Korovin S. Ya. Situatsionnye sovetuyushchie sistemy s nechetkoy logikoy [Situational advisory systems with fuzzy logic]. Moscow: Nauka Publ., 1990. 272 p.
7. Osowski S. Sieci neuronowe do przetwarzania informacji. Warszawa, 2000.
8. Saaty T. L. Decision making with dependence and feedback: The Analytic Network Process. Pittsburgh, Pennsylvania: RWS Publications, 1996.
9. Saaty T. L. The Hierarchon: A Dictionary of Hierarchies. Pittsburgh, Pennsylvania: RWS Publications, 1992.
570 p.
Шелковников Евгений Юрьевич, доктор технических наук, профессор, зав. лабораторией ИМ УрО РАН, профессор кафедры «Вычислительная техника» ИжГТУ имениМ.Т. Калашникова, e-mail: [email protected]
Тюриков Александр Валерьевич, кандидат физико-математических наук, старший научный сотрудник ИМ УрО РАН, e-mail: alex. tyurikov@mail. ru
Гуляев Павел Валентинович, кандидат технических наук, старший научный сотрудник ИМ УрО РАН, e-mail: lucac@e-izhevsk. ru Осипов Николай Иванович, кандидат технических наук, старший научный сотрудник ИМ УрО РАН, e-mail: [email protected]