Научная статья на тему 'ИССЛЕДОВАНИЕ ВОЗМОЖНОСТИ ПРИМЕНЕНИЯ СИСТЕМ НЕЧЁТКОГО ВЫВОДА ПРИ МОДЕЛИРОВАНИИ СВОЙСТВ ЯДЕР'

ИССЛЕДОВАНИЕ ВОЗМОЖНОСТИ ПРИМЕНЕНИЯ СИСТЕМ НЕЧЁТКОГО ВЫВОДА ПРИ МОДЕЛИРОВАНИИ СВОЙСТВ ЯДЕР Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
23
5
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
НЕЧЁТКАЯ СИСТЕМА / ГИБРИДНАЯ СЕТЬ / ЭНЕРГИЯ СВЯЗИ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Ильиных Нина Иосифовна, Ковалёв Леонид Евгеньевич, Просянкина-Жарова Татьяна Ивановна

Рассмотрена возможность применения нечётких систем для анализа экспериментальных данных в области ядерной физики на примере разработки нечётких нейронных сетей, моделирующих зависимость энергии связи от зарядового числа, массового числа, спина и чётности ядра. Проектирование и исследование нечёткой системы было выполнено в специальном пакете расширения Fuzzy Logic Toolbox среды MATLAB. Анализ спроектированных нечётких нейронных сетей позволяет сделать вывод о достаточной адекватности систем нечёткого вывода при моделировании свойств ядер.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

INVESTIGATION OF APPLICABILITY OF FUZZY INFERENCE SYSTEMS FOR NUCLEI PROPERTIES MODELING

Applicability of the use of fuzzy systems for the analysis of experimental data in nuclear physics by the example of developing fuzzy neural networks, modeling the dependence of binding energy of the nucleus on its atomic number, mass number, spin and parity is considered. The projecting and investigation of the fuzzy system is carried out in special Fuzzy Logic Toolbox of Matlab medium. The analysis of planned fuzzy neural networks allows us to draw a conclusion about sufficient adequacy of fuzzy inference systems for nuclei properties modeling.

Текст научной работы на тему «ИССЛЕДОВАНИЕ ВОЗМОЖНОСТИ ПРИМЕНЕНИЯ СИСТЕМ НЕЧЁТКОГО ВЫВОДА ПРИ МОДЕЛИРОВАНИИ СВОЙСТВ ЯДЕР»

УДК 519.876.5

Исследование возможности применения систем нечёткого вывода при моделировании свойств ядер

Н. И. Ильиных, Л. Е. Ковалёв, Т. И. Просянкина-Жарова

Рассмотрена возможность применения нечётких систем для анализа экспериментальных данных в области ядерной физики на примере разработки нечётких нейронных сетей, моделирующих зависимость энергии связи от зарядового числа, массового числа, спина и чётности ядра. Проектирование и исследование нечёткой системы было выполнено в специальном пакете расширения Fuzzy Logic Toolbox среды MATLAB. Анализ спроектированных нечётких нейронных сетей позволяет сделать вывод о достаточной адекватности систем нечёткого вывода при моделировании свойств ядер.

Ключевые слова: нечёткая система, гибридная сеть, энергия связи, Matlab.

1. Введение

В последнее время аппарат нечётких нейронных сетей признаётся специалистами как один из наиболее перспективных для решения слабо формализованных или плохо структурированных задач прикладного системного анализа. Нечёткие нейронные сети или гибридные сети призваны объединить в себе достоинства нейронных сетей и систем нечёткого вывода.

В основе нечётких нейронных сетей лежит идея использования существующей выборки данных для определения параметров функций принадлежности, выводы делаются на основе аппарата нечёткой логики, а для нахождения параметров функций принадлежности используются алгоритмы обучения нейронных сетей. Такие модели могут использоваться в различных областях человеческой деятельности, например, в интеллектуальном анализе данных [1,

2, 3, 4], в автоматизированных системах управления экономическими и технологическими процессами [5, 6]. Нечёткие нейронные сети находят применение и в физике [7, 8, 9].

По нашему мнению, было бы интересно исследовать возможность применения систем нечёткого вывода для анализа экспериментальных данных ядерной физики. В ядерной физике приходится в значительно большей степени апеллировать к опытным фактам, а не к теории, чем в других разделах физики. Ещё не существует законченной теории ядерных сил, а следовательно, и основанной на ней фундаментальной и последовательной теории ядра. Вместо такой теории в ядерной физике используются различные модели ядра, каждая из которых охватывает лишь ограниченный круг явлений [10].

Удобным средством для проектирования и исследования нечёткой системы является специальный пакет расширения Fuzzy Logic Toolbox среды MATLAB. В пакете Fuzzy Logic Toolbox имеется редактор адаптивных систем нейро-нечёткого вывода (ANFIS Editor), который позволяет автоматически синтезировать из экспериментальных данных нечёткие нейронные сети и настраивать их.

Данные о свойствах атомных ядер нами были взяты в Центре данных фотоядерных экспериментов (ЦДФЭ) НИИ ядерной физики им. Д. В. Скобельцына МГУ им. М. В. Ломоносова [11].

2. Моделирование зависимости энергии связи стабильных ядер от их параметров

2.1. Постановка задачи

Очевидно, что энергия связи ядра зависит от количества нуклонов в нём. Кроме того, опытные факты указывают на присутствие эффекта спаривания одинаковых нуклонов в ядре, проявляющегося в виде зависимости энергии связи от чётности ядра. Для выяснения существенных общих свойств ядер в физике используется полуэмпирическая формула Вейцзекке-ра, которая является функциональной зависимостью энергии связи от зарядового числа A и массового числа Z ядра. Эффект спаривания в формуле Вейцзеккера учитывается посредством соответствующей поправки, которая называется энергией спаривания. Формула Вейцзеккера для энергии связи в большинстве случаев (для стабильных ядер) справедлива с точностью до нескольких мегаэлектронвольт (MeV). Однако некоторые детали не отражаются этой формулой должным образом. Сюда относится, например, особая устойчивость «магических» ядер и флуктуации энергии спаривания. Кроме того, ошибка формулы Вейцзеккера значительно увеличивается при её применении в исследовании радиоактивных ядер [10].

Из сказанного выше вытекает, что актуальной задачей является разработка нечёткой нейронной сети, входными переменными которой будут зарядовое число и массовое число ядра, а выходной переменной - энергия связи ядра. Кроме этого, интересным представляется изучение влияния на информативность модели других параметров ядра, используемых в качестве входных переменных.

2.2. Разработка нечёткой системы Сугено

Нечёткую нейронную сеть можно рассматривать как одно из представлений систем нечёткого вывода типа Сугено. Для решения поставленной задачи моделирования мы использовали возможности редактора нечётких нейронных сетей ANFIS Editor пакета расширения Fuzzy Logic Toolbox среды MATLAB.

Первоначальная модель нечёткой нейронной сети содержала две входные переменные (зарядовое число Z и массовое число A) и энергию связи (Binding Energy) как выходную переменную. В обучающую выборку были включены экспериментальные данные 190 стабильных ядер, а в тестовую выборку - 47 стабильных ядер.

Для каждой из входных переменных мы задали по 4 лингвистических терма, а в качестве типа функции принадлежности выбирали поочерёдно (для определения оптимальной) следующие доступные в пакете Fuzzy Logic Toolbox:

- треугольная функция принадлежности (trimf);

- трапециевидная функция принадлежности (trapmf);

- обобщённая функция принадлежности типа колоколообразной кривой (gbellmf);

- функция принадлежности типа кривой Гаусса (gaussmf);

- функция принадлежности типа двухсторонней кривой Гаусса (gauss2mf);

- П-образная функция принадлежности (pimf);

- разность двух сигмоидальных функций принадлежности (dsigmmf);

- произведение двух сигмоидальных функций принадлежности (psigmmf).

В качестве типа функции принадлежности выходной переменной была задана линейная функция.

В пакете Fuzzy Logic Toolbox для создания системы нечёткого вывода по умолчанию используется простой метод решётчатого разбиения, согласно которому функции принадлежности нечётких термов равномерно распределяются внутри диапазона изменения данных. База знаний содержит все возможные варианты правил. Коэффициенты в заключениях правил принимаются равными нулю.

Для обучения нечёткой нейронной сети использовался гибридный метод обучения с уровнем ошибки 0. Гибридный метод обучения представляет собой комбинацию метода наименьших квадратов и метода убывания обратного градиента. Обучение нечёткой системы было проведено за 50 итераций. Значения средней квадратичной ошибки (RMSE) обучающей и тестовой выборок для используемых функций принадлежности представлены в табл. 1.

Таблица 1. RMSE для различных функций принадлежности

Функция принадлежности trimf trapmf gbellmf gaussmf gauss2mf pimf dsigmmf psigmmf

Обучающая выборка 1.4484 1.6722 1.1692 1.3259 1.4028 1.8581 1.2831 1.2831

Тестовая выборка 1.4125 1.5501 1.1395 1.4824 1.2574 1.9331 1.2097 1.2097

Как видно из табл. 1, меньшие численные значения невязок достигаются для обобщённой функции принадлежности типа колоколообразной кривой ^ЬеПт^ и для сигмоидальных функций принадлежности (dsigmmf, dsigmmf). При дальнейших разработках нечётких систем мы использовали обобщённую функцию принадлежности типа колоколообразной кривой ^Ье11т^.

После определения оптимальной функции принадлежности было проведено изучение поведения среднеквадратичной ошибки обучения (ЯМБЕ) в зависимости от количества итераций обучения. Соответствующая зависимость представлена на рис. 1.

1.21 г 1.21.19 1.18

ш

| 1.17 сг

1.16 1.15 1.14

0 50 100 150 200 250

итерации алгоритма обучения

Рис. 1. Зависимость ошибки нечёткого моделирования от количества итераций обучения

Как видно из рис. 1, ошибка обучения начинает осциллировать после 60 итераций обучения. Такое поведение ошибки обучения свидетельствует о том, что система входит в состояние переобучения. Это соответствует слишком точной аппроксимации обучающих данных и, как следствие, потере генерализующих свойств модели. Переобученная модель очень хорошо отражает реальность, представленную обучающей выборкой. Вне точек обучения адекватность такой модели низкая - результаты моделирования сильно отличаются от экспериментальных данных. Обучение последующих нечётких моделей мы проводили в течение 50 итераций.

Для определения оптимального количества лингвистических термов для входных переменных мы сгенерировали и провели обучение двух моделей. В одной для входных переменных мы задали по 3 лингвистических терма, в другой - по 5. Для первой модели ошибки обучающей и тестовой выборок составили 1.3786 и 1.5884 соответственно. Для второй модели - 1.1183 и 1.3947. Сравнение полученных результатов даёт основание сделать вывод о целесообразности задания для входных переменных по 4 лингвистических терма. При использовании 5 лингвистических термов мы получаем сомнительный выигрыш в ошибке и значительное увеличение времени обучения.

Для изучения влияния на нечёткую нейронную сеть других параметров ядра в неё была добавлена третья входная переменная. Нечёткая модель, в которой в качестве третьей входной переменной была использована чётность ядра, дала значения RMSE на обучающей и тестовой выборках 1.1169 и 0.9262 соответственно. Невязки модели, для которой в качестве третьей входной переменной был выбран спин, на обучающей и тестовой выборках составили 0.4117 и 0.4099 соответственно. Как видно из полученных результатов, такой параметр, как спин ядра, является достаточно информативным признаком для нечёткой нейронной сети, моделирующей энергию связи ядра. Этот факт может быть использован для дальнейшей разработки соответствующих нечётких моделей.

3. Тестирование нечёткой модели на радиоактивных ядрах

Для проверки полученной нечёткой нейронной сети на тестовой выборке, содержащей только радиоактивные ядра, нами было проведено её новое обучение. В двухвходовой нечёткой модели для входных переменных использовалось по 4 лингвистических терма. В обучающую выборку были включены параметры всех стабильных ядер и её объём составил 237 ядер. Обучение было проведено за 200 итераций. Ошибка на обучающей выборке составила 1.1395. Для общего анализа разработанной нечёткой модели полезным является визуализация соответствующей поверхности нечёткого вывода (рис. 2).

х 104

Рис. 2. Поверхность «входы - выход» нечёткой модели после 200 итераций обучения

Как видно из рис. 2, разработанная модель нечёткого вывода адекватно описывает общую закономерность, которая состоит в том, что атомные ядра могут существовать лишь в ограниченной области значений величин А и 2. В точках поверхности, где энергия связи равна нулю или отрицательна, ядро существовать не может. Область на рис. 2, где энергия связи больше нуля, практически совпадает с теоретическими границами существования ядер, полученными в ядерной физике. Однако при рассмотрении верхнего левого угла поверхности обнаруживается парадоксальный эффект: для ядер с большими значениями массового

числа А и маленькими значениями зарядового числа 2 энергия связи резко возрастает. Такое неожиданное поведение модели объясняется отсутствием в обучающей выборке данных в этой области факторного пространства. Это естественно, так как атомные ядра с такими параметрами никогда не наблюдались.

В тестовую выборку были включены 35 лёгких, средних и тяжёлых радиоактивных ядер. Среднеквадратичная ошибка на тестовой выборке равна 25.2592. Такое большое значение ЯМБЕ говорит о том, что для радиоактивных ядер в нечёткой модели должны применяться иные эвристические правила. В качестве эксперимента из обучающей выборки были исключены выбранные случайным образом 10 стабильных ядер, а вместо них включены 10 радиоактивных (отличных от используемых в тестовой выборке). После проведения обучения на этой выборке рассматриваемой нечёткой модели получены значения ЯМБЕ на обучающей и тестовой выборках, равные 1.4233 и 11.9623 соответственно. Эффект переобучения на 200 итерациях не наблюдался. Включение в обучающую выборку всего десяти радиоактивных ядер значительно уменьшило невязку тестовой выборки.

4. Заключение

Исследовано применение нечётких нейронных сетей для анализа экспериментальных данных в ядерной физике. Предложено использовать нечёткие базы знаний типа Сугено для моделирования зависимости энергии связи ядра от его параметров. Приведены примеры, подтверждающие возможность построения нечётких моделей для энергии связи ядра с такой базой знаний.

Лучшие результаты моделирования получены при применении для входных переменных по 4 логических терма с обобщённой функцией принадлежности типа колоколообразной кривой.

Проведён анализ значимости входных параметров и выяснено, что введение третьей входной переменной «спин ядра» улучшает адекватность двухвходовой нечёткой модели с входными переменными «зарядовое число» и «массовое число».

Литература

1. Нечеткие гибридные системы: теория и практика (монография) / И. З. Батыршин, А. О. Недосекин, А. А. Стецко, В. Б. Тарасов, А. В. Язенин, Н. Г. Ярушкина. М.: Физматлит, 2007. 208 с.

2. Зайченко Ю. П. Нечеткие модели и методы в интеллектуальных системах: учеб. пособие для студентов вузов. Киев: Слово, 2008. 344 с.

3. Катасёв А. С., Ахатова Ч. Ф. Гибридная нейронечеткая модель интеллектуального анализа данных для формирования баз знаний мягких экспертных диагностических систем // Наука и образование. 2012. № 12. С. 487-504.

4. Kacprzyk J., Wilbik A., Zadrozny S. Linguistic Summarization of Time Series by Using the Choquet Integral // Proceedings of 12th Fuzzy Systems Association World Congress (IFSA'2007, Cancun, Mexico, June 18-21, 2007). Theoretical Advances and Applications of Fuzzy Logic.- New York: Springer Verlag, 2007. P. 284-294.

5. Белоусов Р. Л., Дрожжин Н. А., Костенчук М. И. Построение нечетких лингвистических переменных с использованием методов кластерного анализа данных // Прикладная информатика. 2015. Т. 10, № 1 (55). С. 98-106.

6. Ротштейн А. П., Штовба С. Д. Моделирование надежности человека-оператора с помощью нечеткой базы знаний Сугено // Автомат. и телемех. 2009. Вып. 1. С. 180-187.

7. Castellano Marcello , Masulli Francesco, Penna Massimo. Fuzzy systems in high-energy physics. // Proc. SPIE 2761. Applications of Fuzzy Logic Technology Ш. 163 (June 14, 1996). [Электронный ресурс]. URL: http://dx.doi.org/10.1117/12.243252 (дата обращения: 15.01.2016).

8. Иванов В. В. Многомерный анализ данных на основе интегральных непараметрических статистик и многослойных перцептронов. Дубна: Препринт ОИЯИ Р10-93-348. 1993. 18 с.

9. Кисель И. В., Нескоромный В. Н., Ососков Г. А. Применение нейронных сетей в экспериментальной физике // ЭЧАЯ. 1993. Т. 24, Вып. 6. С. 1551-1595.

10. Сивухин Д. В. Общий курс физики. 3-е изд., стереотип. М.: Физматлит, 2006. Т. V: Атомная и ядерная физика. 784 с.

11. Центр данных фотоядерных экспериментов (ЦДФЭ) НИИ ядерной физики им. Д. В. Скобельцына МГУ им. М. В. Ломоносова [Электронный ресурс]. URL: http://cdfe.sinp.msu.ru (дата обращения: 17.01.2016).

Статья поступила в редакцию 01.02.2016

Ильиных Нина Иосифовна

к.ф.-м.н., доцент, зав. кафедрой высшей математики и физики УрТИСИ СибГУТИ (620109, г. Екатеринбург, ул. Репина, 15), тел. (343) 2-359-91-02, e-mail: ninail@bk.ru.

Ковалёв Леонид Евгеньевич

к.ф.-м.н., доцент кафедры математики и физики Уманского национального университета садоводства (Украина, 20305, Черкасская обл., г. Умань, ул. Институтская, 1), e-mail: leokova60@mail.ru.

Просянкина-Жарова Татьяна Ивановна

к.э.н., доцент кафедры информационных систем и технологий Европейского университета (20300, Украина, Черкасская обл., г. Умань, ул. Шевченко, 15а), e-mail: t.pruman@gmail.com.

Investigation of applicability of fuzzy inference systems for nuclei properties modeling N. Ilinykh, L. Kovalyov, T. Prosyankina-Zharova

Applicability of the use of fuzzy systems for the analysis of experimental data in nuclear physics by the example of developing fuzzy neural networks, modeling the dependence of binding energy of the nucleus on its atomic number, mass number, spin and parity is considered. The projecting and investigation of the fuzzy system is carried out in special Fuzzy Logic Toolbox of Matlab medium. The analysis of planned fuzzy neural networks allows us to draw a conclusion about sufficient adequacy of fuzzy inference systems for nuclei properties modeling.

Keywords: fuzzy system, hybrid network, binding energy, Matlab.

i Надоели баннеры? Вы всегда можете отключить рекламу.