Научная статья на тему 'Решение задачи определения уровня озона в атмосфере при помощи самоконфигурирующегося эволюцинного алгоритма построения нечетких баз правил'

Решение задачи определения уровня озона в атмосфере при помощи самоконфигурирующегося эволюцинного алгоритма построения нечетких баз правил Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
55
11
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ЭВОЛЮЦИОННЫЕ АЛГОРИТМЫ / EVOLUTIONARY ALGORITHMS / НЕЧЕТКАЯ ЛОГИКА / FUZZY LOGIC / НЕСБАЛАНСИРОВАННЫЕ ДАННЫЕ / UNBALANCED DATA / КЛАССИФИКАЦИЯ / CLASSIFICATION / УРОВЕНЬ ОЗОНА / OZONE LEVEL

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Становов В.В.

Приведен один из возможных подходов к решению задачи определения уровня озона в атмосфере. Задача классификации является разреженной, смещенной, изменяющейся со временем, ограниченной в числе измерений и содержит большое число незначимых переменных. Предложенная схема решения задачи подразумевает использование видоизмененной функции пригодности с учетом несбалансированности классов в выборке. Показано, что предложенный подход позволяет решить задачу с достаточной точностью.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

SOLVING THE ATMOSPHERE OZONE LEVEL DETECTION PROBLEM WITH SELF-CONFIGURED EVOLUTIONARY ALGORITHM FOR FUZZY RULE BASES DESIGN

One of the possible ways of solving the problem of ozone level detection in atmosphere is presented. The classification problem is a sparse, biased, changing with time, limited in number of measurements and includes a big number of unimportant variables. The proposed problem solving schema implies using modified fitness function which takes data imbalance into consideration. It is shown, that the proposed method allows to solve the problem with sufficient accuracy.

Текст научной работы на тему «Решение задачи определения уровня озона в атмосфере при помощи самоконфигурирующегося эволюцинного алгоритма построения нечетких баз правил»

го анализа относятся методы нечёткой логики, классификационные и регрессионные деревья решений, нейронные сети, генетические алгоритмы.

К недостаткам методов данной группы относятся: внедрение Data Mining почти всегда требует серьезных финансовых затрат; в основу технологии положен не один, а несколько принципиально различных подходов [7]; отсутствие прозрачности моделирования; сложность выбора архитектуры; высокие требования к непротиворечивости обучающей выборки и ресурсоемкость процесса обучения; необходимость специального программного обеспечения; отсутствие стандартной методики конструирования нечетких систем; невозможность математического анализа нечетких систем традиционными методами; применение нечеткого подхода по сравнению с вероятностным не приводит к повышению точности вычислений.

Анализ и сравнение достоинств и недостатков рассмотренных методов показывают, что только комбинирование существующих методов в различных сочетаниях поможет полноценно оценить влияние вредных факторов окружающей среды на здоровье населения. Кроме того, на первый план выходят современные информационные технологии, способные с малыми трудозатратами обработать огромный объем информации.

Библиографические ссылки

1. Потылицына Е. Н., Липинский Л. В., Сугак Е. В. Использование искусственных нейронных сетей для решения прикладных экологических задач // Современные проблемы науки и образования. 2013. № 4. С. 1-8. URL: http://www.science-education.ru/110-9779 (дата обращения: 1.09.2014).

2. Ревич Б. А., Авалиани С. Л., Тихонова Г. И. Основы оценки воздействия загрязненной окружающей среды на здоровье человека. М. : Акрополь, ЦЭПР, 2004. 268 с.

3. Акимова Т. А., Кузьмин A. П., Хаскин В. В. Экология. Природа - Человек - Техника. М. : Юнити-Дана, 2001. 343 с.

4. Риск воздействия химического загрязнения окружающей среды на здоровье населения: От оценки к практическим действиям / С. М. Новиков, Т. А. Ша-

шина, И. Л. Абалкина, Н. С. Скворцова. М. : Ада-матЪ, 2003. 84 с.

5. Требования к выполнению работ по оценке риска для здоровья населения, обусловленного воздействием химических факторов среды обитания. М. : Департамент Госсанэпиднадзора Минздрава России,

2003. 23 с.

6. Киселев А. В., Фридман К. Б. Оценка риска здоровью. СПб. : Междунар. ин-т оценки риска здоровью, 1997. 100 с.

7. Дюк В. А., Самойленко А. П. Data Mining : учеб. курс. СПб. : Питер, 2001. 368 с.

References

1. Potylicyna E. N., Lipinskij L. V., Sugak E. V. Ispol'zovanie iskusstvennyh nejronnyh setej dlja reshenija prikladnyh jekologicheskih zadach // Sovremennye problemy nauki i obrazovanija. 2013. № 4, s. 1-8. URL: http://www.science-education.ru/110-9779 (date of visit: 1.09.2014).

2. Revich B. A., Avaliani S. L., Tihonova G. I. Osnovy ocenki vozdejstvija zagrjaznennoj okruzhajushhej sredy na zdorov'e cheloveka. M. : Akropol', CJePR,

2004. 268 s.

3. Akimova T. A., Kuz'min A. P., Haskin V. V. Jekologija. Priroda - Chelovek - Tehnika. M. : Juniti-DANA, 2001. 343 s.

4. Risk vozdejstvija himicheskogo zagrjaznenija okruzhajushhej sredy na zdorov'e naselenija : Ot ocenki k prakticheskim dejstvijam / S. M. Novikov, T. A. Shashina, I. L. Abalkina, N. S. Skvorcova. M. : Adamat##, 2003. 84 s.

5. Trebovanija k vypolneniju rabot po ocenke riska dlja zdorov'ja naselenija, obuslovlennogo vozdejstviem himicheskih faktorov sredy obitanija. M. : Departament gossanjepidnadzora Minzdrava Rossii, 2003. S. 23.

6. Kiselev A. V., Fridman K. B. Ocenka riska zdorov'ju. SPb. : Mezhdunar in-t ocenki riska zdorov'ju, 1997. 100 s.

7. Djuk V. A., Samojlenko A. P. Data Mining. Uchebnyj kurs. SPb. : Piter, 2001. 368 s.

© Потылицына Е. Н., Тасейко О. В., Сугак Е. В., 2014

УДК 519.87

РЕШЕНИЕ ЗАДАЧИ ОПРЕДЕЛЕНИЯ УРОВНЯ ОЗОНА В АТМОСФЕРЕ ПРИ ПОМОЩИ САМОКОНФИГУРИРУЮЩЕГОСЯ ЭВОЛЮЦИННОГО АЛГОРИТМА ПОСТРОЕНИЯ НЕЧЕТКИХ БАЗ ПРАВИЛ

В. В. Становов

Сибирский государственный аэрокосмический университет имени академика М. Ф. Решетнева Российская Федерация, 660014, г. Красноярск, просп. им. газ. «Красноярский рабочий», 31

Е-шаП: vladimirstanovov@yandex.ru

Приведен один из возможных подходов к решению задачи определения уровня озона в атмосфере. Задача классификации является разреженной, смещенной, изменяющейся со временем, ограниченной в числе измерений и содержит большое число незначимых переменных. Предложенная схема решения задачи подразумевает использование видоизмененной функции пригодности с учетом несбалансированности классов в выборке. Показано, что предложенный подход позволяет решить задачу с достаточной точностью.

Ключевые слова: эволюционные алгоритмы, нечеткая логика, несбалансированные данные, классификация, уровень озона.

Решетневскуе чтения. 2014

SOLVING THE ATMOSPHERE OZONE LEVEL DETECTION PROBLEM WITH SELF-CONFIGURED EVOLUTIONARY ALGORITHM FOR FUZZY RULE BASES DESIGN

V. V. Stanovov

Siberian State Aerospace University named after academician M. F. Reshetnev 31, Krasnoyarsky Rabochy Av., Krasnoyarsk, 660014, Russian Federation E-mail: vladimirstanovov@yandex.ru

One of the possible ways of solving the problem of ozone level detection in atmosphere is presented. The classification problem is a sparse, biased, changing with time, limited in number of measurements and includes a big number of unimportant variables. The proposed problem solving schema implies using modified fitness function which takes data imbalance into consideration. It is shown, that the proposed method allows to solve the problem with sufficient accuracy.

Keywords: evolutionary algorithms, fuzzy logic, unbalanced data, classification, ozone level.

Уровень содержания озона вблизи поверхности земли является результатом сложных химических и физических процессов и зависит от множества известных и неизвестных факторов. Так как концентрация озона выше некоторого порогового уровня является достаточно вредной для здоровья человека, исследования, направленные на предсказание, были важной темой в области исследования атмосферы [1]. Задача трансформируется в задачу классификации, то есть определения опасных для здоровья дней. В этой постановке задача является смещенной относительно числа объектов в классах (отношение числа объектов первого и второго класса 35:1). Большое число имеющихся параметров, многие из которых являются незначимыми, усложняют классификацию.

В таких условиях классические методы обучения классификаторов, такие, например, как [2; 3], могут показать хорошие результаты на первом, мажоритарном классе, но при этом воспринять второй класс как шум. Некоторые подходы к решению подобных проблем дисбаланса в данных были представлены в [4]. В их числе можно выделить, к примеру, использование усредненного критерия качества классификации по двум классам Ave:

1 ( T1 T 2 ^ Ave = —\-+-I.

2 ^ T1 + F2 T 2 + F1)

Смысл обозначений в данной формуле разъяснен ниже (см. таблицу).

Обозначения результатов классификации

Класс Предсказан первый класс Предсказан второй класс

Истинный первый класс True 1 (T1) False 2 (F2)

Истинный второй класс False 1 (F1) True 2 (T2)

В качестве метода построения классификатора был выбран эволюционный алгоритм автоматизированного формирования баз нечетких правил, предложенный в работах Ишибучи [5]. Данный алгоритм был модифицирован введением самоконфигурации и описан в [6; 7]. Стоит отметить, что введение модифицированного критерия качества классификации может быть произведено и для других подходов, например, при формировании нейронных сетей [8], ма-

шин опорных векторов [9], символьной регрессии [10] или иных методов [11]. Также возможен многокритериальный подход [12], в котором качество классификации по каждому классу отдельно представляет собой отдельный критерий.

В результате проведенных экспериментов можно заключить, что использование классического критерия качества классификации - общей точности по выборке - во всех случаях приводило к тому, что второй класс игнорировался алгоритмом классификации; таким образом, не было возможности получить адекватное решение, несмотря на то что в целом точность классификации оставалось высокой, т. е. все объекты второго, миноритарного, класса считались шумом, и на них классификатор всегда делал ошибки. Использование же средней точности по обоим классам позволило построить не столь точные классификаторы, но при этом удалось достичь баланса в соотношении неверно классифицированных объектов в первом и втором классе.

Полученное решение является приемлемым, но оно может быть улучшено рассмотрением задачи не только как задачи классификации, но также и как временного ряда, в котором возможность появления опасного для здоровья дня может зависеть от состояния атмосферы в предыдущие дни.

Библиографические ссылки

1. Zhang K., Fan W. Forecasting skewed biased stochastic ozone days: analyses, solutions and beyond // Knowledge and Information Systems. March 2008. Vol. 14, iss. 3, p. 299-326.

2. Semenkin E., Semenkina M. Self-configuring genetic programming algorithm with modified uniform crossover // IEEE Congress on evolutionary computation. CEC 2012 (Brisbane, 10-15.07.2012).

3. Сопов Е. А., Сопов С. А., Многокритериальный алгоритм извлечения знаний из данных на базе нечеткой логики // SWORLD : сб. науч. тр. 2009. Т. 4, № 2. С. 11-18.

4. Bhowan U., Genetic Programming for Classification with Unbalanced Data. Victoria University of Wellington. 2012.

5. Ishibuchi H., Mihara S., Nojima Y. Parallel Distributed Hybrid Fuzzy GBML Models With Rule Set Migration and Training Data Rotation // IEEE Transactions on fuzzy systems. 2013. Vol. 21, № 2.

6. Stanovov V., Semenkin E., Self-adjusted evolutionary algorithms based approach for automated design of fuzzy logic systems // Вестник СибГАУ. 2013. Вып. 4. С. 148-152.

7. Semenkin E., Stanovov V., Fuzzy rule bases automated design with self-configuring evolutionary algorithm // Proceedings of the 11th International Conference on Informatics in Control, Automation and Robotics (1-3 сент. 2014 г., Vienna). Vol. 1. С. 318-323.

8. Khritonenko D. I., Semenkin E. S. Distributed Self-Configuring Evolutionary Algorithms For Artificial Neural Networks Design // Вестник СибГАУ. 2013. № 4 (50). С. 112-116.

9. Akhmedova Sh. A., Semenkin E. S., Gasanova T., Minker. W., Co-Operation of Biology Related Algorithms for Support Vector Machine Automated Design // Engineering and Applied Sciences Optimization (OPT-i'14). 2014.

10. Семенкин Е. С., Бухтояров В. В. Разработка и исследование гибридного метода генетического программирования // Программные продукты и системы. 2010. Вып. 3.

11. Семенкин Е. С., Шабалов А. А., Ефимов С. Н. Автоматизированное проектирование коллективов интеллектуальных информационных технологий методом генетического программирования // Вестник СибГАУ. 2011. Вып. 3. С. 77-81.

12. Brester C., Semenkin E. Development of adaptive genetic algorithms for neural network models multicriteria design // Вестник СибГАУ. 2013. № 4 (50). С. 99-103.

References

1. Zhang K., Fan W., Forecasting skewed biased stochastic ozone days: analyses, solutions and beyond // Knowledge and Information Systems March 2008, vol. 14, issue 3, p. 299-326.

2. Semenkin E., Semenkina M., Self-configuring genetic programming algorithm with modified uniform crossover // IEEE Congress on evolutionary computation. CEC 2012. Brisbane, 10-15 June 2012.

3. Sopov E. A., Sopov S. A. Multicriteria algorithm for knowledge extraction based on fuzzy logic //

Collection of scientific papers SWORLD. 2009. Vol. 4, № 2, p. 11-18.

4. Bhowan U. Genetic Programming for Classification with Unbalanced Data. Victoria University of Wellington. 2012.

5. Ishibuchi H., Mihara S., Nojima Y. Parallel Distributed Hybrid Fuzzy GBML Models With Rule Set Migration and Training Data Rotation // IEEE Transactions on fuzzy systems, vol. 21, no. 2. April 2013.

6. Stanovov V., Semenkin E., Self-adjusted evolutionary algorithms based approach for automated design of fuzzy logic systems // Vestnik SibGAU. 2013, vol. 4, p. 148-152.

7. Semenkin E., Stanovov V. Fuzzy rule bases automated design with self-configuring evolutionary algorithm // Proceedings of the 11th International Conference on Informatics in Control, Automation and Robotics (Vienna, 1-3 September 2014 r.). Volume 1, p. 318-323.

8. Khritonenko D. I., Semenkin E. S. Distributed Self-Configuring Evolutionary Algorithms For Artificial Neural Networks Design // Vestnik SibGAU. 2013, № 4 (50), p. 112-116.

9. Akhmedova Sh. A., Semenkin E. S., Gasanova T., Minker. W. Co-Operation of Biology Related Algorithms for Support Vector Machine Automated Design // Engineering and Applied Sciences Optimization (OPT-i'14). 2014.

10. Semenkin E. S., Bukhtoyarov V. V., Development and research of a hybrid genetic programming method // Software products and systems. 2010, vol. 3.

11. Semenkin E. S., Shabalov A. A., Efimov S. N. Automated ensembles of intelligent informational technologies design by means of genetic programming // Vestnik SibGAU. 2011, vol. 3, p.77-81.

12. Brester Ch., Semenkin E. Development of adaptive genetic algorithms for neural network models multicriteria design // Vestnik SibGAU. 2013, № 4 (50), p. 99-103.

© CraHOBOB B. B., 2014

УДК 504.054

ПРОБЛЕМЫ ИСПОЛЬЗОВАНИЯ ЭКОЛОГИЧЕСКИХ РИСКОВ ДЛЯ НОРМИРОВАНИЯ КАЧЕСТВА АТМОСФЕРНОГО ВОЗДУХА*

О. В. Тасейко, Е. Н. Потылицына, Е. В. Сугак

Сибирский государственный аэрокосмический университет имени академика М. Ф. Решетнева Российская Федерация, 660014, г. Красноярск, просп. им. газ. «Красноярский рабочий», 31

Е-таП: taseiko@gmail.com

Анализируются неопределенности в задачах оценки риска здоровью населения от загрязнения атмосферного воздуха городов. Сопоставляются системы разработки нормативов качества атмосферного воздуха в разных странах. Показаны недостатки государственной наблюдательной сети, препятствующие объективной оценке рисков.

Ключевые слова: нормативы качества окружающей среды, экологический ущерб, оценка рисков.

*Работа выполнена при поддержке Российского фонда фундаментальных исследований (проект 14-06-00256).

i Надоели баннеры? Вы всегда можете отключить рекламу.