Научная статья на тему 'Разработка сервиса для решения задач прогнозирования методами нечеткой математики'

Разработка сервиса для решения задач прогнозирования методами нечеткой математики Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
178
20
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ПРОГНОЗИРОВАНИЕ / ПРОГРАММИРОВАНИЕ / НЕЧЕТКАЯ МАТЕМАТИКА / МЕТОДЫ ПРОГНОЗИРОВАНИЯ / РАЗРАБОТКА СЕРВИСА / РЕШЕНИЕ ЗАДАЧ ПРОГНОЗИРОВАНИЯ / АНАЛИЗ ДАННЫХ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Рубцова Алиса Валерьевна

В статье обсуждается теоретическая обоснованность выбора методов нечеткой математики при решении задач прогнозирования. Проводится краткий анализ популярных, распространенных методов решения и анализа решения задач прогнозирования в различных сферах повседневной жизни.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Разработка сервиса для решения задач прогнозирования методами нечеткой математики»

УДК 004.42

Рубцова А.В.

Смоленский государственный университет, г. Смоленск, Россия

РАЗРАБОТКА СЕРВИСА ДЛЯ РЕШЕНИЯ ЗАДАЧ ПРОГНОЗИРОВАНИЯ МЕТОДАМИ

НЕЧЕТКОЙ МАТЕМАТИКИ

АННОТАЦИЯ

В статье обсуждается теоретическая обоснованность выбора методов нечеткой математики при решении задач прогнозирования. Проводится краткий анализ популярных, распространенных методов решения и анализа решения задач прогнозирования в различных сферах повседневной жизни.

КЛЮЧЕВЫЕ СЛОВА

Прогнозирование; программирование; нечеткая математика; методы прогнозирования; разработка сервиса; решение задач прогнозирования; анализ данных.

Rubtsova A.V.

Smolensk State University, Smolensk, Russia

DEVELOPMENT OF SERVICE FOR THE SOLUTION OF TASKS OF FORECASTING BY METHODS OF INDISTINCT MATHEMATICS

ABSTRACT

In the article theoretical justification of the choice of methods of indistinct mathematics in case of the solution of tasks of forecasting a is discussed. The short analysis of popular, widespread methods of the decision and the analysis of the solution of tasks of forecasting in various spheres of everyday life is carried out.

KEYWORDS

Forecasting; programming; indistinct mathematics; forecasting methods; service development; solution of tasks of forecasting; analysis of data.

Сегодня перспективным является применение интеллектуальных технологии, методы теории нечетких множеств являются удобным средством моделирования сложных динамических процессов в условиях многокритериальности, ограниченности и неопределенности. Процесс развития жизнедеятельности того или иного явления есть процесс труднопредсказуемыи, практически непрогнозируемым, которыи зависит от многих граничных условии и факторов, и в этих условиях целесообразно использовать нечеткие модели вывода. Вопросы практического применения нечетких моделеи рассматривались в работах X. Танаки, К. Сонга [1], однако универсальныи подход к прогнозированию на данныи момент не сформулирован. В зависимости от вида анализируемои деятельности существуют рекомендации, но определенного, общего подхода не существует.

Под «разработкои сервиса» понимается проектирование программного продукта, которыи будет удовлетворять требованиям: анализа, сбора и обработки информации. В нашем случае, с помощью такого сервиса требуется осуществить сервисное обслуживание, которое способно качественно повысить уровень жизни людеи. Но достичь этого в деиствительности возможно только при условии, если обслуживаемыи и обслуживающии понимают друг друга в процессе обслуживания. Вопрос адаптации сервиса к потребностям конечного пользователя стремится к вопросу о теоретическом фундаменте метода, на которыи разработчик склонен опираться-метод нечеткои математики. Данныи аспект будет освещен в даннои статье.

Следует рассмотреть историческии аспект рассматриваемого метода. Как известно, обобщениями теории множеств являются: математическая теория нечетких множеств (fuzzy sets) и нечеткая логика (fuzzy logic). Как известно, данные понятия были впервые предложены американским ученым Лотфи Заде (Lotfi Zadeh) в 1965 г. Основнои причинои появления новои теории стало наличие нечетких и приближенных рассуждении при описании человеком процессов, систем, объектов. Первоначально, до того, как нечеткии подход к моделированию сложных систем

получил признание во всем мире, прошло много времени с момента отделения теории нечетких множеств, как отдельной науки. При этом, первый период (конец 60-х-начало 70 гг.) характеризуется развитием теоретического аппарата нечетких множеств ([2]). Второи период (7080-е годы) интерпретируется появлением первых практических результатов в области нечеткого управления сложными техническими системами (парогенератор с нечетким управлением).

Одновременно стало уделяться внимание вопросам построения экспертных систем, построенных на нечеткои логике, в большеи степени иллюстрируется на разработке нечетких контроллеров. Нечеткие экспертные системы для поддержки принятия решении находят широкое применение в таких отраслях как экономика, образование, медицина. Наконец, в третьем периоде, которьш длится с конца 80-х годов и продолжается в настоящее время, появляются пакеты программ для построения нечетких экспертных систем, а области применения нечеткои логики заметно углубляются. Она применяется в автомобильнои, аэрокосмическои и транспортнои промышленности, в области финансов, анализа и принятия управленческих решении и многих других.

Безусловно, оба рассмотренных вида прогнозирования часто работают в совокупности, например, на основании сложного алгоритма вычисляются будущие значения временного ряда, а далее, эксперт проверяет эти цифры на адекватность. На этом этапе эксперт может внести ручные корректировки, которые при его высокои квалификации, способны положительно повлиять на качество прогноза. Работа нашего сервиса основана именно на сложном алгоритме вычисления будущих значении из совокупности данных.

Если требуется повысить точность экспертного прогнозирования, например, в задачах маркетинга (что непременно является яркои иллюстрациеи), то нужно следовать ряду определенных рекомендации. Если же перед разработчиком стоит задача повышения точности прогнозирования за счет сложных, быстрых, программно реализованных математических моделеи, то стоит взглянуть в сторону консенсус-прогноза, то есть прогноза, составленного на основании обзора независимых прогнозов.

Относительно теоретическои обоснованности выбора метода в разработке сервиса, следует отметить его недостатки, чтобы в будущем их неитрализовать. Классические нечеткие системы обладают тем недостатком, что для формулирования правил и функции принадлежности необходимо привлекать экспертов тои или инои предметнои области, что не всегда удается обеспечить. Решением этого недостатка являются, как отмечают специалисты [3], адаптивные нечеткие системы (adaptive fuzzy systems). В таких системах подбор параметров нечеткои системы производится в процессе обучения на экспериментальных данных. Алгоритмы обучения адаптивных нечетких систем относительно трудоемки и сложны по сравнению с алгоритмами обучения неиронных сетеи, и, как правило, состоят из двух стадии: 1. Генерация лингвистических правил; 2. Корректировка функции принадлежности. Первая задача относится к задаче переборного типа, вторая - к оптимизации в непрерывных пространствах. При этом возникает определенное противоречие: для генерации нечетких правил необходимы функции принадлежности, а для проведения нечеткого вывода - правила. Кроме того, при автоматическои генерации нечетких правил необходимо обеспечить их полноту и непротиворечивость.

Значительная часть методов обучения нечетких систем использует генетические алгоритмы. В англоязычнои литературе этому соответствует специальным термин - Genetic Fuzzy Systems [3]. Значительным вклад в развитие теории и практики нечетких систем с эволюционнои адаптациеи внесла группа испанских исследователеи во главе с Ф. Херрера (F. Herrera) [4].

По нашему мнению, быстрым и удобным источником для сбора данных являются базы данных. Они известны простым обывателям, разнообразием своих возможностеи и общеи доступностью пользователям, которые владеют первоначальными навыками работы за компьютером. Нечеткие запросы к базам данных (fuzzy queries) - перспективное направление в современных системах обработки информации [2]. Данныи инструмент дает возможность формулировать запросы на естественном языке, например: "Вывести список недорогих предложении о съеме жилья близко к центру города", что невозможно при использовании стандартного механизма запросов. Для этои цели разработана нечеткая реляционная алгебра и специальные расширения языков SQL для нечетких запросов. Большая часть исследовании в этои области принадлежит западноевропеиским ученым Д. Дюбуа и Г. Праде[6].

Нечеткие ассоциативные правила (fuzzy associative rules) - инструмент для извлечения из баз данных закономерностей которые формулируются в виде лингвистических высказывании.[1] Здесь введены специальные понятия нечеткои транзакции, поддержки и достоверности нечеткого ассоциативного правила.

Нечеткие когнитивные карты (fuzzy cognitive maps) были предложены Б. Коско в 1986 г. [3]

и используются для моделирования причинных взаимосвязей, выявленных между концептами некоторой области. В отличие от простых когнитивных карт, нечеткие когнитивные карты представляют собои нечеткии ориентированным граф, узлы которого являются нечеткими множествами. Направленные ребра графа не только отражают причинно-следственные связи между концептами, но и определяют степень влияния (вес) связываемых концептов. Активное использование нечетких когнитивных карт в качестве средства моделирования систем обусловлено возможностью, во-первых, наглядного представления анализируемои системы, именно возможность иллюстрирования результатов работы является, на наш взгляд, самым привлекательным при получении итоговых результатов. Так, во-вторых легкостью интерпретации причинно-следственных связеи между концептами. Иначе говоря, получение возможности быстрого и понятного синтеза и анализа полученного результата. Основные проблемы в данном случае связаны с процессом построения когнитивнои карты, которыи не поддается формализации. Кроме того, необходимо доказать, что построенная когнитивная карта адекватна реальнои моделируемои системе [7] Одним словом, что мы получим понятно и эффективно обработанную цепочку данных. Для решения данных проблем разработаны алгоритмы автоматического построения когнитивных карт на основе выборки данных.

К нечетким методам относятся колоссальное количество методов: нечеткие деревья решении, нечеткие сети Петри, нечеткие методы кластеризации нечеткая ассоциативная память, нечеткие самоорганизующиеся карты и другие гибридные методы.

Если подвергнуть сравнению привычную многим классическую логику и нечеткую в последнеи явно заметно отличие: вместо величин истина и ложь используется степень истинности, принимающая любые значения из бесконечного множества от 0 до 1 включительно. Следовательно, логические операции уже нельзя представить в виде таблицы. В нечеткои логике они задаются функциями.

Однако, надо помнить, что не существует универсальных методов прогнозирования на любые варианты зависимости чисел. Выбор метода прогнозирования и его эффективность зависят от многих условии, и в частности от требуемои длины или времени прогнозирования.

По времени прогнозирования различают краткосрочныи, среднесрочныи и долгосрочныи прогноз. Краткосрочным прогноз характеризует собои прогноз «на завтра», то есть прогноз на несколько шагов вперед. Среднесрочным прогноз - это обычно прогноз на один или на половину сезонного цикла. А при построении долгосрочного прогноза стандартные статистические методы прогнозирования практически не используют, и требуется использование комплексных подходов. Например, использование неиронных сетеи или регрессионных моделеи.

Для построения прогноза, важно правильно понимать термины, используемые при построении моделеи и хорошо ими оперировать. После построения любои модели важно проверять, насколько адекватно она построена, насколько верно она соответствует деиствительности. Для этого можно, во-первых, провести визуальныи анализ со сдвигом прогноза на несколько шагов назад, иначе говоря, данныи шаг можно охарактеризовать как приближенная оценка предполагаемого результата. А во-вторых, воспользоваться анализом остатков - стандартным методом проверки адекватности любои построеннои модели. Таким образом, главная функция прогнозирования заключается в проведении научного анализа связанных с тематикои исследования процессов и тенденции, а также в предвидении новых ситуации и выявлении характерных проблем. Основные функции прогнозирования состоят также в исследовании объективных связеи явлении и процессов в конкретных условиях, результаты которого мы планируем обработать с помощью сконструированного сервиса. Хотелось бы также отметить следующие две характерные особенности: адекватность и рентабельность прогнозирования. Под адекватностью понимается максимальное приближение прогнознои модели к реальнои деиствительности, тенденциям, закономерностям. Рентабельность прогнозирования

заключается в том, чтобы эффект от разработанного прогноза должен превышал затраты на его разработку.

Числовые данные масштабируются в принятым для сети диапазон. Обычно данные масштабируются по линеинои шкале. При обработке некоторых данных используются алгоритмы, которые автоматически находят масштабирующие параметры для преобразования числовых значении в нужным диапазон. [8] На первым план, в общем случае, выходит формулирование и применение алгоритма, которыи с помощью функции способен автоматически сгенерировать результат и обработать массив числовои информации.

Так, нам становится более понятно, как деиствовать с числовыми характеристиками. Велика вероятность, что нам придется пользоваться нечисловыми данными. Примеров данному явлению существует колоссальное количество. Например, в образовании можно сгенерировать

данные по численности педагогического и ученического составов. Длят достаточно трудоемко запоминать имена, фамилии, место жительства с помощью чисел. По крайней мере, потому что для этого понадобится специалист, которыи запомнит все числа соответствующие данным и понадобится сложнеишая функция для нахождения характеристик статистики.

Чаще всего нечисловые данные представляют в виде номинальных переменных. Номинальные переменные могут быть двузначными (например, Пол = {Мужчина, Женщина}) или многозначными (то есть принимать больше двух значении). Двузначную номинальную переменную легко превратить в числовую (например, Мужчина = 1, Женщина = 0. Такои способ представления информации может иметь место и в других отраслях нашеи повседневнои жизни, например, в медицине (формирование электроннои очереди, количество пациентов, медицинскии состав учреждения). Данные и общую систематизацию данных мы встречаем повсеместно.

Обратимся к общеи схеме работы сервиса (рис. 1). Конечныи пользователь получает результат работы при помощи обработки выполненного им запроса некоторои базы данных, включающеи в себя комплекс числовых характеристик некоторого явления. Отметим также, что задача нашего сервиса состоит в формировании некоторого прогноза, методом нечеткои математики, что выделяет его работу среди подобных. В свою очередь, подобная работа уникальна по своему проявлению, поскольку задача баз данных заключена не только в работе над сбором и анализом, но и над синтезом полученнои информации. Значительная часть информации имеет нечеткую структуру и построение прогнозов на основе методов нечеткои математики нечетких временных рядов должно быть составнои частью комплекснои системы прогнозирования и принятия решении.

компонент представления данных

КЛИЕНТ

компонент интерпретации данных

запросы

Рис. 1. Общая схема работы сервиса

В заключении рассмотрим такои аспект, как не совсем достоверные данные. Например, когда физик делает замеры сигнала - значения некоторых переменных могут быть испорчены шумом или частично отсутствовать. Такие переменные можно заменить на среднее значение этои переменнои. Если данных немного, можно включить в рассмотрение случаи с пропущенными значениями.

Принципы прогнозирования обеспечивают методологическое единство разнообразных методов и моделеи прогнозирования. После получения предвиденных значении при наличии правильных можно получить абсолютные и относительные отклонения на всем контрольном множестве, для каждого шага прогнозирования. При наличии удовлетворительных результатов прогнозирования можно считать, что полученныи сервис будет максимально точно и цело отвечать общим требованиям. Далее рассмотрим методы нечеткои математики и их интерпретацию.

Говоря об основании выбора именно таких методов-нечеткои математики хотелось бы выделить следующую идею. Известно, что все операторы языков программирования требуют именно четких условии, так получается всегда приходится из нечеткои степени истинности получать четкии критерии срабатывания. Данное явление можно проиллюстрировать на таком примере: мы знаем, что живые организмы обладают своиством раздражимость. Получается если

взять три одинаковых организма, их жизненныи цикл будет протекать в нормальном режиме, спокоиное состояние. Добавив к одному организму-раздражитель, мы получим реакцию, а значит режим спокоиствия нарушается. Такое явление имеет название дефаззификация, именно основываясь на нем будет работать разрабатываемыи сервис. Работа выполнена под руководством к.ф.-.м.н., доцента Кристалинского В.Р.

Литература

1. Сох I J., Lewis R. W., Rasing R.S. and etc. Application of neural computingin basic oxygen steelmaking // J. of Materials Processing Techn., 2002.V.120, №l-3.-p.310-315.

2. BaseGroup Labs URL:https://basegroup.m/community/artides/fuzzylogic-math

3. Заде Л. Понятие лингвистической переменной и его применение к принятию приближенных решений. - М.: Мир, 1976.

4. Kosko B. Fuzzy systems as universal approximators // IEEE Transactions on Computers, vol. 43, No. 11, November 1994. -P. 1329-1333.

5. Cordon O., Herrera F., A General study on genetic fuzzy systems // Genetic Algorithms in engineering and computer science, 1995. - P. 33-57.

6. Дюбуа Д., Прад А. Теория возможностей. Приложения к представлению знаний в информатике.

7. Прикладные нечеткие системы / Под ред. Т. Тэрано, К. Асаи, М. Сугэно. - М.: Мир, 1993.- 368 с.

8. Chen S.M. Forecasting enrollments based on fuzzy time series // Fuzzy Sets Systems, 1996, vol. 81, no. 3, pp. 311-319.

References

1. Сох I J., Lewis R. W., Rasing R.S. and etc. Application of neural computingin basic oxygen steelmaking // J. of Materials Processing Techn., 2002.V.120, №l-3.-p.310-315.

2. BaseGroup Labs URL:https://basegroup.ru/community/articles/fuzzylogic-math.

3. 3. Zade L. Ponyatie lingvisticheskoy peremennoy i ego primenenie k prinyatiyu priblizhennykh resheniy. - M.: Mir, 1976.

4. Kosko B. Fuzzy systems as universal approximators // IEEE Transactions on Computers, vol. 43, No. 11, November 1994. -P. 1329-1333.

5. Cordon O., Herrera F., A General study on genetic fuzzy systems // Genetic Algorithms in engineering and computer science, 1995. - P. 33-57.

6. Dyubua D., Prad A. Teoriya vozmozhnostey. Prilozheniya k predstavleniyu znaniy v informatike

7. Prikladnye nechetkie sistemy / Pod red. T. Terano, K. Asai, M. Sugeno. - M.: Mir, 1993.- 368 s.

8. Chen S.M. Forecasting enrollments based on fuzzy time series // Fuzzy Sets Systems, 1996, vol. 81, no. 3, pp. 311-319.

Поступила 12.10.2016

Об авторах:

Рубцова Алиса Валерьевна, магистрант физико-математического факультета Смоленского государственного университета, 409223@gmail.com.

i Надоели баннеры? Вы всегда можете отключить рекламу.