Научная статья на тему 'Статистика нечетких данных'

Статистика нечетких данных Текст научной статьи по специальности «Математика»

CC BY
639
198
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
МАТЕМАТИКА / ПРИКЛАДНАЯ СТАТИСТИКА / МАТЕМАТИЧЕСКАЯ СТАТИСТИКА / НЕЧЕТКИЕ МНОЖЕСТВА / СЛУЧАЙНЫЕ МНОЖЕСТВА / СРЕДНИЕ ЗНАЧЕНИЯ / ПРОВЕРКА СТАТИСТИЧЕСКИХ ГИПОТЕЗ / РЕГРЕССИОННЫЙ АНАЛИЗ / КЛАСТЕР-АНАЛИЗ / СБОР И ОПИСАНИЕ НЕЧЕТКИХ ДАННЫХ / СТАТИСТИКА НЕЧИСЛОВЫХ ДАННЫХ / MATHEMATICS / APPLIED STATISTICS / MATHEMATICAL STATISTICS / FUZZY SETS / RANDOM SETS / AVERAGES / STATISTICAL HYPOTHESIS TESTING / REGRESSION ANALYSIS / CLUSTER ANALYSIS / COLLECTION AND DESCRIPTION OF FUZZY DATA / STATISTICS OF NON-NUMERICAL DATA

Аннотация научной статьи по математике, автор научной работы — Орлов Александр Иванович

Нечеткие множества частный вид объектов нечисловой природы. Поэтому при обработке выборки, элементами которой являются нечеткие множества, могут быть использованы различные методы анализа статистических данных произвольной природы расчет средних, непараметрических оценок плотности, построение диагностических правил и т.д. Рассказано о развитии наших работ по теории нечеткости (1975 2015). В первой нашей работе по нечетким множествам (1975) теория случайных множеств рассматривается как обобщение теории нечетких множеств. В научно-популярной серии «Математика. Кибернетика» издательства «Знание» в 1980 г. вышла первая книга советского автора по нечетким множествам наша брошюра [13]. Эта книга представляет собой в основном «выжимку» наших исследований 70-х годов, т.е. работ по теории устойчивости и, в особенности, по статистике объектов нечисловой природы, с уклоном в методологию. Книга включает в себя основные результаты по теории нечеткости и ее сведению к теории случайных множеств, а также новые результаты (первая публикация!) по статистике нечетких множеств. На основе дальнейшего опыта можно ожидать, что теория нечеткости будет всё активнее применяться при организационно-экономическом моделировании процессов управления промышленными предприятиями. Обсуждается понятие среднего значения нечеткого множества. Рассмотрен ряд постановок задач проверки статистических гипотез о нечетких множествах. Предложены и обоснованы алгоритмы восстановления зависимостей между нечеткими переменными. Дано представление о различных вариантах кластер-анализа нечетких данных и переменных. Описаны методы сбора и описания нечетких данных

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

STATISTICS OF FUZZY DATA

Fuzzy sets are the special form of objects of non-numeric nature. Therefore, in the processing of the sample, the elements of which are fuzzy sets, a variety of methods for the analysis of statistical data of any nature can be used the calculation of the average, non-parametric density estimators, construction of diagnostic rules, etc. We have told about the development of our work on the theory of fuzziness (1975 2015). In the first of our work on fuzzy sets (1975), the theory of random sets is regarded as a generalization of the theory of fuzzy sets. In non-fiction series "Mathematics. Cybernetics" (publishing house "Knowledge") in 1980 the first book by a Soviet author fuzzy sets is published our brochure "Optimization problems and fuzzy variables". This book is essentially a "squeeze" our research of 70-ies, ie, the research on the theory of stability and in particular on the statistics of objects of non-numeric nature, with a bias in the methodology. The book includes the main results of the fuzzy theory and its note to the random set theory, as well as new results (first publication!) of statistics of fuzzy sets. On the basis of further experience, you can expect that the theory of fuzzy sets will be more actively applied in organizational and economic modeling of industry management processes. We discuss the concept of the average value of a fuzzy set. We have considered a number of statements of problems of testing statistical hypotheses on fuzzy sets. We have also proposed and justified some algorithms for restore relationships between fuzzy variables; we have given the representation of various variants of fuzzy cluster analysis of data and variables and described some methods of collection and description of fuzzy data

Текст научной работы на тему «Статистика нечетких данных»

УДК 005.521:633.1:004.8

01.00.00 Физико-математические науки

СТАТИСТИКА НЕЧЕТКИХ ДАННЫХ

Орлов Александр Иванович

д.э.н., д.т.н., к.ф.-м.н., профессор

РИНЦ БРШ-код: 4342-4994

Московский государственный технический

университет им. Н.Э. Баумана, Россия, 105005,

Москва, 2-я Бауманская ул., 5, prof-orlov@mail.т

Нечеткие множества - частный вид объектов нечисловой природы. Поэтому при обработке выборки, элементами которой являются нечеткие множества, могут быть использованы различные методы анализа статистических данных произвольной природы - расчет средних, непараметрических оценок плотности, построение диагностических правил и т. д. Рассказано о развитии наших работ по теории нечеткости (1975 - 2015). В первой нашей работе по нечетким множествам (1975) теория случайных множеств рассматривается как обобщение теории нечетких множеств. В научно-популярной серии «Математика. Кибернетика» издательства «Знание» в 1980 г. вышла первая книга советского автора по нечетким множествам - наша брошюра [13]. Эта книга представляет собой в основном «выжимку» наших исследований 70-х годов, т.е. работ по теории устойчивости и, в особенности, по статистике объектов нечисловой природы, с уклоном в методологию. Книга включает в себя основные результаты по теории нечеткости и ее сведению к теории случайных множеств, а также новые результаты (первая публикация!) по статистике нечетких множеств. На основе дальнейшего опыта можно ожидать, что теория нечеткости будет всё активнее применяться при организационно-экономическом моделировании процессов управления промышленными предприятиями. Обсуждается понятие среднего значения нечеткого множества. Рассмотрен ряд постановок задач проверки статистических гипотез о нечетких множествах. Предложены и обоснованы алгоритмы восстановления зависимостей между нечеткими переменными. Дано представление о различных вариантах кластер-анализа нечетких данных и переменных. Описаны методы сбора и описания нечетких данных

Ключевые слова: МАТЕМАТИКА, ПРИКЛАДНАЯ СТАТИСТИКА, МАТЕМАТИЧЕСКАЯ СТАТИСТИКА, НЕЧЕТКИЕ МНОЖЕСТВА, СЛУЧАЙНЫЕ МНОЖЕСТВА, СРЕДНИЕ ЗНАЧЕНИЯ, ПРОВЕРКА СТАТИСТИЧЕСКИХ ГИПОТЕЗ, РЕГРЕССИОННЫЙ АНАЛИЗ, КЛАСТЕР -

UDC 005.521:633.1:004.8 Physics and mathematical sciences STATISTICS OF FUZZY DATA

Orlov Alexander Ivanovich

Dr.Sci.Econ., Dr.Sci.Tech., Cand.Phys-Math.Sci.,

professor

Bauman Moscow State Technical University, Moscow, Russia

Fuzzy sets are the special form of objects of non-numeric nature. Therefore, in the processing of the sample, the elements of which are fuzzy sets, a variety of methods for the analysis of statistical data of any nature can be used - the calculation of the average, non-parametric density estimators, construction of diagnostic rules, etc. We have told about the development of our work on the theory of fuzziness (1975 - 2015). In the first of our work on fuzzy sets (1975), the theory of random sets is regarded as a generalization of the theory of fuzzy sets. In non-fiction series "Mathematics. Cybernetics" (publishing house "Knowledge") in 1980 the first book by a Soviet author fuzzy sets is published - our brochure "Optimization problems and fuzzy variables". This book is essentially a "squeeze" our research of 70-ies, ie, the research on the theory of stability and in particular on the statistics of objects of non-numeric nature, with a bias in the methodology. The book includes the main results of the fuzzy theory and its note to the random set theory, as well as new results (first publication!) of statistics of fuzzy sets. On the basis of further experience, you can expect that the theory of fuzzy sets will be more actively applied in organizational and economic modeling of industry management processes. We discuss the concept of the average value of a fuzzy set. We have considered a number of statements of problems of testing statistical hypotheses on fuzzy sets. We have also proposed and justified some algorithms for restore relationships between fuzzy variables; we have given the representation of various variants of fuzzy cluster analysis of data and variables and described some methods of collection and description of fuzzy data

Keywords: MATHEMATICS, APPLIED STATISTICS, MATHEMATICAL STATISTICS, FUZZY SETS, RANDOM SETS, AVERAGES, STATISTICAL HYPOTHESIS TESTING, REGRESSION ANALYSIS, CLUSTER ANALYSIS, COLLECTION AND DESCRIPTION OF FUZZY DATA, STATISTICS OF NON-

АНАЛИЗ, СБОР И ОПИСАНИЕ НЕЧЕТКИХ NUMERICAL DATA

ДАННЫХ, СТАТИСТИКА НЕЧИСЛОВЫХ

ДАННЫХ

1. Введение

Основные понятия теории нечетких множеств (fuzzy sets) хорошо известны (см., например, [1, 2]). В настоящей статье обсудим некоторые вопросы статистического анализа нечетких данных.

Нечеткие множества - частный вид объектов нечисловой природы. Поэтому при обработке выборки, элементами которой являются нечеткие множества, могут быть использованы различные методы анализа статистических данных произвольной природы - расчет средних, непараметрических оценок плотности, построение диагностических правил и т.д. [3 - 6].

Расскажем о развитии наших работ по теории нечеткости, а затем обсудим ряд вопросов статистической теории анализа нечетких данных.

2. Развитие работ по теории нечеткости

В первой нашей работе по нечетким множествам теория случайных множеств рассматривается как обобщение теории нечетких множеств. В частности, найдены необходимые и достаточные условия, при которых проекция пересечения случайных множеств дает произведение либо пересечение нечетких множеств [7]. В следующей работе, вышедшей через два года, полностью развернуто сведение теории нечеткости к теории случайных множеств [8]. Подробное изложение сведения теории нечеткости к теории случайных множеств дано в статье [9]. Присущая мышлению человека нечеткость рассматривалась на примере древнегреческой апории «Куча» в научно-популярной публикации [10]. Итоги первого этапа наших работ по теории нечеткости были подведены в монографии [11].

Эти исследования вызвали интерес у научной общественности. Так, связь между нечеткими и случайными множествами рассмотрена в статье, написанной по заказу специалистов по математическому моделированию в психологии [12]. Несмотря на свой солидный статус, эту статью следует рассматривать как научно-популярную, поскольку новых результатов по сравнению с более ранними нашими публикациями на рассматриваемую тему в ней нет.

В научно-популярной серии «Математика. Кибернетика» издательства «Знание» в 1980 г. вышла первая книга советского автора по нечетким множествам - наша брошюра [13]. Эта книга представляет собой в основном «выжимку» наших исследований 70-х годов, т.е. работ по теории устойчивости и в особенности по статистике объектов нечисловой природы, с уклоном в методологию. Книга включает в себя основные результаты по теории нечеткости и ее сведению к теории случайных множеств, а также новые результаты (первая публикация!) по статистике нечетких множеств.

Название книги «унаследовано» у отвергнутого издательством неизвестного мне предшественника (у него было «Задачи оптимизации с нечеткими переменными»). У меня задачи оптимизации увязывались с медианой Кемени, эмпирическими и теоретическими средними в пространствах произвольной природы (ср. [3 - 6]). Получилось, мне кажется, хорошо. Именно с этой небольшой книги можно посоветовать начинать знакомство с нашим научным направлением. Хорошо бы ее переиздать. Она практически полностью соответствует современному научному уровню, целесообразно только добавить ссылки на последние книги и убрать устаревшую информацию о научных семинарах.

Книга получила вторую премию на всесоюзном конкурсе научно-популярных изданий. Однако ее обманный научно-популярный статус сыграл с ней злую шутку. Несмотря на внушительный тираж (40 тыс.

экземпляров - на порядок больше изданий научных книг) и первенство во времени (она была первой книгой советского автора по нечетким множествам, до этого были лишь переводы), в отечественной литературе по нечетким множествам цитируют чаще всего вышедшие позже издания, авторы которых находились в центре тех численно небольших групп (несколько десятков человек), которые специализировались на развитии теорию нечеткости в нашей стране. Такие сплоченные неформальные группы активно поддерживают своих и не менее активно отвергают (в лучшем случае игнорируют) чужих. Я сталкивался еще с двумя подобными сектами, к тому же с заметно более выраженной мафиозностью, - в области классификации ("классификационное движение" 80-х годов) и в области интервальной математики. Находясь снаружи и двигаясь в своем научном направлении, я не мог изменить установки этих групп, прежде всего из-за недостатка времени и душевных сил на контакты.

Полученные результаты были представлены специалистам на всесоюзном семинаре в Перми [14]. С удовлетворением констатирую, что результаты были осознаны специалистами по нечеткости и рассматривались ими (В.Б. Кузьминым, А.Н. Аверкиным и др.) в публикациях.

После выхода рассмотренной выше брошюры в обществе «Знание» я получил приглашение написать статью для основного советского научно-популярного журнала «Наука и жизнь» с двухмиллионным тиражом [15]. Несмотря на формальный статус статьи как научно-популярной, в ней впервые были нами рассмотрены основные методологические проблемы развития и применения теории нечеткости.

Однако в дальнейшем мы занимались в основном разработкой статистики нечисловых данных, организацией Всесоюзного центра статистических методов и информатики Центрального правления Всесоюзного экономического общества и Всесоюзной статистической

ассоциации. Работы по нечетким множествам были приостановлены. Исключением был доклад [16] на международной конференции 1988 г., посвященный связи между нечеткими и случайными множествами.

В последние десятилетия проявился интерес со стороны экономистов к теории нечеткости как математическому аппарату анализа неопределенностей, что отражено в статьях [17, 18], монографии [19], учебнике [20]. Можно ожидать, что теория нечеткости будет всё активнее применяться при организационно-экономическом моделировании процессов управления промышленными предприятиями.

В 2013 г. было сочтено полезным опубликовать основные результаты о сведении теории нечетких множеств к теории случайных множеств в виде развернутой журнальной статьи [1]. Эта тематика отражена в недавних монографиях [21, 22].

Перейдем к обсуждению избранных вопросов статистики нечетких данных.

3. Среднее значение нечеткого множества

Как уже отмечалось, при обработке выборки, элементами которой являются нечеткие множества, могут быть использованы различные методы анализа статистических данных произвольной природы. Однако иногда используются методы, учитывающие специфику нечетких множеств.

Например, пусть универсальным множеством для рассматриваемого нечеткого множества является конечная совокупность действительных чисел {х1, х2, ..., хп}. Тогда под средним значением нечеткого множества иногда понимают число. А именно, среднее значение нечеткого множества определяют по формуле:

п

Еа (х) М ( а) = -

Е ^ а (х)

г=1

где тА(х) - функция принадлежности нечеткого множества А. Если знаменатель равен 1, то эта формула определяет математическое ожидание случайной величины, для которой вероятность попасть в точку хг равна тА (х). Такое определение наиболее естественно, когда нечеткое множество А интерпретируется как нечеткое число.

Очевидно, наряду с М(А) может оказаться полезным использование эмпирических средних, определяемых (согласно статистике в пространствах произвольной природы [3 - 6]) путем решения соответствующих оптимизационных задач. Для конкретных расчетов необходимо ввести то или иное расстояние между нечеткими множествами.

4. Расстояния в пространствах нечетких множеств

Как известно, многие методы статистики нечисловых данных базируются на использовании расстояний (или показателей различия) в соответствующих пространствах нечисловой природы. Расстояние между нечеткими подмножествами А и В множества Х = {х1, х2, ..., х^} можно определить как

й (А, В) = ЕI тА (х;) -тв (х; )1,

1=1

где тА (х})- функция принадлежности нечеткого множества А, а тв (х})-

функция принадлежности нечеткого множества В. Может использоваться и другое расстояние:

£ I тА ()-mв ()|

D( A, B) = -.

£ (т()(х}-))

1=1

(Примем это расстояние равным 0, если функции принадлежности тождественно равны 0.)

В соответствии с аксиоматическим подходом к выбору расстояний (метрик) в пространствах нечисловой природы разработан обширный набор систем аксиом, из которых выводится тот или иной вид расстояний (метрик) в конкретных пространствах, в том числе в пространствах нечетких множеств [23]. При использовании вероятностных моделей расстояние между случайными нечеткими множествами (т.е. между случайными элементами со значениями в пространстве нечетких множеств) само является случайной величиной, имеющей в ряде постановок асимптотически нормальное распределение [24].

5. Проверка гипотез о нечетких множествах

Пусть ответ эксперта - нечеткое множество. Естественно считать, что его ответ, как показание любого средства измерения, содержит погрешности. Если есть несколько экспертов, то в качестве единой оценки (группового мнения) естественно взять эмпирическое среднее их ответов. Но возникает естественный вопрос: действительно ли все эксперты измеряют одно и то же? Может быть, глядя на реальный объект, они оценивают его с разных сторон? Например, на научную статью можно смотреть как с теоретической точки зрения, как и с прикладной, и соответствующие оценки будут, скорее всего, различны (если они совпадают, то работа либо никуда не годится, либо является выдающейся).

Итак, возник вопрос: как проверить согласованность мнений экспертов (в рамках теории проверки статистических гипотез, принятой в математической статистике)? Надо сначала определить понятие

согласованности. Пусть А - нечеткий ответ эксперта. Будем считать, что соответствующая функция принадлежности есть сумма двух слагаемых:

Ма (и) = Мм(А)(и) + ХА (и)

где Щ(А) - «истинное» нечеткое множество, а £,а(м) - «погрешность» эксперта как прибора. Естественно рассмотреть две постановки.

Первая постановка. Мнения экспертов А(1), А(2), ..., А(т) будем считать согласованными, если

Щ(А(1)) = Щ(А(2)) = Щ(А(т)).

Вторая постановка. Рассмотрим две группы экспертов. В первой у всех «истинное» мнение Щ(А), а во второй у всех - Щ(В). Две группы будем считать согласованными по мнениям, если

Щ(А) = Щ(В).

Согласованность определена. Как же ее проверить? Если экспертов достаточно много, то эти гипотезы можно проверять отдельно для каждого элемента множества - общего носителя нечетких ответов. Проверка последней гипотезы переходит в проверку однородности двух независимых выборок [3, гл.8; 25, гл.4]. Здесь ограничимся приведенными выше постановками основных гипотез (ср. с аналогичными гипотезами, рассмотренными для люсианов в [26]).

6. Восстановление зависимости между нечеткими переменными

Рассмотрим две нечеткие переменные А и В. Пусть каждый из п испытуемых выдает в ответ на вопрос два нечетких множества Аг и Вг, г = 1, 2, ..., п. Необходимо восстановить зависимость В от А, другими словами, наилучшим образом приблизить В с помощью А.

Для иллюстрации основной идеи ограничимся парной линейной регрессией нечетких множеств. Нечеткое множество С назовем линейной функцией от нечеткого множества А, если для любого х из носителя А

функции принадлежности множеств А и С таковы, что цС(х) = ЦА(у) при х = ау + ß. Другими словами,

ц с(х) = Ца((х - ß)/a) для любого х из носителя А. В таком случае естественно писать

С = аА +ß.

Однако нечеткие переменные, как и привычные для статистиков числовые переменные, обычно несколько отклоняются от линейной связи. Наилучшее линейное приближение нечеткой переменной В с помощью линейной функции от нечеткой переменной А естественно искать, решая задачу минимизации по а, ß расстояния от В до С. Пусть

р(В, а0А + ß0) = min p(B, аА + ß), где р - некоторое расстояние между нечеткими множествами, а минимизация проводится по всем возможным значениям а и ß. Тогда наилучшей линейной аппроксимацией В является а0А + ß0. Если рассматриваемый минимум равен 0, то имеет место точная линейная зависимость.

Для восстановления зависимости по выборочным парам нечетких переменных естественно воспользоваться подходом, развитым в статистике в пространствах произвольной природы для параметрической регрессии. В соответствии с методами статистики нечисловых данных [3 -6] в качестве наилучших оценок параметров линейной зависимости следует рассматривать

n

(a*,ß*) = Arg min £ р(Вг, oAt + ß)

a,ß k=i .

Тогда наилучшим линейным приближением В является С* = а*А + ß*.

Вероятностно-статистическая теория регрессионного анализа нечетких переменных [13] строится как частный случай аналогичной теории для переменных произвольной природы [3 - 6]. В частности, при

обычных предположениях оценки а*, в* являются состоятельными, т.е. а* ^ а0 и в* ^ р0 при п ^ да.

7. Кластер-анализ нечетких данных и переменных

Строить группы сходных между собой нечетких данных и переменных (кластеры объектов и кластеры признаков) можно многими способами (см. предложения Л. Заде с соавторами в [27]). Опишем два семейства алгоритмов.

Пусть на пространстве, в котором лежат результаты наблюдений, т.е. на пространстве нечетких множеств, заданы две меры близости р и т (например, это могут быть введенные выше расстояния й и D). Берется один из результатов наблюдений (нечеткое множество) и вокруг него описывается шар радиуса Я, определяемый мерой близости р. (Напомним, что шаром с центром в х относительно р называется множество всех элементов у рассматриваемого пространства таких, что р(х, у) < Я.) Берутся результаты наблюдений (элементы выборки), попавшие в этот шар, и находится их эмпирическое среднее относительно второй меры близости т. Оно берется за новый центр, вокруг которого снова описывается шар радиуса Я относительно р, и процедура повторяется. (Чтобы алгоритм был полностью определен, необходимо сформулировать правило выбора элемента эмпирического среднего в качестве нового центра, если эмпирическое среднее состоит более чем из одного элемента.)

Когда центр шара зафиксируется (перестанет меняться), попавшие в этот шар элементы объявляются первым кластером и исключаются из дальнейшего рассмотрения. Алгоритм применяется к совокупности оставшихся результатов наблюдений, выделяет из нее второй кластер и т.д.

Всегда ли центр шара остановится? При реальных расчетах в течение многих лет так было всегда. Соответствующая теория построена лишь в 1978 г. [28]. Доказано, что описанный выше процесс всегда остановится

через конечное число шагов. Причем число шагов до остановки оценивается через максимально возможное число результатов наблюдений в шаре радиуса Я относительно р.

Обширное семейство образуют алгоритмы кластер-анализа типа «Дендрограмма», известные также под названием «агломеративные иерархические алгоритмы средней связи». На первом шаге алгоритма из этого семейства каждый результат наблюдения рассматривается как отдельный кластер. Далее на каждом шагу происходит объединение двух самых близких кластеров. Название «Дендрограмма» объясняется тем, что результат работы алгоритма обычно представляется в виде дерева. Каждая его ветвь соответствует кластеру, появляющемуся на каком-либо шагу работы алгоритма. Слияние ветвей соответствует объединению кластеров, а ствол - заключительному шагу, когда все наблюдения оказываются объединенными в один кластер.

Для работы алгоритмов кластер-анализа типа «Дендрограмма» необходимо определить расстояние между кластерами. Естественно использовать ассоциативные средние, которыми, как известно, являются средние по Колмогорову всевозможных попарных расстояний между элементами двух рассматриваемых кластеров. Итак, расстояние между кластерами К и Ь, состоящими из п1 и п2 элементов соответственно, определяется по формуле:

( 1 ^ ?(К, Ь) = ^ - -ЕЕ Р (Р(Хг , X, ))

^ П1П2 геК ,еЬ )

где р - некоторое расстояние между нечеткими множествами; ^ - строго монотонная функция (строго возрастающая или строго убывающая).

Соображения теории измерений позволяют ограничить круг возможных алгоритмов типа «Дендрограмма». Естественно принять, что единица измерения расстояния выбрана произвольно. Тогда измерения проводятся в шкале отношений, и согласно результатам теории измерений

(см., например, [29, разд. 3.4]) из всех средних по Колмогорову годятся только степенные средние, т.е.

ад = 7х при X ф 0 или ад = 1п(г).

Чтобы получить разбиение на кластеры, надо «разрезать» дерево на определенной высоте, т.е. объединять кластеры лишь до тех пор, пока расстояние между ними меньше заранее выбранной константы. При альтернативном подходе заранее фиксируется число кластеров. Рассматривают и двухкритериальную постановку, когда минимизируют сумму (или максимум) внутрикластерных разбросов и число кластеров. Для решения задачи двухкритериальной минимизации либо один из критериев заменяют ограничением, либо два критерия «свертывают» в один, либо применяют иные подходы (последовательная оптимизация, построение поверхности Парето и др.).

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

При классификации нечетких множеств полезны многие подходы, рассмотренные в [3, гл.9; 25, гл.5], а именно, все подходы, основанные только на использовании расстояний.

8. Сбор и описание нечетких данных

Разработано большое количество процедур описания нечеткости. Так, согласно Э. Борелю [30] понятие «Куча» описывается с помощью функции распределения - при каждом конкретном х значение функции принадлежности - это доля людей, считающих совокупность из х зерен кучей. Результат подобного опроса может дать и кривую иного вида, например, по поводу понятия «молодой» (слева будут отделены «дети», а справа - «люди зрелого и пожилого возраста»). Нечеткая толерантность может оцениваться с помощью случайных толерантностей (см. [29, разд. 7.2]).

Целесообразно попытаться выделить наиболее практически полезные простые формы функций принадлежности [14]. Видимо,

наиболее простой является «ступенька» - внутри некоторого интервала функция принадлежности равна 1, а вне этого интервала равна 0. Это -простейший способ «размывания» числа путем замены его интервалом. Нечеткое множество описывается двумя числами - концами интервала. Оценки этих чисел можно получить с помощью экспертов. Статистическая теория подобных нечетких множеств, т.е. статистика интервальных данных, рассмотрена в [3, гл.12], [4], [21], [31]. При прогнозировании погоды температура обычно описывается интервалами.

Тремя числами a < Ь < c описывается функция принадлежности типа треугольника. При этом левее числа а и правее числа с функция принадлежности равна 0. В точке Ь функция принадлежности принимает значение 1. На отрезке [а; Ь] функция принадлежности линейно растет от 0 до 1, а на отрезке [Ь;с] - линейно убывает от 1 до 0. Оценки трех чисел а < Ь < с получают при опросе экспертов.

Следующий по сложности вид функции принадлежности - типа трапеции - описывается четырьмя числами а < Ь < с < С. Левее а и правее С функция принадлежности равна 0. На отрезке [а; Ь] она линейно возрастает от 0 до 1, на отрезке [Ь; с] во всех точках равна 1, а на отрезке [с; С] линейно убывает от 1 до 0. Для оценивания четверки чисел а < Ь < с < С используют экспертов.

Ряд результатов статистики нечетких данных приведен в первой монографии российского автора по нечетким множествам [13] и во многих дальнейших публикациях, в том числе в [3, 25].

Литература

1. Орлов А.И. Теория нечетких множеств - часть теории вероятностей // Политематический сетевой электронный научный журнал Кубанского государственного аграрного университета. 2013. № 92. С. 51-60.

2. Орлов А.И., Луценко Е.В. Системная нечеткая интервальная математика. Монография (научное издание). - Краснодар, КубГАУ. 2014. - 600 с.

3. Орлов А.И. Прикладная статистика. Учебник для вузов. - М.: Экзамен, 2006. - 671 с.

4. Орлов А.И. Организационно-экономическое моделирование : учебник : в 3 ч. Ч. 1. Нечисловая статистика. - М.: Изд-во МГТУ им. Н.Э. Баумана, 2009. — 541 с.

5. Орлов А.И. Тридцать лет статистики объектов нечисловой природы (обзор) // Заводская лаборатория. Диагностика материалов. 2009. Т.75. №5. С.55-64.

6. Орлов А.И. О развитии статистики объектов нечисловой природы // Политематический сетевой электронный научный журнал Кубанского государственного аграрного университета. 2013. № 93. С. 41-50.

7. Орлов А.И. Основания теории нечетких множеств (обобщение аппарата Заде). Случайные толерантности // Алгоритмы многомерного статистического анализа и их применения. - М.: Изд-во ЦЭМИ АН СССР, 1975. С.169-175.

8. Орлов А.И. Связь между нечеткими и случайными множествами. Нечеткие толерантности // Исследования по вероятностно-статистическому моделированию реальных систем. - М.: Изд-во ЦЭМИ АН СССР, 1977. С.140-148.

9. Орлов А.И. Нечеткие и случайные множества // Прикладной многомерный статистический анализ. Ученые записки по статистике, т.33. - М.: Наука, 1978. С.262-280.

10. Орлов А.И. Кем же был этот грек? // Химия и жизнь. 1978. №12. С.75-78.

11. Орлов А.И. Устойчивость в социально-экономических моделях. - М.: Наука,1979.- 296 с.

12. Орлов А.И. Теория нечеткости и случайные множества // Математическое моделирование в психологии / Вопросы кибернетики. Вып.50. - М.: Научный Совет АН СССР по комплексной проблеме «Кибернетика», 1979. С.35-43.

13. Орлов А.И. Задачи оптимизации и нечеткие переменные. - М.: Знание, 1980. - 64 с.

14. Орлов А.И. Нечеткость, вероятность и статистика // Тезисы V научно-технического семинара «Управление при наличии расплывчатых категорий» (Пермь, 13 декабря 1982 г.). Ч.1. - Пермь: Изд-во НИИ управляющих машин и систем, 1982. С.35-38.

15. Орлов А.И. Математика нечеткости // Наука и жизнь. 1982. № 7. С. 60-67.

16. Orlov A.I. The Connection between fuzzy and random Sets // Moscow International Conference «Fuzzy Sets in Informatics» (September 20-23, 1988). Abstracts. -М.: ВЦ АН СССР, 1988. С.51-52.

17. Орлов А.И. Размытые цены. Нечисловая экономика и управление инвестиционным процессом // Российское предпринимательство. 2001. № 12. С.103-108.

18. Загонова Н.С., Орлов А.И. Мы новый, лучший вариант построим. Эконометрическая поддержка контроллинга инноваций. Нечеткий выбор // Российское предпринимательство. 2004. №4. С.54-57.

19. Проектирование интегрированных производственно-корпоративных структур: эффективность, организация, управление / С.Н.Анисимов, А.А.Колобов, И.Н.Омельченко, А.И.Орлов, А.М. Иванилова, С.В. Краснов; Под ред. А.А. Колобова, А.И. Орлова. Научное издание. - М.: Изд-во МГТУ им. Н.Э. Баумана, 2006. - 728 с.

20. Колобов А. А., Омельченко И. Н., Орлов А. И. Менеджмент высоких технологий. Интегрированные производственно-корпоративные структуры: организация, экономика, управление, проектирование, эффективность, устойчивость. Учебник для вузов. — М.: Экзамен, 2008. — 621 с.

21. Орлов А.И., Луценко Е.В. Системная нечеткая интервальная математика. Монография (научное издание). - Краснодар, КубГАУ. 2014. - 600 с.

22. Орлов А.И., Луценко Е.В., Лойко В.И. Перспективные математические и инструментальные методы контроллинга. Под научной ред. проф. С.Г. Фалько. Монография (научное издание). - Краснодар, КубГАУ. 2015. - 600 с.

23. Орлов А.И. Расстояния в пространствах статистических данных // Политематический сетевой электронный научный журнал Кубанского государственного аграрного университета, 2014. № 101. С. 227 - 252.

24. Орлов А.И., Раушенбах Г.В. Метрика подобия: аксиоматическое введение, асимптотическая нормальность // Статистические методы оценивания и проверки гипотез. Межвузовский сборник научных трудов. - Пермь: Изд-во Пермского государственного университета, 1986. - С.148-157.

25. Орлов А.И. Эконометрика. Учебник для вузов. Изд. 3-е, исправленное и дополненное. - М.: Экзамен, 2004. - 576 с.

26. Орлов А.И. Теория люсианов // Политематический сетевой электронный научный журнал Кубанского государственного аграрного университета. 2014. № 101. С. 275 - 304.

27. Bellman R., Kalaba R., Zadeh L. Abstractions and Pattern Classification // Journal of Mathematical Analysis Applications. 1966. Vol.13. Pp.1-7. (Перевод: Беллман Р., Калаба Р., Заде Л. Абстрагирование и классификация образов // Современные проблемы кибернетики. - М.: Знание, 1979. С.21-29.)

28. Орлов А.И. Сходимость эталонных алгоритмов // Прикладной многомерный статистический анализ. Ученые записки по статистике, т.33. - М.: Наука, 1978. С. 361-364.

29. Орлов А.И. Организационно-экономическое моделирование: учеб. Ч.2. Экспертные оценки. М.: Изд-во МГТУ им. Н.Э. Баумана, 2011. 486 с.

30. Борель Э. Вероятность и достоверность. - М.: ГИФМЛ, 1961. - 120 с.

31. Орлов А.И. Теория принятия решений. Учебник для вузов. — М.: Экзамен, 2006. — 576 с.

References

1. Orlov A.I. Teorija nechetkih mnozhestv - chast' teorii verojatnostej // Politematicheskij setevoj jelektronnyj nauchnyj zhurnal Kubanskogo gosudarstvennogo agrarnogo universiteta. 2013. № 92. S. 51-60.

2. Orlov A.I., Lucenko E.V. Sistemnaja nechetkaja interval'naja matematika. Monografija (nauchnoe izdanie). - Krasnodar, KubGAU. 2014. - 600 s.

3. Orlov A.I. Prikladnaja statistika. Uchebnik dlja vuzov. - M.: Jekzamen, 2006. - 671 s.

4. Orlov A.I. Organizacionno-jekonomicheskoe modelirovanie : uchebnik : v 3 ch. Ch. 1. Nechislovaja statistika. - M.: Izd-vo MGTU im. N.Je. Baumana, 2009. — 541 s.

5. Orlov A.I. Tridcat' let statistiki ob#ektov nechislovoj prirody (obzor) // Zavodskaja laboratorija. Diagnostika materialov. 2009. T.75. №5. S.55-64.

6. Orlov A.I. O razvitii statistiki ob#ektov nechislovoj prirody // Politematicheskij setevoj jelektronnyj nauchnyj zhurnal Kubanskogo gosudarstvennogo agrarnogo universiteta. 2013. № 93. S. 41-50.

7. Orlov A.I. Osnovanija teorii nechetkih mnozhestv (obobshhenie apparata Zade). Sluchajnye tolerantnosti // Algoritmy mnogomernogo statisticheskogo analiza i ih primenenija. - M.: Izd-vo CJeMI AN SSSR, 1975. S.169-175.

8. Orlov A.I. Svjaz' mezhdu nechetkimi i sluchajnymi mnozhestvami. Nechetkie tolerantnosti // Issledovanija po verojatnostno-statisticheskomu modelirovaniju real'nyh sistem. - M.: Izd-vo CJeMI AN SSSR, 1977. S.140-148.

9. Orlov A.I. Nechetkie i sluchajnye mnozhestva // Prikladnoj mnogomernyj statisticheskij analiz. Uchenye zapiski po statistike, t.33. - M.: Nauka, 1978. S.262-280.

10. Orlov A.I. Kem zhe byl jetot grek? // Himija i zhizn'. 1978. №12. S.75-78.

11. Orlov A.I. Ustojchivost' v social'no-jekonomicheskih modeljah. - M.: Nauka,1979.- 296 s.

12. Orlov A.I. Teorija nechetkosti i sluchajnye mnozhestva // Matematicheskoe modelirovanie v psihologii / Voprosy kibernetiki. Vyp.50. - M.: Nauchnyj Sovet AN SSSR po kompleksnoj probleme «Kibernetika», 1979. S.35-43.

13. Orlov A.I. Zadachi optimizacii i nechetkie peremennye. - M.: Znanie, 1980. -

64 s.

14. Orlov A.I. Nechetkost', verojatnost' i statistika // Tezisy V nauchno-tehnicheskogo seminara «Upravlenie pri nalichii rasplyvchatyh kategorij» (Perm', 1-3 dekabrja 1982 g.). Ch.1. - Perm': Izd-vo NII upravljajushhih mashin i sistem, 1982. S.35-38.

15. Orlov A.I. Matematika nechetkosti // Nauka i zhizn'. 1982. № 7. S. 60-67.

16. Orlov A.I. The Connection between fuzzy and random Sets // Moscow International Conference «Fuzzy Sets in Informatics» (September 20-23, 1988). Abstracts. -M.: VC AN SSSR, 1988. S.51-52.

17. Orlov A.I. Razmytye ceny. Nechislovaja jekonomika i upravlenie investicionnym processom // Rossijskoe predprinimatel'stvo. 2001. № 12. S.103-108.

18. Zagonova N.S., Orlov A.I. My novyj, luchshij variant postroim. Jekonometricheskaja podderzhka kontrollinga innovacij. Nechetkij vybor // Rossijskoe predprinimatel'stvo. 2004. №4. S.54-57.

19. Proektirovanie integrirovannyh proizvodstvenno-korporativnyh struktur: jeffektivnost', organizacija, upravlenie / S.N.Anisimov, A.A.Kolobov, I.N.Omel'chenko, A.I.Orlov, A.M. Ivanilova, S.V. Krasnov; Pod red. A.A. Kolobova, A.I. Orlova. Nauchnoe izdanie. - M.: Izd-vo MGTU im. N.Je. Baumana, 2006. - 728 s.

20. Kolobov A. A., Omel'chenko I. N., Orlov A. I. Menedzhment vysokih tehnologij. Integrirovannye proizvodstvenno-korporativnye struktury: organizacija, jekonomika, upravlenie, proektirovanie, jeffektivnost', ustojchivost'. Uchebnik dlja vuzov. — M.: Jekzamen, 2008. — 621 s.

21. Orlov A.I., Lucenko E.V. Sistemnaja nechetkaja interval'naja matematika. Monografija (nauchnoe izdanie). - Krasnodar, KubGAU. 2014. - 600 s.

22. Orlov A.I., Lucenko E.V., Lojko V.I. Perspektivnye matematicheskie i instrumental'nye metody kontrollinga. Pod nauchnoj red. prof. S.G. Fal'ko. Monografija (nauchnoe izdanie). - Krasnodar, KubGAU. 2015. - 600 s.

23. Orlov A.I. Rasstojanija v prostranstvah statisticheskih dannyh // Politematicheskij setevoj jelektronnyj nauchnyj zhurnal Kubanskogo gosudarstvennogo agrarnogo universiteta, 2014. № 101. S. 227 - 252.

24. Orlov A.I., Raushenbah G.V. Metrika podobija: aksiomaticheskoe vvedenie, asimptoticheskaja normal'nost' // Statisticheskie metody ocenivanija i proverki gipotez. Mezhvuzovskij sbornik nauchnyh trudov. - Perm': Izd-vo Permskogo gosudarstvennogo universiteta, 1986. - S.148-157.

25. Orlov A.I. Jekonometrika. Uchebnik dlja vuzov. Izd. 3-e, ispravlennoe i dopolnennoe. - M.: Jekzamen, 2004. - 576 s.

26. Orlov A.I. Teorija ljusianov // Politematicheskij setevoj jelektronnyj nauchnyj zhurnal Kubanskogo gosudarstvennogo agrarnogo universiteta. 2014. № 101. S. 275 - 304.

27. Bellman R., Kalaba R., Zadeh L. Abstractions and Pattern Classification // Journal of Mathematical Analysis Applications. 1966. Vol.13. Pp.1-7. (Perevod: Bellman R., Kalaba R., Zade L. Abstragirovanie i klassifikacija obrazov // Sovremennye problemy kibernetiki. - M.: Znanie, 1979. S.21-29.)

28. ОГ1ОУ А.1. 8Ьо&то81;' ]е1а1оппуЬ algoritmov // Prikladnoj mnogomernyj 81а11811еЬе8к1] analiz. ИсЬепуе zapiski ро statistike, t.33. - М.: Nauka, 1978. Б. 361-364.

29. ОГ^ А.1. Organizacionno-jekonomicheskoe modelirovanie: ucheb. СЬ.2. Jekspertnye ocenki. М.: Izd-vo МСТИ im. N.Je. Baumana, 2011. 486 s.

30. Borel' Je. Verojatnost' i dostovernost'. - М.: ОШМЬ, 1961. - 120 s.

31. ОГ^ А.1. Teorija prinjatija reshenij. Uchebnik dlja vuzov. — М.: Jekzamen, 2006. — 576 s.

i Надоели баннеры? Вы всегда можете отключить рекламу.