Научная статья на тему 'Оптимальная идентификация случайных событий'

Оптимальная идентификация случайных событий Текст научной статьи по специальности «Математика»

CC BY
188
37
i Надоели баннеры? Вы всегда можете отключить рекламу.
Область наук
Ключевые слова
ВОПРОСНИК / СТОИМОСТЬ ВОПРОСНИКА / СОБЫТИЕ / ВЕСОВАЯ ФУНКЦИЯ СОБЫТИЯ / ТРУДОЕМКОСТЬ АЛГОРИТМА / QUESTIONNAIRE / THE COST OF THE QUESTIONNAIRE / EVENT / THE WEIGHT FUNCTION OF THE EVENTS / COMPLEXITY OF THE ALGORITHM

Аннотация научной статьи по математике, автор научной работы — Чугаев Борис Николаевич, Аржененко Александр Юрьевич

В статье излагается метод оптимизации идентификации случайных событий с помощью теории вопросников. Теория вопросников раздел математики, возникший на стыке математической статистики, комбинаторики, теории графов и теории информации. Её основоположник К.Ф.Пикар разработал эту теорию как аппарат описания логических взаимосвязей задач, методов их решения и условий, при которых принимаются эти решения. П.П. Пархоменко предложил использовать теорию вопросников как математический аппарат для наглядного построения, представления и описания оптимальных условных алгоритмов диагностирования. Основной задачей теории вопросников стало построение оптимального в некотором смысле вопросника.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Чугаев Борис Николаевич, Аржененко Александр Юрьевич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

OPTIMAL IDENTIFICATION OF RANDOM EVENTS

The paper presents a method for optimizing identification of random events by using the theory of questionnaires. Theory questionnaires a branch of mathematics that arose at the turn of mathematical statistics, combinatorics, graph theory and information theory. Its founder K.F.Pikar developed this theory as a description of the device logical relationships of tasks and methods of their solutions and the conditions under which these decisions are made. PP Parkhomenko suggested using questionnaires theory as a mathematical device to illustrate the construction, presentation and description of the best conventional diagnostic algorithms. The main task of the theory of the questionnaires was to build optimal in some sense of the questionnaire.

Текст научной работы на тему «Оптимальная идентификация случайных событий»

ОПТИМАЛЬНАЯ ИДЕНТИФИКАЦИЯ СЛУЧАЙНЫХ СОБЫТИЙ

УДК 681.518

Борис Николаевич Чугаев

к. т. н., доцент кафедры вычислительные машины, системы и сети Московского авиационного института (МАИ) Тел. 8 (499) 158-43-82 Эл. почта: b.915@yandex.ru

Александр Юрьевич Аржененко

д. ф-м. н., профессор кафедры Информационные технологии Московского авиационного института (МАИ)

В статье излагается метод оптимизации идентификации случайных событий с помощью теории вопросников. Теория вопросников - раздел математики, возникший на стыке математической статистики, комбинаторики, теории графов и теории информации. Её основоположник К.Ф.Пикар разработал эту теорию как аппарат описания логических взаимосвязей задач, методов их решения и условий, при которых принимаются эти решения. П.П. Пархоменко предложил использовать теорию вопросников как математический аппарат для наглядного построения, представления и описания оптимальных условных алгоритмов диагностирования.

Основной задачей теории вопросников стало построение оптимального в некотором смысле вопросника.

Ключевые слова: вопросник, стоимость вопросника, событие, весовая функция события, трудоемкость алгоритма.

Boris N. Chugaev

PhD in Engineering, Associate Professor, Department of computers, systems and networks, Moscow Aviation Institute (MAI) Tel. 8 (499) 158-43-82 E-mail: b.915@yandex.ru

Alexander Y. Arzhenenko

Doctorate of Physics and Mathematics, Professor, Department of Information Technologies, Moscow Aviation Institute (MAI)

OPTIMAL IDENTIFICATION OF RANDOM EVENTS

The paper presents a method for optimizing identification of random events by using the theory of questionnaires. Theory questionnaires - a branch of mathematics that arose at the turn of mathematical statistics, combinatorics, graph theory and information theory. Its founder K.F.Pikar developed this theory as a description of the device logical relationships of tasks and methods of their solutions and the conditions under which these decisions are made. PP Parkhomenko suggested using questionnaires theory as a mathematical device to illustrate the construction, presentation and description of the best conventional diagnostic algorithms. The main task of the theory of the questionnaires was to build optimal in some sense of the questionnaire.

Keywords: questionnaire, the cost of the questionnaire, event, the weight function of the events, complexity of the algorithm.

1. Введение

В журналах прикладного и теоретического характера часто встречаются задачи, относящиеся к теории принятия решений, теории дискретного поиска, теории искусственного интеллекта, технической диагностике цифровых систем и т.п., которые при различной постановке имеют схожее математическое описание. Часто для их решения используют единый математический аппарат. Таким аппаратом является теория вопросников [2,3,4].

Ниже излагаются основные понятия и определения теории вопросников.

Задано конечное множество У, состоящее из N элементов у, именуемых событиями. Каждому событию у, е У приписана не отрицательная весовая функция ю(у), называемая весом события у,. Задано также конечное множество Т разбиений множества У на классы, число элементов в множестве Т есть |Т| = Я. Элементы t множества Т называются вопросами. Число подмножеств а(0, на которые вопрос t разбивает множество У, называют основанием вопроса t. Очевидно, что 2 < а(0 < N. Классы событий, которые множество У разбивается вопросом t е Т, называются ответами или исходами вопроса t. Каждому вопросу t е Т приписана положительная весовая функция с(0, называемая стоимостью вопроса.

Описание разбиения множества событий У вопросами из Т на подмножества принято проводить при помощи анкеты. Анкета представляет собой матрицу А размерности R х N, элементы которой определяется значением исходного вопроса ^ для события у [2,4].

Совокупность вопросов Q е Т и последовательности, в которых задаются эти вопросы, для полной идентификации каждого из N событий множества У, образуют вопросник для У. При одних и тех же множествах Т и У могут быть построены вопросники, отличающиеся последовательностью постановки, так и множествами поставленных вопросов. Поэтому возникает основная задача теории вопросников, а именно выбор оптимального, в некотором смысле, вопросника.

Вопросник представляется нагруженным орграфом 0(Х, Г), у которого

X: {х е ^ и У)}; х = у е Y ^ \Гу\ = 0; х = t е Q ^ Щ = Q п Y = 0.

В графе О(ХГ) существует единственная вершина х0 = t1 е Q, для которой \Г\0\ = 0. Очевидно, что такой граф является корневым деревом с корнем в вершине Хо, оканчивается в Хк е У.

Стоимостью пути из Хо в Хк е У называют сумму стоимостей вопросов, принадлежащих этому пути:

С&, хк) = 2ОД),

где I = 0,... к.

Пронормируем весовые функции ю(у) событий у е У следующим образом:

Р(У) = ®(У) / Г,

где

Ш = Ею(у). Ер(у) = 1, 0 < р(у) < 1.

Таким образом, в качестве весовой функции р(у) можно задавать вероятности событий у полной системы событий У. Такой подход наиболее распространен в теории вопросников [6].

Затраты на идентификацию событий в целом (стоимость вопросника), определяется как математическое ожидание идентификации всех событий из У. Другими словами, под стоимостью под стоимостью обхода графа 0(Х, Г):

ОД, У) = у)р(у).

Вопросник с равными основаниями а(0 всех вопросов называется однородным, а однородный вопросник, у которого а(0 = 2 - дихотомичным или бинарным. Бинарному вопроснику соответствует бинарное дерево.

Таблица 1.

Вопросы Т События У. Стоимости С(')

Т У1 У2 Уз У4 У5 У6 У7 С(г,)

п 0 0 0 0 1 1 1 2

'2 0 1 0 1 0 0 1 1

'3 0 0 0 0 0 0 0 3

4 0 1 1 0 1 0 0 2

'5 0 0 1 0 1 0 1 4

Вероятности р(у) 0,1 0,15 0,07 0,1 0,2 0,08 0,3

Отметим, что вопросник с любым основанием а(') достаточно просто сводится к бинарному вопроснику [4,6].

В дальнейшем будем рассматривать бинарные вопросники.

Минимальное число вопросов к, необходимое для полной идентификации N событий, определяется из соотношения

К = ^2^,

где [^2^ - наибольшее целое данного выражения.

Очевидно, что неизбыточное множество вопросов Т, позволяющее идентифицировать каждое событие у е У, задается таким образом, чтобы |Т| > К. Если |Т| = К, то вопросник называется компактным. В противном случае (|Т| > К) - вопросник некомпактный.

Рассмотрим в качестве примера построение вопросника по заданной анкете (таблица. 1).

Как уже отмечалось, одной и той же анкете соответствуют различные вопросники. На рис. 1 приведены три варианта возможных вопросников, построенных по заданной анкете (таблица 1). Приведенные варианты вопросников отличаются последовательностью задаваемых вопросов.

Приведенные на рис. 1 варианты вопросников отличаются последовательностью задаваемых вопросов.

Подсчитаем стоимость вопросника, приведенного на рис. 1 а.

Са(¥) = [с(0 + с&) + с(/з)] х [р^) +

+Р(Уз)] + №) + с(/2) + с(/д)] х х РУ) + рУ)] + №) + с(/5)]р(у6) + + [сад + с(/5) + сад] х ру) +р(у5)] = = (2 + 1 + 3)(0,1 + 0,07) + (2 + 1 +2 ) х X (0,15 + 0,1) + (2 + 4) х 0,08 +

+ (2 + 4 + 2)(0,3 + 0,2) = 6 х 0,17 + + 5 х 0,25 + 6 х 0,08 + 8 х 0,5 = 6,75.

Подсчитав аналогично стоимость вопросников, приведенных на рис. 16, и рис.1 в, получим соответственно Сб(У) = 7,87 и Св(У) = 8,51.

Из приведенного примера видно, что стоимость вопросника сущест-

венно зависит от последовательности задания вопросов.

Выше отметилось, что вопросник, имеющий минимальную стоимость, называется оптимальным.

2. Алгоритм оптимизации вопросника

Для построения оптимального вопросника при наличии полной системы бинарных вопросов и вероятностей

событий, предлагается метод сокращений.

Очевидно, что вопросник с максимальной стоимостью можно построить, задавая все вопросы из Т для каждого события у^ е У. Стоимость такого вопросника:

С(¥) = Ъс(')рУ).

Длина пути от корня дерева х1 до любой конечной вершины в вопроснике О равна Я. Следовательно, число висячих вершин £ в бинарном вопроснике определяется как: £ = 2я

Но множество событий У состоит из N элементов. Остальные Е = £ - N событий образуют подмножество событий с нулевыми вероятностями. Все события, принадлежащие этому подмножеству, обозначим у0.

Будем поочередно удалять из воп-

а)

б)

У1 ув У2 У4

в)

Рис. 1. Варианты возможных вопросников

Экономика, Статистика и Информатика

189

№2, 2013

росника такие вопросы, у которых один из исходов на рассматриваемом множестве событий принадлежит подмножеству Е.

Удалив вопрос, стоящий на (г-1) ранге вопросника, число висячих вершин, имеющих нулевые вершины, сократится на величину

2Я-г-2,

а стоимость вопросника при этом уменьшится на величину

С(У, г) = с(и)р(Г).

Из сказанного следует, что оптимальный вопросник О1 можно построить в том случае, если удаляя все вершины У. е Е получим минимум С(О). Этого можно достичь последовательно удаляя из вопросника наибольшее слагаемые С(у, 4) = С(/М)р(у.).

Исходя из сказанного, вопросник О1 строится так, чтобы вопросы, имеющие меньшую стоимость, имели бы меньший ранг в вопроснике. Упорядочим все вопросы в порядке возрастания их цен.

Очевидно, сокращение стоимости вопросника следует начинать с удаления максимального слагаемого Стах('г_2)Ртах(у.). При этом множество F уменьшится на единицу, т.е. Е1 = Е-1, а вершина У. переместится с ранга г на ранг (г-1). Отметим, что удалив теперь из стоимости С(О1) слагаемое С(/г-1)Ртах(У/), число нулевых вершин Е. сократится на 2 единицы. Вообще говоря, сокращение каждой из вершин у0 е Е уменьшает С(О1) на величину

С('г-2)Ртах(у/)/2

Поставим в соответствие каждому событию у. некоторое число, определяемое как

дг(у) = с(и)р(у)2-г-\ которое назовем функцией сокращения для события у. имеющего ранг г в формируемом вопроснике г = Я-т-1.

Коэффициентом сокращения дг(у) для рассматриваемого события у в вопроснике О1 дг(у>) = 2т.

Удаляя из вопросника О1 вопросы, определяющие максимальное слагаемое в сумме С(О1), удовлетворяем при этом соответствующее число вершин у0 до тех пор, пока коэффициент сокращения д^^у.) для события у., имеющего минимальный ранг, не окажется больше числа Ек оставшихся вершин с нулевыми вероятностями. На

этом этапе возникает задача выбора Мк чисел дг(у) так, чтобы их сумма была максимальной.

Достаточно просто доказать, что эта задача является обобщением известной ^ - полной задачи «целочисленный» рюкзак и, следовательно, тоже ^ полной [3]. Это означает, что оптимальный вопросник не может быть построен за полиноминальное, относительно числа событий, число шагов.

Таким образом, метод сокращения позволяет построить оптимальный вопросник, но при этом метод имеет экспоненциальную трудоемкость.

Приведем алгоритм оптимизации по методу сокращений. Алгоритм:

1. Вычислим значение функции сокращения дг(у.) для каждого события У; Е0 = 2Г- N . = 0.

2. Выбрать событие у. для которого дг(у) имеет максимальное значение и дг(у) < Е,

3. Удалить последний вопрос 'к стоящий на пути от корня вопросника к висячей вершине у е Е.

4. Вычислить новые значения дм(у),

Оу), е..

5. Если Е1 = 0, то алгоритм заканчивает работу.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

6. Если дгт1п(уи) < М„ то перейти к пункту 2. В противном случае методом перебора выделить Е1 значений функции сокращения, образующих максимальную сумму и провести удаление соответствующих вопросов.

Для получения алгоритма более, приемлемого с точки зрения трудоемкости, заменим в приведенном алгоритме пункт 6 безусловным переходом к пункту 2. В результате получим алгоритм построения квазиоптимального вопросника, который будет иметь полиномиальную трудоемкость [2].

3. Заключение

Большое распространение теория вопросников получила в технической диагностике. В этом случае множеству вопросов ставится в соответствие множество тестов, а множеству событий -множество неисправностей технической системы. Такое применение теории вопросников объясняется тем, что в настоящее время большое внимание уделяется быстрому и точному определению исправности, работоспособ-

ности и правильности функционирования технических систем. Особенно это касается автоматических систем управления, работающих в реальном масштабе времени [4,5].

Метод сокращения может быть использован для точной оценки нижней границы стоимости условных алгоритмов диагностирования технических устройств при полном множестве текстов различной стоимости, а так же для оптимальной стратегии идентификации множества неисправностей и системы цен.

Литература

1. Алискеров Ф.Т., Хабина Э.Л., Шварц Д.А. Бинарные отношения, графы и коллективные решения. - М.: ГУ ВШЭ, 2006. - 300с.

2. Аржененко А.Ю., Чугаев Б.Н. Оптимальные бинарные вопросники. - М.: Энергоатомиздат, 1989.-128 с.

3. Пападимитриу Х., Стайглиц К. Комбинаторная оптимизация. Алгоритмы и сложность: перев. с англ. - М. : Мир, 1985. 512с.

4. Пархоменко П.П., Согомонян Е.С. Основы технической диагностики. - М. : Энергоатомиздат, 1981. - 410 с.

5. Филин В.М., Пчелинцев Л.А., Денчик В.Н., Задеба В. Оптимизация диагностики космического разгонного блока. - М.: УРСС, 2004. - 184 с.

6. Picard C. F. Theorie des questionnaires. Paris: Ganthier-Villars. 1972. P. 182.

References

1. Aliskerov F.T., Habina Je.L., Sh-varc D.A. Binarnye otnoshenija, grafy i kollektivnye reshenija. - M.: GU VShJe, 2006. - 300s.

2. Arzhenenko A.Ju., Chugaev B.N. Optimal'nye binarnye voprosniki. - M.: Jenergoatomizdat, 1989.-128 s.

3. Papadimitriu H., Stajglic K. Kom-binatornaja optimizacija. Algoritmy i slozhnost': perev. s angl. - M.: Mir, 1985. 512s.

4. Parhomenko P.P., Sogomonjan E.S. Osnovy tehnicheskoj diagnostiki. - M.: Jenergoatomizdat, 1981. - 410 s.

5. Filin V.M., Pchelincev L.A., Denchik V.N., Zadeba V. Optimizacija diagnostiki kosmicheskogo razgonnogo bloka. - M.: URSS, 2004. - 184 s.

6. Picard C. F. Theorie des questionnaires. Paris: Ganthier-Villars. 1972. P. 182.

i Надоели баннеры? Вы всегда можете отключить рекламу.