Научная статья на тему 'Подход к проблеме классификации технического состояния зданий и сооружений с использованием алгоритмов возможностной кластеризации и генетических алгоритмов'

Подход к проблеме классификации технического состояния зданий и сооружений с использованием алгоритмов возможностной кластеризации и генетических алгоритмов Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
106
17
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
НЕЧЁТКИЕ МНОЖЕСТВА / ГЕНЕТИЧЕСКИЕ АЛГОРИТМЫ / ЦЕЛЕВАЯ ФУНКЦИЯ / FCM-АЛГОРИТМ / PCM-АЛГОРИТМ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Демидова Лилия Анатольевна, Кираковский Валерий Владимирович, Коротаев Александр Николаевич

Рассмотрен новый подход к проблеме классификации технического состояния зданий и сооружений с использованием алгоритмов возможностной кластеризации и генетических алгоритмов. В ходе решения данной задачи было рассмотрено несколько алгоритмовI

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Демидова Лилия Анатольевна, Кираковский Валерий Владимирович, Коротаев Александр Николаевич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

n article view new approach to problem of classification technical state of buildings and constructions with using algorithms of possibilitic clusterization and genetic algorithms. During the solving this task was view some algorithms

Текст научной работы на тему «Подход к проблеме классификации технического состояния зданий и сооружений с использованием алгоритмов возможностной кластеризации и генетических алгоритмов»

организационно-технических систем // Вестник компьютерных и информационных технологий. 2009. № 6. М., С. 38-45.

5. Аврамчук Е. Ф., Вавилов А. А., Емельянов С. В. и др. Технология системного моделирования. М.: Машиностроение, 1988. 520 с.

6. Гнеденко Б. Д., Коваленко И. Н. Введение в теорию массового обслуживания. М.: Наука, 1987. 336 с.

7. Форрестер Дж. Мировая динамика. М.: Наука, 1978. 168 с.

8. Парийская Е.Ю. Сравнительный анализ математических моделей и подходов к моделированию и анализу непрерывно-дискретных систем. URL: http:// home.imm.uran.ru/dolly/vl_97/pariis/pariis.html

9. Программное обеспечение моделирования непрерывно-дискретных систем / Под ред. В.М. Глуш-кова. М.: Наука, 1975.

УДК 519.254

Л.А. Демидова, В.В. Кираковский, А.Н. Коротаев

ПОДХОД К ПРОБЛЕМЕ КЛАССИФИКАЦИИ ТЕХНИЧЕСКОГО СОСТОЯНИЯ ЗДАНИЙ И СООРУЖЕНИЙ С ИСПОЛЬЗОВАНИЕМ АЛГОРИТМОВ ВОЗМОЖНОСТНОЙ КЛАСТЕРИЗАЦИИ И ГЕНЕТИЧЕСКИХ АЛГОРИТМОВ

Эффективная классификация технического состояния зданий и сооружений (например, с целью проведения капитального ремонта) невозможна без исчерпывающих сведений о техническом состоянии зданий и сооружений в целом, а также отдельных строительных конструкций и инженерных систем. Использующийся в этих целях анализ проектной документации даёт лишь общее представление о параметрах и характеристиках объекта.

Имеющаяся техническая документация в большинстве случаев не фиксирует всех отступлений от проекта, допущенных как в процессе строительства, так и в процессе эксплуатации. Более полным и достоверным источником информации о техническом состоянии объектов могут служить материалы натурного обследования, выполняемые экспертами в соответствии с чёткими методическими принципами и положениями.

Обследование технического состояния таких объектов как с использованием инструментальных средств мониторинга, так и экспертного оценивания, должно дать ответ о соответствии современным требованиям и оценку целесообразности сохранения в существующем состоянии или переустройства, с учётом необходимых работ по реконструкции.

Постановка задачи. Оценка технического состояния зданий и сооружений при определении

процента (степени) износа производится экспертом (группой экспертов) по некоторому набору критериев, таких как "фундаменты", "стены кирпичные", "стены деревянные", "междуэтажные перекрытия", "лестницы каменные", "перегородки", "крыши", "окна", "двери", "местные приборы отопления", "центральная система отопления", "водопровод", "дворовая канализация", "тротуары" и "мостовые" путём выставления процента износа или баллов по некоторой шкале, например, по десятибалльной шкале (чем ниже балл, тем выше качество объекта по данному критерию) [4].

В случае мониторинга технического состояния большого количества зданий и сооружений с целью определения аварийных объектов при составлении плана штатных ремонтных работ, классификация может быть выполнена посредством кластеризации множества объектов мониторинга для выбранного набора критериев на заданное количество кластеров.

Например, на основе выставленных экспертных оценок по критериям множество анализируемых объектов может быть разбито на четыре класса: ветхие здания, не подлежащие восстановлению; здания, требующие капитального ремонта; здания, требующие текущего ремонта; здания, находящиеся в идеальном состоянии. При этом исходное множество объектов разбивается на

классы, содержащие объекты с близкими значениями характеристик.

Выбор алгоритма кластеризации. Обычно при решении задачи кластеризации объектов используется алгоритм нечётких с-средних ^СМ-алгоритм), реализующий учёт свойства кластерной относительности для объектов [3].

Как показывает практика, применение алгоритма возможностных с-средних (РСМ-алгоритма) позволяет улучшить результаты кластеризации, полученные с помощью FCM-алгоритма, в случае, если множество объектов содержит атипичные объекты, за счёт ослабления свойства кластерной относительности и учёта свойства типичности. Однако результаты кластеризации с использованием FCM-алгоритма и РСМ-алгоритма сильно зависят от выбора параметров алгоритма (например, для РСМ-алгоритма от значений фаззи-фикатора и значений "ширины зоны" п. (. = 1,с)), если кластеры имеют существенно разную плотность или существенно разный объём. Таким образом, можно говорить о существовании неопределённости при определении типичности объекта кластеру в РСМ-алгоритме и о необходимости в реализации метода расчёта значений степеней типичности объектов кластерам за счёт управления неопределённостью в выборе параметров РСМ-алгоритма - значений фаззификатора т значений или "ширины зоны" п. (. = 1,с).

Расширение множества объектов на интервальные нечёткие множества второго типа для PCM-алгоритма. Неопределённость в РСМ-алгоритме на основе интервальных нечётких множеств второго типа (ИНМТ2) может быть выражена как с помощью двух различных значений фаззификатора т (как в FCM-алгоритме на основе ИНМТ2) при фиксированном значении "ширины зоны" п.. (. = 1,с) для каждого кластера, так и с помощью двух различных значений "ширины зоны" п.. (. = 1,с) для каждого кластера при фиксированном значении фаззификатора т [1].

Пусть неопределённость в РСМ-алгоритме на основе ИНМТ2 задана с помощью двух различных значений фаззификатора т: т1 и т2 при фиксированном значении "ширины зоны" п. (. = 1,с) для каждого кластера.

Тогда "нижняя" и "верхняя" интервальные функции типичности могут быть представлены как:

-,если

1 +

IV 7Щ-1 1 + (л Л 1 1 + (А Л 4 л

К; К-;

2 Щ-!

т2-1 т1~1 {Л А

1+ к] 1+ К] 1+

2

1

2

(V щ-1

1+

1

2

чл щ-1

1+

1

1

1+

,если

1

1 +

.ъ)

щ—\

1+

1+

1

К

»«2—1

.(2)

Если неопределённость в РСМ-алгоритме на основе ИНМТ2 выражена с помощью двух различных значений "ширины зоны" п. (. = 1,с) для каждого кластера при фиксированном значении фаззификатора т, то при определении интервальных первичных функций типичности объекта х. в РСМ-алгоритме на основе ИНМТ2 "нижняя" и "верхняя" интервальные функции типичности (для двух различных значений "ширины зоны" п.: п. и п ) могут быть представлены как [2]:

1

2

(¿А т-1

1+ р

1

2

V " т-1

1+ р

ОМ,

1

2

(¿А т-1

1+

1

1+

Ил

1+

2 т-1

,если

1

,(3)

1+

,если

1 +

р

.4/0

1 +

л

2 т-1

1 +

Р

П,2

2 т-1

,(4)

2 ,если

1 +

С «О т-1 т-1 Г«0

р 1 + Р 1 + р

Ли

2 »1-1

где п. и п. - две ширины зоны , определяющие различные расстояния, на которых возможност-ная степень типичности равна 0,5.

Использование различных значений для фаз-зификатора т определяет различные целевые функции в РСМ-алгоритме на основе ИНМТ2 при т = т1 и т = т2 [3]:

^.VhttfaM)* -4 +±n2j -tk-Wjhp ,(5)

j=i i=l

;=1 ¡=1 № ¡=1 Использование различных значений "ширины зоны" ц. (/ = 1,с) определяет различные целевые функции в РСМ-алгоритме на основе ИНМТ2 при

п = П1 и п = /

^min < n , nmax < n , nmn < nmax , П - некоторое

j 'max' j — 'ma^' j j ' 'max *

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

действительное число, определяющее максимальное значение "ширины зоны".

В качестве функции соответствия для ГА может использоваться общий гиперобъём H [2, 3]:

}=1

—>min,

(7) Rj -Vjf,

i—1 i—1 i—I i—I J t/1 J J

j=l i=1

j=l i=1

i=l

(10)

(11)

Jnn№'V)=lE1lEi{wj(xi)Y wj(xi)Y ■ (8) где R - ковариационная матрица j-го кластера;

M w

М

Вычисление функции типичности и координат центров кластеров реализуется с использованием итерационного алгоритма Карника-Менделя. Поиск оптимальных параметров РСМ-алгоритма на основе ИНМТ2, обеспечивающих адекватные результаты кластеризации, не возможен без применения какого-либо оптимизационного алгоритма, например, генетического алгоритма (ГА).

Генетический алгоритм поиска оптимальной комбинации значений фаззификаторов, реализующих управление неопределённостью, и значений "ширины зоны" для РСМ-алгоритма на основе интервальных нечётких множеств второго типа. Метод возможностной кластеризации с использованием РСМ-алгоритма на основе ИНМТ2 и ГА позволяет значительно сократить время поиска оптимальной комбинации значений параметров алгоритма кластеризации и обеспечить получение адекватных результатов кластеризации [3].

Пусть, например, в РСМ-алгоритме на основе ИНМТ2 для каждого кластера задаётся единственное значение "ширины зоны" п. (/ = 1,с), а для фаззификатора т определяется комбинация значений: т1 и т2. В этом случае для поиска оптимальной комбинации значений фаззификаторов т1, т2 и оптимальных значений "ширины зоны" П. (/ = 1,с) может быть использован ГА.

При этом хромосома задаётся в виде:

^ = т т Лр..^ пД (9)

где т т2 е (1, ттах); ттах - некоторое действительное число, определяющее максимальное значение фаззификатора; т1 < т2; п. - "ширина зоны"/-го кластера (/ = 1С); п- е [п/Ч птак]; п™ > 0, п™* > 0,

п. - количество объектов кластеризации, отнесённых к /-му кластеру; V - вектор координат центра /-го кластера; х. - вектор координат (оценок по критериям) /-го объекта; det(Я/) - определитель ковариационной матрицы -го кластера; п - количество объектов; с - количество кластеров; г = 1,п,

/ = 1С.

При выполнении операции скрещивания выбирается вероятность скрещивания Яс и генерируется случайное число N. Если Яс > N, то случайным образом выбирается точка скрещивания г и выполняется скрещивание. Если в качестве точки скрещивания выбирается второй ген, определяющий фаззификатор т2, то скрещивание выполняется без проверки каких-либо условий. Если в качестве точки скрещивания выбирается первый ген, определяющий фаззификатор т1, то при выполнении операции скрещивания для обоих хромосом-отпрысков выполняется проверка условия: т1 < т2. Если это условие не выполняется, то осуществляется выбор новой точки скрещивания до тех пор, пока в точке скрещивания для обоих хромосом-отпрысков не будет выполнено условие: т1 < т2, либо в качестве точки скрещивания не будет выбран второй ген, определяющий фаззификатор, или ген, соответствующий "ширине зоны" /-го кластера / = 1,с.

При выполнении операции мутации выбирается вероятность мутации Ят и генерируется случайное число N . Если Я > N , то случайным об-

т т т7 ^

разом выбирается точка мутации г и выполняется мутация. Если в качестве точки мутации выбирается первый или второй ген, то при выполнении мутации для хромосомы-отпрыска выполняется проверка условия: т1 < т2. Если это условие не выполняется, то осуществляется выбор новой точки мутации до тех пор, пока в точке мутации

для хромосомы-отпрыска не будет выполнено условие: т1 < т2 либо в качестве точки мутации не будет выбран ген, соответствующий "ширине зоны" п /-го кластера/ = 1,с.

Тогда генетический алгоритм имеет вид:

1) случайным образом создаётся популяция размером Р. При этом для первого и второго генов выполняется проверка условия: т1 < т2;

2) при g < О (О и g - максимальное и текущее количество поколений ГА) реализуется РСМ-алгоритм на основе ИНМТ2 с вычислением значения функции соответствия для каждой хромосомы и создается Яс • Р/2 пар хромосом-родителей;

3) выполняются операции скрещивания и мутации для текущей популяции. При этом для первого и второго генов выполняется проверка условия: т1 < т2. Для хромосом-отпрысков реализуется РСМ-алгоритм на основе ИНМТ2 и вычисляются значения функции соответствия;

4) создаётся новая популяция размером (Р + Яс • Р), дополненная хромосомами-отпрысками в количестве Яс • Р, затем Яс • Р хромосом с худшими значениями функции соответствия отбрасываются. Если g < О, осуществляется переход к шагу 2;

5) выбирается лучшая хромосома, которая минимизирует функцию соответствия. Для каждого объекта определяется его принадлежность к кластерам.

В случае неопределённости выбора значений "ширины зоны" п (/ = 1,с) для РСМ-алгоритма на основе ИНМТ2 соответствующий ГА поиска оптимальных параметров метода возможностной кластеризации реализуется аналогичным образом.

Отметим, что при реализации ГА следует использовать одноточечное скрещивание, а количество мутирующих генов не должно превышать 10-20 % от длины хромосомы.

Приведённый выше метод кластеризации и соответствующий ему ГА могут быть модифицированы, если есть какие-либо веские соображения по выбору значений фаззификаторов т1 и т2. Например, в качестве значений фаззификаторов т1 и т2, реализующих управление неопределённостью, для РСМ-алгоритма на основе ИНМТ2 могут использоваться значения фаззификаторов т1 и т2, полученные с помощью FCM-алгоритма на основе ИНМТ2. В этом случае при инициализации РСМ-алгоритма на основе ИНМТ2 следует использовать координаты центров кластеров, вычисленные с помощью FCM-алгоритма на основе ИНМТ2. При этом в ряде случаев удаётся не толь-

ко уменьшить размерность оптимизационной задачи, но и улучшить результаты кластеризации за счёт учёта свойства кластерной типичности.

При фиксированных значениях фаззификато-ров т1 и т2 хромосома может быть представлена в виде:

5 = (пР..., п), (12)

где п- - "ширина зоны" /-го кластера (/ = 1,с);

п е [пт1" «тзх]' пт1п > 0 птах > 0 п"!" < п птах < п

- 1- / ' / ^' / ' / ' / 'та^' / 'та^'

п/шп < п/пах , птах - некоторое действительное число, определяющее максимальное значение "ширины зоны".

Предлагаемый модифицированный ГА реализуется так же, как и приведенный выше ГА за исключением тех шагов, где для генов, определяющих значения фаззификаторов т1 и т2, необходимо выполнять проверку условия: т1 < т2, так как значения фаззификаторов фиксированы.

Экспериментальные результаты. Ниже приведен пример кластеризации множества объектов на три кластера с использованием алгоритма чётких с-средних и методов кластеризации на основе НМТ1 и ИНМТ2 для множества объектов, содержащего кластеры существенно разной плотности или существенно разного объёма.

На рис. 1 показано множество объектов, содержащее три кластера существенно разного объёма (объекты разных кластеров помечены маркерами разной формы). Кластеры представляют собой множества объектов, координаты которых были сгенерированы с использованием нормального закона распределения с центрами (10, 50), (50, 50) и (90, 50). При этом при генерации первой и второй координат объектов первого и третьего кластеров использовались нормальные законы распределения, имеющие одинаковые дисперсии. Координаты объектов второго кластера имеют существенно большую дисперсию по обеим координатам. Первый и второй кластеры содержат по тридцать пять объектов, а второй кластер -сто тридцать объектов. На рис. 2-5 приведены результаты кластеризации с использованием различных алгоритмов кластеризации, при этом центры кластеров отмечены "белыми" маркерами треугольной формы.

При использовании алгоритма чётких с-средних (рис. 2) и FCM-алгоритма на основе НМТ1 (рис. 3) были ошибочно классифицированы девять и тринадцать объектов соответственно (4,5 % и 6,5 % от мощности множества объектов кластеризации

Рис. 1. Исходное множество объектов кластеризации

100 90 30 70 60 50 40 30 20 10

* \ ▼

* V ■

* к- : .........г ^ у ж-Вгч......г "к -Я-....... ж ■ ...ж....

* ....... ■ ■

• • ! ! ■1

• * !

т • ! * » 1

20

40

60

§0

100

Рис. 3. Результаты кластеризации с использованием

FCM-алгоритма на основе НМТ1 при т = 2 центры кластеров: первый кластер (11,014, 54,997); второй кластер (49,771, 50,962); третий кластер (89,982, 57,994)

Рис. 2. Результаты кластеризации с использованием чёткого алгоритма с-средних

100 90 30 70 60 50 40 30 20 ¡0

«

# ■ г ■

& V. • + % V. : - : 1 11111 4» НН

* |т V

а т 1 т ▼

0

20

40

60

80

100

Рис. 4. Результаты кластеризации с использованием FCM-алгоритма на основе ИНМТ2 для комбинации

т1 = 108,813 и т2 = 112,174 центры кластеров: первый кластер (10,134, 54,962); второй кластер (48,000, 49,999); третий кластер (89,999, 57,999)

соответственно). Применение РСМ-алгоритма на основе ИНМТ2 позволило улучшить результаты кластеризации: в этом случае были ошибочно классифицированы пять объектов (2,5 % от мощности множества объектов кластеризации) (рис. 4).

Использование РСМ-алгоритма на основе ИНМТ2 при фиксированных значениях фаззи-фикаторов т1 = 108,813 и т2 = 112,174, определённых с помощью РСМ-алгоритма на основе

ИНМТ2, позволило улучшить результаты кластеризации, полученные с помощью РСМ-алгоритма на основе ИНМТ2: были ошибочно классифицированы только четыре объекта (2 % от мощности множества объектов кластеризации) (рис. 5).

В таблице приведены результаты кластеризации с использованием алгоритмов кластеризации на основе НМТ1 и ИНМТ2, подтверждающие эффективность использования алгоритмов

100

90

so

70

60

50

40

30

20

10

в 1 т

* V н

•а •г ..............f ........ г *......г Ъ В-....... М, я

....... _. _ .тт.:J JbTXi;.^,____ я и

* Г т ■1

* i Ж !

щ т \ т * I

20

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

40

SO

so

ICO

Рис. 5. Результаты кластеризации для РСМ-алгоритма на основе ИНМТ2 для комбинации т1 = 108,813 и т2 = 112,174, ц1 = 115,410, П2 = 148,455 и п3 = 117^08 центры кластеров: первый кластер (10,923, 48,029), второй кластер (49,728, 49,883), третий кластер (88,453, 56,894)

кластеризации на основе ИНМТ2 для множеств объектов существенно разной плотности или существенно разного объёма.

Следует отметить, что для трёх сгенерированных исходных кластеров (рис. 1) общий гиперобъём Н составляет 279,725.

Таким образом, при использовании алгоритмов кластеризации на основе ИНМТ2 удалось уменьшить ошибку кластеризации с минимального количества в девять объектов (4,5 % от мощности множества объектов) для алгоритма чётких с-средних до четырёх—пяти объектов (2-2,5 % от мощности множества объектов) для алгоритмов кластеризации на основе ИНМТ2.

Как видно из таблицы, лучший результат кластеризации (при минимальном значении общего гиперобъёма Н, равном 311,776) с ошибкой кластеризации в четыре объекта (2 % от мощности множества объектов) был получен с помощью РСМ-алгоритма на основе ИНМТ2 при фиксированных значениях фаззификаторов т = 108,813 и т2 = 112,174, определённых с помощью FCM-алгоритма на основе ИНМТ2.

Таблица

Результаты кластеризации

Алгоритм кластеризации Значение функции соответствия Ошибочно классифицированные объекты

Алгоритм чётких с-средних 350,616 9 объектов, 4,5 %

FCM на основе НМТ1 при т = 2 (нечёткий общий гиперобьём) 541,268 13 объектов, 6,5 %

FCM на основе ИНМТ2 для комбинации щ =108,813 и т2 =112,174 330,144 5 объектов, 2,5 %

РСМ на основе ИНМТ2 (при фиксированных значениях фаззификаторов щ и т2, определённых с помощью FCM-алгоритма) 311,776 4 объекта, 2 %

В статье рассмотрена проблема управления неопределённостью выбора параметров РСМ-алгоритма на основе ИНМТ2 при кластеризации множества объектов, содержащего кластеры существенно разной плотности или существенно разного объёма.

Предложен метод кластеризации, разработанный для РСМ-алгоритма на основе ИНМТ2, позволяющий ослабить свойство кластерной относительности и учесть свойство кластерной типичности объектов, что в ряде случаев приводит к улучшению результатов кластеризации.

Применение ГА позволяет найти оптимальную комбинацию значений фаззификатора и "ширины зоны" в РСМ-алгоритме на основе ИНМТ2, обеспечивающую лучшие результаты кластеризации, что подтверждается минимальным значением функции соответствия.

Использование предлагаемого подхода на практике для решения задачи классификации технического состояния зданий и сооружений обеспечило принятие обоснованных и адекватных решений, что доказывает возможность его дальнейшего использования.

СПИСОК ЛИТЕРАТУРЫ

1. Rhee F.C.-H. Uncertain fuzzy clustering: insights and recommendations // IEEE Computational intellegence magazine. 2007. Vol. 2. № 1. P. 44-56.

2. Демидова Л.А., Кираковский В.В. Кластеризация объектов на основе нечетких множеств второго типа и генетического алгоритма // Управление созданием и развитием систем, сетей и устройств телекоммуникаций / Под ред. докт. экон. наук, канд. техн. наук,

проф. А.В. Бабкина, докт. техн. наук, проф. В.А. Кежае-ва / Труды Междунар. конф. СПб, 2008. С. 212-222.

3. Демидова Л.А., Кираковский В.В. Методы кластеризации объектов на основе нечетких множеств второго типа и генетического алгоритма // Научно-технические ведомости СПбГПУ Информатика. Телекоммуникации. Управление. СПб., 2008. № 6 (69). С. 136-142.

4. URL: http://www.appraiser.ru

УДК 656.7.025: 519.8

А. Д. Припадчев

МАТЕМАТИЧЕСКИЕ МОДЕЛИ ПРОЦЕССА ПАССАЖИРСКИХ ПЕРЕВОЗОК В ГРАЖДАНСКОЙ АВИАЦИИ

Решение задач оптимизации означает поиск и достижение оптимального соотношения параметров авиационной транспортной системы и ряда параметров системы, которые влияют на оптимальность и результат её функционирования. Оптимальность означает наличие в системе приемлемых свойств в соответствии с принятым критерием эффективности. В нашей постановке это структура и размерность парка воздушных судов во взаимодействии с процессом пассажирских перевозок.

Оптимизация парка воздушных судов проводится на основе математического моделирования. Для построения математической модели необходимо иметь чёткое представление о цели функционирования исследуемой системы и располагать информацией об ограничениях, которые опреде-

ляют область допустимых значений переменных. В общем случае основные этапы исследования представлены на рис. 1.

Идентификация проблемы

Построение модели

Проверка адекватности

Решение сформулированной задачи

Рис. 1. Этапы исследования процесса пассажирских перевозок

На первом этапе задача исследования заключается в идентификации проблемы. Выделим следующие основные стадии:

i Надоели баннеры? Вы всегда можете отключить рекламу.