Научная статья на тему 'Об одном алгоритме таксономической классификации на основе искусственных нейронных сетей'

Об одном алгоритме таксономической классификации на основе искусственных нейронных сетей Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
146
36
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Бодянский Евгений Владимирович, Любчик Леонид Михайлович, Матусовский Григорий Абрамович, Плисс Ирина Павловна

Предложена архитектура искусственной нейронной сети для расчета таксономического показателя уровня развития. Нейронная сеть в реальном времени оценивает состояние сложных систем по результатам обработки последовательности данных.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Бодянский Евгений Владимирович, Любчик Леонид Михайлович, Матусовский Григорий Абрамович, Плисс Ирина Павловна

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

About taxonomic classification algorithm based on artificial neural networks

The artificial neural network architecture for accounting of taxonomic development level coefficient is proposed. Neural network estimates the complex systems state in real time using data sequence processing.

Текст научной работы на тему «Об одном алгоритме таксономической классификации на основе искусственных нейронных сетей»

онарные значения достигнуты в состояниях с 1-го по (п-1)-е. Значит, и p0(t) = p0 . Следовательно,

если число состоянии конечно, то промежуток времени, за который при работе алгоритма вероятности нахождения процесса во всех состояниях достигают стационарных значении, конечен. Оценим этот промежуток времени. Очевидно, что он совпадает со временем достижения стационарного значения вероятностью нахождения процесса в состоянии 0:

Тогда

' n—1

P0(t) = exp-jl E^ i(t) п ioPi (t) 0 It \

Ц=1

p0 = exp

n—1

E pin i0zi(t0)p0 —^ 0 jt

t* =________l^Po_________

0 n—1 * * *

E pin i0zi(t0)p0 —^ 0

i=1

Вычислим

n—1 * * * * n—1 Д

Epini0zi(t0)p0 = p0 Epi i=1 i=1 V

n—1

En ij

j=1 j

zi(t0) =

Тогда

* n—1n—1 * * * n—1 *

p0 E Epinijzi(t0) = p0 E^0n0j = p0^0

j=1i=1 j=1

Литература:І.Розанов Ю.А. Теория вероятностей. Случайные процессы и математическая статистика. М.: Наука. 1989. 312 с. 2.Веприк А.Е., Герасин С.А., Дикарев В.А., Родзинский А.А., Числин Н.И. Методы и алгоритмы фокусировки распределении марковских процессов. Харьков, 1997. 159 с.

Поступила в редколлегию 27.09.98 Рецензент: д-р техн. наук Гиль Н.И. Веприк Александр Ефимович, научный сотрудник кафедры ПМ ХТУРЭ. Адрес: Украина, Харьков, ул. Командарма Уборевича, 20-А, кв.10, тел. 65-90-38.

УДК 681.513.7

ОБ ОДНОМ АЛГОРИТМЕ ТАКСОНОМИЧЕСКОЙ КЛАССИФИКАЦИИ НА ОСНОВЕ ИСКУССТВЕННЫХ НЕЙРОННЫХ СЕТЕЙ

БОДЯНСКИЙ Е.В., ЛЮБЧИК Л.М., МАТУСОВСКИЙ Г.А., ПЛИСС И.И

Предлагается алгоритм сжатия массивов финансово-экономической информации на основе таксономического показателя уровня развития. Процедура предназначается для работы в режиме реального времени и реализована с помощью нейросетевой технологии.

В настоящее время в социально-экономических, экономико-математических, математико-криминалистических [1-4] исследованиях для анализа объектов и систем с большим числом показателей используются таксономические процедуры классификации [5]. Они основаны на расчете так называемого таксономического показателя уровня развития, представляющего собой синтетическую величину.Пос-ледняя включает в себя все множество контролируемых технических, экономических, финансовых и других показателей и позволяет ответить на вопросы: насколько хорошо или плохо функционировал объект в каждый текущий момент контроля; каков его рейтинг в системе аналогичных объектов; какие показатели “виновны” в плохих результатах (низком рейтинге); каким должен быть гипотетический эталонный объект и насколько далеко наш контролируемый объект отстоит от эталона.

Рассмотрим процесс построения таксономического показателя уровня развития для объекта с п

технико-экономическими и финансовыми показателями, наблюдавшегося на временном интервале от 1 до t.

Первым этапом является построение (t х n) мат-

рицы наблюдений

'x 11 x 12 . • x 1k x1,k+1 . •• x1n ^

x 21 x 22 . • x 2k x2,k+1 . •• x 2n

Xt =

x i1 xi2 . • x ik xi,k+1 . •• xin (1)

Vx t1 xt2 . • xtk xt,k+1 . • • x tn j

сод ержащей t строк, которые соответствуют разным моментам времени контроля, и п столбцов, отвечающих разным показателям. Таким образом, Xim — это значение m-го показателя в i-й момент времени. Все показатели в матрице Xt разбиты на две группы: показатели-стимуляторы и показатели- дестимуляторы, которые отличаются тем, что если увеличение значения показателя улучшает общее состояние объекта, то это стимулятор, если же наоборот (чем больше показатель, тем хуже) — то это дестимулятор. Показатели-стимуляторы будем обозначать с помощью символа л, дестимуляторы — v . Если же в процессе вычислений разделение на стимуляторы и дестимуляторы непринципиально — символы л и v не используются. С формальной точки зрения такое разбиение соответствует введению двух подмножеств: стимуляторов Xц...xik таких, что xij ь xi+ц,

если xij > xi+1,j, j = 1,2,...,k , и дестимуляторов xi,k+1. xin таких, что xa ь xi+11, если xa < xi+11, l = k +1,... ,n.

РИ, 1998, № 3

63

Следующим этапом является процедура стандартизации показателей, приводящая к элиминированию единиц измерения и выравниванию значений показателей. При этом рассчитываются оценки среднего, дисперсии и стандартизованные показатели

_ 1 t

xtm =-Z xim , m = 1,2 • • • ,n, (2)

t i=1

1

c* = ( Z (7im - zim)2 I 2 Vi = 1,2...Л (7)

V m=1 У

причем чем меньше это расстояние, тем лучше работал объект в этот момент времени.

Собственно таксономический показатель уровня развития имеет вид

ст

2

tm =

1 Z (xim t i=1

xtm)

(3)

7 •

■4m

xim xtm ст tm

(4)

и формируется стандартизованная матрица наблюдений

Zt ={7im }. (5)

Разделение показателей на стимуляторы и дестимуляторы служит основой для построения так называемого эталона развития (виртуального объекта, являющегося эталоном работы для исследуемого объекта), который математически представляет собой точку с координатами:

* * * *

Zt = (7tb7t2>---, 7tn),

<7* = max 7ij, i = 1,2,... ,t; j = 1,2,... ,k,

i (6)

7ti = min7ii, i = 1,2,... ,t; l = k +1,... ,n. i

Далее рассчитывается “расстояние” между состоянием контролируемого объекта в каждый момент времени и эталоном:

*

di = 1 - ^, ct (8)

где ~t = c* + 2St, (9)

а _* 1 * * ct =-Z cb t i=1

1 St =( ‘,?<с*- c*)2)2 (10)

— моментные характеристики расстояний до эталона.

Величина di лежит в интервале от нуля до единицы, причем чем ближе эта характеристика к единице, тем устойчивее и эффективнее работает

контролируемый объект. Резкие уменьшения di свидетельствуют о нарушении устойчивости работы, значительном отклонении от эталона и необходимости тщательного выяснения причин ухудшения состояния.

Если число контролируемых объектов и соответствующих им показателей достаточно велико, а расчеты необходимо производить в текущем времени

(число строк матрицы Xt в каждый момент контроля увеличивается), данная процедура становится слишком громоздкой, требует больших объемов оперативной памяти ЭВМ и порождает трудности с интерпретацией результатов.

Ситуация существенно может быть упрощена, если для расчетов воспользоваться аппаратом теории искусственных нейронных сетей [6], учитывая, что уже накоплен опыт обработки больших массивов информации с их помощью [7], включая и финансово-экономические задачи [8], а также перспектив-

1*

Искусственная нейронная сеть для расчета таксономического показателя уровня развития

64

РИ, 1998, № 3

ность их применения в математико-криминалистических исследованиях [2].

Пусть в момент контроля t+1 показатели приняли значения

xt+1 = (xt+1,1 , xt+1,2 , — , xt+1,k ,

xt+1,k+1,

M+1

,n),

а сама матрица наблюдений приняла вид (Xt '

Xt+1 = •••

V xt+12

(11)

(12)

и размерность ((t +1) х n). Все расчетные характеристики (2) — (10) перепишем в рекуррентной форме: вместо (2) воспользуемся соотношением

наблюдений: каждое новое наблюдение после обработки забывается, а хранятся лишь интегральные характеристики.

Искусственная нейронная сеть, реализующая предлагаемый подход, приведена на рисунке, причем для изображения отдельных ее элементов приняты обозначения из [7], достаточно ясные без дополнительных объяснений. Отметим лишь, что литерой Ю

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

обозначен блок рекуррентной настройки, а z-1 _ оператор сдвига назад.

На первый слой (ю m) сети подаются элементы вектора xt+1 (11), где с помощью рекуррентной формулы (13) вычисляются xt+1m и et+1m и подаются на второй слой (ю'm), где рассчитываются

1 , 4

xt+1,m = xtm + t + 1 (xt+1,m xtm), (13)

вместо (3) -

2 ст t+1,m 2 1 2 2 = ст tm + t +1 (et+1,m _ст tm) (14)

(здесь et+1,m = xt+1,m xt+1,m ),

вместо (4) -

xt+1,m_ xt+1,m

zt+1,m = '

П+1,m

вместо (6) —

z *+1,j = max{z *j,z t+1,j}:

= z * + 0.5

( \ z tj _ z t+1,j

1-

(z* _ zt+1,j)

(zt+1,j _ z*),

j = 1,2, — ,k,

z*+1,l = zt+1,l}

= z*l + 0.5

( \ zti _ zt+1,l

1+

V

( _ zt+1,l)

(zt+1,l _ z*l),

l = k +1, —, n, вместо (7) —

ct+1 =| 2 (zt+1,m zt+1,m) V m=1

и вместо (8) — (10) —

dt+1 = 1 _

ct+1 ct+1

где

ct+1 = ct+1 + 2St+l,

_* ______* 1 * ____________*

ct+1 = ct + ^+1 (ct+1 _ ct),

* _*

є t+1 = ct+1 _ ct+1,

St2+1 = St2 + y+y(b 2+1 _ St2).

(15)

(16)

(17)

(18)

(19)

(20)

Видно, что при использовании соотношений (13) — (20) нет нужды хранить в памяти всю матрицу

1

дисперсии ст 2+1m (14) и стандартизованные показатели zt+1,m (15).

В третьем слое (ю m) вычисляются эталоны z*+1m и величины (zt+1 m _ z*+1 m )2, с помощью которых далее рассчитывается расстояние c*+1 (17).

В четвертом (Ю*) и пятом (Ю) слоях вычисляются значения ct*+1, є t+1,s2+1 (20). Выходные делитель + и сумматор 2 вычисляют текущее значение таксономического показателя уровня развития dt+1.

Таким образом, на выходе искусственной нейронной сети формируется случайная последовательность d0,d1, — ,dt,dt+1, —, причем если ее элементы близки к единице, можно полагать, что контролируемый объект работает в “штатном” режиме. Сильные колебания свидетельствуют о потере устойчивости. Значительные уклонения к нулю служат признаком крайне неблагополучной ситуации, которая должна быть изучена с экономических и криминалистических позиций.

С помощью рассмотренной искусственной нейронной сети был проведен вычислительный эксперимент по анализу деятельности крупнейших банков США [9], который показал практически полное совпадение расчетных показателей с официальными данными.

Данный подход в настоящее время используется в НИИ изучения проблем преступности Академии правовых наук Украины при разработке методик выявления признаков экономических преступлений.

Литература: 1. Матусовсъкий Г., Бодянський Є., Іващенко П. Використання наукового потенціалу в розробці криміналістичних методик виявлення економічних злочинів // Вісник Академії правових наук України. Харків: Право, 1997. №4(11). С.111-116. 2. Бодянський Є. Можливості використання математичних методів обробки даних при виявленні економічних злочинів // Вісник Академії правових наук України. Харків: Право, 1997. №4(11). С.138-142. 3. МатусовсъкийГ, Пліс., Багинський В. Про можливості використання математичного апарату виявлення розладнань для розкриття латентних розкрадань // Вісник Академії правових наук України. Харків: Право, 1997. №4(11). С.143-146. 4. Матусовский Б.А., БагинскийВ.З., БодянскийЕ.В., ПлиссИ.П. Проблемы научной разработки методики выявления экономических преступлений // В кн. “Теневая экономика,

РИ, 1998, № 3

65

проблемы борьбы с организованной преступностью и коррупцией в сфере экономики”. Луганск: РИО ЛИВД МВД Украины, 1997. С.138-140. 5. ПлютаВ. Сравнительный многомерный анализ в экономических исследованиях. М.: Статистика, 1980. 151 с. 6. Scherer A. Neuronale Netze. Grundlagen und Anwendungen. Braunschweig / Weisbaden: Friedr. Vieweg & Sohn Verlagsgesselschaft mbH, 1997. 249 S. 7. Cichocky A., Unbehauen R. Neural Networks for Optimization and Signal Processing. Stuttgart: Teubner, 1993. 526 p. 8. Pham D.T., Liu X. Neural Networks for Identification, Prediction and Control. London: Springer. Verlag, 1995. 238 p. 9. Van Matre J.G., Gilbreath G.H. Statistics for Business and Economics. Homewood, Illinois: Business Publications, Inc., 1987. 786 p.

Поступила в редколлегию 27.09.98 Рецензент: д-р техн. наук Шкварко Ю.В.

Бодянский Евгений Владимирович, д-р техн. наук, профессор кафедры технической кибернетики ХТУРЭ. Научные интересы: теория адаптивных систем, искусственные нейронные сети, техническая диагностика. Увлечения: фелинология, восточные учения, японская поэзия. Адрес: Украина, 310166, Харьков, пр. Ленина, 14, тел. 40-98-90.

Любчик Леонид Михайлович, д-р техн. наук, профессор кафедры системного анализа и управления ХГПУ, лауреат Государственной премии Украины, член IEEE. Научные интересы: теория адаптивных и обучающихся систем, робастное управление, обратные задачи динамики. Адрес: Украина, 310002, Харьков, ул. Фрунзе, 21. E-mail: lyubchik@lotus.kpi.kharkov.ua

Матусовский Григорий Абрамович, д-р юрид. наук, профессор кафедры криминалистики Национальной юридической академии им. Ярослава Мудрого, зав. сектором НИИ изучения проблем преступности Академии правовых наук Украины. Научные интересы: межнаучные связи криминалистики, математико-криминалистические методы, экономическая криминалистика. Увлечения: символика, геральдика. Адрес: Украина, 310022, Харьков, а/я 4539.

Плисс Ирина Павловна, канд. техн. наук, старший научный сотрудник, ведущий научный сотрудник ПНИЛ АСУ ХТУРЭ. Научные интересы: адаптивные системы обработки информации и управления. Адрес: Украина, 310166, Харьков, пр. Ленина, 14, тел. 40-98-90.

УДК 621.391(07), 658.12.512.011

КОМБИНАТОРНЫЙ ПОДХОД К ПОСТРОЕНИЮ ТЕХНОЛОГИЧЕСКИХ ШТРИХОВЫХ КОДОВ МИНИМАЛЬНОЙ ДЛИНЫ

ГОЛУБ В.И., ГРЕБЕННИКИ.В., КУЗЬМЕНКО В.М.

Проводится анализ проблемы использования технологических штриховых кодов при наличии специальных требований. Рассматривается подход к построению штриховых кодов, использующий комбинаторику разбиений. Приводятся и анализируются примеры штриховых кодов, предназначенных для использования в почтовой связи.

Одним из условий повышения эффективности обработки различных отправлений (почтовых, промышленных товаров и т.д.) является нанесение на их упаковку штрихового кода, содержащего всю необходимую информацию. Источниками требований к виду, структуре и характеристикам штриховых кодов служат положения государственных стан -дартов, технология обработки информации об отправлениях, техническая база для нанесения и считывания штриховой информации, вопросы контролепригодности и др.

Рассмотрим задачу построения технологического штрихового кода, предназначенного для кодирования текстовой информации, который может быть использован, например, при обработке почтовых

отправлений. Опыт применения различных штрихо -вых кодов для маркировки и автоматической идентификации различных видов почтовых отправлений позволяет сформулировать ряд требований к структуре и характеристикам кода [1]:

1. Код должен быть равномерным, т.е. кодовые комбинации должны иметь равную длину.

2. Штрихи в кодовых комбинациях должны иметь одинаковую (минимальную) ширину, а между любыми двумя штрихами должен быть промежуток, не менее чем вдвое превышающий ширину штриха.

Это требование вызвано применением для печати ярлыков со штриховыми кодами и матричных и струйных принтеров, которые допускают отклонение ширины штриха в обе стороны до одной трети от базового размера.

3. Количество штрихов в каждой кодовой комбинации должно быть одинаковым. Каждая кодовая комбинация должна иметь не менее двух промежутков одинаковой длины между штрихами. Данное требование вызвано необходимостью обеспечения контролепригодности штрихового кода при использовании имеющихся считывающих устройств.

4. Код должен позволять обнаруживать и исправлять заданное количество ошибок.

При выполнении требований 1-4 естественно стремление к построению кодовых комбинаций минимальной длины.

Формализуем задачу, исходя из сформулированных требований. Штриховому коду поставим во взаимооднозначное соответствие двоичный код по правилу: штрих единичной ширины обозначим 1, промежуток единичной ширины обозначим 0. В связи с этим далее речь пойдет о построении двоичного кода, удовлетворяющего набору требований, в которые превращаются условия 1-4:

1. Равномерность кода (одинаковое число символов в каждой кодовой комбинации).

2. Между любыми двумя единицами в кодовых комбинациях должно быть не менее двух нулей. Это же требование должно выполняться и при составлении последовательности символов в слово, т.е. не

66

РИ, 1998, № 3

i Надоели баннеры? Вы всегда можете отключить рекламу.