Научная статья на тему 'Нейросетевая идентификация почерка для вневедомственной охраны полиции'

Нейросетевая идентификация почерка для вневедомственной охраны полиции Текст научной статьи по специальности «Математика»

CC BY
209
23
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
НЕЙРОСЕТЬ / НЕЧЕТКИЕ МНОЖЕСТВА / ПОЧЕРК / КЛАСТЕРИЗАЦИЯ / ИДЕНТИФИКАЦИЯ / ПОДДЕРЖКА ПРИНЯТИЯ РЕШЕНИЙ

Аннотация научной статьи по математике, автор научной работы — Ермоленко А. В.

Рассмотрены вопросы поддержки принятия решений по обра-ботке рукописных документов подразделениями вневедомственной охраны полиции. Автором разработан оригинальный метод выделения уникальных характеристик почерка на основе строкового и межбуквенного анализа. При-менены методы кодирования символов с использованием теории графов. Модифицирован критерий информативности и показана разделимость признаковой базы. Синтезирована архитектура нейросетевого решающего устройства, модифицированная использованием теории нечетких множеств.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Ермоленко А. В.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Нейросетевая идентификация почерка для вневедомственной охраны полиции»

УДК 004.93

НЕЙРОСЕТЕВАЯ ИДЕНТИФИКАЦИЯ ПОЧЕРКА ДЛЯ ВНЕВЕДОМСТВЕННОЙ ОХРАНЫ ПОЛИЦИИ

А.В. Ермоленко

NEURAL NETWORK IDENTIFICATION OF HANDWRITING FOR THE PRIVATE SECURITY POLICE

A.V. Ermolenko

Аннотация. Рассмотрены вопросы поддержки принятия решений по обработке рукописных документов подразделениями вневедомственной охраны полиции. Автором разработан оригинальный метод выделения уникальных характеристик почерка на основе строкового и межбуквенного анализа. Применены методы кодирования символов с использованием теории графов. Модифицирован критерий информативности и показана разделимость признаковой базы. Синтезирована архитектура нейросетевого решающего устройства, модифицированная использованием теории нечетких множеств.

Ключевые слова: нейросеть, нечеткие множества, почерк, кластеризация, идентификация, поддержка принятия решений.

Abstract. Questions of decision-making support on processing of hand-written documents by divisions of police private security are considered. The author has developed an original allocation method of unique handwriting characteristics on the basis of the line and symbols analysis. Symbols coding methods by counts theory are applied. The informational content criterion is modified and parametric base divisibility is shown. The neural network architecture of decisive device modified by fuzzy logic theory is synthesized.

Keywords: neural net, fuzzy logic, hand-writing, clustering, identifications, decision-making support.

Подразделения вневедомственной охраны МВД России предназначены для охраны имущества всех форм собственности на договорной основе. По состоянию на декабрь 2015 г. под охраной полиции находятся 1 565 287 объектов, квартир и иных мест хранения имущества граждан. Процесс охраны объектов основывается на заключении договора по личному заявлению собственника охраняемого объекта. Любые изменения в условиях действия договора на охрану имущества также базируются на письменных заявлениях собственников. Данные изменения зачастую являются существен-

ными для обеспечения имущественной безопасности. Так, в список лиц, имеющих право снятия объекта с охраны, могут вноситься дополнительные персоналии, а техническая блокировка охранно-пожарной сигнализации объекта претерпевать значительные изменения вплоть до отключения от охраны отдельных рубежей [1]. Помимо того, на основе заявлений производится блокировка, приостановка и снятие объектов с охраны. Принимая в учет число охраняемых объектов, нагрузка по таким заявлениям на территориальные филиалы вневедомственной охраны является значительной. Принятие решений при ручной обработке персональных данных собственников охраняемых объектов юридическими и инженерно-техническими сотрудниками подразделений вневедомственной охраны полиции требует больших временных затрат, что в условиях повышения эффективности функционирования личного состава при оптимизации его численности является недопустимым.

Сферами деятельности, в которых идентификация автора при принятии управленческих решений не мене важна, также являются процедуры ведения путевых листов личным составом моторизованных подразделений полиции, а также организация зачетов в кадрово-воспитательной и служебно-боевой подготовке. При этом методы и модели поддержки принятия решений при идентификации автора рукописных документов на сегодняшний день практически отсутствуют.

Вышеописанное показывает, что в процессе оперативно-служебной деятельности сотрудники указанных подразделений сталкиваются с ситуациями, которые диктуют необходимость идентификации автора почерка. Существующие методы решения задачи умозрительны, основаны на визуальном анализе и не способствуют качеству оказываемых услуг. Отсутствуют формальные алгоритмы принятия решений для задачи идентификации. В этой связи представляется важным разработать процедуры поддержки принятия решений для задачи идентификации автора рукописного документа с использованием различных интеллектуальных методов. В частности, может быть предложен метод идентификации на основе нечеткой логики и с использованием нейронных сетей.

Любая организационная система, как правило, рассматривается как некоторая управляющая система, которая реализует функцию

управления и некую управляемую систему [2]. Применительно к филиалам федеральных государственных казенных учреждений управлений вневедомственной охраны (далее - ФГКУ УВО), функционирующим на уровне городских и районных филиалов органов внутренних дел, уместно говорить, что звеном, осуществляющим функцию управления, является начальник и его заместители по линиям служб и направлениям деятельности. Вместе с тем, в части касающейся рассмотрения заявлений собственников также функцию управления осуществляют и сотрудники подразделений договорно-правовой работы (отделов либо отделений - далее ОДПР) в большинстве случаев юрисконсульты.

Управляемой системой в данном случае являются заявления и иные документы собственников как субъектов договорно-правовых отношений. В области контроля за расходованием и списанием горюче-смазочных материалов функция управляющей системы может быть закреплена как за руководителями материально-тыловых (ОМ-ТиХО) и финансово-экономических (ФЭО) служб вневедомственной охраны, так и за командирами строевых подразделений полиции (СИП) при осуществлении ими ежедневной служебной деятельности по принятию управленческих решений в части, касающейся эксплуатации личным составом автомобильной и иной специальной техники. В управленческой деятельности при проведении служебно-боевой и морально-психологической подготовки подобная управляющая функция возлагается на психологов и инструкторов отделов кадровой и воспитательной работы (ОКиВР).

Проиллюстрируем графически структуру (рис. 1) управления типовым подразделением вневедомственной охраны полиции на районном / межрайонном / городском уровне с точки зрения системы управления.

Расшифровка большинства условных сокращений структурной схемы представлена выше, кроме того, будем понимать под ПЦО -пульт централизованной охраны, под ЦОУ - центр оперативного управления, под ДЧ - дежурная часть.

Основа управленческого цикла при этом базируется на представлении процесса управления неким алгоритмом операций, воспроизводимых субъектом управления в целях решения отдельно взятой управленческой задачи. Данная последовательность состоит

Рисунок 1. Структура управления филиалом вневедомственной охраны при работе с рукописными документами, требующими идентификации автора почерка

как из поиска оптимальных вариантов адекватных решений, так и из их непосредственной реализации.

Недостаточная полнота представляемых для удостоверения личности документов, равно как и отсутствие уверенности в написании рукописного документа заведомо заявителем не снимает с лица принимающего решение необходимости выработки управленческого воздействия, а следовательно, необходимым становится решение задачи управления по принятию решений в условиях неопределенности. Очевидно, что важным фактором в свете управления является демпфирование или искоренение данной неопределенности посредством решения задачи идентификации автора рукописного текста как средства обеспечения полноты и точности информации об управляемом объекте.

В целом успешность принятия управленческих решений в органах внутренних дел во многом определяется качественными характеристиками используемой информации. В то же время одним из способов, позволяющих компенсировать неопределенность решаемой задачи и обоснованность выводов в ходе идентификационно-управленческой работы, является внедрение в практическую

деятельность подразделений вневедомственной охраны полиции математических моделей и методов обработки информации.

Под моделью понимается упрощенный (по сравнению с реальным объектом) в некоторой степени условный образ процесса или объекта. Упрощение в данном случае представляет собой факт того, что модель отображает только часть характерных параметров объекта, доминирующих по значимости при их оценке экспертом [6].

В работе исследованы модели и методы совершенствования управленческой деятельности подразделений вневедомственной охраны полиции по идентификации заявлений собственников на основе нейросетевого анализа сегментированного изображения рукописного текста. Решение задачи идентификации с выдачей управленческого решения реализовано на основе трехступенчатой структуры.

Первой составной частью является синтез алгоритмов и методов выделения уникальных характеристик рукописного текста методами анализа растрового представления образа. На данном этапе из сканированного растрового изображения рукописного текста выделяются наиболее характерные признаки, являющиеся уникальными для каждого автора. При этом все множество характеристик рукописного текста может быть разделено на два направления для исследований: строковые характеристики текста (угол наклона и средняя высота букв, относительный межстрочный интервал, средняя, минимальная и максимальная ширина пробела, средний, максимальный и минимальный угол наклона строк, максимальный угол разброса строк) и символьные характеристики текста (включает в себя различные виды межбуквенного соединения: прямые штрихи, трех- четырехлучевые соединения, петли) [4].

Второй этап функционирования системы реализует задачу передачи формализованного описания образа в блок принятия решений посредством преобразования числовых характеристик к формализованному виду, пригодному для восприятия нейросетевым или нечетким решателем.

Ключевая роль работы системы отводится блоку, синтезированному на базе нейросетевой или нечеткой системы принятия решения заранее обученной соответствующей обучающей выборкой. Итоговое решение принимается путем обобщения решения по обе-

им группам параметров на выходе решателя, который и является заключительной третьей ступенью.

В основу процедур нахождения строковых характеристик рукописного текста положим принцип пороговой кластеризации изображения. В результате разбиения условных столбцов рукописного текста на кластеры сформируем число кластеров в столбце, которое после проведения процедуры фильтрации изображения и осреднения по всем столбцам равно среднему числу строк в тексте. На основании данных этого же разбиения получим среднее значение высоты буквы в тексте, которое также может быть использовано как характеристика почерка.

Кластеризация имеет свойство порождать лишние кластеры или объединять несколько реальных строк в один кластер, как показано на рис. 2. Разработанным решением является процедура фильтрации изображения, основанная на анализе статистической информации о строках и кластерных столбцах [2].

Для построения корректной траектории строк необходимо определить их начальные и конечные точки. Однако в связи с наличием в тексте отступов для абзацев, а также с неполной длиной строки (различная длина слов и правила переноса) на краевых столбцах можно получить неполное количество строк. Для исключения подобной ситуации реализована процедура построения виртуальных кластеров, которая генерирует на местах продолжения строк виртуальные кластеры, аналогичные значениям предыдущего столбца.

После проведения кусочно-линейной аппроксимации произведем генерацию траектории написания строки для определения угла

Центр при склеивании

Центр

при маленьком

-Центры при разрыве

Рисунок 2. Принцип работы процедуры кластеризации и необходимость фильтрации

наклона и иных характеристик. Применим для этого метод наименьших квадратов первого порядка, основанный на подборе параметров кривой при условии минимизации суммы квадратов невязок. Будем полагать, что мы имеем 5 экспериментальных точек на каждой строке, то есть п = 5 с соответствующими им координатами. Таким образом, применительно ко всему тексту мы получаем матрицу размерности т х п, где т - неизвестное заранее и определяемое в процессе кластеризации количество строк в тексте. Каждый элемент этой матрицы представляет собой координаты центра кластера по х и по у.

/ (с[1,1].х с[1,1].у) (с[1,2].х с[1,2].у) ... (с[1,п].х с[1,п].у) \ I (с[2,1].х с[2,1].у) (с[2,2].х с[2,2].у) ... (с[2,п].х с[2,п].у) ■

^^ (с[т,1].х с[т,1].у) (с[т,2].х с[т,2].у) ... (с[т,п].х с[т,п].у) / (

(1)

(т, п)

Для реализации данной матрицы координат решено использовать двумерный массив структуры из двух полей координат koordinaty: {х,у}. При этом структурно определим границы движения вдоль фиксированного количества кластерных столбцов и предельно определенного значения их количества.

Зависимость у от x изображается аналитической функцией вида:

у = bx + c (2)

Для хранения параметров линий написания строк создается двупольная структура длиной т. Так как данная функция не может совпадать с экспериментальными значениями во всех п точках исследуемой строки, то согласно методу наименьших квадратов необходимо находить отличную от нуля невязку:

4 = у, - Ьх ,- с (3)

Требуется подобрать параметры Ь и с, чтобы сумма квадратов разностей была наименьшей [6], то есть требуется обратить в минимум выражение:

т 2 п

Г = I 4 = X [у, - Ьх ,, - с]2 (4)

i=1 i=1

Дифференцируя функцию невязки по неизвестным параметрам Ь и с и приравнивая производные к нулю, получаем следующую систему уравнений:

- -2 db

i (У, - bx. - c)2x- = 0

(5)

2 Ц=i (y, - bx,- c)2=0

Данная система представляет собой систему двух линейных уравнений относительной неизвестных параметров Ь и с. Решая данную систему методом последовательного исключения, получаем искомые значения коэффициентов т-й сторки:

b = -

c =

i (c(m, n).x . c(m, n).y) i

n n

n i ((c(m, n).x)2) - (i (c(m, n).x))2

i (c(m, n).y) - b i (c(m, n).x) i i

(6)

i

Дополним данную процедуру движением виртуальной пиксельной линейки и выделим из рукописного текста пробелы и слова для детального символьного анализа.

Задача распознавания рукописных символов есть задача нахождения соответствия между изображением рукописного символа и его кодом. Существуют две различные постановки задачи распознавания символов, различие которых связано со способом получения изображения: off-line и on-line. Изображение символа, полученное при сканировании документа, содержащего рукописный текст, относится к off-line задаче. В этом случае входными данными для задачи распознавания являются матрицы точек, соответствующие изображениям букв.

Среди существующих методов решения задачи распознавания рукописного символа важное место занимает метод, основанный на восстановлении траектории написания символа по его бинарному изображению. Существующие методы восстановления траектории

пишущего инструмента в качестве входной информации используют либо скелет изображения, либо контур изображения.

При разработке алгоритмов для определения символьной группы параметров использован метод детализации отдельных фрагментов рукописного текста совокупностью трапеций с различными значениями ребер и оснований, определяемых на основе размера участков внутреннего и внешнего контура очертания фрагмента символа. В исследовании реализован математический и программный аппарат алгоритма кодирования символов рукописного текста трапециями.

Первым этапом работы алгоритма является поиск всех пар отрезков, принадлежащих контурам, которые находятся в отношении R (при условии, что R симметрично). Будем говорить, что отрезки s и t, принадлежащие одному или различным граничным контурам, находятся в отношении R, если возможно построить равностороннюю трапецию, со сторонами на отрезках s и t, удовлетворяющую следующим условиям:

1. Основания трапеции d1, d2 соединяющие точки отрезков s и t полностью лежат внутри области черных точек.

2. Углы в а, у оснований трапеции отличаются от прямого угла не более чем на заданную величину а .

J max

3. Значения di / sin а и di / sin в не превосходят заданной величины d .

max

Область, ограниченная трапецией обладает всеми свойствами прямолинейного отрезка штриха с равномерно изменяющимся радиусом пера: линия, соединяющая середины оснований есть отрезок траектории, стороны трапеции - огибающие семейства окружностей. Условие 1 означает что отрезок штриха является областью черных точек (хотя допустимы белые пятна внутри штриха), условие 2 ограничивает скорость изменения диаметра пишущего инструмента, условие 3 определяет максимально возможный диаметр d пишущего инструмента d .

max

Первым этапом работы алгоритма является поиск всех пар отрезков, принадлежащих контурам, которые находятся в отношении R (очевидно, что R симметрично). Для каждой пары (s, t) е R находится трапеция, с максимально возможной высотой, для которой выполнены рассмотренные условия.

Отметим некоторые особенности практической реализации построения трапеции на произвольных отрезках контуров я и X. Вначале определяется максимально возможная трапеция с учетом только второго условия. Когда трапецию удается построить, она может быть трансформирована до размеров, при которых выполняется третье условие.

После построения и фильтрации трапеций, изображение разбивается на смежные с ними так называемые узловые области. Каждая трапеция соприкасается с двумя узловыми областями, причем основания являются границами между трапецией и каждой из двух областей. Кратностью узловой области назовем количество соприкасающихся с ней трапеций. Обозначим значение кратности буквой. Тогда если К = 0 - в области не удалось выделить ни одной трапеции и в дальнейшем область рассматривается нераспознаваемое «пятно»; если К = 1 - область является концом штриха при условии выполнения критерия регулярности; если К = 2 - область является отрезком траектории между двумя трапециями, если К > 2 - найдена область пересечения штрихов. В результате получаем набор различных трапеций с четко определенными для образца значениями высоты, ребер и их ориентации относительно строки (рис. 3).

Полученный набор трапеций может быть использован для описания соединений элементов как в букве, так и между ними. В процессе исследования изучены аспекты построения соединений с разным количеством лучей (последовательность трапеций образующих прямую). Установлено, что соединения, состоящие более чем из трех лучей, встречаются редко и малоинформативны. При этом

Рисунок 3. Кодирование символа трапециями с детерминацией трех-лучевых соединений

чеиырехлучевые соединения могут быть использованы для тонких признаков идентификации.

Параметрами трехлучевых соединений являются углы между лучами (с учетом угла наклона строки). Так как абсолютно одинаковых соединений быть не может, для выявления похожих соединений решено провести кластеризацию. Отклонение параметров соединения принадлежащих одному кластеру не должно было превышать эмпирически детерминированных 2 %. В результате работы процедуры формируется массив возможных типов трехлучевых соединений с вероятностью их нахождения в исследуемом образце.

Перейдем теперь к рассмотрению алгоритмов для получения характеристик отдельных символов почерка. Рассмотрим процедуру фильтрации лишних трапеций. Представленный символ состоит из набора трапеций, взаимное расположение которых не позволяет производить с ними какие-либо действия. Для удаления лишних элементов закодированного символа, применим фильтрацию, суть которой заключается поиске областей пересечения трапеций. Каждую трапецию можно представить в виде системы неравенств:

ax + ay + c > 0

aX + ay + c2 > 0 (7)

a3x + ay + c3 > 0

aje + a y + с 4>0

где a, b, c - параметры трапеции для координат {x, y}.

Таким образом, для определения взаимного положения двух трапеций, составляющих закодированный символ, необходимо решить систему:

\ах + ау^с>0 (8)

( i = 1,8

Решение данной системы позволяет выявить элементы, которые необходимо «отредактировать». В работе рассмотрены, разработаны и апробированы математические модели и методы фильтрации трапеций при кодировании символов. Непосредственный механизм кодирования реализован посредством представления параметрических характеристик трапеций в форме неориентированного графа.

Для определения информативности признаков, содержащихся в нормированной выборке с приведением к единому диапазону величин

1'

0,8 0,7 0,6 0,5 0,4 0,3 0,2 0,1 0

0,5 1 1,5 2 2,5 3 3,5 4 4,5 5

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Рисунок 4. Распределение признаков для различных авторов

0.100, использованы методы представления данных в нечетких множествах. Построены треугольные и гауссовские (рис. 4) распределения величин признаков всех параметров для различных авторов одинакового текста. Анализ разделимых множеств показывает принципиальную возможность решения задачи идентификации на основе существующей признаковой базы. Вместе с тем, большая дисперсионность признаков не позволяет использовать линейные методы разделения множеств.

Определение информативности различных признаков позволяет поставить для него в соответствие некоторый входной весовой коэффициент, который определит степень влияния признака на выходной результат. В качестве коэффициента, оценивающего информативность признака, предлагается использовать отношение площади общей части графиков к суммарной площади. Тогда коэффициент информативности .'-го признака ц. может быть представлен в следующем виде:

j

t_per truemax.

I ffalse (x)dx + falsemin.

I f_true (x)dx t_per.

(9)

false_max

true max.

I ffalse . (x)dx

j

+

I f true . (x)dx

false_min

true min.

где t_per - точка пересечения графиков; falsemin, falsemax, true_ min, true_max - начальные и конечные точки функций различных и идентичных авторов соответственно.

В работе проведены исследования различных алгоритмов решающих моделей. Изучены возможности применения нечетких моделей, в том числе с выводом по Мамдани. Установлены существенные достоинства данной модели в скорости работы алгоритмов. Вместе с тем, значительная ошибка выхода решателя не позволяет применять данные алгоритмы в условиях поддержки принятия решений при идентификации рукописных документов.

Проведен анализ применимости различных топологий нейронных сетей и методологий их обучения применительно к решению задачи идентификации на основе существующей признаковой базы. Выход нейронной сети показывает являются ли два введенных образца экземплярами одного и того же автора или нет. Согласно данной постановке задачи уместно рассматривать в качестве обучающей и тестирующей выборки нейронной сети не матрицу прямых входов параметров образцов, а матрицу разностей значений между образцами. Это позволяет в N раз (где N - число образцов почерка в выборке) увеличить размер обучающей выборки.

В исследовании изучены и опробованы возможности применения различных топологий нейронных сетей, в том числе радиально-базисных и вероятностных, обоснованы нюансы неприменимости нейронных сетей Хопфилада и самоорганизующихся карт Кохонена [6].

Выход нейронной сети должен показывать, являются ли два введенных образца экземплярами одного и того же автора или нет. Согласно данной постановке задачи уместно рассматривать в качестве обучающей и тестирующей выборки нейронной сети не матрицу прямых входов параметров образцов, а матрицу разностей значений между образцами. Это позволяет в N раз (где N - число образцов почерка в выборке) увеличить размер обучающей выборки. Так как при составлении выборки нам известны авторы образцов, то каждому полученному значению можно сопоставить атрибут «Автор». Становится возможным осуществить разделение выборки на две, большая из которых будет содержать множество F (False) результатов для двух образцов различных авторов, а меньшая - (множество Т (True)) для одного автора. Итоговая размерность обучающей выборки О будет составлять:

Mx Ш-JL (Ю)

где М - число признаков, N - число примеров.

Алгоритм составления тестирующей матрицы Test аналогичен вышеописанному составлению обучающей матрицы. Соотношение объема значений О : Test составляет 3 :1. Данные о принадлежности значений к F или T множеству необходимы для анализа корректности, получаемых при тестировании результатов.

Среди различных нейросетевых архитектур наиболее приемлемый результат ожидаемо демонстрируют сети на алгоритмах обратного распространения ошибки с тангенсно-сигмоидной функцией активации с a = tan sig(n). Выбор итоговой нейросетевой архитектуры проведен на основе экспериментального анализа наиболее распространенных методов оптимизации процедуры обучения многослойного персептрона. В частности путем эмуляции нейронных сетей рассмотрены результаты обучения и тестирования сетей, основанных на методе наискорейшего спуска, квазиньютоновском методе и методе Левенберга-Маруа. Меньшую ошибку обобщения при оптимальном времени обучения демонстрирует квазиньютоновская модель обучения, синтезированная для двухслойной сети.

Идея квазиньютоновских методов с ограниченной памятью состоит в учете информации о кривизне минимизируемой функции, содержащейся в матрице Гессе G; причем данные относительно кривизны функции накапливаются на основе наблюдения за изменением градиента g во время итераций спуска. Суть метода опирается на возможность аппроксимации кривизны нелинейной оптимизируемой функции без явного формирования матрицы Гессе. Матрицей Гессе при этом называем матрицу вторых частных производных целевой функции по управляемым параметрам [5].

К началу очередной k-й итерации квазиньютоновского поиска известна некоторая аппроксимация матрицы Гессе минимизируемой функции, которая служит средством отображения информации о кривизне, накопленной на предыдущих итерациях. Используя ее в качестве матрицы Гессе модельной квадратичной формы, очередное направление Рк квазиньютоновского поиска на k-м шаге определяем как равенство:

ВРк = -gk di)

где Вк- матрица, аппроксимирующая матрицу Гессе; gk - градиент функции оценки в начальной точке k-го шага.

После того, как определится новая точка Xk+p приближение Бк матрицы Гессе обновляется с учетом вновь полученной информации о кривизне, то есть совершается переход от матрицы Бк к матрице Бк+1.

В нашем случае была использована наиболее эффективная формула пересчета - BFGS формула (Broiden C., Fletcher R., Goldfarb D., Shannon D.):

(12)

S gk+Y + Y gk+A S gk+) 1 + Y V

pk+1 =

g

k+1

+ ■

Y S)

Y SJ Y Sк

S

где Рк - очередное направление квазиньютоновского поиска на к-м шаге; Sk = Хк+1 - Хк - вектор, равный изменению Х на к-й итерации; Yk = gk+1 - gk - соответствующее изменение градиента.

Так как в ЯРС£-формуле используются результаты предыдущего шага, то первый шаг обучения необходимо проводить каким-либо другим способом, например методом наискорейшего спуска.

Первый слой предлагаемой топологии нейронной сети представляет пять нейронов с тангненсно-сигмоидной функцией активации [3]. Второй слой состоит из одного нейрона с линейной функцией активации. Предельное количество эпох в цикле обучения было установлено равным 2000. Проведенные испытания готового программного продукта демонстрируют (рис. 5) однозначную разделимость на выходе нейронной сети как по строковым, так и по символьным параметрам.

В результате исследований сформирована система поддержки принятия решений, способная идентифицировать автора рукописного текста. Проведенный анализ информативности полученных результа-

1,5 1

0,5 0

-0,5 -1 -1,5

20

40

60 80

1,5 1

0,5 0

-0,5 -1 -1,5

: •

; \

20

40

60 80

Рисунок 5. Тестирование работы нейронной сети: слева для символьной группы параметров, справа для межбуквенных соединений

тов показывает, что полученный набор признаков представляет собой разделимые множества. Проанализированы и изучены свойства различных идентифицирующих моделей в условиях данного входного набора признаков. Синтезирована модель блока принятия решения. С учетом максимальной эффективности в условиях данной задачи выбрана и реализована решающая модель на основе квазиньютоновской BFGS-нейронной сети с методологией обучения на основе обратного распространения ошибки.

Разработанное программное обеспечение отлажено и готово к работе. Получено свидетельство Роспатента об официальной регистрации программы для ЭВМ за № 2007612599.

Внедрение данной модели принятий решений при функционировании договорно-правовых подразделений вневедомственной охраны позволяет повысить эффективность несения службы личным составом, усилить финансово-хозяйственную и кадровую дисциплину, снизить искажение статистической отчетности.

Библиографический список

1. Рекомендации МВД России от 23 октября 2013 г. Р 78.36.031-2013 «О порядке обследования объектов, квартир и МХИГ, принимаемых под централизованную охрану».

2. Горошко И.В. Математическое моделирование в управлении органами внутренних дел. М., 2000.

3. Ермоленко А.В. КорляковаМ.О., Филимонков А.А. Формирование ней-росетевой модели геоинформационного датчика //Известия Института инженерной физики. 2011. № 1 (19).

4. Ермоленко А.В., КозличенковА.А., КорляковаМ.О. Выбор входного набора признаков для нейросетевой идентификации почерка // Научная сессия МИФИ 2007. IX Всероссийская научно-техническая конференция «Ней-роинформатика-2007»: сборник научных трудов: в 3 ч. Ч. 1. М., 2007.

5. Комарцова Л.Г., Максимов А.В. Нейрокомпьютеры: учебное пособие для вузов. М., 2004.

6. Методы классической и современной теории автоматического управления: учебник в 5т. Т. 5. Методы современной теории автоматического управления / под ред. К.А. Пупкова, Н.Д. Егупова. М., 2004.

А.В. Ермоленко

соискатель Академии управления

Министерства внутренних дел Российской Федерации, г. Москва E-mail: [email protected]

i Надоели баннеры? Вы всегда можете отключить рекламу.