Научная статья на тему 'Модель обработки документальных источников информации деловой разведки'

Модель обработки документальных источников информации деловой разведки Текст научной статьи по специальности «СМИ (медиа) и массовые коммуникации»

CC BY
268
113
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ДЕЛОВАЯ РАЗВЕДКА / BUSINESS INTELLIGENCE / ИНФОРМАЦИОННЫЙ ДОКУМЕНТ / INFORMATION DOCUMENT / ЭЛЕМЕНТАРНЫЙ ФРАГМЕНТ ИНФОРМАЦИИ / ЭФФЕКТИВНОСТЬ ОБРАБОТКИ ИНФОРМАЦИИ / EFFICIENCY OF INFORMATION PROCESSING / ВХОДНОЙ ПОТОК ИНФОРМАЦИОННЫХ ДОКУМЕНТОВ / INPUT FLOW OF INFORMATION DOCUMENTS / INFORMATION SAMPLE

Аннотация научной статьи по СМИ (медиа) и массовым коммуникациям, автор научной работы — Левкин Игорь Михайлович

Предлагается модель обработки текстовых документов, позволяющая определить вероятность решения информационной задачи в информационных контурах ситуационных центров деловой разведки при ограничениях по времени, а также требуемый состав средств обработки.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по СМИ (медиа) и массовым коммуникациям , автор научной работы — Левкин Игорь Михайлович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Model of Documentary Source Processing in Business Intelligence

A model for processing of text documents is proposed. The model allows evaluation of probability to solve an information problem in information contours of situational center of business intelligence in time limitation conditions. The model also makes it possible to determine the necessary set of information processing tools.

Текст научной работы на тему «Модель обработки документальных источников информации деловой разведки»

УДК 347.775

И. М. Левкин

МОДЕЛЬ ОБРАБОТКИ ДОКУМЕНТАЛЬНЫХ ИСТОЧНИКОВ ИНФОРМАЦИИ ДЕЛОВОЙ РАЗВЕДКИ

Предлагается модель обработки текстовых документов, позволяющая определить вероятность решения информационной задачи в информационных контурах ситуационных центров деловой разведки при ограничениях по времени, а также требуемый состав средств обработки.

Ключевые слова: деловая разведка, информационный документ, элементарный фрагмент информации, эффективность обработки информации, входной поток информационных документов.

Важнейшей особенностью деловой разведки является необходимость решения ряда информационных задач в условиях ограничения по времени. Сложность решения этих задач связана, во-первых, с необходимостью обработки большого числа источников информации в целях выявления информационных признаков, относящихся к конкретной задаче, и, во-вторых, с ограниченными возможностями сотрудников информационно-аналитической структуры деловой разведки по семантической обработке источников информации [1, 2].

В связи с этим возникает необходимость оценки вероятности решения соответствующей информационной задачи в зависимости от интенсивности входного информационного потока, состава информационного контура (числа автоматизированных рабочих мест) и требований по времени решения задачи.

В основу формирования этой оценки может быть положена операционно-временная модель процесса обработки текстовых отчетно-информационных документов.

Последовательность агрегированных действий при обработке документальных источников информации представлена на рис. 1. При этом учитывается, что информационный документ состоит их элементарных фрагментов информации (ЭФИ), каждый из которых представляет собой законченную совокупность предложений, характеризующую некую сущность — служебную информацию (название, выходные данные и т.п.), описание информационного признака, поясняющие фрагменты и т.п. [1].

Текстовый отчетно-информационный документ

Элементарный фрагмент информации 1 (чтение) Интерпретация элементарного фрагмента информации 1 Элементарный фрагмент информации 2 (чтение) Элементарный фрагмент информации N (чтение) Организационно-технологические задержки

Тэ1 4- Тн1 л Т * Т Л Тэ2 о Е> л -► л Тз

Рис. 1

Объем каждого текстового отчетно-информационного документа (число ЭФИ) зависит от таких случайных факторов, как вид и качество источника информации, число описываемых объектов деловой разведки, опыт и квалификация составителя документа и др. В связи с этим

24 И.М. Левкин

общую продолжительность обработки /-го текстового информационного документа (операционное время) тЕ., / = 1, N, следует рассматривать как случайную величину (символ „Л" — знак случайной величины).

Величина тЕ. (см. рис. 1) формируется из следующих составных частей:

— суммарной продолжительности выполнения операций ознакомления с элементарными фрагментами информации (чтение): т э£. = ! э1 +т э2 +... + т ЭN;

— суммарной продолжительности выполнения операций интерпретации элементарного фрагмента (объекта): тн2. = тн1 +... + т^, где к е [1, N].

Исследования показывают, что число терминов, содержащихся в ЭФИ, также является случайной величиной пэ и подчиняется нормальному закону распределения с параметрами

оп , т . Это позволяет предположить, что продолжительность обработки тэ фрагмента также подчиняется нормальному закону распределения с плотностью ф„ (т) и параметрами

т э

от , т . Такой же характер носят и случайные величины тн и тз.

При данных предположениях модель ф„ (т) продолжительности выполнения опера-

т эЕi

ций изучения всех ЭФИ /-го текстового отчетно-информационного документа будет описываться т- -кратной композицией нормальных законов распределения ф„ (т) (для упрощения

э тэ

записи индекс „/" у символа „Е" здесь и далее опущен):

фтэЕ (т) = фтэ (т) ®... ® фтэ(т) = о 1/2- еХР {- (Т - ттэЕ )2/2о2эЕ т-эЕ - 3отэЕ; ттэЕ + 3отэЕ ),

4-V-^ т эЕ ^ 271

т -

э

где о! = Л/т» о22 , тт = т» тт

тэЕ \ пэ тэ ' тэЕ пэ тэЕ

Используя аналогичные рассуждения для интерпретации полученной информации, по результатам обработки фрагментов /-го текстового отчетно-информационного документа т ^

можно записать:

фт не (т) =фт н (т) ® ... ®фт н (т) =0Т^/2- еХР т! не))202не}П^; т- нЕ- 3°т нЕ ; тт нЕ+ 30 нЕ ),

-нЕ

т -

н

где от = Л тп о22 , тт = тп тт , пн < йэ.

т нЕ \ пн т н ' т нЕ пн т нЕ' н э

Следовательно, модель операционного времени тЕ, необходимого для достижения целевого эффекта — обработки текстового отчетно-информационного документа, определяется композицией законов распределения фт Е (т) и фт Е (т) , а учет продолжительности организационно-технологической задержки тз предполагает дополнительную свертку с моделью фт (т) [3].

В случае представления модели организационно-технологической задержки в виде нормального закона распределения модель общих временных затрат на обработку /-го текстового документа может быть представлена следующим образом (для упрощения записи индекс „ тЕ. " обозначим как д):

фа (х) = фхэх (*) ® фх„у ® фхз =

х нЕ*

-1= ехр {-(х - тя)2 / 2ст^ } П(х;т? - 3а?'т? + 3а<,

Г~2 2 2"

где а„ = л/ах + ах + ах , та = тх + тх + тх .

а V хэЕ хнЕ хз ' а хэЕ хнЕ хз

В связи с тем, что достижение целевого эффекта обеспечивается интеллектуальным потенциалом сотрудника информационного центра деловой разведки, в качестве функции связности случайных величин результативности V^ и оперативности х , обработки следует выбрать нелинейную функцию вида [1]

V, = 1 - ехр {-(х,- (х - X, - хз ))} ,

где X,- — производительность (квалификация) сотрудника, х, = хэ£ + хнх .

Совместная плотность вероятности функционально связанных случайных величин V ■ и

х , определяется как

Ф-уг- (v, х) = Фл (х)Фх 'Л (х; Vi );

Фл (и) =

1 -V,

X,- а л/2л

^ т.

ехр <

(X-11п(1 -V,-)-1 - тх, )2

2а2

Фх /v (х; v) = -—/=

х з

ехр

(Т-(тх, ~3ах, ))11п (1 ^) 1 -тх з)

2а2

а эффективность процесса обработки отчетно-информационного документа, определяемая вероятностью достижения цели рд.ц, вычисляется по формуле

Р = Р д.ц д.ц

V х

('VI ^ V*) п (хI < х*)) = Л Ф-,, Мф^ ^ (х; v)dvdт,

00 ■ 11

где V* — требуемое значение результативности обработки, х* — требуемое значение ее оперативности.

График, характеризующий зависимость эффективности процесса обработки текстового отчетно-информационного документа от ее результативности V, и оперативности х,, представлен на рис. 2.

Р

1 д.ц 1

0,9 0,8 0,7 0,6 0,5 0,4 0,3 0,2 0,1

0

v=0,1

v=0,9

10 20к 30 40 50 60 70 Т, мин Рис. 2

Данные зависимости позволяют:

— определить время обработки рассматриваемого источника информации: Т° = аг§(Рд ц (^) | Рд ц = Р*), где Р* — требуемая вероятность решения информационной задачи;

26_И. М. Левкин_

— определить интенсивность обработки информации сотрудником деловой разведки на одном автоматизированном рабочем месте: д/ = 1/То , где То — средняя продолжительность обработки информационного документа на у'-м рабочем месте;

— определить требуемое число автоматизированных рабочих мест J в информационной структуре ситуационного центра деловой разведки, обеспечивающее непрерывную обработку потока информации, поступающего с интенсивностью швх , исходя из условия [4]

J

®вх ^ЕК/ .

/=1

СПИСОК ЛИТЕРАТУРЫ

1. Левкин И. М. Теория и практика информационно-аналитической работы. Курск: НАУКОМ, 2011. 389 с.

2. Доронин А. И. Бизнес-разведка. М.: Ось-89, 2006. 496 с.

3. Петухов Г. Б., Якунин В. И. Методологические основы внешнего проектирования целенаправленных процессов и целеустремленных систем. М.: АСТ, 2006.

4. Двухуровневая модель информационного взаимодействия / Б. Я. Советов, М. О. Колбанёв, Т. М. Татар-никова // Материалы VIII Санкт-Петербург. межрегион. конф. „Информационная безопасность регионов России", 23—25 окт. 2013 г. СПб: СПОИСУ, 2013. С. 184—185.

Сведения об авторе

Игорь Михайлович Левкин — д-р воен. наук, профессор; Санкт-Петербургский государственный экономический университет, кафедра прикладных информационных технологий; E-mail: [email protected]

Рекомендована кафедрой Поступила в редакцию

прикладных информационных 28.04.14 г.

технологий

i Надоели баннеры? Вы всегда можете отключить рекламу.