Выбор архитектуры системы распределенных информационных хранилищ на основе решения задачи оптимизации стоимости документопотоков

Гудов Александр Михайлович; Мешечкин Владимир Викторович; Завозкин Сергей Юрьевич

УДК 004.7

ВЫБОР АРХИТЕКТУРЫ СИСТЕМЫ РАСПРЕДЕЛЕННЫХ ИНФОРМАЦИОННЫХ ХРАНИЛИЩ НА ОСНОВЕ РЕШЕНИЯ ЗАДАЧИ ОПТИМИЗАЦИИ СТОИМОСТИ ДОКУМЕНТОПОТОКОВ

А. М. Гудов, В. В. Мешечкин, С. Ю. Завозкин

CHOICE OF ARCHITECTURE OF DISTRIBUTED INFORMATION STORES SYSTEM BASED ON THE SOLUTION OF THE INFORMATION FLOWS COST OPTIMIZATION PROBLEM A. M. Gudov, V. V. Meshechkin, S. Y. Zavozkin

В статье представлена математическая модель для задачи оптимизации стоимости документопотоков в информационных системах и взаимодействующих с ними информационных хранилищах, с учетом выбора различных вариантов их архитектурных решений. Предлагается вычислительная процедура решения построенной задачи на основе метода динамического программирования.

A mathematical model of information flows cost optimization problem in information systems and information stores which are interacting with them is presented in the article taking into consideration the choice of different variants for their architectural solutions. A computational procedure for solving the constructed problem with the help of the dynamic programming method is proposed.

Ключевые слова: информационные системы, электронные документы, оптимизация.

Keywords: information systems, electronic documents, optimization.

Для эффективной работы системы электронного документооборота важно, чтобы она не только автоматизировала управление движением электронных документов, но и делала это по возможности наиболее оптимально, с точки зрения выбранного критерия. Для определения такого критерия можно использовать решения задачи оптимизации стоимости документопотоков [5, 8].

Построение математической модели оптимизации стоимости документопотоков основывается на методике, использованной в работе [3], в основе которой лежит «структурный» подход, когда рассматривается конкретная структура исследуемой организации и оптимизируются документопотоки в рамках этой заданной структуры. Однако при создании информационной среды предприятия такая методика накладывает ряд ограничений, в частности, на масштабирование 1Т-решений и технологий в распределенной организации.

Поэтому при построении математической модели воспользуемся «архитектурным» подходом, суть которого заключается в оптимизации стоимости до-кументопотоков на основе анализа возможного применения различных архитектурных решений при проектировании информационной системы [4, 5].

Часто выделяют следующие основные объекты оптимизации:

- объем занимаемого документами места в базе данных (БД) системы, включая все копии документов;

- время, затрачиваемое на получение документа из БД по запросу пользователя;

- время, затрачиваемое на получение документа из некоторой информационной системы (ИС).

Для этих объектов можно выделить несколько вариантов решений, используемых при выборе критерия оптимизации.

Первый вариант состоит в минимизации времени получения требуемого документа пользователем. Это время складывается из времени, затрачиваемого на передачу запроса, времени поиска или формиро-

вания запрашиваемого документа, а также времени его непосредственной передачи пользователю. При таком подходе необходимо оценивать параметры коммуникационной сети и информационных хранилищ (ИХ) системы. Параметры целевой функции будут зависеть от архитектуры хранилищ и архитектуры ИС, использующих данные из этих хранилищ.

Второй вариант предполагает минимизацию стоимости передачи документов между пользователями и хранилищем системы, а также между пользователями и ИС. В этом случае оценка стоимости, как параметры функции, также будет определяться архитектурой распределенной системы.

Третий вариант состоит в минимизации объемов документов, хранящихся в системе. Оптимизация по данному признаку ведет к снижению непериодических затрат на хранение документов, а также на их обновление, поскольку минимизация дублирования документов приводит к снижению затрат на внесение изменений во все хранилища системы. При этом значительно увеличивается быстродействие поиска документов. Однако уменьшение объемов информации за счет ликвидации дублирования имеет и свои отрицательные стороны - возможность потери информации при неосторожном удалении документа, а также увеличение стоимости передачи всех копий документов между хранилищами. Такой подход напрямую не зависит от архитектуры системы, но имеет ряд существенных ограничений из-за того, что он не учитывает «окружение» системы.

Четвертый вариант заключается в минимизации затрат на обновление документов. При высокой степени изменчивости информации данный вариант приводит к значительному уменьшению количества копий и одновременно к увеличению стоимости поиска информации из-за необходимости обращения именно к тем хранилищам, где находятся запрашиваемые документы. Если эти хранилища территориально разделены, то время и стоимость передачи могут значительно превысить экономию от уменьшения объемов хранимой информации. Такой вари-

ант значительно снижает показатели надежности системы. Стоимость модификации документа включает в себя стоимость получения нужного документа пользователем, стоимость передачи информации и стоимость непосредственно изменения содержимого документа. При выборе хранилища, предназначенного для работы с большими объемами данных, стоимость непосредственного обновления информации будет существенно меньше стоимости поиска нужного документа и его передачи. Поэтому нет смысла рассматривать отдельно задачу минимизации стоимости модификации документа - она решается в рамках второго варианта.

Таким образом, оптимальность стоимости доку-ментопотоков может быть достигнута путем выбора интегрального критерия, сочетающего только первые три варианта.

При выборе такого критерия можно использовать экономический подход [3], заключающийся в минимизации суммы затрат на хранение, передачу, поиск и обновление электронного документа (ЭД).

Еще одним важным критерием может служить время передачи информации, которое можно выразить через стоимость передачи ЭД пользователю или за счет введения дополнительного ограничения на максимально возможный временной интервал, в течение которого пользователь может ожидать ЭД по своему запросу. В работе были объединены оба этих подхода.

Определим основной объект исследования следующим образом. Под электронным документом будем понимать информационную пару

йг = {йг , Сйг } ,

обрабатываемую в информационной среде предприятия и циркулирующую в ней,

где Сй - содержимое ЭД,

Мй - метаданные ЭД.

Под содержимым понимается информационное наполнение ЭД, которое представляется в виде вложенного файла или набора файлов произвольного типа и размера, а также в виде ЭД или набора ЭД. Метаданные - описание ЭД, однозначно его идентифицирующее, где отражаются как его статические, так и динамические характеристики. Такое определение позволяет обрабатывать отдельно метаданные и содержимое документа.

Определим интегральный экономический критерий £ следующим образом [5]:

Б = ( + Б2 + Б3), (1)

где Б1 - стоимость хранения информации;

Б2 - стоимость получения данных из ИС;

Б3 - стоимость получения данных пользователем из ИХ.

Введем параметр х. в качестве индикатора, отражающего факт размещения ЭД й. в ИХ И,:

11, є Н,

[о, ї нг,

(2)

где . = 1, пг,

П - количество ЭД в И i, г = 1, N , N - количество ИХ.

Каждый ЭД может иметь определенное количество копий г- в различных хранилищах:

(3)

Использование выражения (3) в качестве ограничения позволяет управлять избыточностью данных в среде.

Возможность хранения документов в хранилище ограничена объемом этого хранилища:

N п . п

ЕЕх,,»,, <Е°., <4)

г=1 .=1 г=1

где уг- - объем й- в Иг;

г. . г

01 - объем, доступный для размещения ЭД в Иi.

Для удобства введем индикаторы т.к и с.к, показывающие, из каких метаданных и какого содержимого состоит й. в И.:

і, мк є нг,

о, Мк ї нг,

і, ск є нг, [о, ск ї н,

(5)

(6)

где Мк - к -е метаданное й.; С'к - к -е содержимое й.;

{«* с}.

Общий объем ЭД можно представить в следующем виде:

хчуч = £ тФуф + £ %

(7)

к=1

где V' - объем мк

й. в И .;

. г ’

V. - объем С. й ■ в Иг;

п[- - число метаданных й. в Иг;

г. . г

п. - число элементов содержимого й. в И,. Введем обозначения:

1

тт., =

с.-, =

Вестник КемГУ

№ 3 (47) 2011

тгі = { I к = 1 п] }, СЦ ={к I к = 1, ^ },

Vі- = | к = 1, и'- }, } = {к | к = 1, п,; },

У !_ ]к I ’ V J ’ V у -к I ’ V ’

п-

т-и'ч = £ тФ— , (8)

к=1

—” = £ в,--V-, ■

в Н

- времени, затрачиваемого на поиск й- в Ні;

- времени, затрачиваемого на передачу й- из Ні пользователю.

Через Ьі обозначен период, характеризующий среднее время ожидания й. по запросу пользователя из Ні. При этом существует максимально допустимое время ожидания Т, которое не может быть

превышено. Таким образом, можно определить следующее ограничение:

Ч < Т ■ (10)

Обозначим через Оі частоту запросов к Н і.

Очевидно, что Оі будет влиять на эффективность распределения информации в системе, поэтому для включения этого параметра в модель выразим Оі

через х - :

и і

0 = £ Пух - ,

-=1

где ц- - частота обращения к й ■ в Н і за единицу времени.

С учетом (5), (6) и (8) выразим цЧху :

ЦухЧ = т-цт + СЧЦСЧ ■

Тогда Оі можно представить как:

Оі = £(т]( + Су Ці

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

3=1

(11)

(12)

= Е с

к=1

Тогда окончательный вид ограничения (4) с учетом (8) будет выглядеть следующим образом:

N п{ п

ЕЕ КЧ + сЛ )<Е°. (9)

г=1 . =1 г=1

Заметим, что формула (9) уже не учитывает доступ к значению каждого метаданного и каждому элементу содержимого ЭД. Данное ограничение регулирует общий объем, занимаемый электронными документами, и зависит только от двух параметров -физического объема ИХ и архитектуры распределенной системы хранилищ. Ограничение не влияет непосредственно на оптимизацию документопото-ков, однако может оказаться довольно важным фактором для оценки количества хранилищ в информационной среде и необходимой избыточности хранения информации.

Время получения й. из И■ складывается из:

где цт - частота обращений к метаданным документа,

ці - частота обращения к содержимому ЭД.

Следует отметить, что время іі зависит от V- и

0,:

1 пі

1. = —£ Ь.ц.х.

і О і- - і-% -=1

(13)

где І, =

я

- время, требуемое на передачу й-

объемом V. из И ;

г. г ’

Щ - пропускная способность канала связи для передачи ЭД между пользователем и хранилищем.

Подставляя (11) в (13), с учетом (8) и (7) получаем ограничение:

1

времени, затрачиваемого на передачу запроса

яя £ [КЧ- цц) + - ( ці

+я"- цт ) + ( С-я"- цс )

і] 'із ! \ у ч'у !

(14)

Через ограничение (14) можно выразить максимальный объем электронных документов, передаваемых по сетям передачи данных между пользователем и ИХ за временной период Т. Увеличение

объема передаваемой информации будет непосредственно влиять на выбор архитектурного решения.

Ограничение для времени получения документов из ИС аналогично ограничению для времени получения документов из ИХ. Отличие заключается в значительно больших временных затратах на поиск и формирование запрашиваемой информации. При этом время передачи документа из ИС может увеличиться за счет более низкой пропускной способности канала передачи данных в случае корпоративной сети, основанной на технологиях Интернет.

Для уменьшения негативного влияния этого фактора на общую работоспособность системы вводится понятие регистрации документа в хранилище без получения его содержимого из ИС. Под регистрацией документа в хранилище понимается формирование в этом хранилище метаданных полученного документа. Поскольку размер метаданных документа мал по сравнению с размером его содержимого, то время его регистрации в системе также мало по сравнению с остальными временными составляющими. Следовательно, временем регистрации ЭД в данном случае можно пренебречь.

п

V.-

и

Время получения пользователем й. из ИС рассчитаем по аналогии с (13):

1 1-

Тг = 07 Е Т. < Т,',

°г .=1

где 07 - частота запросов к ^ , у. - индикатор размещения й. в ИС.

Выражая О через у. по аналогии с (12), с уче том (8) и (11) получаем:

Исходя из вышесказанного, стоимость хранения документов в ИХ с учетом (7) и (8) выражается следующим образом:

N пг

(15) Б1 = ЕЕ(т -V1- + с-я" ), (17)

г \ г. г. г. г. ! ’ 4 /

г=1 .7=1

где 5.1 - стоимость хранения единицы информации

в Нг .

Стоимость получения данных пользователем из

H :

-m -c. -1 v^( + v"rm

г - г - \ г in - 1 г rh -

ff c

C--V • - h

г г г

(18)

Q' = У (m-mm + c- m

^г ¿—i\ г] Гг] г^г]

-=1

где m]i - частота обращения к метаданным документа в ИС за единицу времени;

- частота обращений к содержимому документа; где S2 - стоимость получения единицы информации

^ - количество электронных документов в I. .

Тогда среднее время передачи представляется в следующем виде:

1

Т = ОТ Е тг. тг.уг. , ч .=1

я.

где т. = - время, требуемое на передачу й.

Стоимость получения документов из ИС:

2

S3 = УQhЕСmm) +

г = 1 q,r, - = 1

+ {Vi3mu + V-) + )сі^ії)

(19)

объемом v{- из I,

гJ 1

где «3 - стоимость получения единицы информации от ИС.

Для возможности управления вкладом каждой стоимости в итоговое значение целевой функции Подставляя полученное в^1ражение в (15), окон- вводятся весовые коэффициенты ^, ^, ^:

Ri - пропускная способность канала связи.

чательно получим:

1

г

—У

!т>!

-

m■vmm ) + m civ'.mc +

г г г г г г г

f (M,C) = w1S1 + w2S2 + w3S3

(20)

+v”um ) + ( C■ -v”-UC-

г г - 1 \ г - г г -

(16)

У wi = 1, wi > о, г = 1,2, з.

Смысл этого ограничения такой же, как и (14) с учетом того, что в рассматриваемых ИС ЭД соответствуют введенному понятию.

Окончательный вид целевой функции с учетом выражений (17), (18) и (19) будет выглядеть следующим образом:

N Пг

f (m,c) = w1 уs1 У«- + c-vl) +

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

=1 -=1

w2 У —г— У (m-v' rm ) + m-c-iv'-цс + v"r)m ) + (c-v"nc-

2 Z=/ QR Z=/ \ г- г-'Iг- / г- г- \ г-Нз ' гуНз / ' \ г- г-Нз

h S 3 - '• 2

- w3У —г— У (m vmm ) + m c.. (v..uc + v".mm ) + fc. v ".иг

3 = q/r/Z= |^\ г- гуг- J г- г- \ г^г! ' гуг^^уг- гуг

(21)

Матрицы M = {п-1 і = 1, N, - = 1, и - } и C = {c- \ і = 1, N, Ї = 1, и ■ j составляют набор

V’ = \ Vm^- ^ 0, г = 1, N, - = 1, и- j

и V" = iv"\ Vc-- ^ 0,г = 1,L,Ї = 1,1, j

- - -

переменных задачи. Определяемые элементами этих являются известными значениями для каждого кон-

матриц объемы метаданных и содержания

кретного документа.

3

1

Тогда полную постановку задачи можно опре делить как: f (M, C) ^ min при следующих ограничениях:

N

У (ш-- + с,-) = т-, 1 < т- < N + L ,

I__j \ ,- ,- ) - > — - — ’

i = 1

N ni n

yVimv'. + c..v") < УО ,

Z.-t Z.-t \ i- i- i- i- / — Z-t i ’

i=1 -=1 i=1

N 1 n, 2

У---------У (m vг>ш) + m -c-- (v'-rc + v"rf-

z^n t> z^ \ - ч 'ч ! - i-\ ч 'ч ч 'ч

i=1 QiRi -=1

2 l і i + {c-) | + У QQR7У\(шЛm

+ m- с■ - (v'mc + v"rnm) + ( c -v"- m

i i i i i i i i i

(22)

(23)

(24)

(25)

< T,

T = min(T„ T,), і = 1, N + L.

Для решения этой задачи необходимо найти та-

Тогда задача (22)-(25) перепишется следующим образом:

N n,

f(M,c) = ч У sf У b- +

i=1 -=1 (27)

N s пхр nі

L пинф l — SA —

У^ Vd.. + w3 У^-----------------У d,

Z—І Пі D ' J ,J 3 ' J /УіУ ' J ,

1 QiRi -=1

1 QiR -=1

У a■■ = т-, 1 < т- < N + L

ijjj

(28)

(29)

(30)

£ ъ.- < о.,

^ і] — і *

]=1

N 1 п Ь 1 ¡і _

£—£й.. + £—^£йу < т.

- -і = 1 - =1 і = 1 Оі яі - = 1

На основании достаточно общих рассуждений получена нелинейная задача дискретного целочисленного программирования (ДЦП). Заметим, что переменные М и С являются булевыми (принимают значения {0,1}), значения V' и V'' являются целы-

ми числами (например, выражаются в мегабайтах, Мб).

Следует отметить, что в соответствии с принятой моделью ЭД значения метаданных представляют собой строго структурированные данные, а содержание - файлы произвольного формата и объема. Тогда вполне оправданно хранить метаданные в табличных структурах данных под управлением реляционной СУБД, а содержимое ЭД - в объектных структурах под управлением объектной или объектно-реляционной СУБД. Такой подход позволит выбрать оптимальную (с точки зрения производительности обработки запросов к ЭД) архитектуру системы и упростить задачу (27)-(30).

Поскольку современные СУБД оптимизируют затраты на поиск данных и обработку запросов в многопользовательском режиме работы, частота обращений к метаданным в СУБД будет зависеть только от конфигурации самой системы. Таким образом, можно оценить коэффициенты й . и й . в

кое распределение т. и с., при которых значение (26): f (М, С) в (21) становится минимальным для данного набора коэффициентов при ограничениях объема, числа копий и времени получения ЭД, задаваемых выражениями (23), (24) и (25).

Для удобства дальнейшего изложения введем обозначения:

а. = т■■ + с■■,

г] г] Ч ’

Ь.. = тя7 + ся'-7,

г. г. Ч Ч Ч

й.. = (тя7пт ) +

г] \ г] Ч Ч !

+ т с -(я'-пс- + я”г>т ) + (с -я"пс-) , ( )

ч ч \ ч 'ч ч 'ч ! \ ч ч 'ч ! ’

й.. = (т.яЧтт ) +

г] \ г] Ч Ч )

+ т .с.-. (я7IIе + я"тт \ + {с .я”пс ■'

г г г г г г г г г

d - » b - Vrm + Vе ) » m -v'-rm + c -v"nc-,

i-X 'i- ',- ) ,- i- 'i- ,- - '-і

d,- » b,- (mm + mc-) » -mm + с,^mc-.

(31)

Возможно несколько вариантов выбора архитектуры информационных хранилищ и взаимодействующих с ними информационных систем:

1. Метаданные и содержимое документа расположены в разных ИХ. Прикладные ИС поддерживают свою базу данных документов и обмениваются друг с другом только через общую БД электронных документов (модель процесса процессноориентированной интеграции).

2. Метаданные и содержимое документа расположены в разных хранилищах. Прикладные ИС поддерживают одну и ту же базу данных, обмениваясь между собой ссылками на общие документы (модель процесса сервисно-ориентированной интеграции).

3. Метаданные и содержимое документа расположены в одном хранилище. Прикладные ИС поддерживают ту же базу данных, используют прямые запросы к данным (модель процесса информационно-ориентированной интеграции).

В первом случае необходимо решать задачу (27) - (30) с учетом представления коэффициентов (31).

Во втором случае задача (27) - (30) с учетом (31) преобразуется к следующему виду:

N

N S2 n-

=1 -=1

2Z—/

i=1

- =1

У а■■ = т-, 1 < т. < 2N

- 3’ — - —

i=1

n.

Уь.. < О ,

•min, (32)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

(33)

(34)

1

І

N і n.

У —— У d-- < Т .

QtRtU ij ~

(35)

Для третьего случая задача трансформируется следующим образом:

1 n

f (M, C) = — (Rs1 + s2 ) btjhj ^ min , (36)

QR

j=1

У (m- + c-) = r, r > 1.

-=1

n

У b.. < о,

-

-=1

1n

—У b.n < t .

QR y ij 7 “

(37)

(38)

(39)

программирования с целочисленными переменными. Для решения задач целочисленного программирования известен целый ряд прямых методов (например, метод последовательного анализа решений, метод ветвей и границ) и приближенных методов (например, метод локальной оптимизации, методы случайного поиска). Описание этих методов можно найти в [6].

Однако работы Р. Беллмана [1, 2] заложили основы для решения задач оптимизации методами динамического программирования, общий принцип которых состоит в том, чтобы свести задачу оптимизации для п переменных к последовательности более простых оптимизационных задач.

Для построения вычислительной процедуры решения задачи оптимизации воспользуемся принципами динамического программирования [7] и идеей метода случайного поиска [6].

Перепишем целевую функцию (27) в виде:

Задача (27) - (30) с учетом (31), как было показано ранее, является линейной задачей дискретного

n. J N ' —жр

f (M, C) = У j=1 У І = 1 хр W1si v 7 + ij 1 W2— 2 Q,R,

nj N —жр L

+ у: -=1 У І = 1 W1 —xpv!! -. .- + W2 Q.R. v" nc ij 'ij + У i=1 >

-v'-nm

І7 'І7

L

У

i=1

пинф

І // c

w ——v . m 3 Q’R’ ij^ij

c.. = У(а..т.. + ß -c.- ),

i- Z-^/ \чч ' - - r

j=1

где коэффициенты a7j будут иметь следующий вид:

а.. =

7

У

І = 1

N

У

W 1S7V',3 + W 2

—пр

QiR-.

пхр

■v'. nm

i. ' i.

пинф

+ w3 тттттгv. mm, для случая 1,

пинф

W ,s Xpv 7 + W 2 —------v 7 h m + W 3 —4----rV 7 m m

1 . - Q R 3 Q.R.

^ i i ^ i i

N

У

хр

w 1si vij + w 2

■v'- nm

ij I ij

, для случая 2, , для случая 3.

(40)

7

вилу:

Аналогично можно выписать и коэффициенты где

к 1 I 1

gjj = У Q-RTv'v < + У Q7R7v^mm,

A7 = У QRv- ncj- + У QR7v",

Фк(0) = 0, (41) 111 111

1 < к < N.

ßi7. Введем функцию фк (pj) по следующему пра-

к

(p-) = У(ат + —),

Заменим задачу (27)-(30) на последовательность задач:

F7 = minфк(p-), j = 1,...,n, (42)

Ot, j = 1,

n — j

Oi — У b-j, j >1.

7=1

(46)

(47)

Таким образом, для к = 1 (третий случай) получаем:

У atj = pj, p. = 0,1,..., min {к, ry },

i=1

b.. < O. , i = 1,...,к,

ij — ij , TT,

g m.- + A .c.. < тіп(Т,Тк,T,),

ij ij — V 5 к5 l ' '

(43) F1 = min f1(Pj) = min(a1j-m1j- + ß1jc!j),

m1jv1j + < O1,

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

m1j + = P., (48)

QR(m1j<j+ c1jv1'-пї- )< T.

(44)

(45)

n

= 1

Здесь возможны только два варианта: нельзя разместить ни одной копии документа (р■ = 0) или разместить в единственном хранилище одну копию документа (ту = с1- = 1; р- = 2). Тогда получаем:

Фі(0) = 0,

фі(2) : ті- = 1, Сі- = 1; 0і(2) = {«і- + ^1- };

Р = тіпфі(р-) = тт{«і- + Рі- }.

Для второго случая (к = 2) получаем следующую задачу оптимизации:

2

= тІП Ф2(Р- ) = тІП У (аЦтЦ + - X

Для задачи (49) возможны несколько вариантов: нельзя разместить ни одной копии документа при

Pj = 0; разместить метаданные в одном хранилище, а содержимое в другом при р- = 2

(m1j = 1, c1 j = 0, m2j = 0, c2j = 1 или

m1j. = 0, c1j = 1, m2j = 1, c2j = 0); целиком разместить документ в каком-либо одном хранилище

при pj = 2 (m1j = 1, c1 j = 1, m2 j = 0, c2 j = 0

или m1j = 0, c1j = 0, m2 ■ = 1, c2 ■ = 1); целиком

разместить документ в каждом из двух хранилищ при Pj = 4 (my = 1, C1 j = 1, m-2- = 1, C2- = 1). Суммируя, приходим к виду:

f2(0) = 0, f2(2) :

m1j = ^ c1j = 0> m2j = 0’ C2j = !;

f21(2) = {«1j + b2 j}; m1j = °’ c1j = ^ m2j = C2j = °;

f2(2) = {a2j + b1j }; m1j = ^ c1j = 1’ m2 j = 0’ C2 j = 0;

f2 (2) = {% + b1j };

m.. = 0, c = 0, m2 - = 1, c2 - = 1;

1j ’ 4-j ’ 2 j ’2 j ’

f2(2) = {a2 j + b2 j };

F2 = min ф, (р-) = min (2) | s = 1,4}.

Далее легко обобщить эти рассуждения для первого случая (k = 3) и вообще для любого числа хранилищ (k = N). Учитывая, что все коэффициенты а-

и в. - положительные вещественные числа, m-- и

j j с - принимают значения из {0;1}, то среди всех локальных оптимумов найдется глобальный оптимум F , который и будет являться решением нашей задачи [7].

Таким образом, решение задачи:

F* = minFj = minфк(р.,minфк(р._1)) Ц+1 ;

j (50)

j = 1,..,n; i = 1,..,N _ 1

с условиями (43) - (45) будет приближенным решением задачи (27) - (30). Эта задача сходна с задачей о размещении предметов с разными весами в многомерном рюкзаке [7]. Начальными параметрами задачи будут являться: фиксированное количество документов n в системе; количество хранилищ k; начальное распределение объемов метаданных V' и содержимого V ЭД в системе; известные значения коэффициентов целевой функции.

Предлагаемую математическую модель можно использовать для организации электронного документооборота так, чтобы оптимизировать выбор архитектуры информационных хранилищ и взаимодействующих с ними информационных систем, а в конечном счете - минимизировать стоимость доку-ментопотоков в целом.

Литература

1. Беллман, Р. Динамическое программирование [Текст] / Р. Беллман. - М.: Иностранная литература, 1960. - 400 с.

2. Беллман, Р. Прикладные задачи динамического программирования [Текст] / Р. Беллман, С. Дрейфус. - М.: Наука: Глав. ред. физ.-мат. лит., 1965. - 460 с.

3. Бессонов, С. В. Оптимизация электронного документооборота в корпоративных системах [Текст]: дис. ... канд. экон. наук. / С. В. Бессонов. -М., 2001. - 187 с.

4. Гудов, А. М. Интеграция распределенных приложений при помощи системы электронного документооборота [Текст] / А. М. Гудов, С. Ю. Завоз-кин // Труды международной конференции «Вычислительные и информационные технологии в науке, технике и образовании». - Павлодар: ЭКО, 2006. -Т. II. - С. 442 - 451.

5. Гудов, А. М. Об одной модели оптимизации документопотоков, реализуемой при создании системы электронного документооборота [Текст] / А. М. Гудов, С. Ю. Завозкин // Вычислительные технологии. - 2006. - Т. 11. Спец. вып. - С. 53 - 65.

6. Ковалев, М. М. Дискретная оптимизация (целочисленное программирование). Изд. 2-е, стереотипное [Текст] / М. М. Ковалев. - М.: Едиториал УРСС, 2003. - 192 с.

7. Мину, М. Математическое программирование. Теория и алгоритмы [Текст] / М. Мину. - М.: Наука: Глав. ред. физ.-мат. лит., 1990. - 488 с.

8. Моисеев, Н. Н. Методы оптимизации [Текст] / Н. Н. Моисеев, Ю. П. Иванилов, Е. М. Столярова. - М.: Наука, 1978. - 352 с.