Научная статья на тему 'Оптимизация хранения корпоративных данных'

Оптимизация хранения корпоративных данных Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
119
35
i Надоели баннеры? Вы всегда можете отключить рекламу.
i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Оптимизация хранения корпоративных данных»

(показатель, уточняющий метрики сложности, ориентированные на оценку информационной энтропии).

Проведенные статистические исследования множества разноязычных текстов (русский, английский, немецкий, французский) позволяют оценить характеристики человека как канала связи (восприятия) с присущими ему пропускными показателями. Была разработана программа (язык С++) с алгоритмом, подсчитывающим количество букв в словах и количество слов в предложении. Результатом исследований явилось среднестатистическое значение показателя а=8 - количество параллельного восприятия человеком отдельных символов. Экспериментальный результат подтверждает вывод теории информодинамики о дискретности восприятия человеком с «мерой восприятия» а=2 =8. Сделанные выводы позволяют говорить о возможности применения «ментальных» мер сложности для оценки разноаспектных информационных структур.

Ментальные меры сложности. Процесс объективирования будем рассматривать с позиции двух составляющих.

1. Процесс обучения (education), осознания. В человеческом мозгу формируется множество A ментальных символов на основе новых визуальных образов и (или) нового семантического наполнения уже существующих, в зависимости от внешних условий (ограничений) и состава определяющих поведенческих задач. Формируется синтаксическое пространство B языка активного восприятия, воздействия, управления. В этом случае количество сравнительных операций внутри множества A равняется: ke=log2A\, где ke - коэффициент обучения; \A\ - мощность множества А.

Основанием логарифма выступает 2, так как необходимо классифицировать (сравнить попарно) каждый элемент множества А друг с другом.

2. Процесс манипуляции (manipulation), действия, восприятия. Манипулируя ментальными образами B, человек формирует команды (на основе

синтаксиса выработанного языка) и осуществляет целенаправленное воздействие на систему или анализ системы (управление). Процесс действия или восприятия характеризуем коэффициентом манипуляции кт: кт=^8А\.

Основываясь на двух введенных коэффициентах, введем понятие информационной меры мен-тальности: коэффициент сложности управления (соиХго\) Кс - количество ментальных операций, необходимых человеку для работы с системой управления, чтобы задействовать максимум операций за минимум времени:

Кс=ке+кт=1о22А\+1о28А\=1о22А\+1/3-1о22А\= =4/3Щ2А\.

Если мы хотим рассчитать производительность интерфейса по образу «закона Хика», то можно воспользоваться формулой:

Время(мс)=с-^2А\+й-^8А\, (1)

где с и й - физические характеристики человека: с - время, затрачиваемое на ментальное сравнение одного символа; й - время, затрачиваемое на ментальное сравнение восьми символов.

По существу, можно предположить, что величины с и й совпадают (¿=с=й), так как являются показателями одной и той же производительности мозга («количество времени, затрачиваемое мозгом на обработку информации за один «такт») и тогда формула (1) примет вид:

Время (мс) = г4/3-1о^2А\. (2)

На основании введенных характеристик мы можем проводить оценку сложности программного обеспечения. Для этого необходимо рассматривать программу как управляющую систему. Тогда можно говорить о метрике ментальной структурной сложности «алгоритмических» программ М5:

м=ьошт+р)+ьош8т, (3)

где ^ - количество переменных; М2 - количество операций всего; Р - количество подпрограмм.

Аналогично можно осуществить расчет объектно-ориентированных и потоковых программ, манипулируя понятием обучение и управление.

ОПТИМИЗАЦИЯ ХРАНЕНИЯ КОРПОРАТИВНЫХ ДАННЫХ

И.Н. Ефимов, д.т.н.; С.А. Жукова

(Чайковский технологический институт (филиал) ИжГТУ, Пермский край, г. Чайковский)

В настоящее время наблюдается серьезное увеличение объема корпоративной информации. В соответствии с отчетами IDC, рост объемов хранимых и обрабатываемых данных составляет более 70 % в год. В некоторых специфичных отраслях, например в медицине, наблюдается экспоненциальный рост информационных объемов. Ситуация осложняется требованиями нормативных

актов и внутрикорпоративных стандартов, предписывающих длительное хранение некоторых видов информации, иногда в течение 5-10 лет. А это значит, что компания, имеющая корпоративные данные скромного объема в 1 Тбайт и показывающая рост этих объемов на 60 % в год, через 10 лет будет хранить уже 110 Тбайт информации. Проблема взрывного роста объемов данных тесно

связана с другой проблемой - постоянно усложняющимися процессами управления хранением данных.

Управление информацией включает решение задач, связанных с организацией хранения, доступа, защищенности, производительности, то есть с обеспечением гарантированного уровня обслуживания. Размещение информации должно осуществляться, с одной стороны, на тех носителях, характеристики которых удовлетворяют заданным параметрам уровня обслуживания. С другой стороны, необходимо добиваться снижения затрат на их хранение. При организации хранения информации выбор носителя является определяющим (Жесткие диски вчера, сегодня, завтра //Системы хранения данных. 2005, №3).

Как правило, специалисты выбирают либо дорогостоящие средства хранения, максимально удовлетворяющие требования к уровню сервиса, либо недорогие запоминающие устройства. В этом случае возникают риски, связанные с потерей качества обслуживания информации (снижение надежности, потеря производительности и т.д.). Добиться оптимального распределения ресурсов хранения при снижении затрат на хранение и сопровождение информации можно, формируя информационные ресурсы в виде многоуровневой блочной среды.

С этой целью необходимо классифицировать корпоративную информацию по степени ее значимости для бизнес-процессов компании и применять инструменты управления размещением данных на устройствах хранения в соответствии с этой классификацией. В этом случае среда хранения формируется как совокупность дисковых массивов различных типов для каждого класса информационных ресурсов (ИР.)

Таким образом, можно сформулировать задачу, заключающуюся в оптимизации параметров многоуровневой среды хранения ИР с заданными локальными характеристиками каждого уровня и в то же время объединенными совокупностью ограничений на всю среду хранения. Оптимальным планом является номенклатура дисковых массивов и количество внешних запоминающих устройств (ВЗУ), составляющих дисковый массив, при минимальной суммарной стоимости хранения. В такой постановке задачу можно рассматривать как задачу математического программирования с блочной (многоуровневой) структурой. Одна система ограничений содержит все переменные и образует блок-связку, другая - лишь часть переменных и формирует блочную структуру (Глухов В.В., Медников М.Д., Коробко С.Б. Математические методы и модели для менеджмента. СПб., 2000).

С учетом вышесказанного дадим формализованное описание задачи. Пусть имеем P уровней и mp, p=1..P параметров, характеризующих ресурс, наличие каждого 1-го параметра составляет наи-

меньшее Ьр и наибольшее Вр¡, 1=1... тр (значения в соответствующих единицах измерений). Эти параметры предназначены для формирования пр типов дисковых массивов. Каждая единица 7-го типа дискового массива содержит ау единиц ¿-го параметра ресурса. Требуется определить, какие типы дисковых массивов и какое количество дисков необходимо для формирования многоуровневой среды хранения с наилучшими показателями для принятого критерия оптимальности.

Обозначим через Хр количество единиц у-го типа дисковых массивов на р-м уровне, тогда математическую постановку задачи можно записать в виде:

р пр

Р = Е Т/рУСр7ХрУ ^тп (1)

р=1 7=1

при ограничениях

р пр р тр

ЕЕ?*, <ЕЕв,, (2)

р=1 7=1 р

Е Еа7хру *ЕЕъР1 ,

р=1 7=1 р=11 =1

Р пр

Е ЕХру <ь,

р=1 7=1 пр

Еаухру<В , 1=1~тр,p=1...р,

7=1 пр

Еаухру *Ь , ¿^.Мр, р^.^

7=1

(3)

(4)

(5)

(6)

х7 еЛ,у=1..пр, р=1..Р, (7)

где Р - общее количество локальных блоков; т0 -число ограничений в блоке-связке; пр - число переменных в р-м локальном блоке; тр - число ограничений в р-м локальном блоке; Ур - объем диска у-типа в р-м локальном блоке; Ср - стоимость хранения информации на диске у-типа в р-м локальном блоке; Ь0 - общее количество дисков для хранения ИР; Ьр, Вр - наименьшее и наибольшее значения параметра ИР; Л - множество целых, положительных чисел.

Условия (2)-(4) описывают блок-связку, (5), (6) - отдельные блоки (уровни), (7) - условие целочисленного значения переменной хру.

Организация среды хранения ИР по заданной классификации может характеризоваться следующими основными параметрами: V - максимальный объем, Мб; Р5 - пропускная способность, Мб/с; С - стоимость хранения, руб/Мб.

В ходе исследования проведены расчеты для случая трехуровневой среды хранения при следующих значениях параметров модели: Р=3, т0=2, т1=2, т2=2, т3=2, п1=3, п2=2, п3=3, Ь0=100 с учетом изменяющихся параметров ИР. На рисунке приведены графики, отражающие зависимость объема и стоимости хранения при организации

р=И=1

т

р ""р

объем ИР, Гб

■ ■ "одноуровневая многоуровневая

Изменение стоимости хранения с ростом ИР

одноуровневой и многоуровневой среде хранения. Как показывают сравнительные результаты расчета, использование многоуровневой среды хранения снижает затраты на хранение ИР. При этом обеспечивается гарантированный уровень обслу-

живания информации. Однако использование многоуровневой среды хранения эффективно при достижении объема ресурса сотен Гбайт.

Проведенные исследования показывают, что использование многоуровневой структуры среды хранения позволяет сократить затраты за счет оптимального использования дисковых устройств. Если учитывать полную стоимость обслуживания информации, включающую затраты на поддержку информации на всех стадиях ее жизненного цикла, то эффект от внедрения многоуровневой среды будет расти. Введение такой структуры ИР позволяет обеспечить уровни сервиса в соответствии с потребностями бизнеса. В частности, в модели рассмотрены показатели производительности и объема. Данную модель можно расширить, добавив в качестве ограничений такие показатели сервиса, как требования к надежности и восстанавливаемости.

АВТОМАТИЗИРОВАННАЯ СИСТЕМА ПОИСКА ФИЗИЧЕСКИХ ЭФФЕКТОВ «ПОЛЕЗНЫЙ ЭФФЕКТ»

А.М. Герасимов, П.А. Колчин, С.А. Фоменков, д.т.н.

(Волгоградский государственный технический университет)

Физические знания играют важную роль при проведении научных исследований и в проектировании технических изделий и технологий. Существуют специальные базы данных (БД) физических знаний в форме так называемых физических эффектов (ФЭ), применяемые в инженерном творчестве и поисковом конструировании (Фоменков С.А., Давыдов Д.А., Камаев В.А. Моделирование и автоматизированное использование структурированных физических знаний. М., 2004).

Для повышения удобства и эффективности поиска и работы с ФЭ авторами создано программное приложение «Полезный эффект, предоставляющее широкие возможности поиска, обладающее эффективным пользовательским интерфейсом и механизмами обучения пользователей процессу формирования поисковых запросов.

Возможности системы

Основными задачами, которые были поставлены при разработке системы «Полезный эффект», являются предоставление пользователям новых поисковых возможностей и упрощение формирования поисковых запросов.

Система «Полезный эффект» состоит из нескольких специализированных подсистем, выполняющих различные функции в процессе ввода запроса и поиска. Основными подсистемами являются:

- редакторы поисковых запросов;

- поисковое ядро для получения информации из БД ФЭ;

- подсистема адаптивности и обучения пользователя работе в программе;

- советник по вводу и коррекции поисковых запросов;

- мастер формализации запроса.

Следует отметить, что особое внимание при разработке программы уделялось эргономичности и понятности пользовательского интерфейса. Так, например, для удобства работы в систему была добавлена поддержка «жестов мыши». Данная технология позволяет упростить и ускорить управление программными системами.

Работа в системе «Полезный эффект»

Процесс работы в рассматриваемой системе состоит из следующих шагов:

1) формирование запроса на поиск ФЭ;

2) ввод запроса в систему;

3) поиск;

4) коррекция ошибочно введенного запроса;

5) просмотр и сохранение результатов поиска.

Указанная последовательность является условной, так как некоторые шаги могут повторяться несколько раз, а их порядок может изменяться.

Для повышения понятности указанного процесса в программу был внедрен адаптивный помощник, выполняющий обучение пользователя. Подсистема-помощник следит за действиями че-

i Надоели баннеры? Вы всегда можете отключить рекламу.